
💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。,🤖 Toy Box Flux是专注于生成3D玩具设计的人工智能模型,改变了玩具设计方式。🎨 独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出可爱风格。🚀 未来计划强化模型性能,为玩具设计领域带来更多可能性。
💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。,智谱技术团队发布了CogView3及其升级版CogView3-Plus-3B,标志着AI辅助艺术创作迈入新阶段。CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。开源仓库已开放,推动AI图像生成领域快速发展,文生图技术应用前景广阔。
🌟 Podcastfy是开源Python软件包,可将文本和网络内容转换为多语言音频对话。🎧 用户可以通过Gradio演示应用或HuggingFace体验Podcastfy,操作简单易上手。⚠️ 使用外部内容时,需确保拥有版权和权限,生成的音频内容由AI生成,不模仿现实人物。,🤖 企业自律:协议鼓励制定人工智能治理策略、识别高风险系统、提升员工素养。💼 积极参与:超过100家公司签署协议,跨越科技、医疗、银行等行业。⚠️ 苹果和Meta观望:担忧监管环境不确定性、数据泄露风险,Meta停止在欧盟提供Llama模型服务。,6、炸了!OpenAI人事大震荡,CTO、首席研究官纷纷宣布离职!,🌟 每日仅剩5000人使用Rabbit R1,销售数据堪忧。🤖 设备匆忙上市,用户体验不佳。📱 智能手机AI功能强大,独立AI设备前景不确定。,OpenAI的首席技术官Mira Murati宣布离职,引发了公司高层人事大变动。离职信中表达了对过去工作的感激之情,同时指出团队取得的成就和技术进步。公司首席执行官Sam Altman表示领导层变动是自然发展的一部分,并安排新的人事安排以确保公司稳步发展。
🌟 新发布的Llama-3.1-Nemotron-70B-Instruct模型表现超越OpenAI和Anthropic,标志着AI竞争的重大变化。🚀 Nvidia将其AI发展从硬件扩展到软件,展示出强大的模型开发能力。💻 该模型提供了易于使用的API接口,使更多企业能获取并使用先进的AI技术。,2、vivo发布全新蓝心大模型矩阵,近日,卡内基梅隆大学的研究团队发布了名为“DressRecon”的新技术,通过单目视频实现高质量的人体重建,尤其适用于宽松衣物和手持物体的场景。该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识捕捉细微几何特征。重建结果生成高保真的三维模型,支持从任意角度渲染,提升了可视化体验。
10、欧盟委员会公布《人工智能契约》签署者名单,7、每天仅剩5000人使用!曾风靡一时的Rabbit R1为何被抛弃?,Canva最近宣布对其开发者平台进行全面升级,推出一系列新功能,旨在促进应用生态系统的发展和创新。这一举措将为用户带来更丰富、更强大的创意体验,同时为开发者提供更多机会,共同推动设计工具生态系统的发展。
8、特斯拉官宣Robotaxi发布时间,👗 研究团队推出DressRecon技术,通过单目视频实现高质量的人体重建,特别适用于宽松衣物和手持物体的场景。📷 该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识来捕捉细微几何特征。🎥 重建结果不仅生成高保真的三维模型,还支持从任意角度渲染,提升了可视化体验。
🚀 Sana框架高效生成4096×4096分辨率图像,可在笔记本GPU上运行。🔑 Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。💡 Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。,Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。
💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。,Magnific近日推出的V2图像生成服务在AI图像处理领域掀起了新的波澜,标志着其从高端软件跃升为顶级AI图像生成器,展现了技术创新和用户体验优化的雄心。,9、12亿美元出售Drift后,前HubSpot高管再创业,让AI替你管理客户!,🌟 微软正在开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。📂 Windows 的新功能 Recall 能深入挖掘用户的数字历史,重现过去的点滴经历。💬 Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。,🚀 Molmo以小巧高效的设计理念挑战传统商业模型🎯 Molmo引入指向功能,拓展人机交互和增强现实应用可能性💡 Molmo在性能评估中表现亮眼,仅次于GPT-4o,排名第二
🌟 Kimi 助手更新语音通话功能,提升用户互动体验。🎤 支持实时字幕和可调节声音,交互更自然。🤖 引入声音克隆技术,增加趣味性和应用场景。,🎥 Runway公司设立500万美元基金资助100部原创电影项目。💡 百部电影基金计划支持使用公司生成式视频模型的视频项目。🌟 Runway邀请知名人士担任顾问,致力于发现AI生成视频的实用性和开创性应用。,9、12亿美元出售Drift后,前HubSpot高管再创业,让AI替你管理客户!,🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。
2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元,猫眼娱乐发布动态故事板 AI 生成工具“神笔马良”猫眼娱乐推出的“神笔马良”工具为剧本创作者带来极大便利,实现智能分析、角色创作、分镜创作等功能,节省创作者时间和精力。工具还能将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。
8、OpenAI 申请法庭驳回马斯克诉讼,称其为 “骚扰” 行为,6、夸张!GPT-4无意中掌握面部识别技术,准确率超越专业算法
Hugging Face旗下Gradio5发布,致力于简化AI开发,提供企业级安全性和AI Playground功能,进一步推动AI应用开发体验。,9、美国司法部AI新规:AI 犯错,企业担责,Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。新功能集多样化应用和个性化体验于一身,提升交流效率,满足个性化需求。针对特定场景深化了功能应用,如英语陪练和模拟面试,为学习和职场提供创新解决方案。引入声音克隆技术增添趣味性,持续关注用户反馈,优化扩展语音服务应用范围。,OpenAI 新模型 o1 声称能 “完美” 纠正偏见,但数据并不完全支持