1、Pika1.5重磅上线四个新特效:从粉碎到消失,效果炸裂了!,Molmo是一款开源多模态人工智能模型,基于Qwen2-72B和OpenAI的CLIP,以高效性能和创新功能挑战传统商业模型。其突出特点在于小巧高效、引入指向功能、性能优异、开源性质和全面功能。Molmo的成功归功于高质量训练数据和多样性,展现出色的多模态交互能力。,9、德勤:72% 专业人士将生成式 AI 的数据隐私列为首要担忧!
🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。,在2024年9月,OpenAI的ChatGPT取得了里程碑式成就,其访问量首次超越微软必应搜索引擎。ChatGPT在全球和移动应用上的使用量显著增长,展现出稳定的增长趋势。OpenAI扩大了ChatGPT的免费服务,可能影响其未来盈利能力。,Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。
欧盟最新推出的人工智能倡议吸引了100多家公司的支持,其中包括OpenAI、谷歌等科技巨头。虽然苹果和Meta选择观望,但行业对人工智能发展的重视和责任感仍然显著。该倡议旨在推动企业自律,为未来人工智能发展奠定基础。,5、谷歌NotebookLM新增功能:快速总结YouTube精华内容,11、DreamWaltz-G:从文本生成生动的3D 可动画头像
Midjourney即将推出在线编辑器,V7版本和个性化功能在路上,👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。,8、特斯拉官宣Robotaxi发布时间
7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为,🚀 CogView3及CogView3-Plus-3B开源,标志AI辅助艺术创作新阶段。💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。,近日,卡内基梅隆大学的研究团队发布了名为“DressRecon”的新技术,通过单目视频实现高质量的人体重建,尤其适用于宽松衣物和手持物体的场景。该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识捕捉细微几何特征。重建结果生成高保真的三维模型,支持从任意角度渲染,提升了可视化体验。
Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。,11、AI协作工具Cove完成600万美元融资,前谷歌团队打造类notion可视化工作空间,vivo在2024vivo开发者大会上发布了全新蓝心大模型矩阵,升级了语言、语音、图像和多模态能力,提供更强大的性能和功能。新的蓝心大模型矩阵将行业标准提升至新高度,为用户带来更优质的体验。,🚖 特斯拉将于10月10日展示Robotaxi无人驾驶出租车,马斯克表示意义重大。🔋 特斯拉CEO马斯克回应电动公交车供暖问题,暗示传统公交车或被淘汰。🚗 网友拍到特斯拉Robotaxi伪装车,外形独特,可能采用Cybertruck设计。,9、美国司法部AI新规:AI 犯错,企业担责