
Magnific近日推出的V2图像生成服务在AI图像处理领域掀起了新的波澜,标志着其从高端软件跃升为顶级AI图像生成器,展现了技术创新和用户体验优化的雄心。,猛了!Meta震撼发布Llama3.2视觉方面吊打所有闭源模型?Meta在其年度Meta Connect2024大会上发布了Llama3.2,旨在提升边缘AI和视觉任务的能力。新推出的Llama3.2模型包括11亿和90亿参数的中型视觉模型,以及1亿和3亿参数的小型模型,特别优化了在移动设备上的使用。,西湖心辰开源中文情感端到端语音大模型Westlake-Omni西湖心辰宣布开源其研发的Westlake-Omni模型,作为全球首个开源的中文情感端到端语音交互大模型。该模型采用离散表示法统一文本和语音模态,注重实时性,提供零延迟体验。具备出色的情感理解与表达能力,生成清晰、自然、富有表现力的中文语音。期望通过开源鼓励更多开发者参与中文情感语音交互技术的发展。,在日常生活中,我们经常拍摄有趣的照片和视频,但缺乏合适的音乐。Suno推出的新功能“Suno Scenes”解决了这一难题,用户可以上传照片或视频生成匹配氛围的歌曲,让照片和视频更生动有趣。
👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。,Pika1.5版本再度增加了四种新特效,让用户可以轻松生成炫酷动画。Pika Labs已吸引5500万美元投资,迅速积累50万用户。提供四种灵活的订阅计划,适应不同用户的需求。
🔒 数据隐私成为2024年生成性AI的主要担忧,关注从22%跃升至72%。📈 78%的商业领袖将“安全和保障”列为伦理技术原则之一,强调安全性的重要性。⚖️ 欧盟AI法案的实施影响深远,促使公司在AI使用上进行必要的调整与合规。,✨ Zoom计划推出数字分身功能,将用户视频转化为AI驱动的逼真数字化身,提高异步交流效率。💡 深度伪造技术的普及使得区分真相和虚假信息变得困难,可能导致虚假视频的滥用。🔒 Zoom对安全措施描述模糊,仍需加强保护措施以防止恶意虚假视频的生成。,全新Notion AI发布 一站式 集成搜索、生成内容、分析数据等功能Notion AI以全新面貌强势回归,为用户带来办公体验革命。这款多功能智能助手集搜索、内容生成、数据分析和智能聊天于一体,改变工作方式。
10、DressRecon:输入视频就能构建出还原服装细节的3D模型,🌟 Kimi 助手更新语音通话功能,提升用户互动体验。🎤 支持实时字幕和可调节声音,交互更自然。🤖 引入声音克隆技术,增加趣味性和应用场景。,🌟 新发布的Llama-3.1-Nemotron-70B-Instruct模型表现超越OpenAI和Anthropic,标志着AI竞争的重大变化。🚀 Nvidia将其AI发展从硬件扩展到软件,展示出强大的模型开发能力。💻 该模型提供了易于使用的API接口,使更多企业能获取并使用先进的AI技术。,Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。,最近,微软正致力于开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。这反映出人类对于倾诉、理解和陪伴的基本需求。同时,Windows 的新功能 Recall 可深入挖掘用户的数字历史,重现过去的点滴经历。Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。
🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。,欧盟最新推出的人工智能倡议吸引了100多家公司的支持,其中包括OpenAI、谷歌等科技巨头。虽然苹果和Meta选择观望,但行业对人工智能发展的重视和责任感仍然显著。该倡议旨在推动企业自律,为未来人工智能发展奠定基础。,在2024年9月,OpenAI的ChatGPT取得了里程碑式成就,其访问量首次超越微软必应搜索引擎。ChatGPT在全球和移动应用上的使用量显著增长,展现出稳定的增长趋势。OpenAI扩大了ChatGPT的免费服务,可能影响其未来盈利能力。,7、Runway推出百部电影扶持计划,1、豆包推出Ola Friend智能体耳机:售价1199元
🌐 ChatGPT在2024年9月的全球访问量突破31亿次,首次超越必应搜索引擎。📈 在美国,ChatGPT的访问量达到4.43亿次,显示持续增长趋势。💡 OpenAI扩大了ChatGPT的免费服务,可能影响其未来盈利能力。,🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破,1、Kimi推出多功能语音通话模式 支持更换声音语速调节,火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。
3、Magnific推V2图像生成服务 可直出4K图像,Runway公司宣布百部电影基金计划,旨在支持AI技术在电影制作中的应用。该计划提供500万美元现金资助,吸引导演们参与。公司强调灵活性和支持多种视频项目形式。
Magnific近日推出的V2图像生成服务在AI图像处理领域掀起了新的波澜,标志着其从高端软件跃升为顶级AI图像生成器,展现了技术创新和用户体验优化的雄心。,🔍 新界面设计:新增Canvas功能和移动提示框位置,提升用户体验。🌐 引入SearchGPT功能:按 / 键激活,访问实时网络数据,附有内联引用和链接。💡 使用便捷:直观操作,提问后几秒内提供带有来源的答案,支持追问深入探讨话题。,📌 创新框架DreamWaltz-G能根据文本描述生成生动的3D可动画头像。🎨 结合骨骼引导的得分蒸馏和混合3D高斯表示,提升头像生成的一致性和动画表现力。🎥 支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。🔍 深圳市睿域科技有限公司确认音频为嫌疑人使用其自主研发的AI配音大模型平台克隆而成,已加强安全管控。👮♂️ 警方抓获伪造音频传播谣言的嫌疑人王某,已采取刑事强制措施,案件正在进一步侦办中。🔗 公司已启动内部审核机制,强化用户身份认证和音频生成的安全管控,确保技术合法合规应用。,7、Runway推出百部电影扶持计划,研究人员开发的AI模型DIAMOND能够模拟《反恐精英:全球攻势》游戏,运行在Nvidia RTX3090显卡上,每秒10帧的速度。尽管存在一些缺陷,但未来有望通过增加数据和计算能力来改善模型性能。
在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。,5、沃尔玛推出新型人工智能模型 Wallaby,火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。
欧盟最新推出的人工智能倡议吸引了100多家公司的支持,其中包括OpenAI、谷歌等科技巨头。虽然苹果和Meta选择观望,但行业对人工智能发展的重视和责任感仍然显著。该倡议旨在推动企业自律,为未来人工智能发展奠定基础。,2、Meta AI发布Orion AR 眼镜:你的手机屏幕无缝融入现实世界!Meta AI近日发布了令科技界为之震撼的产品Orion AR 眼镜,这款经过五年潜心研发的增强现实设备不仅外观炫酷,更是瞄准智能手机市场地位,轻便设计和强大功能让它在室内外轻松应对各种场景。,🌟 升级视频AI Sora,生成更长、更高质量视频片段⏱️ 初始版本生成时间过长,存在风格、物理错误问题📈 视频AI市场竞争激烈,Sora需加快步伐以保持竞争力
8、美国FTC重拳出击:五家 AI 公司因虚假宣传被起诉!,💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。
✨ Zoom计划推出数字分身功能,将用户视频转化为AI驱动的逼真数字化身,提高异步交流效率。💡 深度伪造技术的普及使得区分真相和虚假信息变得困难,可能导致虚假视频的滥用。🔒 Zoom对安全措施描述模糊,仍需加强保护措施以防止恶意虚假视频的生成。,Rabbit R1曾备受关注的AI设备,却仅有5000人每天在使用,销售数据令人堪忧。设备匆忙上市导致用户体验不佳,面临智能手机AI功能强大的挑战。即将推出的全能行动模型或许能改变现状,但前景仍不乐观。,🚀 Molmo以小巧高效的设计理念挑战传统商业模型🎯 Molmo引入指向功能,拓展人机交互和增强现实应用可能性💡 Molmo在性能评估中表现亮眼,仅次于GPT-4o,排名第二