英伟达与麻省理工学院、清华大学合作开发的Sana框架能高效生成高达4096×4096分辨率的图像,且在笔记本电脑GPU上运行。Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。虽存在局限性,但Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。,全新Notion AI发布 一站式 集成搜索、生成内容、分析数据等功能Notion AI以全新面貌强势回归,为用户带来办公体验革命。这款多功能智能助手集搜索、内容生成、数据分析和智能聊天于一体,改变工作方式。,9、Zoom推数字分身功能:便利还是隐忧?,5、沃尔玛推出新型人工智能模型 Wallaby
Sieve AI初创公司推出的创新技术旨在改变视频互动方式,通过实现视频中眼神接触的自动修复,提升视频内容的吸引力和互动性。该技术能快速集成到现有应用中,解决视频缺乏眼神接触的问题,特别适用于需要演讲者直视镜头的场景。Sieve的实时视线修正技术精妙运用AI模型和神经网络,实现眼神角度调整,保持视频流畅自然。,📹 Firefly AI视频模型让用户通过文本创建和修改视频内容,为创作者们提供全新创作空间。🖼️ Photoshop新增多项AI工具,如移除工具和生成填充,帮助用户更轻松地编辑图像。🔍 Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。,📈 Llama3.2模型支持在移动设备上进行视觉任务,帮助开发者实现创新。🕶️ 首款Orion AR眼镜被称为“最先进的AR眼镜”,将整合其他可穿戴设备。🎤 Ray-Ban智能眼镜推出实时语言翻译功能,提升用户交流体验。,🔒 数据查看在严格控制的安全环境中进行,禁止携带录音设备。⚖️ 未来可能面临更多法规,推动AI数据透明度的要求。📝 OpenAI同意向律师披露训练数据,满足版权诉讼需要。
在数字创意的浪潮中,Toy Box Flux作为一款专注于生成3D玩具设计的人工智能模型,革新了玩具设计的方式。其独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出令人心动的可爱风格。未来,开发团队计划进一步强化模型性能,为玩具设计领域带来更多可能性。,2、Meta AI发布Orion AR 眼镜:你的手机屏幕无缝融入现实世界!Meta AI近日发布了令科技界为之震撼的产品Orion AR 眼镜,这款经过五年潜心研发的增强现实设备不仅外观炫酷,更是瞄准智能手机市场地位,轻便设计和强大功能让它在室内外轻松应对各种场景。
7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为,🚀 Westlake-Omni是全球首个开源的中文情感端到端语音交互大模型,注重实时性和零延迟体验。💡 模型具备出色的情感理解与表达能力,能生成清晰、自然、富有表现力的中文语音。🌱 西湖心辰期望通过开源Westlake-Omni模型,促进更多开发者参与中文情感语音交互技术的发展
6、夸张!GPT-4无意中掌握面部识别技术,准确率超越专业算法,英伟达最新一代Blackwell GPU引发了前所未有的需求,CEO黄仁勋透露未来12个月供应量已售罄,市场对高性能计算的渴望再次得到证实。
8、OpenAI 申请法庭驳回马斯克诉讼,称其为 “骚扰” 行为,2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元,强!ChatGPT 月访问量突破31亿,首次超越必应搜索引擎!,🌟 升级视频AI Sora,生成更长、更高质量视频片段⏱️ 初始版本生成时间过长,存在风格、物理错误问题📈 视频AI市场竞争激烈,Sora需加快步伐以保持竞争力
在日常生活中,我们经常拍摄有趣的照片和视频,但缺乏合适的音乐。Suno推出的新功能“Suno Scenes”解决了这一难题,用户可以上传照片或视频生成匹配氛围的歌曲,让照片和视频更生动有趣。,🔑 AIGC和多模态技术深刻改变用户体验🔑 火山引擎探索AI大模型与视频技术融合,提供全方位解决方案🔑 火山引擎开发的预处理方案优化算法和工程层面,提高模型训练效率,13、开源多模态模型Molmo 能够识别图像中的物体并生成准确描述,在数字创意的浪潮中,Toy Box Flux作为一款专注于生成3D玩具设计的人工智能模型,革新了玩具设计的方式。其独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出令人心动的可爱风格。未来,开发团队计划进一步强化模型性能,为玩具设计领域带来更多可能性。,🚀 Westlake-Omni是全球首个开源的中文情感端到端语音交互大模型,注重实时性和零延迟体验。💡 模型具备出色的情感理解与表达能力,能生成清晰、自然、富有表现力的中文语音。🌱 西湖心辰期望通过开源Westlake-Omni模型,促进更多开发者参与中文情感语音交互技术的发展
在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。,✨ 4K图像直接生成:V2版本能直接生成4K质量的图像,提高效率并拓展创作者创作空间。🎨 多样化风格选项:用户只需输入描述性提示,选择分辨率和风格,系统生成优化后的图像,提供丰富的创作可能性。🔧 精细控制与高级功能:提供精细调整工具,如创意细节生成、背景调整、重新照明等,满足专业用户需求。,✨ 沃尔玛推出 Wallaby 大型语言模型,专注于零售行业数据,旨在提升客户服务体验。🤖 沃尔玛采用多模型组合的方法,灵活应对不同应用需求。🛍️ 升级后的客户支持助手能够更精准地理解客户意图,提供个性化服务。,OpenAI快凉了的Sora将迎来大升级:生成速度更快、内容更长、质量更高,Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。
🎬 MOKI专注于AI短片创作,提供动画短片、网文短剧、故事绘本、MV等多种视频内容生产。🤖 MOKI操作简便,用户只需三步即可生成创意短片,包括设定阶段、内容生成阶段和后期制作阶段。🎥 MOKI支持一键生成带配乐的视频内容,虽然目前生成效果有待提升,但产品力得到进一步增强。,10、DressRecon:输入视频就能构建出还原服装细节的3D模型,最近,微软正致力于开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。这反映出人类对于倾诉、理解和陪伴的基本需求。同时,Windows 的新功能 Recall 可深入挖掘用户的数字历史,重现过去的点滴经历。Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。
11、Canva开发者平台全面升级:推出新功能和盈利模式,猫眼娱乐发布动态故事板 AI 生成工具“神笔马良”猫眼娱乐推出的“神笔马良”工具为剧本创作者带来极大便利,实现智能分析、角色创作、分镜创作等功能,节省创作者时间和精力。工具还能将剧本内容视听化呈现,助力创作者提升作品表现,推动影视行业创新。,3、Magnific推V2图像生成服务 可直出4K图像,10、DressRecon:输入视频就能构建出还原服装细节的3D模型
9、惊艳!AI模型DIAMOND可模拟《反恐精英》,单张RTX3090就能运行,9、德勤:72% 专业人士将生成式 AI 的数据隐私列为首要担忧!,✨ 4K图像直接生成:V2版本能直接生成4K质量的图像,提高效率并拓展创作者创作空间。🎨 多样化风格选项:用户只需输入描述性提示,选择分辨率和风格,系统生成优化后的图像,提供丰富的创作可能性。🔧 精细控制与高级功能:提供精细调整工具,如创意细节生成、背景调整、重新照明等,满足专业用户需求。,豆包推出Ola Friend智能体耳机,这款集成了人工智能技术的耳机旨在为用户提供一个随时陪伴在耳边的AI朋友。用户可以享受听音乐、学习英语、获取导游服务等多种功能,需要下载豆包APP来充分利用。,9、Zoom推数字分身功能:便利还是隐忧?
✨ 企业签署《人工智能契约》自愿承诺,强调人工智能治理战略和风险评估。🌐 签署者需关注工作人员人工智能意识,设计系统让用户知晓与人工智能互动。🚀 《人工智能契约》促进企业填补合规真空,鼓励签署者间合规竞争。,欧盟最新推出的人工智能倡议吸引了100多家公司的支持,其中包括OpenAI、谷歌等科技巨头。虽然苹果和Meta选择观望,但行业对人工智能发展的重视和责任感仍然显著。该倡议旨在推动企业自律,为未来人工智能发展奠定基础。,9、12亿美元出售Drift后,前HubSpot高管再创业,让AI替你管理客户!,6、OpenAI、谷歌等100多家公司支持欧盟人工智能法案