台积电财报:Q3净利润增长54%达101亿美元,OpenAI的首席技术官Mira Murati宣布离职,引发了公司高层人事大变动。离职信中表达了对过去工作的感激之情,同时指出团队取得的成就和技术进步。公司首席执行官Sam Altman表示领导层变动是自然发展的一部分,并安排新的人事安排以确保公司稳步发展。,7、200万用户量!Hugging Face旗下Gradio5发布:用自然语言轻松构建AI应用,西湖心辰开源中文情感端到端语音大模型Westlake-Omni西湖心辰宣布开源其研发的Westlake-Omni模型,作为全球首个开源的中文情感端到端语音交互大模型。该模型采用离散表示法统一文本和语音模态,注重实时性,提供零延迟体验。具备出色的情感理解与表达能力,生成清晰、自然、富有表现力的中文语音。期望通过开源鼓励更多开发者参与中文情感语音交互技术的发展。,Sieve AI初创公司推出的创新技术旨在改变视频互动方式,通过实现视频中眼神接触的自动修复,提升视频内容的吸引力和互动性。该技术能快速集成到现有应用中,解决视频缺乏眼神接触的问题,特别适用于需要演讲者直视镜头的场景。Sieve的实时视线修正技术精妙运用AI模型和神经网络,实现眼神角度调整,保持视频流畅自然。
近日,卡内基梅隆大学的研究团队发布了名为“DressRecon”的新技术,通过单目视频实现高质量的人体重建,尤其适用于宽松衣物和手持物体的场景。该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识捕捉细微几何特征。重建结果生成高保真的三维模型,支持从任意角度渲染,提升了可视化体验。,🌟 微软正在开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。📂 Windows 的新功能 Recall 能深入挖掘用户的数字历史,重现过去的点滴经历。💬 Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。,8、OpenAI 申请法庭驳回马斯克诉讼,称其为 “骚扰” 行为,在数字时代,制作引人入胜的多语言音频内容成为热门话题。谷歌的NotebookLM备受好评,而开源Python软件包Podcastfy引起广泛关注。Podcastfy是开源版NotebookLM,采用先进的生成式人工智能技术,让用户实现更多个性化和规模化的播客制作。
🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。,Midjourney即将推出在线编辑器,V7版本和个性化功能在路上
🚀 Canva吸引开发者构建超过300个应用,累计使用次数超过10亿次。💼 Canva将高级应用纳入Pro订阅,设立5000万美元的开发者创新基金,奖励参与盈利计划的开发者。🔍 Canva推出新API功能,包括内容查询API、设计编辑API、身份验证API和表格API,提供更强大和灵活的应用创建能力。,5、比FLUX快100倍!英伟达联手MIT、清华推出超快AI图像生成模型Sana,笔记本也能秒速出图!,Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。
5、沃尔玛推出新型人工智能模型 Wallaby,🌟 Gradio5引入企业级安全性,确保应用安全无忧。🚀 新增的AI Playground功能,简化开发流程,让生成应用变得轻松。🔮 Hugging Face规划未来,推出多种新功能,进一步提升AI应用开发体验。,Elias Torres的故事展现了现实版的美国梦,从移民少年到科技传奇人物的成功轨迹令人瞩目。他创立的Agency利用AI技术革新客户成功管理领域,填补了CRM系统的空白,引起行业关注。,7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为,Hugging Face旗下Gradio5发布,致力于简化AI开发,提供企业级安全性和AI Playground功能,进一步推动AI应用开发体验。
英伟达与麻省理工学院、清华大学合作开发的Sana框架能高效生成高达4096×4096分辨率的图像,且在笔记本电脑GPU上运行。Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。虽存在局限性,但Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。,Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能,🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破,👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。,🔒 数据查看在严格控制的安全环境中进行,禁止携带录音设备。⚖️ 未来可能面临更多法规,推动AI数据透明度的要求。📝 OpenAI同意向律师披露训练数据,满足版权诉讼需要。