Nvidia悄然推出了一款名为Llama-3.1-Nemotron-70B-Instruct的新型人工智能模型,表现出色,已超越了OpenAI的GPT-4和Anthropic的Claude3.5,标志着人工智能领域竞争格局的重大变化。该模型在知名AI平台Hugging Face上发布,引起业界关注。Nvidia展示了强大的AI软件开发能力,支持企业探索AI解决方案。然而,用户需谨慎使用,避免错误或滥用。,Molmo是一款开源多模态人工智能模型,基于Qwen2-72B和OpenAI的CLIP,以高效性能和创新功能挑战传统商业模型。其突出特点在于小巧高效、引入指向功能、性能优异、开源性质和全面功能。Molmo的成功归功于高质量训练数据和多样性,展现出色的多模态交互能力。,💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。,7、AI玩具设计师来袭:3D玩具设计工具Toy Box Flux
🚀 Nvidia股价创下138.07美元新高,年内涨幅近180%。📊 公司在AI芯片市场占有率高达70%至95%,市值达3.4万亿美元。💡 CEO黄仁勋表示新一代Blackwell芯片需求“疯狂”,已售罄至明年。,Sieve AI初创公司推出的创新技术旨在改变视频互动方式,通过实现视频中眼神接触的自动修复,提升视频内容的吸引力和互动性。该技术能快速集成到现有应用中,解决视频缺乏眼神接触的问题,特别适用于需要演讲者直视镜头的场景。Sieve的实时视线修正技术精妙运用AI模型和神经网络,实现眼神角度调整,保持视频流畅自然。
🔒 数据隐私成为2024年生成性AI的主要担忧,关注从22%跃升至72%。📈 78%的商业领袖将“安全和保障”列为伦理技术原则之一,强调安全性的重要性。⚖️ 欧盟AI法案的实施影响深远,促使公司在AI使用上进行必要的调整与合规。,Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。新功能集多样化应用和个性化体验于一身,提升交流效率,满足个性化需求。针对特定场景深化了功能应用,如英语陪练和模拟面试,为学习和职场提供创新解决方案。引入声音克隆技术增添趣味性,持续关注用户反馈,优化扩展语音服务应用范围。,🚀 Sana框架高效生成4096×4096分辨率图像,可在笔记本GPU上运行。🔑 Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。💡 Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。
🎥 Runway公司设立500万美元基金资助100部原创电影项目。💡 百部电影基金计划支持使用公司生成式视频模型的视频项目。🌟 Runway邀请知名人士担任顾问,致力于发现AI生成视频的实用性和开创性应用。,1、Pika1.5重磅上线四个新特效:从粉碎到消失,效果炸裂了!
沃尔玛最近推出了名为Wallaby的大型语言模型,专注于零售行业数据,旨在提升客户服务体验。他们采用多模型组合的方法,灵活应对不同应用需求。升级后的客户支持助手能够更精准地理解客户意图,提供个性化服务。,在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。,🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破,5、沃尔玛推出新型人工智能模型 Wallaby,1、豆包推出Ola Friend智能体耳机:售价1199元
🌟 台积电Q3净利润达101亿美元,同比增长54%。💻 人工智能推动高性能芯片需求,助力业绩增长。🚀 台积电持续扩大生产能力,以满足市场日益增长的需求。,英伟达与麻省理工学院、清华大学合作开发的Sana框架能高效生成高达4096×4096分辨率的图像,且在笔记本电脑GPU上运行。Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。虽存在局限性,但Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。
✨ 企业签署《人工智能契约》自愿承诺,强调人工智能治理战略和风险评估。🌐 签署者需关注工作人员人工智能意识,设计系统让用户知晓与人工智能互动。🚀 《人工智能契约》促进企业填补合规真空,鼓励签署者间合规竞争。,在这篇文章中,OpenAI向法庭申请驳回马斯克对公司的诉讼,称其为“骚扰”行为。文章揭示了马斯克和OpenAI之间的法律纠纷背景,强调马斯克的指控缺乏证据,并质疑他的法律地位。,在数字时代,制作引人入胜的多语言音频内容成为热门话题。谷歌的NotebookLM备受好评,而开源Python软件包Podcastfy引起广泛关注。Podcastfy是开源版NotebookLM,采用先进的生成式人工智能技术,让用户实现更多个性化和规模化的播客制作。,🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。,🌟 o1模型被称为能显著减少 AI 偏见,但测试结果显示其表现不如预期💡 o1在隐性歧视方面表现优于 GPT-4o,但在显性歧视上却更糟糕。💰 推理模型 o1成本高,运行缓慢,未来仍需在多个方面改进。
🚀 Westlake-Omni是全球首个开源的中文情感端到端语音交互大模型,注重实时性和零延迟体验。💡 模型具备出色的情感理解与表达能力,能生成清晰、自然、富有表现力的中文语音。🌱 西湖心辰期望通过开源Westlake-Omni模型,促进更多开发者参与中文情感语音交互技术的发展,OpenAI的首席技术官Mira Murati宣布离职,引发了公司高层人事大变动。离职信中表达了对过去工作的感激之情,同时指出团队取得的成就和技术进步。公司首席执行官Sam Altman表示领导层变动是自然发展的一部分,并安排新的人事安排以确保公司稳步发展。,7、Runway推出百部电影扶持计划
🎬 MOKI专注于AI短片创作,提供动画短片、网文短剧、故事绘本、MV等多种视频内容生产。🤖 MOKI操作简便,用户只需三步即可生成创意短片,包括设定阶段、内容生成阶段和后期制作阶段。🎥 MOKI支持一键生成带配乐的视频内容,虽然目前生成效果有待提升,但产品力得到进一步增强。,1、Kimi推出多功能语音通话模式 支持更换声音语速调节
美图公司宣布其开发的AI短片创作工具MOKI正式对所有用户开放,为用户提供一站式成片能力,结合AI驱动的脚本、分镜、视频生成、配音、配乐能力,使普通用户能轻松上手,快速创作个性化短片。MOKI在中文语意理解准确性和东方视觉风格上表现出色,未来计划提供更多专业功能。,Elias Torres的故事展现了现实版的美国梦,从移民少年到科技传奇人物的成功轨迹令人瞩目。他创立的Agency利用AI技术革新客户成功管理领域,填补了CRM系统的空白,引起行业关注。,火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。,近日,欧盟委员会公布了《人工智能契约》的首批100多家签署者名单,旨在促使企业就人工智能处理和部署发布自愿承诺,填补《人工智能法》实施前的合规真空。签署者将受邀报告进展情况,可能会鼓励签署者之间开展合规竞争。苹果和Meta尚未加入。,英伟达最新一代Blackwell GPU引发了前所未有的需求,CEO黄仁勋透露未来12个月供应量已售罄,市场对高性能计算的渴望再次得到证实。
6、夸张!GPT-4无意中掌握面部识别技术,准确率超越专业算法,近日,欧盟委员会公布了《人工智能契约》的首批100多家签署者名单,旨在促使企业就人工智能处理和部署发布自愿承诺,填补《人工智能法》实施前的合规真空。签署者将受邀报告进展情况,可能会鼓励签署者之间开展合规竞争。苹果和Meta尚未加入。,🔑 AIGC和多模态技术深刻改变用户体验🔑 火山引擎探索AI大模型与视频技术融合,提供全方位解决方案🔑 火山引擎开发的预处理方案优化算法和工程层面,提高模型训练效率,美国联邦贸易委员会(FTC)针对五家涉嫌虚假宣传和欺诈行为的人工智能公司展开执法行动,强调保护消费者和市场公平。部分公司已达成和解,但仍有公司选择对抗指控。专家对监管措施存在担忧,称可能抑制创新。,全新Notion AI发布 一站式 集成搜索、生成内容、分析数据等功能Notion AI以全新面貌强势回归,为用户带来办公体验革命。这款多功能智能助手集搜索、内容生成、数据分析和智能聊天于一体,改变工作方式。
西湖心辰开源中文情感端到端语音大模型Westlake-Omni西湖心辰宣布开源其研发的Westlake-Omni模型,作为全球首个开源的中文情感端到端语音交互大模型。该模型采用离散表示法统一文本和语音模态,注重实时性,提供零延迟体验。具备出色的情感理解与表达能力,生成清晰、自然、富有表现力的中文语音。期望通过开源鼓励更多开发者参与中文情感语音交互技术的发展。,🚀 Elias Torres从17岁移民美国到创立Agency,展现现实版美国梦的传奇故事。💡 Agency利用AI技术深度学习客户数据,自动化处理客户需求预测、日程安排等任务,填补CRM系统空白。💼 Agency获得1200万美元种子轮融资,得到Sequoia合伙人和HubSpot联合创始人的支持,展望广阔的发展前景。