成立一年半以来,这家公司动作频频。,🎬 Runway将利用Lionsgate两万部影视作品创建定制AI视频制作模型,应用于故事板和特效制作。,🌟 首个大型电影公司与AI视频模型供应商直接签订协议,标志着行业合作新纪元的到来。,实现需求、边聊边研发,上线半年内,Tripo1.0全球用户生成的3D模型超过了500万个。
AI 程序员生成的完整需求较长,此处并未完整展示。,生成好的3D模型还可以一键绑定骨骼、风格化。,博文表示,虽然o1模型距离人类的顶级表现还有很长的一段路要走,但我们期待有一天能实现这个目标。,大会的展台上,一位13岁的中学生在通义灵码上输入了几句话,AI 程序员在两分钟内就生成了一个 Python 语言编写的倒计时网页。,Fal.ai是一家专注于AI生成音频、视频和图像的云平台,最近成功融资2300万美元。该平台吸引了知名投资者和众多开发者、企业客户,展现出巨大潜力和市场需求。未来,Fal.ai将加强内容审核和模型优化工作,以更好地应对生成技术带来的挑战。
🚀 AI技术在多模态能力、推理成本、技术可用性等方面取得巨大进步,超越摩尔定律。,Tripo2.0支持文生3D、单图生3D;Tripo1.4版本也支持多图生3D。,另一个值得关注的数据,QuestMobile数据显示,当前主流AIGC类APP的月人均使用天数基本低于5天(仅有星野达到7.7天),导致活跃率普遍低于15%(星野、文心一言、天工、豆包分别为25.7%、16.8%、15.2%、15.1%)。
大模型厂商们希望更多的用户来训练“调教”产品,用户有限的使用次数显然无法让他们来实现这个目标,好处是,厂商成本也不太多。,可以看到,o1-preview对所有模型的胜率都超过了50%,对比04-09版GPT-4-Turbo的胜率最高,达到了88%。
一直以来,外界对3D大模型赛道的关注度都稍逊于语言模型和视频模型。然而,全球3D大模型选手们则都在暗中较量、默默发力,从a16z押注的Yellow,到李飞飞的World Labs,3D大模型的迭代速度是没落下一点。,这不,一个拿着“花开富贵”大姨人设的Agent直接甩了个链接,对面的AI客服就开始大段大段冗长回复,几个回合都是如此。,在语言模型和视频模型带给这个世界一点小小震撼过后,人们也希望3D生成赛道能滋养出属于自己的ChatGPT时刻。,通义千问团队宣布开源Qwen2.5系列模型,包括通用语言模型Qwen2.5、Qwen2.5-Coder和Qwen2.5-Math,预训练在18T tokens数据集上,提升知识获取、编程和数学能力。支持长文本处理,生成最多8K tokens内容,保持对29种以上语言的支持。提供多种规模版本,采用Apache2.0许可证。Qwen2-VL-72B模型性能媲美GPT-4,在指令执行、长文本生成、数据理解和结构化输出方面有显著改进。,我们让 AI 程序员简单地分析了这个项目并提出了改进意见。点击「确定」,AI 程序员就能替我们完成代码改进。
最近,字节跳动推出了音乐创作新工具 Seed-Music,让用户通过多种方式生成音乐,如文字描述、音频参考、乐谱甚至语音提示。这一神奇模型结合自回归语言模型和扩散模型,生成高质量音乐作品,同时提供精确控制。用户可配乐歌词、改编旋律,甚至上传语音片段转化为歌声,功能强大且高效。,OpenAI想要达成的,估计就是究极进化的、能在编程上碾压人类顶级高手的AlphaZero。