🌟 EzAudio 是由约翰霍普金斯大学与腾讯合作推出的新型文本转音频生成模型,标志着音频技术的一次重大进步。,🎮 GiantGPT是专注于游戏业务的垂直大模型,结合自有数据和互联网公共数据进行训练,深度优化基础能力。,今年,从业者们开始抛弃了对“越大越好”的执念。被认为是行业风向标的OpenAI发布了“ o1”以及更小更便宜的“mini”新一代大模型,不止Open AI,微软、英伟达、苹果等头部公司已经相继发布了最新的小型语言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B、OpenELM。,但现实是,高额的成本、千万级的用户,都不足以支撑故事继续。绕了一圈,大模型厂商们还是需要回到现实:一个关于技术与商业化的永恒命题。,但在用户真正的体验中,他们能发挥的作用有限。猎豹移动董事长兼 CEO、猎户星空董事长傅盛在8月30日表示,行业没有出现关键性App,并没有哪家真正哪家用了大模型后提效特别明显。哪怕对用户,一个月要交几十块钱才能用的那种闭源大模型也是智商税。
Fal.ai是一家专注于AI生成音频、视频和图像的云平台,最近成功融资2300万美元。该平台吸引了知名投资者和众多开发者、企业客户,展现出巨大潜力和市场需求。未来,Fal.ai将加强内容审核和模型优化工作,以更好地应对生成技术带来的挑战。,再比如TGS:Triplane Meets Gaussian Splatting,同样被CVPR2024收录。
之前,Tripo2.0背后团队还与其他团队合作,推出了一箩筐学术成果,被Siggraph、CVPR、ICLR、ECCV等顶会接收。,当然,融资方面的引领,也只是技术实力的展现。因为VAST的技术和应用场景,确实够顶。
技术飞快进步的同时,整个行业的人才密度都在不断增大。,从技术上层层解剖,Tripo2.0在实现过程中打满了一个词:3D Scaling Law。,广告为Kimi带来了海量的用户。今年3月20日,因为流量超过了规划,Kimi一度宕机。App Growing的数据显示,从3月到8月,短短6个月,Kimi的广告投入已经将近1.4亿元。,上线半年内,Tripo1.0全球用户生成的3D模型超过了500万个。
o1推理团队的领导者之一William Fedus看到这张图也是相当开心,他表示这张图「很好地用视觉表达了范式转换」。,大模型创业公司最激进的是月之暗面,这家公司旗下的AI智能助手Kimi因长对话能力出圈,是时下最火热的大模型产品之一。Tech星球通过AppGrowning查询发现,今年3月开始,Kimi每个月的广告投放都高达上千万元。3月份,Kimi的广告投放还只有近1500万元,到了7月和8月,高达近5000万元。,可以看到,o1-preview对所有模型的胜率都超过了50%,对比04-09版GPT-4-Turbo的胜率最高,达到了88%。,7、OpenAI在新一轮融资据悉要求投资者至少出资2.5亿美元,Tech星球通过AppGrowning查询发现,今年6月豆包的投放达到了1.4亿元,相当于每天光投放就要花掉467万元,一个月的投放费用比Kimi半年都要多。
另外不得不提的是,通义灵码 AI 程序员无需任何 IDE 工具,web 端就支持全部功能。没错,也就是说,你可以在任何可使用浏览器的设备上进行项目开发!,VAST,去年3月成立,是一家专注于在3D大模型研发的AI公司。,🚨 政府可能介入,实施强制措施如果AI效果不佳。,具体能力上,通义灵码 AI 编码助手立足通义大模型,采用了阿里云首创的代码仓库知识图结构,支持64K 上下文,具备跨文件感知、检索增强式生成(RAG)和自适应生成能力,研发问答准确率超过90%。据统计,通义灵码为已有用户贡献的代码比例已经接近30%。,💡 Anthropic还在开发针对artifacts的创新功能,有望让用户直接将artifacts导出到VSCode编辑器中。