生成式AI
一、 实测Claude 3.7:3200行代码一口气输出,物理规律拿捏
1. Claude 3.7能一次性输出3200多行代码,制作出具有完整游戏机制的可玩游戏;
3. Anthropic获35亿美元融资,公司估值已达615亿美元,新模型被官方定位为"更擅长现实世界任务"。
二、 DeepSeek Day 2 用于MoE训推的EP通信库DeepEP
1. DeepSeek开源MoE训练与推理通信库DeepEP,是首个用于MoE模型的EP通信库;
2. DeepEP实现高效All-to-All通信,支持NVLink、RDMA跨节点通信,适配训练和推理不同场景;
3. 项目迅速获得超1000星标,被认为是MoE并行技术突破,证明DeepSeek技术创新能力。
三、 阿里推出推理模型QwQ-Max预览版,可进行联网搜索
1. 阿里开源QwQ-Max-Preview深度思考模型,支持联网搜索和思维链可视化,计划以Apache 2.0协议完全开源;
2. 模型基于Qwen2.5-Max构建,能进行实时联网推理、代码编写、游戏开发,但实测效果与展示案例有差距;
3. 通义千问将推出轻量级思考模型变体,并推广Qwen Chat App,加入推理模型开源潮流。
四、 AI说书媲美真人!豆包语音大模型升级长上下文理解
1. 豆包语音模型升级,实现媲美真人主播的有声书效果,无需额外标签可端到端合成声音;
2. 技术团队改进Seed-TTS架构,加入上下文理解能力,解决旁白与角色区分、情感表达和声音连贯性问题;
3. 已落地番茄小说平台,基于王明军、李满超两位专业主播声音合成千部有声书,覆盖多种热门书目类型。
五、 特斯拉官宣在华发布 FSD,自动驾驶的「狼」真要来了
2. FSD通过短视频训练应对中国道路,优先推送至搭载AI4.0硬件车型,一次性买断价格6.4万元;
3. 特斯拉FSD入华将产生"鲶鱼效应",加速中国智能驾驶行业竞争格局分化,标志着新能源汽车竞争正式进入"下半场"。
六、 苹果宣布未来四年投入5000亿美元,AI、芯片及先进制造
1. 苹果宣布未来四年将在美国投资5000亿美元,是该公司史上最大规模投资计划;
2. 计划在得克萨斯州建造AI服务器工厂,与鸿海精密合作组装支持Apple Intelligence的服务器;
3. 投资将在美国创造约2万个研发岗位,同时将美国先进制造基金增加一倍至100亿美元,专注研发、芯片工程和AI领域。
前沿科技
七、 英伟达推出AI手语学习平台Signs,采用3D虚拟形象演示
1. 英伟达与美国聋童协会合作推出AI手语学习平台Signs,免费提供美国手语学习服务;
2. 平台采用3D虚拟形象演示手势,AI实时提供反馈,目前提供100种手势,计划扩展至1000种;
3. 用户可贡献平台上未提供的手势视频,英伟达将向开发者开放数据存储库,未来版本将增加面部表情和头部动作等非手动信号。
八、 放弃agent,图灵奖得主提出Scientist AI:避免人类生存威胁
1. 图灵奖得主Yoshua Bengio提出Scientist AI,是一种非智能体AI系统,旨在避免智能体可能带来的人类生存威胁;
2. 当前智能体AI存在目标偏差、目标泛化和奖励篡改等风险,可能导致AI逃脱人类控制;
3. Scientist AI通过限制行动能力、目标导向性和持久内部状态,专注于理解世界而非干预世界,可应用于科学发现和作为其他AI系统的安全护栏。
九、 从零开始自主「起身站立」,上海AI Lab发布最新具身控制算法
1. 上海AI Lab开发HoST算法,使人形机器人能在复杂环境中自主从坐姿站起,展现强大抗干扰能力;
2. 该算法采用强化学习框架,结合多评论家技术、辅助力探索策略和运动约束设计,解决控制难题;
3. HoST在多种复杂地形和外部干扰条件下表现出色,为人形机器人在家庭、医疗、救援等场景应用奠定基础。
报告观点
十、 Snowflake CEO:DeepSeek是好模型,而ChatGPT是一款好产品
1. DeepSeek是优秀模型,但ChatGPT作为产品更具吸引力,因拥有完整功能体系和5亿忠实用户,而非仅提供基础模型能力;
2. 在AI领域,真正的价值来自拥有客户关系并快速拥抱AI技术的公司,创新不仅需要资金,更需要在限制条件下推动发展;
3. 企业级AI市场不会出现单一垄断入口,专业化机会多样,而消费端ChatGPT有可能成为主要入口,AI技术正在创造实际价值。
十一、 中金点睛:DeepSeek的“大模型平权”,是算力拐点还是黑洞?
1. DeepSeek推动"大模型平权"通过MoE稀疏架构、FP8精度训练及GRPO算法等创新,以1/10成本获得与顶级模型相当能力,实现算力使用效率突破;
2. 这些创新是在中美贸易摩擦背景下采购受限情况的较优解,未反驳"Scaling Law",而是通过算法和工程优化降低训练门槛;
3. 杰文斯悖论表明,全行业算力使用效率提升反而创造更大需求,新技术将促使AI训练硬件需求持续增长而非下降。