日前,小米大模型团队通过“Xiaomi MiMo”公众号宣布,小米开源首个“为推理而生”的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。
据介绍,MiMo 是来自全新成立不久的“小米大模型 Core 团队”的初步尝试。
在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
官方表示,MiMo 推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包括:
预训练:核心是让模型见过更多推理模式。
数据:着重挖掘富推理语料,并合成约 200B tokens 推理数据。
训练:进行了三阶段训练,逐步提升训练难度,总训练 25T tokens。
后训练:核心是高效稳定的强化学习算法和框架
算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。
框架:设计了 Seamless Rollout 系统,使得 RL 训练加速 2.29 倍,验证加速 1.96 倍。
结合官方给出的数据报告,相较于目前广泛使用的强化学习起步模型DeepSeek-R1-Distill-7B和Qwen2.5-32B,小米的MiMo-7B 在相同RL训练数据情况下,数学&代码领域的强化学习潜力显著领先。
目前MiMo全系列模型均已开源,作为“小米大模型Core团队”的初步尝试,MiMo实际表现力如何,大家可以保持关注。
与此同时,博主@数码闲聊站 发文称,“6.83"1.5K LTPS 2.5D大直屏+直角金属中框,红米新机这个大宽屏大R角方案可以适应一下。”
虽然图片中的手机显示为REDMI Turbo 4 Pro,不过结合评论区来看,该博主可能在暗示K80至尊版也将会采用类似的外观设计方案。
按照该博主的说法,REDMI K80至尊版有望采用6.83英寸1.5K LTPS 2.5D大直屏+直角金属中框方案,屏幕较宽且R角较大。
前置摄像头采用中置打孔设计,四周边框为近似四等边设计,屏占比较高,预计会带来不错的视觉效果。
不过,大宽屏+直角中框的设计可能会对手机的握持手感造成一定的影响,暂不清楚REDMI是否会进行针对性的设计或优化。
同时,参考REDMI K70至尊版,REDMI K80至尊版的机身背面可能会延续REDMI K80 Pro的外观设计:同色系拼接背板、左上角后置大圆形Deco。
综合此前爆料,REDMI K80至尊版有望在今年6月底发布,搭载联发科天玑9400+处理器。该处理器采用台积电3nm工艺,全大核架构,8核CPU包含X925、X4和A720核心,安兔兔跑分为250万左右。
同时新机还将搭载一颗独显芯片,进一步优化手机的游戏性能,内置超过7000mAh的超大电池,支持百瓦有线快速充电,不支持无线充电,配备一颗5000万像素的大底主摄。