“狠人”闫俊杰,闯关IPO
创始人
2025-07-11 17:01:54
0

来源:中国企业家杂志

“MiniMax在探索一条之前没有被验证过的路。”

|《中国企业家》记者 孔月昕

编辑|马吉英

头图来源|受访者

6月17日,在MiniMax官方公众号发布了全球首个开源大规模混合架构推理模型MiniMax-M1后,公司创始人闫俊杰随即转发到朋友圈,并配文称:“第一次感觉到大山不是不能翻越。”

之所以这么说,是因为M1模型通过以闪电注意力机制为主的混合架构和更快的强化学习算法CISPO(一种强化学习算法,通过裁剪重要性采样权重提升强化学习效率)两项技术突破,实现了深度推理的显著高效,并提升了强化学习的效率。据公司介绍,整个强化学习阶段只用了512块H800三周的时间,换算成(算力)租赁成本为53.47万美元。

除了M1外,在之后的4个工作日里,MiniMax又连续发布了Hailuo 02视频生成模型、MiniMax Agent通用智能体、Hailuo Video Agent视频创作智能体、Voice Design音色设计。在MiniMax Agent发布当天,闫俊杰的朋友圈配文是:“研发中越来越强烈的感受是AI的价值可以开始被经济来衡量。”

与此同时,MiniMax在资本市场也有新消息传出。6月,公司被爆出正考虑在港股IPO的消息。

来源:受访者

这一消息并非空穴来风:早在2024年,MiniMax旗下产品星野AI(Talkie)的营收已突破千万美元,在海外市场表现尤其出色,下载量曾超越CharacterAI,成为美国AI应用Top4。财务实力的支撑更为关键——知情人士透露,公司今年以来通过多轮未公开融资,积累了充足的现金储备(约十几亿美元)。近期还完成了Pre-IPO融资,使其成为大模型创业公司中资金最雄厚的玩家。

截至发稿,对于资本市场相关进展,公司方面并未正面回应。

充足的现金储备让闫俊杰具备了高度的战略自主权,也让这位“赌性”很重的创业者,能坚定推行“加速技术迭代”的发展路径。明势创投合伙人夏令此前参加活动时,曾评价MiniMax是“一家兼具野心、资源实力与非共识坚持的公司”,明势创投创始合伙人黄明明则称,“闫俊杰是一个‘狠人’,在资源等方方面面有限的情况下,他还是专注在模型研发上。只有这样的企业家可能才能走得更远,走到终局。”

锚定MoE架构破局

2021年12月,商汤上市前夕,作为副总裁、研究院副院长和智慧城市事业群CTO的闫俊杰,选择离开商汤。

在闫俊杰看来,2020年之前,AlphaGo做过很多东西,整个社会对人工智能的关注度和期待值都非常高,且国内外都投入了大量的研发资金,但当时的人工智能只能做一些非常简单的事,比如人脸识别、语音识别等,创造的社会价值比较低。

对于当时的闫俊杰来说,这是一件“很痛苦的事”,他逐渐意识到,核心因素在于当时的人工智能不够通用。

来源:AI生成

“当时我们用虚拟模型解决客户的问题,一旦客户有无数个问题,就得做无数个模型,即每做一个模型就要训练一次,还要导数据,整个生产链条非常慢。因此我们只能服务一些大客户,因为企业需要定制,但定制的成本周期很长,商业模式也变成了定制模型。”闫俊杰回忆。

他在思考的是,“如果不做定制模型,把模型做得通用,是不是就可以服务普通人了?”

同时,闫俊杰恰好看到了OpenAI关于GPT-3的论文,并受到启发,“把(GPT)模型放大10倍,技术路线就可能成立了。”

不过,做通用的工具和闫俊杰在商汤的研发路线完全不一样,需要的人才、组织结构也不一样,闫俊杰由此发现,“这应该是一家新兴公司的机会。”2022年初,MiniMax正式成立。

云启资本是MiniMax早期投资方之一,合伙人陈昱最初跟闫俊杰接触时,就发现闫俊杰是一位野心比较大的创业者,“他想做中国的OpenAI或DeepMind,最终实现通用人工智能”。

在技术路线的选择上,闫俊杰也非常大胆。

2023年下半年,大部分中国同行还在继续迭代稠密模型(dense model),它能更稳健地提升大模型性能。闫俊杰则几乎把全部研发和算力资源都投到了一件更不确定的事情上——MoE(混合专家系统)模型。

黄明明回忆,彼时,MoE在硅谷都不是主流共识,只有OpenAI在做,甚至MoE的提出者,都没有把MoE这条路坚持走下去。

在闫俊杰看来,尽管OpenAI尚未公开GPT-5,但其内部已完成了该模型的训练。GPT-5的训练需要高达5万张卡的算力,短期内,国内难以达到3万张卡的规模,因此若要实现与GPT-5相当的效果,必须采用更高效的算法(MoE),否则就永远追不上(OpenAI)。因此,MoE也成了团队“一定要做的事情”。

2023年夏天,闫俊杰带领MiniMax团队开始专注研发MoE。

黄明明认为,闫俊杰看上去是一个很温和的人,实际上他很疯狂。在认定终极目标后,他会把所有资源all in,去赌这个事情。

“他把当时手头80%的算力资源都用来推MoE。”黄明明说,“前两次是失败的,直到第三次成了,他才跑过来跟我们(投资人)讲,MoE差不多能搞定了。”

黄明明问闫俊杰:“为什么你要赌这么大?你赌不出来,可能这家公司就挂了。”

闫俊杰的回复是,“只有我把MoE做出来,才能用更低的成本向更高的模型阶段去演进,否则用的是一个不可估量的成本去往下一步,没有一家公司能支持这样token的消耗量去往更高的平台进化。”

应对DeepSeek,慢了一步

2025年1月15日,MiniMax发布了首个开源模型MiniMax-01系列。

在接受晚点采访时,闫俊杰指出,开源的核心价值在于加速技术进化。“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”闫俊杰说。想清楚“智能水平的提升,没那么依赖用户规模”后,闫俊杰做出了取舍,他认为现在MiniMax最重要的目标不是增长,也不是收入,是“加速技术迭代”,并坚定了要做一家技术驱动型公司的念头,开始有意识地打造技术品牌。

但从行业变化看,闫俊杰还是“慢”了一步。2024年12月26日,DeepSeek-V3发布后,在业内形成一定的口碑和品牌效应。2025年1月20日,DeepSeek-R1发布,在大众层面掀起的声量迅速盖过了相对低调的MiniMax,进一步抢夺了C端用户的心智。

面对汹涌而来的DeepSeek冲击波,国内模型厂商主要分成了两队,一队是积极拥抱,大力宣传旗下产品接入DeepSeek;另一队是坚决不接入DeepSeek,并死磕自研自己的推理模型。

MiniMax的选择是,在国内C端应用上坚持不接入DeepSeek,只在海外的AI应用上选择接入DeepSeek。

同时,据MiniMax内部员工透露,DeepSeek发布并没有影响他们研发团队的节奏,内部还是保持原有计划,专注且低调地进行技术研发。

来源:视觉中国

黄明明也表示,他们非常认可MiniMax持续专注在底层模型的研发上。“好的应用或好的产品,都是模型能力自然而然的体现,模型能力强了,一定会做出好的产品。事实证明,当模型能力不够强时,做出的产品就需要很多缝缝补补,打很多补丁,耗费巨大的人力和物力,并丧失你在底层模型上的专注度。”黄明明说。

6月中旬,MiniMax连续发布了包括基础模型及应用在内的5款产品,业内对于其模型和应用的产品评价比较正面,Hugging Face工程师王铁震告诉《中国企业家》:“MiniMax在探索一条之前没有被验证过的路,非常有价值。”

(注:Hugging Face是一家成立于2016年的美国人工智能公司,致力于构建开源的机器学习社区和平台,提供丰富的预训练模型、数据集和工具,帮助开发者更便捷地构建、训练和部署AI应用。)

不过,MiniMax-M1系列模型并未引发大范围轰动。截至7月10日,其在Hugging Face最热帖下载量仅25.2K,GitHub最热帖收藏量仅3K——这一数据明显低于Google、Meta今年初发布的开源模型,也逊色于DeepSeek-R1的收藏及下载量。

部分Agent创业者反馈,虽注意到MiniMax M1模型的发布,但因自身产品上线排期紧张,暂未及时投入测试。另一位AI领域创业者告诉《中国企业家》,当前海外AI领域热点频发(如GPT-5发布在即,Meta新模型迭代),分散了行业注意力,客观上削弱了M1的传播声量。在他看来,国际模型技术仍具备一定领先优势。

对此,一位MiniMax投资人表示,MiniMax一贯的风格是相对低调和克制,它最后交付的产品口碑,可能比大家记住模型名字或下载量更重要。

“你只有最后交付一个产品,才容易做商业化,才有可能达到上市的体量。快手的可灵交付的也是一个生产工具,大家看重的也是产品,而非快手的视频模型。”该投资人补充道。

相关内容

热门资讯

豆豆钱用担保费推高利率至36%... 36%利率里面的“秘密”。 手工劳动/兽妹 手工编辑 /掘叔 出品/独角兽观察 今年来,在扩内需、...
OPPO K13 Turbo系... 今日,OPPO官方宣布,越级性能先锋 OPPO K13 Turbo系列手机将于7月21日全新发布。 ...
AI 终结传统软件业,如同互联... AI 编程工具正推动软件行业走向 " 峰值时刻 "。 近日,芯片金融分析公司 Fabricated ...
北京多模态大模型辅助城市治理|... 2025年全球数字经济大会上,北京市联合40余个国际伙伴城市成立全球数字经济城市联盟,围绕数字基建、...
荣耀申请基于垂直同步信号的图像... 金融界2025年7月11日消息,国家知识产权局信息显示,荣耀终端股份有限公司申请一项名为“基于垂直同...
在担任珠海市公安局局长、市委政... 据高检网7月11日消息,日前,广东省珠海市人大常委会原党组成员张强(副厅级)涉嫌受贿罪一案,由广东省...
海普洛斯满分通过欧洲权威室间质... 深圳商报·读创客户端记 郑恺 近日,欧洲分子基因诊断质量联盟(European Molecular ...
AI+场景创新⑩丨艾灸机器人上... 近日,在焜傲机器人(成都)有限公司“917智能健康小屋”可以看到,艾灸机器人正在工作——选定艾灸模式...
格力电器取得一种电机专利,显著... 金融界2025年7月11日消息,国家知识产权局信息显示,珠海格力电器股份有限公司取得一项名为“电机”...
新能源智能制造新篇章:MES系... 在全球推动“双碳”目标的浪潮中,中国新能源产业迎来了前所未有的增长浪潮。动力电池、光伏组件及储能设备...