对话技术明星丁琰:具身智能融资超500亿,UMI技术为何突然爆红
创始人
2025-12-19 10:22:18
0

文 | 白鲸实验室

具身领域里,恐怕没人比丁琰更能感受到行业的巨震和疯狂。

9月30日,他任职的一星机器人,因为吉利战略收缩,成立不到半年意外解散。时任CTO的丁琰在随后短暂的33天里,罕见地完成了别人可能需要数年完成的人生轨迹,失业、创业、融资、被收编。

一直到11月2日,丁琰以联席CTO的身份加入明星初创公司鹿明机器人,他带着昔日的10余名骨干终于安定下来。他形容这段经历,每天的信息都在爆炸,人生几乎以10倍速度快进。

去年他留学归国,意外站在具身行业最炙热的前沿,在市场上大受青睐。他是最早将GPT-2模型融入机器人的研究员,博士期间发表论文有上千引用,回国后又all in UMI技术(一种数据采集技术,相比当下的遥操作方式,采集效率提升3~5倍,成本降低近90%),成为国内最大的UMI玩家。时代的机遇放大个人的际遇,推着他往前跳跃。

丁琰加入鹿明不久,UMI技术因为美国具身公司Genralist、Sunday Robotics火爆,在国内也意外走红。

丁琰再次被推到时代前列。市场放量增长,鹿明机器人的UMI数据采集工厂也在同步扩增。同时,鹿明机器人也刚完成来自鼎晖投资、南京创投等多家机构的数亿融资,这也预示着已经发布四款机器人产品的鹿明机器人,从数据入口、模型到本体实现全栈自研,真正步入具身赛道的旷野。

在这次访谈中,丁琰不仅首次分享了离开一星加入鹿明这一阶段的疯狂和割裂,也系统性复盘了UMI数据采集与模型训练中不断精进的认知。

今年具身智能融资超过500亿,仅11月公开宣布的融资案例就超过35起,临近年末,具身行业依然表现出火热的劲头。丁琰说,第二梯队公司也成长起来了,“FOMO”(担心错过)的投资机构在加速上车。

以下是《白鲸实验室》和他的对话,为了文本阅读方便,我们做了精简处理。

以10倍加速的33天

白鲸实验室:最近多家具身智能公司,包括鹿明机器人在内,纷纷宣布获得数亿融资,在当前商业落地仍不明确时,行业还在加速?

丁琰:我个人感受是,从资本以及带动人才的涌入来看,确实是一个加速过程。

现在具身智能行业梯队已经分明,第一梯队公司估值动辄上百亿,对投资人而言价格太贵了,而且普遍营收低迷,能不能上市、 带来回报,充满不确定性。第二梯队公司也成长起来了,还未入局的投资人有一种普遍的忧虑——担心错过上车的机会,所以会涌入第二梯队里有潜力的公司。

白鲸实验室:你的经历非常有意思,去年博士毕业后去上海AI Lab,一家实验室,今年先后去了吉利的一星机器人(由于吉利战略收缩,成立半年自动解散),目前在鹿明机器人公司担任联席CTO,经历身份的巨变,有没有更加坚定的信仰?

丁琰:这个问题挺好的,我的经历确实挺压缩的,在极短时间里,疯狂地经历各种起伏。我就职的这几家风格也完全不同,上海AI Lab属于国家级实验室,更多偏向学术研究,可能只有20%偏向工业。一星机器人属于大公司(吉利)孵化的一个,有自己的场景和业务线,只需要服务好自有的业务线,而鹿明属于明星初创公司,商业化落地和技术研究一样都很重要。

过去几年,我见证了具身智能从少有人问津到火热的过程,越来越意识到具身智能绝对是未来,唯一的问题是商业化落地,这相当于是一个战场。这么多玩家入局,想要生存,必须把所有战略资源、研究重点集中起来,准备好在未来6-8年打一场硬仗。这也是行业重塑的过程。

这一点我非常坚定,在上海AI Lab或者一星时,可能都没那么坚定。

白鲸实验室:为什么?

丁琰:可能因为鹿明离这个战场的核心地带更近。

白鲸实验室:一星不近吗?

丁琰:一星相当于大公司的后花园,有一个大家长把你保护起来,离前线还是稍微远一些。而鹿明这样的初创公司,离炮火更近,可以近距离看到战争的全貌。

白鲸实验室:离得更近,不会觉得商业化更难,现实更骨感吗?

丁琰:换家公司我可能都会很担心。有些公司疯狂融钱,只画饼,在商业化上没有任何落地,没有闭环,会让人觉得害怕。而鹿明属于另一种,一直在做商业闭环。

白鲸实验室:有没有逐渐祛魅的想法?

丁琰:基本上没有。

白鲸实验室:今年10月一星解散,到11月初加入鹿明,时间很短,很多人向你投来橄榄枝。

丁琰:我从美国留学归国后,对时间确实有非常明显的体感差异。我在美国读了五年博士,感觉时间过得很漫长,回国后,每天感觉都是加速状态。在上海AI Lab,可以看作2倍在加速,在一星相当于3到5倍在加速。离开一星后的过渡期,我觉得是10倍加速,手机上的信息非常爆炸,每天都逼着你做决定。

从9月30号知道一星解散的消息,到11月2号加入鹿明。这期间,我们还筹备了一家公司,做各种路演,都融到资了,有一家投资公司已经给TS(投资意向书),还有两家准备投。其中一家准备打钱的前一天,我决定不干了,还去一家企业待了三天,发现不对劲,后来选定了鹿明。

白鲸实验室:你说当时手机都爆掉了,有多少家具身智能公司邀约你?

丁琰:没有30家,也得有20来家,工作机会非常多。

白鲸实验室:怎么就确定是鹿明了呢?

丁琰:鹿明的CEO是创业者行列里最懂技术的那一批,同时也懂商业,这是一个非常少见的组合。

白鲸实验室:具身智能行业里的创业者,纯技术出身的还挺多。

丁琰:不太一样。具身智能行业里纯技术出身的创业者,有些是做大模型出身的,有些是做自动驾驶出身的,我更偏向于选择机器人出身的团队。

白鲸实验室:会有什么不同吗?市场上有不少声音认为,自动驾驶技术离具身智能很近。

丁琰:我从来不觉得这两者贴近,反而认为区别非常大。举个例子,做自动驾驶的人,是不需要考虑车是怎么造的,硬件已经很成熟了。而具身智能需要去造机器人,还有不同形态的机器人,算法和数据都没有完全实现跨本体迁移。

比如数据,作为预训练是可以用的,但是在精细化操作时,完全不能使用。如果可以使用,UMI技术也不会这么热闹了。

白鲸实验室:你经历的大起大落,似乎是中国具身智能行业今年火热的一个缩影,很有代表性。当时为什么没有自己创业?

丁琰:创业对于创始人的心力要求很高,说实话,我觉得自己hold不住。这里面最大的问题是人的管理。鹿明的团队有很强的资源整合能力,原有的硬件业务和我们数据业务也很互补。

UMI技术不只是数采,而是类似基建的系统

白鲸实验室:你从加入上海AI Lab,到现在一直研究UMI技术,有没有始料未及的问题?

丁琰:其实没有什么始料未及的问题,我很坚信自己的技术直觉。

我在上海AI Lab还是挺幸运的,当时只是一位研究员,实验室leader对我们很宽容,允许我们all in 一个当时还不明确的方向。其实最大的难题是如何说服其他12位PHD(博士)和硕士一起做UMI技术研究,这是非常难的,一旦出现一点问题,这事就黄了。事后回顾,如果重新来一遍,能不能成功我都没有把握。

白鲸实验室:你是如何说服他们的?

丁琰:我一直觉得UMI不单单是一个数采技术,而是一套体系,有点像基建。在这个基础上,你可以起万丈高楼。我当时就这样告诉大家,很多人也是有这个信仰的,也一直在研究这个领域。

我当时写过这样一句话,硬件、数据、算法和系统是很难分开的。我们不仅要实现硬件的自给自足,算法也要根据硬件和数据特征开发,系统适配前三者,让这四块形成内循环,大力气搞infra,才能走得更稳健。

白鲸实验室:国内今年多地流行建数据采集工厂,为什么普遍都采用遥操作的方式,而不是UMI技术?

丁琰:数采厂可以消耗掉一大批机器人本体,相当于帮助具身智能公司卖机器人设备了。如果站在数据的通用和资产化的第一性原理来看,UMI数据是正确的选择。

白鲸实验室:一个百万级的数采厂需要多少机器人?

丁琰:百万级都不行,得千万级。我觉得数采厂,至少7成的钱都花在硬件上。数采厂普遍管理成本很高,尤其对数采员的管理,因为这个工作非常枯燥,重复性劳动,通常又是外包,大家并不会很用心,导致采集到的数据质量不会很高。

比如一个关门的动作,常规情况需要机器人的爪子拿着门把手一推,但实际上采到的数据里,可能一些数采员直接用手推开的,轨迹数据完全不能用。后续数据清洗时,工作量会很大,合格率估计很低。

鹿明在数据质量管控方面采取了极为严格的标准,创新性地构建了六道数据检测与校验流程,从采集、处理到交付进行全链路质量把控,最大程度保障交付给用户的数据具备高一致性与高可信度,能够稳定支撑模型训练与性能提升。

白鲸实验室:国内流行的数采方式是遥操作,和你们的UMI技术的主要区别是什么?

丁琰:完全是两个流派。遥操作是人实时控制机器人执行任务,要依赖机器人本体采集数据,而UMI不依赖机器人硬件或本体,通过独立的采集设备,如手持装置、头戴装备等,记录人类的操作过程,这可以迁移到不同的机器人身上。

如果不考虑效率、成本和硬件适配,遥操作机器人采集的数据信息量比较多,模型好训,不需要处理。而UMI技术采集的数据最大的优势是效率高、成本低和异构本体适配,不过对数据后处理要求很高,这正是行业的门槛。

白鲸实验室:最近比较火的两家美国具身智能公司Generalist、Sunday Robotics,采用的也是UMI技术,会影响国内数采方式吗?

丁琰:已经影响了,至少观点刷新了一波,我相信这就是未来,国内公司的数采也一定会follow这一路线。

白鲸实验室:如果follow的话,是不是意味着早期建的数采工厂是一种资源的浪费?

丁琰:对,但是UMI是一场革命,它必然发生。目前国内全栈跑完UMI整套流程,拥有商用数采设备、数据处理、数采工厂和模型验证的,只有鹿明机器人一家。目前市场对鹿明FastUMI的数采方案需求量非常大,我相信FastUMI会成为未来数据采集的标准,会替代一大部分早期的数采工厂方案。

白鲸实验室:综合考虑来看,这两种数据采集方式是互补的?

丁琰:我的理解,完全不是互补,而是互为取代。

白鲸实验室:你在一星时,包括现在的鹿明,也有自己的数采工厂,UMI技术获得数据还对外出售,商业模式上算跑出来了吗?

丁琰:苗头已经很明显,目前势头很好。

白鲸实验室:难点是什么?

丁琰:整个商业模式现在处于大混战中。每家具身智能公司都觉得数据是弹药仓库,都要自己建,哪怕利润很低。可能过一段时间,形势会更明朗。大家会发现数采厂特别难搞。投入和产出也不成正比,如果管理不当,或者技术不够优秀,实际上是亏钱的状态。

这个时候,三方的数据服务商的价值就会凸显,这也是鹿明正在快速深挖的领域。我们已经算是这个市场里做UMI数据的Top1选手。

白鲸实验室:你们现在收入情况如何?

丁琰:具体数字暂时不好说,不过我们有真金白银进账,整体还是不错的,国内外的具身公司基本上都有找我们采买过设备和数据,目前数据采集与交付能力已接近满载。

黎明前夜

白鲸实验室:模型适用scaling law法则(数据越多,训练的模型性能越好),现在的数据集对模型而言处于什么状态?

丁琰:还是一个黎明前夜,大家都知道scaling law,但数据规模还远远不够。

白鲸实验室:现在训练一个模型,能吃透的数据集是多少?

丁琰:不好判断。但我们自己比较坚持FastUMI路线,提供最高质量的UMI数据。

白鲸实验室:你们是如何突破数据采集规模的?

丁琰:建数采厂,增加产能,也只有这一条路。对初创公司而言,需要很大的决心。刚开始我们计划建一两个数采厂,没想到UMI的需求这么大。现在预期加大,准备增建两三个,一步步往前推。

白鲸实验室:建数采厂的成本不大吗?

丁琰:和传统遥操作数采厂相比,投入的成本会便宜很多,不需要买机器人,就会节省很多成本。

白鲸实验室:能便宜多少?

丁琰:具体数字暂不透露,但价值不仅在于便宜,而在于跨本体适配,才能形成真正的数据市场。

白鲸实验室:行业里有人说过,如果现在一个刚刚起步的具身玩家,一比一复刻Generalist的数采方式和规模,大概需要至少要超过半年甚至一年的时间,不包括数据基建的过程。

丁琰:那太乐观了。可能半年、一年都完全达不到。举个例子,光造抓夹硬件,可能需要四到六个月。采集27万小时需要多久呢?至少也需要1000人,马不停蹄的采集大半年,甚至小一年才能达到。

怎么可能半年就复制出Generalist的规模?除了像我们团队这样有硬件、软件基础,又有资源整合能力的,我觉得中国其他团队,在一年内是不可能有人复制出这种规模。

白鲸实验室:Generalist现在以每周1万小时的速度增长,鹿明是在过去一个月时间里,积累了1万小时真机数据,这个时长和美国Generalist相比,是什么水平?

丁琰:我们刚刚起步,但我们未来一定比他们快,要相信我们的组织能力和调动资源的能力。

低估机器人的复杂性

白鲸实验室:今年大家讨论的概念太多了,像VLA是今年Figure带火的,你觉得为什么它就成了主流?

丁琰:VLA一直是比较热的话题。以前没有大语言模型,更多是一个视频输入、动作输出。大语言模型火了后,加入进来,是很自然的过程。语言模态加入,参数量变多,模型能记住更多动作,也能更好地完成任务。

白鲸实验室:你曾说VLA还处于非常早期阶段,目前它只能解决机器人不到10%的问题,它不擅长解决的是什么任务?擅长的是什么任务?

丁琰:这个问题非常有意思。首先机器人有不同的派别,以前的传统机器人,通过加一堆特定规则,把专项任务能解决得非常漂亮,效率高、成功率高,问题在于没法泛化。VLA这种范式,相当于用通用的方式,只需要把不同任务的数据输入进去,就可以做得很漂亮。

这似乎是一种趋势,目标很美好,现实是输入的数据完全不够用,导致输出成功率可能只有百分之三四十,完全达不到传统机器人99%的目标。甚至还得花好多精力微调,一旦环境有一点变化,成功率又下降。解决问题的效率也跟不上,整个解决方案也不怎么顺滑优美。

VLA肯定是未来,但还有很长的路,现在许多任务它都解决不了。像颠勺做菜这类看起来简单的任务,即使是世界上最牛的VLA模型成功率也不会很高。

白鲸实验室:VLA的问题是因为数据规模太小,影响它的泛化能力吗?

丁琰:一方面是数据的问题,目前真机数据规模太小。

另一方面也是模型架构问题,现在有一种趋势,总觉得一个模型能解决机器人的所有问题,这低估了问题的复杂性。比如躲避障碍物,效率,遇到一些日常意外怎么解决,模型实际落地中会冒出很多问题。如果脑子里只有一个VLA或者其他什么模型,我觉得这是有问题的。

白鲸实验室:关于VLA和世界模型的定义分歧很多。有人觉得世界模型是方向,还有人觉得VLA才是核心,世界模型只是VLA的虚拟环境,通过世界模型生成的虚拟数据,可以反过来提升模型的效率性能。你怎么看?

丁琰:VLA是一个很宽泛的定义,只要有一个vison和language输入,然后生成一个动作行为,我认为就是VLA。另外,部分VLA模型中间某个模块依靠一个世界模型来完成,如果按照这种定义的话,我觉得VLA是包含世界模型的。

白鲸实验室:模型训练时,吃透数据是不是一个难题。

丁琰:需要很多耐心和试验,我总觉得机器人是一个经验性工程。你得疯狂的去做试验、试错,才能得到一些insight和know-how(这两个英文单词都强调,真正下场踩过坑,才能获得的经验)。怎么吃数据其实也是在不断试错中调整的。

白鲸实验室:这个吃透数据过程进展到什么程度了?

丁琰:不断去探索数据的边界。我们觉得数据就像宝藏,现在探索的可能才十分之一。什么样的数据算好,什么样的不好,为什么不好,怎么采好数据,这数据需要多少模态,每个模态之间怎么影响,这都是非常大的问题,但对完成任务是很有价值的。这些我们一直在探索,也需要很长的时间。

白鲸实验室:目前你们能看到数据的局部边界吗?

丁琰:没有,我们自己反正没找到,我觉得这个边界还挺远的,我们才探索了一部分。

白鲸实验室:你怎么看仿真数据和真机数据?

丁琰:我觉得这是不同的流派。我不是很相信仿真,甚至觉得两者的差距有点大。但是仿真肯定是有用的,只是说这个用处多大,我没有探索,也不好评价它的边界。

我一直有个比方,如果你想把真机数据跟仿真数据混在一起,有点像做菜,把一个冬瓜跟苦瓜混在一起,能不能做好,是可以的。绝对比单独做一个冬瓜或一个苦瓜要难的,多少比例,什么时候加入什么样的数据,这个工作量会很大。

人的精力和资源都是有限的,我只能all in到一条线上去,不能再分散精力去探索仿真数据的边界。

白鲸实验室:你们目前模型的训练,百分之百都是真机数据吗?

丁琰:对,百分之百都是真机数据。

白鲸实验室:最近有一家具身智能公司极佳世界,刚发布了一个具身的世界模型,其中仿真数据占比达到了90%,在具体的泛化维度上实现了三倍的性能提升。

丁琰:它们属于另一个流派,对算力的要求很高,这两个流派的隔阂很大,我无法评价。

白鲸实验室:业内也在探索真机数据和仿真数据的比例,比如9:1,你会担心多种数据的结构,会在模型训练时取得更好效果吗?

丁琰:不会担心,目前来看,数据问题的边界还远没有探索出来,不好评价。

白鲸实验室:像中国的这些数采厂,消耗不了的数据,完全可以出海?

丁琰:对,很多人都在做了。

具身行业也需要像OpenAI一样的领头羊

白鲸实验室:最近你在认知上最大的变化是什么?

丁琰:我觉得可能是我不只考虑技术了,在商业化上更成熟,我们CEO的商业思维非常好,对我影响很大。设计一款产品时,有些因素我没考虑到,他就会从商业化,或者供应链的角度上提供分析。比如数采厂,我们一下扩增3个,我担心吃不下,他会给出具体的分析,说3个刚刚好,目前来看他的判断是很准确的。

白鲸实验室:你来鹿明后,会做一些技术上的折中和妥协吗?

丁琰:折中是有的。具体怎么折中的话,比如说对资源的利用,人员的配比上,更偏向一些懂商业的人,而不是一个纯技术公司引导的模式。

我觉得不能叫妥协,妥协的隐含意好像心有不甘。经历过一星的事情后,我的想法变了很多,让大家活下来更重要,不能一味满足技术追求,这是很不负责的表现。

白鲸实验室:你觉得一星在商业或者技术上有没有激进的地方?

丁琰:一星倒不是激进,这种判断对一星很不公平。一星已经非常自由,也没有对不起人,这个事儿(解散)不是一星能决定的,是吉利集团决定的。

白鲸实验室:大家可能没有批判一星,而是批判吉利。

丁琰:商业是很复杂的一个行为。人需要妥协,需要考虑更全局的东西,不能太自我,这在商业世界里是忌讳。

白鲸实验室:你之前有提到在一星未做完的事情,要在鹿明继续做,这个指什么?

丁琰:其实就是把整个FastUMI系统搭建好,这个思路一直没有变。我的目标就是希望一年之内能运转起来,形成闭环,如果能完成,就已经很牛了。

白鲸实验室:Generalist的目标很明确,就是要做什么事情都能做的机器人,鹿明呢?

丁琰做成具身领域基础设施,数据平台和硬件平台构建好。

白鲸实验室:目前鹿明内部最可能率先闭环的是UMI系统,是不是?

丁琰:UMI系统的确闭环挺快的,现在已经看到闭环的苗头了。(笑)

白鲸实验室:现在机器人的基座模型还没有达到GPT3的水平。GPT从2.0到3.5版本,参数量有上百倍的增长,反观具身智能赛道,从数据上看还没有形成这么大规模吧?

丁琰:是这样的,具身世界也需要一个领头羊,这个领头羊是谁我不知道,可能是Generalist。他确实证明了某种成功。但是问题在于,他选择的路线很独特,没有像OpenAI产生很大的价值,可以重塑一个商业模式,通过付费形成收入闭环。

Generalist的价值闭环目前没找到,现在只是发布一个会叠乐高、叠衣服的demo,这种场景的商业化落地在哪里?大家怎么跟,投入多少,我觉得都会影响从GPT2到GPT3的进展。比如说像宇树、智元等行业第一梯队的具身公司都跟进尝试的话,是不是GPT3才会来?

白鲸实验室:有一位行业人,把今年的具身智能比作2015年的自动驾驶。

丁琰:我觉得这种比较没意义,这完全是两个赛道。自动驾驶可以一家独大的,只需要在车里面搭载个系统,最后牌桌上剩几个玩家。但是机器人最后不可能只剩下三个玩家。机器人市场很分散,因为场景太多了,至少相当一段时间,不可能一家公司的模型把所有的场景全吃掉。

白鲸实验室:我之前有看到一位具身智能行业里的人,说大厂的成本很抽象,买几千张显卡审批很容易,但是采购上百台这个机器人却很难,对现在刚毕业的具身行业的年轻人,你会建议他们先去大厂还是初创公司?

丁琰:这个事儿其实也挺难说,因人而异吧。在创业公司,有一种共同做事业的感觉。在大厂就有点像领工资那种状态,没有自由,但更稳定一些。就是看你想要以什么样的心态去做事。

大厂的战略目标,可能会更加细致具体,对于下面的员工而言就是要坚决执行。初创公司可能有一点好处,它的打法和战略调整非常快,每个人做的事情也更有灵活性。

相关内容

热门资讯

为何偷地沟油 在美国是重罪? 【留美学子】第3700期 12年国际视角精选 仰望星空·脚踏实地 【陈屹视线】教育·人文·名家文摘 ...
谷歌这波太绝!AI同声传译不仅... 近日,翻译领域,科技巨头谷歌甩出一个大招: 将刚刚升级的Gemini 2.5 Flash 原生语音模...
黑科技透视!wepoke调控参... 黑科技透视!wepoke调控参数,wepoke有挂吗网上靠谱吗,2025新版技巧(有挂教学)-哔哩哔...
黑科技挂!云扑克德州PK(智能... 黑科技挂!云扑克德州PK(智能ai)太坑了是有挂(介绍教程黑科技教程)-哔哩哔哩进入游戏-大厅左侧-...
黑科技辅助"WePo... 黑科技辅助"WePoKe透视挂"微扑克ai机器人打德州(其实真的是有挂)-哔哩哔哩1、实时微扑克ai...
黑科技辅助挂(智星德州菠萝偷偷... 黑科技辅助挂(智星德州菠萝偷偷看牌功能)外挂透明挂辅助器(透视)都是有挂(黑科技工具)-哔哩哔哩进入...
黑科技ai代打!wpk俱乐部,... 黑科技ai代打!wpk俱乐部,微扑克ai辅助神器,辅助教程(有挂技巧)-哔哩哔哩是一款可以让一直输的...
黑科技好友!微扑克微乐辅助(黑... 黑科技好友!微扑克微乐辅助(黑科技)太坑了真的有挂(透明挂教程黑科技方法)-哔哩哔哩1、全新机制【微...
黑科技辅助"德州ai... 黑科技辅助"德州ai辅助神器"wepoke软件(切实是有挂)-哔哩哔哩;1、让任何用户在无需德州ai...
黑科技最新(德州ai辅助有用)... 黑科技最新(德州ai辅助有用)外挂黑科技辅助下载(透视)竟然是有挂(黑科技工具)-哔哩哔哩1、完成德...