位于临港的商汤智算中心。 邢千里摄
2014年5月,习近平总书记在上海考察时提出“加快向具有全球影响力的科技创新中心进军”。十年来,上海牢记嘱托,砥砺前行,实现了科技综合实力和创新整体效能的大幅提升,上海国际科技创新中心正从“建框架”向“强功能”迈进。
5月的一天,记者跟随几位科学家、企业家、创业者,记录下科创中心的平凡一天。
这一天很长。从第一缕阳光照进岳阳路上的实验室,到凌晨两点大洋彼岸满怀期许的键盘敲击,科创中心的一天忙碌到不分昼夜、跨越时区。
这一天很短。面对新一轮科技革命和产业变革的突飞猛进,实现高水平科技自立自强的迫切需要,身处创新一线的每一个人都感觉时间飞快,等不起、慢不得、坐不住的紧迫感如影随形。
时间:下午4点
地点:商汤临港智算中心
商汤临港智算中心103会议室,一场有关商汤AI大装置的内部沟通会正在进行。
面对大模型日日新团队提出的新需求,商汤科技联合创始人、大装置事业群总裁杨帆颇有信心地说:“目前大装置现已实现对万亿参数大模型的生产支持,可保持90%的加速效率,具有超30天稳定训练不间断能力。”
2021年世界人工智能大会上,商汤科技推出AI大装置SenseCore,规划算力3740P。如今,大装置的总算力规模已增至12000P,运营GPU高达4.5万张。去年,商汤基于“大模型+大装置”的生成式AI业务录得收入12亿元,占总收入的35%。这也是商汤2014年成立以来从无到有最快超过十亿元收入体量的新业务。
商汤智算中心内景。
2017年,商汤科技正式落户上海。基于未来通用模型需要大算力支撑的判断,公司提出了建设算力大装置的建议并被政府采纳。这件事,当时很多人看不懂,但5年后,远见令人叹服。
市场爆发比预期更快。2022年底,由ChatGPT引发的生成式人工智能浪潮方兴未艾,当如雨后春笋般冒出来的AI企业四处寻找算力时,商汤算力成了价廉物美的代名词。
杨帆似乎“预见”了这一天的到来。经过四年多布局深耕,商汤AI大装置进行了多次技术迭代和创新,解决了软硬件连接、异构调度、可持续性等诸多问题,他们还与上海人工智能实验室一同研发了DeepLink并行计算体系,以确保国产芯适配主流的大模型训练框架和算法库。
商汤科技联合创始人、大装置事业群总裁杨帆。
算力讲究规模效应,拥有“万卡万参”的商汤AI大装置可支撑超过20个千亿超大模型同时训练,并支持万亿参数大模型的全生命周期生成,这对AI生态的吸引力可想而知。上月举行的商汤科技技术交流会,小米、华为、金山办公、海通证券、阅文集团等客户悉数到场,商汤作为AI领军企业的生态位凸显。
从落户上海时的寥寥数人,到如今已有近5000名员工,其中研发人员3000多人,这被商汤视为来沪发展的最大红利。业内认为,商汤科技已经拿到了AIGC时代的“门票”。杨帆感慨说:“我们对未来一直有很明确的判断,‘软硬结合’是一条必须要走的路。同时商汤也是幸运的,正巧赶上了算力需求大爆发的时代。”
作者:沈湫莎
文:沈湫莎 图:除注明外为受访者提供 编辑:沈湫莎 责任编辑:任荃
转载此文请注明出处。