智算之渴如何解?
创始人
2024-05-22 11:49:36
0

原标题:智算之渴如何解?

算力几乎决定了人工智能技术创新的上限。作为数字时代的先进生产力,算力是推动人工智能、区块链、云计算、大数据等技术创新与应用的基础支撑。尤其是当下,大模型发展进入了深水区,躬身入局的参与者们对算力的需求愈发复杂。究竟要具备怎样的能力,才能够建设好AI时代的算力底座?

一面AI急需 一面算力浪费

数字金融、智能驾驶、生物医疗、智能制造……没有人会怀疑,人工智能大模型会在今天,也会在未来几年“+千行百业”,成为人类目前能拥有的最趁手的工具之一。但同时,数据不均衡、算力集群效率低、模型可信度有待考验、云边端算力资源没有有效协同……发展大模型的阶段不同,所“涌现”的问题复杂性和关键难点不尽相同,对AI支撑能力体系的要求也各具侧重。

在模型训练阶段,用户本身往往有很强的算法能力,但需要解决算效的难题。据了解,OpenAI在训练GPT4过程中的算力利用率约为35%,听起来偏低,其实已是行业正常水平。

如何才能释放更多的算力?这可能像中彩票一样难得。只有算、网、存、管四方面能力全面提升,才能够形成极致算效体系,从而提升在模型训练当中的算力利用率。

来到垂直场景适配阶段,用户对于算效的需求不像前者那样强烈,但他们需要极高的模型精度和效率——不同于To C场景中60%左右的精准度,行业模型精度的门槛可以达到95%。

因此,在行业实际落地当中,如果想要开出一个比较好的“精度盲盒”,需要考虑的因素更为复杂,包括数据安全合规、高质量数据的治理、调优的硬件加速和软件优化等等,这意味着深入行业,形成专业增强体系。

再到大模型应用部署运行阶段,这样一群每天需要AI应用最多的用户,他们的需求是极致的“高效稳定”。一方面要加速做好模型的精简、蒸馏、压缩等各个环节的处理,另一方面要实现轻量级一键式甚至分钟级的部署,同时能在稳定的运行环境里,对资源进行实时地调用、健康全面地监管。

以前我们会想,超高算效、超大算力、超强稳定是不可能三角吗?但如今,大模型发展至此,对算力服务的确提出了如此复杂和严苛的要求。

在以大模型为焦点的新一轮AI竞赛中,智能计算作为推动产业发展的关键引擎,已经不再局限于算力性能这一单一竞争要素。算法协同优化、数据处理能力、模型可解释性以及与特定行业应用的融合度,都成为了智能计算能否成功推动技术创新和实际落地的核心因素。

而没有满足需求的智算服务,发展大模型就是天方夜谭。

“摸彩票”还是“开盲盒”?

大模型闪耀在聚光灯下,背后是不同的发展阶段的客户涌现出来的对于AI支撑能力体系愈发复杂的需求。

不管是万卡时代的“算效彩票”还是深入行业的“精度盲盒”,以及高效调用的“服务瓶颈”,如何解决这些复杂问题,满足这些来自不同客户的不同需求,在大模型的发展之路上建立起一套全面的AI的支撑能力体系,是当下急需解决的问题。

3月29日,宁畅发布“全局智算”战略,并揭幕了包括“AI算力栈”在内的一系列战略性新品与系统解决方案,旨在有效解决大模型产业落地的全周期问题。

“全局智算”,顾名思义,是具备全栈智能计算能力,以及涵盖硬件、软件、算法、液冷和服务质量等多个维度的系统性AI计算方案,背后是打造AI时代最坚实算力底座的决心。

这个底座的最底层是硬件资源层,比如通用服务器、GPU、整机柜、存储等多种形态的产品。

硬件层之上是集群设计层,这一层绝不是将海量硬件进行简单的连接堆叠,而是通过分析整个业务运行的特征和系统的量化需求,提供从微架构、网络、存储、AI模型特征等一系列的方案设计。

集群层以上是算子优化层,为了降本增效,方案提供了整体的AI算子自由化能力,减少模型执行的时间,提高能效比,使得AI能在有限的资源上高效运行。

再往上是中台层,可以提供基于AI算力系统深度整合的工作栈。最上面则是业务层和场景层。

整体来看,全局智算以全体系、全液冷、全服务、全场景、全行业、全阶段的六“全”能力,可满足大模型开发、适配、部署等全方位需求。

明年智算超三分之一

今年是大模型落地产业应用的关键一年。随着外部环境的变化,大模型从参数竞赛走向商业化、产业化的落地阶段,在这个阶段,单纯提供算力硬件已经远远不够,需要的是支撑能力体系的整体升级,就像“木桶原理”一样,各类能力都不能有短板。

同时,涉及算法、算力、数据三个维度的复杂系统需求也会不断涌现,而目前的智算中心在算效、精度和服务方面的表现还远不能支撑。全局智算战略正是希望向上解决极致算效、精度增强、高效稳定三个复杂需求,向下扎根千行百业,让大模型真正落地成为各行各业的新质生产力。

发布会上透露,为加速赋能用户,国内首个AI算力栈——宁畅NEX AI Lab(Nettrix AI Open Lab)已在桐乡市成功落地并开放预约试用,用以展现应用场景优化、行业智算定制解决方案,通过免费提供短期的软、硬件服务,带来大模型、数据科学、推荐系统等解决方案工作流的先进体验。

工业和信息化部、中央网信办、教育部等六部门联合印发的《算力基础设施高质量发展行动计划》提出,到2025年,中国算力规模超过300EFLOPS,其中智能算力占比达到35%。另据统计,目前全国正在建设或提出建设智算中心的城市已超过30个。

在智算中心建设大潮下,AI算力栈方案以其全面、灵活、深度的支撑能力,可为行业级、企业级智算中心的构建提供强有力支持,确保智算中心的建设既符合当前业务所需,又具备前瞻性与适应性。英特尔AI首席架构师吴震华强调:“第四代/第五代英特尔® 至强® 处理器可扩展处理器的卓越性能,将为宁畅AI算力栈带来更强助力。”

未来,“AI算力栈”方案将进一步落地汽车、互联网、制造、金融、能源、科研等领域,为数字化转型、智能化升级提供核心引擎。

相关内容

热门资讯

骨科材料“超范围”填充面部,医... 从业多年,刘菲常会遇到两类求美者:一类是拿着各类新奇项目名称网络分享贴的咨询者,这些营销概念在刘菲看...
原创 A... 在阅读文章前,辛苦您点下“关注”,方便讨论和分享。作者定会不负众望,按时按量创作出更优质的内容 文...
大学种的橘子为何不愁销量 新华社重庆12月17日电(记者周思宇、杨仕彦、李晓婷)“‘阳光2号’已经售罄,感谢大家关注!” 2个...
“天才少女”罗福莉走向台前 作者 | 周智宇 编辑 | 张晓玲 一位95后科学家的现身,让小米一次例常的会议,吸睛无数。 12月...
“天才少女”罗福莉小米首秀:国... 来源:市场资讯 (来源:贝壳财经) 新京报贝壳财经讯(记者陈维城)12月17日,95后AI“天才少女...
港股汽车股:从传统车到“华米零... 当前,港股市场上的汽车股大致可分为四大类: 1)以比亚迪(01211.HK)、长城汽车(02333....
零跑朱江明:明年有望平均月销4... 11月11日消息,在零跑汽车第三季度财报电话会上,零跑汽车创始人、董事长、CEO朱江明表示,预计今年...
顺络电子:拟2亿元-4亿元回购... 11月11日消息,顺络电子公告,拟2亿元-4亿元回购股份,回购价格不超过40元/股。公司已取得兴业银...
荆州:加大在职教师等公共服务群... 11月11日消息,荆州住房公积金中心发布最新政策通知,明确加大公共服务群体公积金支持力度。将在职教师...
力帆科技:选举印奇为第六届董事... 11月11日消息,力帆科技公告,公司第六届董事会第九次会议于2024年11月11日召开,会议审议并通...