Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
创始人
2024-07-18 12:01:11
0

?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。

为了最大限度地提升诸通义千问2等大模型的效率,Intel进行了全面的软件优化,包括高性能融合算子、平衡精度和速度的先进量化技术等。

Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。

Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging Face库、vLLM。

首先看Intel Gaudi AI加速器,专为生成式AI、大模型的高性能加速而设计,最新版的Gaudi Optimum可以轻松部署新号的大模型。

Intel使用Gaudi 2,对70亿参数、720亿参数的通义千问2模型的推理和微调吞吐量进行了基准测试,以下为详细性能指标和测试结果:

70亿参数通义千问2在单颗Gaudi 2加速器上的推理

720亿参数通义千问2在八颗Gaudi 2加速器上的推理

通义千问2 FP8在Gaudi 2加速器上的推理

通义千问2在Gaudi 2加速器上的微调

再看Intel至强处理器,作为通用平台具有广泛的可用性,适用于各个规模的数据中心,对于希望快速部署AI解决方案、没有专项基础设施企业非常理想。

至强处理器的每个核心都内置了Intel AMX高级矩阵扩展,可以处理多样化的AI工作负载,并加速AI推理。

以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例,通义千问2的下一个推理token延迟情况。

最后是消费级的AI PC,可以在本地部署大模型,既然可以使用处理器内置GPU核显、NPU AI引擎,也可以搭配独立的锐炫显卡。

以下展示了AI PC运行15亿参数的通义千问2:

酷睿Ultra 7 165H上的通义千问2推理

酷睿 Ultra 7 165H上的通义千问2下一个token延迟

锐炫A770 16GB显卡上的通义千问2下一个token延迟

相关内容

热门资讯

“编织,一起吗?”全民共创的艺... 西岸美术馆与法国蓬皮杜中心五年展陈合作项目近日再度突破艺术边界,推出大型公共编织项目——“编织,一起...
山东泰山42家官方认证球迷会联... 直播吧2月21日讯 山东泰山42家官方认证球迷会联合发布文明观赛倡议书,呼吁广大球迷文明理性观赛,自...
总算清楚!((江城互娱))外挂... 总算清楚!((江城互娱))外挂辅助神器(透视)辅助识别(2024已更新)(哔哩哔哩);一、江城互娱有...
玩家必看科普!((wpk德州局... 【福星临门,好运相随】;玩家必看科普!((wpk德州局))外挂透明挂辅助工具!(透视)有挂实测(20...
分享开挂内幕!wepoke科技... 分享开挂内幕!wepoke科技(网易棋牌)外挂透明挂辅助代打(2024已更新)(哔哩哔哩);1、点击...
每日必看推荐!风娱(WepOk... 每日必看推荐!风娱(WepOke)外挂透明挂辅助测试!(透视)有挂助手(2022已更新)(哔哩哔哩)...
一分钟了解!((wpk德州))... 一分钟了解!((wpk德州))外挂透明挂辅助软件!(透视)有挂讨论(2020已更新)(哔哩哔哩);w...
技术分享!欢喜广西麻将十三张有... 您好,欢喜广西麻将十三张有挂的这款游戏可以开挂的,确实是有挂的,需要了解加微【136704302】很...
五秒钟猫腻!老友麻将有挂的(辅... 五秒钟猫腻!老友麻将有挂的(辅助挂)2020已更新辅助软件(哔哩哔哩);致您一封信;亲爱老友麻将有挂...
一分钟揭秘!((财神十三张))... 一分钟揭秘!((财神十三张))外挂辅助脚本(透视)辅助大厅房(2025已更新)(哔哩哔哩);亲真的是...