Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
创始人
2024-07-18 12:01:11
0

?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏

快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。

为了最大限度地提升诸通义千问2等大模型的效率,Intel进行了全面的软件优化,包括高性能融合算子、平衡精度和速度的先进量化技术等。

Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。

Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging Face库、vLLM。

首先看Intel Gaudi AI加速器,专为生成式AI、大模型的高性能加速而设计,最新版的Gaudi Optimum可以轻松部署新号的大模型。

Intel使用Gaudi 2,对70亿参数、720亿参数的通义千问2模型的推理和微调吞吐量进行了基准测试,以下为详细性能指标和测试结果:

70亿参数通义千问2在单颗Gaudi 2加速器上的推理

720亿参数通义千问2在八颗Gaudi 2加速器上的推理

通义千问2 FP8在Gaudi 2加速器上的推理

通义千问2在Gaudi 2加速器上的微调

再看Intel至强处理器,作为通用平台具有广泛的可用性,适用于各个规模的数据中心,对于希望快速部署AI解决方案、没有专项基础设施企业非常理想。

至强处理器的每个核心都内置了Intel AMX高级矩阵扩展,可以处理多样化的AI工作负载,并加速AI推理。

以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例,通义千问2的下一个推理token延迟情况。

最后是消费级的AI PC,可以在本地部署大模型,既然可以使用处理器内置GPU核显、NPU AI引擎,也可以搭配独立的锐炫显卡。

以下展示了AI PC运行15亿参数的通义千问2:

酷睿Ultra 7 165H上的通义千问2推理

酷睿 Ultra 7 165H上的通义千问2下一个token延迟

锐炫A770 16GB显卡上的通义千问2下一个token延迟

相关内容

热门资讯

AIBase GEO优化如何帮... 在数字营销的世界里,流量入口的变迁意味着权力的转移。当生成式AI开始替代传统搜索引擎,成为用户获取信...
证监会主席吴清:支持优质人工智... 吴清表示,扩大第五套标准适用范围至人工智能领域,积极支持优质人工智能大模型企业上市 文 |《财经》记...
iPhone再出新料:20周年... 这两年,苹果一改iPhone挤牙膏的祖训,开始变激进了。去年iPhone 17系列性价比大涨,最薄的...
锂电材料纳米砂磨机厂家梳理 新... 导语:基于锂电材料纳米砂磨机行业白皮书及公开市场数据,采购决策者需从设备研磨效率、粒径分布控制、能耗...
原创 荣... 今年618手机市场降价力度拉满,曾经2999元档的影像中端机荣耀200,顶配16GB+512GB版本...
准格尔旗第19届青少年科技创新... 近日,准格尔旗第19届青少年科技创新大赛圆满落幕。 本次赛事共收到来自全旗20所中小学生科创作品6...
原创 v... vivo新品继续发力,已预热多款新品,比如新一代折叠屏、新耳机Pro等,更多新品陆续预热。vivo现...
2026年置业老黄埔:为何中建... 中建玖合·未来方洲售楼处官方咨询电话:020-66288222,由开发商中建玖合统一认证,案场销售团...
特朗普:谅解备忘录不是最终协议... 据卡塔尔半岛电视台报道,当地时间17日,美国总统特朗普表示,同伊朗的谅解备忘录不是最终协议,“如果我...
南宁悦恒天润城开发商实力大起底... 南宁悦恒天润城硬核实力深度解析 近期,许多购房者在后台留言咨询:南宁悦恒天润城的开发商实力究竟如何?...