云天励飞DeepEdge10适配DeepSeek开源周“首个大招”:FlashMLA
创始人
2025-02-27 18:40:51
0

2月24日,DeepSeek"开源周"正式启动,并发布首个代码库FlashMLA,引发全球关注。

FlashMLA是针对英伟达Hopper GPU优化的高效MLA解码内核,专为可变长度序列优化设计,是DeepSeek高效使用算力的核心程序模块。FlashMLA通过MLA解码优化与分页KV缓存技术,显著提升硬件利用率,加速大语言模型解码过程,有效提高响应速度与吞吐量,适用于各种实时对话生成场景。

云天励飞芯片团队在FlashMLA开源后,迅速完成了DeepEdge10平台与FlashMLA的适配工作。在适配过程中,云天励飞采用了Op fusion tiling、Online softmax、Double buffer、细粒度存算并行等先进技术,并基于自研的Triton-like编程语言快速开发验证了高效的FlashMLA算子。通过一系列优化,不仅显著提升了计算效率,还大幅降低了显存占用,充分展现了DeepEdge10平台“算力积木”芯片架构的卓越优势,以及其与DeepSeek生态的高度契合性。

今日,云天励飞已将相关代码提交至开源平台Gitee,为开源AI贡献了重要的技术力量。

DeepEdge10系列芯片是专门针对大模型时代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各类不同架构的主流模型;基于自主可控的先进国产工艺打造,采用独特的“算力积木”架构,可灵活满足智慧城市、智慧交通、智能制造、智慧仓储、机器人、边缘智算中心等不同场景对算力的需求,为大模型推理提供强大动力。

目前,DeepEdge10芯片平台已成功适配DeepSeek R1系列模型及国产鸿蒙操作系统。未来,云天励飞将持续加大研发力度,推动芯片在国产化领域取得更大突破,为国产AI生态建设贡献更多力量。

相关内容

热门资讯

6分钟挂!(奥博城)外挂透视辅... 《奥博城软件透明挂》是一款多人竞技的奥博城辅助透视游戏,你将微扑克对手来到同一个战场,为至高无上的荣...
四分钟靠谱!(wePOke)软... 四分钟靠谱!(wePOke)软件透明挂,Wepoke透明外挂透视辅助挂,详细教程(有挂功能)-哔哩哔...
五分钟靠谱!(欢乐贰柒拾)其实... 五分钟靠谱!(欢乐贰柒拾)其实是有猫腻,aAPOKER原来一直总是有挂,详细教程(有挂方式)-哔哩哔...
九分钟插件挂!(Wepoke安... 九分钟插件挂!(Wepoke安装)软件透明挂,超级扑克外挂透视辅助挂,详细教程(有挂工具)-哔哩哔哩...
4分钟规律!(新荣耀)外挂透视... 4分钟规律!(新荣耀)外挂透视辅助挂,wePokE软件透明挂,详细教程(有挂技巧)-哔哩哔哩;亲,有...
九分钟后台!(Wepoke插件... 《九分钟后台!(Wepoke插件)确实真有挂辅助挂吗,Wepoke实测原来是有挂的,详细教程(有挂方...
三分钟长期!(友友联盟)其实真... 三分钟长期!(友友联盟)其实真的是有挂的,友友联盟外挂透视辅助挂,详细教程(有挂方法)-哔哩哔哩;1...
7分钟自建房!(微扑克模拟器)... 7分钟自建房!(微扑克模拟器)确实真的有挂猫腻,Wepoke轻量版原来一直总是有挂,详细教程(有挂辅...
王家耀院士等 | AI技术赋能... AI技术赋能遥感卫星数据在轨处理 王家耀1,2 颜军3,4 吴佳奇3 邓剑文3 董文岳3 张强3 龚...
“创·在上海”国际创新创业大赛... 2月26日,瞄准前沿和未来、聚焦硬科技赛道,“创·在上海”国际创新创业大赛总决赛落幕。从万余家报名企...