开源第一弹!DeepSeek重磅发布
创始人
2025-02-24 22:20:45
0

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。

据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽&580 TFLOPS的计算性能。”DeepSeek说。

简单来说, FlashMLA 是一个能让大语言模型在 H800这样的GPU上跑得更快、更高效的优化方案,尤其适用于高性能AI任务。这一代码能够加速大语言模型的解码过程,从而提高模型的响应速度和吞吐量,这对于实时生成任务(如聊天机器人、文本生成等)尤为重要。

MLA (Multi-Layer Attention,多层注意力机制)是一种改进的注意力机制,旨在提高Transformer模型在处理长序列时的效率和性能‌。MLA通过多个头(head)的并行计算,让模型能够同时关注文本中不同位置和不同语义层面的信息,从而更全面、更深入地捕捉长距离依赖关系和复杂语义结构‌。

此前,有从业者解析DeepSeek架构时提到,MLA的本质是对KV(Key-Value,一种缓存机制)的有损压缩,提高存储信息,“该技术首次在DeepSeek-V2中引入,MLA是目前开源模型里显著减小KV 缓存大小的最佳方法。”

DeepSeek开源这一代码有何影响?媒体用这一问题询问了DeepSeek,它回答称,这一代码就像给AI推理引擎装上了一台“涡轮增压器“,让大模型在处理复杂任务时更快、更省资源,同时降低了技术门槛。FlashMLA的意义不单是技术优化,更是打破算力垄断、加速AI普惠的关键一步。

具体来说, FlashMLA可以突破GPU算力瓶颈,降低成本。传统解码方法在处理不同长度的序列(如翻译不同长度的句子)时,GPU的并行计算能力会被浪费,就像用卡车运小包裹,大部分空间闲置。而FlashMLA的改进是:通过动态调度和内存优化,让Hopper GPU(如H100)的算力被“榨干”,相同硬件下吞吐量显著提升。这意味着企业可以用更少的GPU服务器完成同样的任务,直接降低推理成本。

此前高效解码内核多由科技巨头闭源垄断(如CUDA优化库),中小企业和研究者难以复现。FlashMLA开源后,开发者可免费获得“工业级优化方案”,降低技术门槛,促进更多创新应用(如垂直领域小模型)的诞生。

"the whale is making waves!(鲸鱼正在掀起波浪!)”有网友在DeepSeek的帖子下留言称。(注:DeepSeek的企业LOGO是鲸鱼)。

也有网友希望DeepSeek开源网页搜索(Web Search)相关的代码,并提到,“DeepSeek 是真正的OpenAI(开放人工智能)”。

这仅仅是开始,上周2月21日DeepSeek宣布,下周开始,会陆续开源5个代码库,“以完全透明的方式分享我们微小但真诚的进展”。DeepSeek表示,这些在线服务中的基础构建模块已经经过文档化、部署,并在生产环境中经过实战检验。

DeepSeek在公告中称自己是探索 AGI 的小公司,作为开源社区的一部分,每分享一行代码,都会成为加速AI行业发展的集体动力。同时,DeepSeek 称,没有高不可攀的象牙塔,只有纯粹的车库文化(不少美国著名企业从车库里诞生)和社区驱动的创新。

相关内容

热门资讯

中石化取得压裂用水精细处理装置... 国家知识产权局信息显示,中国石油化工股份有限公司取得一项名为“一种压裂用水精细处理装置及其过滤桶”的...
原创 如... 11月23日。在当代足坛,“梅西接班人”已成为衡量年轻天才的终极标尺,每一个崭露头角的新星都不可避免...
瑞慈医疗集团与联影集团达成战略... 中证报中证网讯(记者 李梦扬)近日,上海瑞慈医疗投资集团有限公司(简称“瑞慈医疗集团”)与联影医疗技...
原创 “... 这几天,深圳各学校的期中考试出分了。 一般来说,期中考试比期末考试难,所以好多孩子都考得不好,家长们...
新锐茶饮品牌“茶叮咛”完成30... 2月28日消息,成都茶舶来品牌管理有限公司旗下品牌“茶叮咛”宣布完成3000万元A轮融资,本轮由中良...
每小时洗800平方米“空中清洁... 每小时洗800平方米“空中清洁工”真能干 无人机化身“空中清洁工”洗玻璃。(受访单位供图) 茅箭 ...
兴宾区25/26年榨季启动 东... (来源:沐甜科技) 来源:沐甜科技 “轰隆——”11月21日,广西来宾东糖迁江有限公司内机器轰鸣,随...
拖着炒作7年后,“英国将批准中... 【文/观察者网 熊超然】“预计斯塔默将于下个月正式批准在伦敦市中心建造一座新的超大型中国大使馆,此前...
“倾听科学空间”在南非约翰内斯... 人民网约翰内斯堡11月22日电 (记者戴楷然)21日,由中国科技馆与南非Sci-Bono科学中心共同...