今天分享的是:人工智能专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求
报告共计:42页
国信证券发布的《DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求》报告指出,DeepSeek发展迅猛,在开源大模型领域取得显著成果,其模型性能对标海外领军产品且成本优势明显,同时AI应用的发展促使算力需求不断攀升,带动相关产业链发展。DeepSeek成立于2023年7月,由幻方量化创立。2024年5月,DeepSeek-V2发布,成为全球最强开源通用MoE模型;同年12月,DeepSeek-V3发布,性能对齐海外领军闭源模型,在多项评测中表现出色,生成速度提升至3倍,且具有更优的性能价格比。2025年1月,DeepSeek-R1发布,性能对标OpenAI-o1正式版,还开源模型权重并上线API。DeepSeek通过MLA和DeepSeekMoE等技术实现高效推理和低成本训练,采用DualPipe算法和混合精度训练优化计算与通信负载,通过分阶段强化学习提升模型性能,并利用硬盘缓存技术降低延迟和成本。在AI应用方面,随着Scaling Law与“涌现”能力的发展,海内外科技公司纷纷发布大模型,模型参数规模指数级增长,性能不断提升,且已从大语言模型进化为多模态模型。AI推动全球IT支出增长,生成式AI市场规模持续提高,智能算力需求激增,全球数据总量大幅上涨,数据中心算力需求快速增长。英伟达CUDA平台及GPU架构快速迭代更新,其GPU算力成倍增长,GB200系统强势赋能下一代AI模型。国内外云服务商资本开支快速增长,AI服务器市场规模大幅提升,搭载AI芯片仍以GPU为主,但搭载ASIC芯片服务器占比呈上升趋势,牧本定律摆向定制化,关注国产ASIC服务商。同时,算力需求是PCB行业的主要增长引擎,服务器平台升级带动PCB板层数增加和CCL介电损耗降低,HDI市场也因新应用领域的推动而有望增长 。
以下为报告节选内容