人工智能专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算
创始人
2025-02-05 22:41:21
0

今天分享的是:人工智能专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求

报告共计:42页

国信证券发布的《DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求》报告指出,DeepSeek发展迅猛,在开源大模型领域取得显著成果,其模型性能对标海外领军产品且成本优势明显,同时AI应用的发展促使算力需求不断攀升,带动相关产业链发展。DeepSeek成立于2023年7月,由幻方量化创立。2024年5月,DeepSeek-V2发布,成为全球最强开源通用MoE模型;同年12月,DeepSeek-V3发布,性能对齐海外领军闭源模型,在多项评测中表现出色,生成速度提升至3倍,且具有更优的性能价格比。2025年1月,DeepSeek-R1发布,性能对标OpenAI-o1正式版,还开源模型权重并上线API。DeepSeek通过MLA和DeepSeekMoE等技术实现高效推理和低成本训练,采用DualPipe算法和混合精度训练优化计算与通信负载,通过分阶段强化学习提升模型性能,并利用硬盘缓存技术降低延迟和成本。在AI应用方面,随着Scaling Law与“涌现”能力的发展,海内外科技公司纷纷发布大模型,模型参数规模指数级增长,性能不断提升,且已从大语言模型进化为多模态模型。AI推动全球IT支出增长,生成式AI市场规模持续提高,智能算力需求激增,全球数据总量大幅上涨,数据中心算力需求快速增长。英伟达CUDA平台及GPU架构快速迭代更新,其GPU算力成倍增长,GB200系统强势赋能下一代AI模型。国内外云服务商资本开支快速增长,AI服务器市场规模大幅提升,搭载AI芯片仍以GPU为主,但搭载ASIC芯片服务器占比呈上升趋势,牧本定律摆向定制化,关注国产ASIC服务商。同时,算力需求是PCB行业的主要增长引擎,服务器平台升级带动PCB板层数增加和CCL介电损耗降低,HDI市场也因新应用领域的推动而有望增长 。

以下为报告节选内容

相关内容

热门资讯

伊朗称捣毁多个与美以有关的“恐... 7月4日消息,当地时间4日获悉,伊朗情报部发表声明称,伊朗安全部门近日捣毁4个与美国和以色列情报机构...
巴基斯坦一检查站遭汽车炸弹袭击... 7月4日消息,巴基斯坦官方消息人士4日说,该国西南部俾路支省一个海岸警卫队检查站3日遭到汽车炸弹袭击...
佛得角首都机票搜索量暴增近30... 7月4日消息,美加墨世界杯1/16决赛,阿根廷队3比2艰难击败佛得角队,“黑马”佛得角再次收获了全世...
泽连斯基证实打击俄圣彼得堡附近... 7月4日消息,当地时间4日,乌克兰总统泽连斯基在社交媒体发文证实,乌方于当日凌晨发起远程打击行动,击...
涉留神峪煤矿事故,国家矿山安全... 7月4日消息,据山西省纪委监委网站,国家矿山安全监察局山西局监察执法八处2人被查。国家矿山安全监察局...
俄称拦截23架飞向莫斯科的乌无... 7月4日消息,俄罗斯莫斯科市长索比亚宁自当地时间7月3日夜间起,在社交媒体多次发布通报。通报称,截至...
暑运前三天,全国铁路累计发送旅... 7月4日消息,铁路暑运自7月1日启动,来自国铁集团的最新数据显示,暑运前三天,也就是7月1日至3日,...
《数据产权登记工作指引(试行)... 7月4日消息,《数据产权登记工作指引(试行)》印发,将促进数据安全合规高效流通使用。国家数据管理部门...
首款神经动力学芯片问世,有助于... 7月4日消息,北京大学集成电路学院教授杨玉超团队联合中国科学院上海微系统与信息技术研究所研究员宋志棠...
豆包:智能体功能将于7月15日... 7月4日消息,据豆包平台消息,由于产品功能调整,智能体功能将于2026年7月15日下线。功能下线后,...