今天分享的是:人工智能系列深度:DeepSeek十大关键问题解读-国海证券
报告共计:22页
《DeepSeek十大关键问题解读——人工智能系列深度》由国海证券刘熹撰写,报告围绕DeepSeek展开,深入探讨其对人工智能领域多方面的影响,指出其探索出 “算法创新 + 有限算力” 的路径,可能开启开源AI时代并重塑国产AI估值。
1. 对算力的影响:依据Jevons悖论,虽然DeepSeek在短期可能影响训练侧算力需求,但因其推理价格下降,吸引更多用户调用模型,使得英伟达H100 GPU租赁价格上升,反映出短期算力需求仍呈增长趋势,且中长期推理算力需求有望持续增长。
2. 文本与多模态对算力需求的差别:多模态模型能处理多种类型信息,相比传统单模态模型,其算法复杂度、参数量和数据集规模都大幅增加,对算力的速度、精度和性能要求更高,大规模应用将升级算力需求。
3. 对芯片未来格局的影响:在训练方面,英伟达凭借计算与生态优势,其高等级芯片未来或主要用于探索通用人工智能(AGI)。在推理领域,呈现推理化、国产化、ASIC化趋势,DeepSeek积极适配国产芯片,推动国产化推理算力需求增长,同时ASIC芯片因性能、能效和成本优势,在AI推理场景中占比逐渐提升。
4. DeepSeek系列模型引起轰动的原因:DeepSeek通过优化模型结构、训练方法以及针对GPU的优化,降低了训练成本,并且模型开源,下游企业可本地部署或云端调用,降低调用成本。其快速的技术突破和开源举措,改变了海外对国内模型能力与迭代速度的认知,打破了高级闭源模型的封闭生态。
5. 其他关键问题:在模型架构选择上,MoE架构相比传统Dense模型,在计算效率、AI响应速度、处理复杂任务和灵活性方面具有优势。蒸馏模型可减少大参数模型部署的缺点,有利于本地部署和端侧发展。多模态技术正从文本向更多模态扩展。DeepSeek推动AI应用降本和强推理,加速应用普及。其支持“模型蒸馏”,有望加速AI在端侧的落地进程。北美互联网大厂增加资本开支用于服务器和数据中心,重视DeepSeek技术发展 。
以下为报告节选内容