今天分享的是:计算机人工智能系列深度报告——DeepSeek研究框架
报告共计:51页
《DeepSeek研究框架——计算机人工智能系列深度报告》由国海证券发布,核心观点为看好DeepSeek为AI全产业带来的机遇。报告围绕DeepSeek展开多方面分析,具体内容如下:
1. 公司及模型概况:DeepSeek成立于2023年7月,由幻方量化创立,专注大模型技术。其发布的V3和R1模型表现出色,V3性能对标GPT-4o等顶尖闭源模型,R1在数学、代码等任务上比肩OpenAI o1正式版。且二者均开源,采用MIT协议,在开源社区备受关注,提升了中国AI大模型的国际影响力。
2. 技术创新:基于Transformer架构,采用MLA和DeepSeek MoE两大核心技术。MLA节省计算资源和内存占用,DeepSeek MoE架构及负载均衡策略降低计算成本、提升计算效率。同时引入多令牌预测、FP8混合精度训练等技术,还运用DualPipe算法和英伟达PTX指令优化性能。
3. 对AI行业影响: 对全球AI行业影响深远,激发了行业创新,推动全球AI模型迭代加速;提振国产AI产业信心,打破技术和算力天花板,重塑国产AI估值;促进开源AI发展,吸引更多人参与研发,加速AI推理进程。在应用层面,降低推理成本,加速AI应用布局,在代码、教育、医疗等垂直领域有望大规模部署;通过模型蒸馏赋予小模型高性能,推动端侧AI发展。在算力方面,虽V3训练成本降低,但整体训练总成本较高。从长远看,推理成本下降会刺激算力需求增长,推理算力需求占比提升,GenAI云厂商有望受益,同时国产AI芯片需求也有望提升。
4. 市场表现:DeepSeek官方App上线后表现亮眼,日活远超同期ChatGPT,下载量在全球140个市场的移动应用榜位居榜首,获得了海内外市场的广泛认可,众多科技巨头如微软、英伟达等纷纷拥抱DeepSeek,上线其模型服务。
以下为报告节选内容