计算机人工智能系列深度报告——DeepSeek研究框架_科技资讯

计算机人工智能系列深度报告——DeepSeek研究框架

创始人

2025-02-14 12:41:58

0次

今天分享的是：计算机人工智能系列深度报告——DeepSeek研究框架

报告共计：51页

《DeepSeek研究框架——计算机人工智能系列深度报告》由国海证券发布，核心观点为看好DeepSeek为AI全产业带来的机遇。报告围绕DeepSeek展开多方面分析，具体内容如下：

1. 公司及模型概况：DeepSeek成立于2023年7月，由幻方量化创立，专注大模型技术。其发布的V3和R1模型表现出色，V3性能对标GPT-4o等顶尖闭源模型，R1在数学、代码等任务上比肩OpenAI o1正式版。且二者均开源，采用MIT协议，在开源社区备受关注，提升了中国AI大模型的国际影响力。

2. 技术创新：基于Transformer架构，采用MLA和DeepSeek MoE两大核心技术。MLA节省计算资源和内存占用，DeepSeek MoE架构及负载均衡策略降低计算成本、提升计算效率。同时引入多令牌预测、FP8混合精度训练等技术，还运用DualPipe算法和英伟达PTX指令优化性能。

3. 对AI行业影响：对全球AI行业影响深远，激发了行业创新，推动全球AI模型迭代加速；提振国产AI产业信心，打破技术和算力天花板，重塑国产AI估值；促进开源AI发展，吸引更多人参与研发，加速AI推理进程。在应用层面，降低推理成本，加速AI应用布局，在代码、教育、医疗等垂直领域有望大规模部署；通过模型蒸馏赋予小模型高性能，推动端侧AI发展。在算力方面，虽V3训练成本降低，但整体训练总成本较高。从长远看，推理成本下降会刺激算力需求增长，推理算力需求占比提升，GenAI云厂商有望受益，同时国产AI芯片需求也有望提升。

4. 市场表现：DeepSeek官方App上线后表现亮眼，日活远超同期ChatGPT，下载量在全球140个市场的移动应用榜位居榜首，获得了海内外市场的广泛认可，众多科技巨头如微软、英伟达等纷纷拥抱DeepSeek，上线其模型服务。

以下为报告节选内容

上一篇：原创 Arm首款自研芯片曝光：台积电代工，Meta是首批客户！

下一篇：总算了解!(大虾娱乐圈)外挂透明挂辅助插件(透视)外挂透视辅助器(2023已更新)(哔哩哔哩)

计算机人工智能系列深度报告——DeepSeek研究框架

相关内容

热门资讯