近期,国内AI领域迎来重磅消息,DeepSeek在春节期间连续发布三款大模型。景顺长城认为,DeepSeek此次发布的三款大模型,对于国内AI产业链来说,形成了确定性利好。具体看,受益程度分别为端侧、AI应用、国产GPU链。
上证报中国证券网讯(记者 何漪)近期,国内AI领域迎来重磅消息,DeepSeek在春节期间连续发布三款大模型,包括基座模型DeepSeek V3(对标OpenAI的GPT4o)、推理模型R1(对标OpenAI的o1)、多模态模型Janus Pro(对标OpenAI的DALL-E 3),引发市场高度关注。
景顺长城基金认为,V3模型的亮点是低成本,DeepSeek通过极致的算法工程优化压缩了模型的训练及推理成本;R1模型以V3模型为基础进行强化学习,亮点是性能,整体效果能够对标OpenAI的o1正式版。
在投资上,景顺长城认为,DeepSeek此次发布的三款大模型,对于国内AI产业链来说,形成了确定性利好。具体看,受益程度分别为端侧、AI应用、国产GPU链。
应用侧方面,DeepSeek凭借开源创新、低成本优势,降低了应用落地门槛;DeepSeek采用蒸馏技术,较大程度地增强了端侧模型能力上限;这都有利于AI应用发展。
端侧、2C Agent类应用方面,R1版本的核心,代表了大模型推理能力可以通过蒸馏技术转移到端侧模型范畴(包含PC端、手机端)。同时,R1版本具有自主规划能力,将加速端侧Agent类应用落地。
AI应用方面,V3版本、R1版本从三个维度降低了应用(如:类O1推理模型)落地推广的门槛:一是高性价比,具有较低的单位推理成本;二是开源,V3版本、R1版本开放了思维链过程,具有较低的部署门槛和复制难度;三是用户教育,DeepSeek大火,进一步增强了用户认知度。
算力层方面,DeepSeek推出后,大幅增强了AI算力的推理叙事能力,相当部分兼具训练与推理逻辑(如ASIC供应链)的A股算力标的存在错杀机会。