DeepSeek号称能以极低成本训练出性能媲美OpenAI聊天机器人“ChatGPT”的AI模型,对美国科技界投下重磅炸弹,并冲击AI芯片龙头英伟达(Nvidia Corp.)股价跳水。然而,外媒分析,成本下降有助AI普及,反倒能提升英伟达芯片需求。
MarketWatch专栏作家Jurica Dujmovic发文指出,无论是DeepSeek或其他大型语言模型(LLM)提供商,AI模型依旧需要绘图处理器(GPU)及数据中心运行。事实上,更有效率的模型有望促进AI普及:当成本下降,企业就可将省下来的资金再投入,进一步提升AI能力。
诚然,这代表高端GPU销售量可能下滑,但英伟达可在更为广大的AI消费者市场提升销量、弥补损失。DeepSeek的突破性发展,有望让英伟达专为消费者设计的GPU需求大增。
DeepSeek性能媲美OpenAI先进模型“o1”的AI模型“R1”,以蒸馏(distillation)与量化(quantization)技术,能在消费者级计算机执行,暗示AI有望逐步民主化。随着更具效率且开源的模型问世,过去曾是专有封闭市场的AI,如今有望跨入主流运算。
Dujmovic认为,英伟达在这波转换潮极具优势,不但能扩展现有消费者AI业务,还能维持商用数据中心的领导地位。换言之,英伟达在高性能数据中心商用芯片市场、以及个人AI消费者运算市场的地位,都有望同步提升。
何谓蒸馏?根据微软(Microsoft)资深机器学习工程师Vishal Yadav、应用科学家Nikhil Pandey说法,“蒸馏是将大型预训练模型(教师模型)知识转移到较小模型(学生模型)的技术,能使学生模型达到与教师模型相当的性能。这项技术让用户能利用大型LLM优质输出,以较小学生模型降低推理成本。”
英国金融时报1月29日报道,OpenAI透露发现“蒸馏”证据,怀疑是来自DeepSeek。虽然蒸馏在业界经常见,但DeepSeek或许借此打造竞争模型,违反OpenAI服务条款。
(首图来源:英伟达)