作为国内首家 All-in 推理的GPU芯片公司,曦望一年内顺利完成近30亿元战略融资,投资方包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技、游族网络、北京利尔等产业投资方,无极资本、IDG 资本、心资本、高榕创投、中金资本、普华资本、松禾资本、易方达资本、工银投资、海通开元、越秀产业基金、银泰投资、国元基金、粤民投、华民投等国内知名 VC/PE 机构,同时获得诚通混改基金、杭州金投、杭州高新金投等国资背景资本的鼎力加持。所筹资金将专项用于下一代推理 GPU 的核心技术研发、规模化量产及生态共建,持续夯实我们在推理算力赛道的核心竞争力。
游族网络于2025年投资曦望,并与其达成战略合作,聚焦人工智能算力基础设施与游戏研发核心场景的耦合,定制GPU算力卡与分布式架构算力底座。
当前,AI模型训练已迈入深水区,推理环节的运行效率、综合成本与稳定性能,正成为左右AI技术商业化落地成败的核心关键,全球AI产业从“训练红利”向“推理红利”深度切换的核心发展趋势已现。
01 代芯片矩阵成型,All-in 推理 GPU 剑指行业新标杆
坚守聚焦推理的差异化路径,曦望始终围绕推理场景的核心痛点优化成本与效率,对芯片架构进行全维度重构。曦望摒弃传统训推一体 GPU 以训练为核心的优化思路,在调度机制、缓存设计、片上 SRAM、芯片互联及编译器路径等核心环节,均针对推理场景做原生深度优化,同时融合 LPDDR 内存技术,实现单位 Token 推理成本的显著降低。
在技术研发层面,曦望坚持原创,全栈自研,实现指令集、GPGPU IP 及编译工具链等关键核心技术的自主可控,截至目前已累计持有 200 余项核心专利,此前推出的芯片产品均实现一次流片成功,以过硬的研发与工程化能力,兑现行业一流的技术承诺。
历经数年技术沉淀与二十亿元研发投入,曦望已构建起覆盖全场景需求的三代芯片产品矩阵,全面覆盖从视觉推理到大模型全场景推理的多元应用需求。2020 年量产的首款AI推理芯片 S1,适配千余种CV模型;2024 年量产的 S2 芯片,深度兼容 CUDA 生态,流畅推理 DeepSeek、Qwen等开源大模型,以及文生图、文生视频、文生3D主流模型; 2026 年即将重磅推出的S3芯片,定位“推理性价比之王”,将在单位 Token 成本、能耗表现上实现数量级突破,原生支持 FP8/FP4 低精度推理,服务“百万 Token 一分钱”的行业新基准,为大模型推理的大规模普惠应用提供核心支撑。
02 做中国AI产业的“损益表优化师”
“如果能让推理成本下降90%,并提供更稳定的服务,我们的竞争就不是‘又一个芯片’,而是‘重写中国AI产业的损益表’。” 曦望联席CEO王湛的表述,精准诠释了公司 All-in 推理的差异化核心定位。
对于算力服务厂商与AI原生应用开发者而言,推理能效、SLA 稳定性与 Token 综合成本,才是决定业务毛利率与终端用户体验的核心指标。基于此,曦望坚定投入推理赛道,聚焦真实场景的单位经济性,成为现有算力系统的“推理分流与成本优化层”,并积极与本土芯片厂商合作,为客户打造专属推理加速专区,构建共生共赢的产业生态。
“我们的目标是极致降低大模型推理的成本与门槛,让推理算力变得普惠且可广泛获取,从而充分释放 AGI 的全部潜力。”王湛表示,这也是曦望坚持 All-in 推理的初心所在。
随着AI推理红利的全面释放,曦望正走出一条中国企业自主发展推理GPU的特色之路,最终实现国产AI芯片从“跟跑”向“差异化领跑”的关键跨越。未来,曦望将以技术创新为核心驱动力,持续践行“把推理成本打下来”的目标,为中国 AI 基础设施自主化发展与算力普惠事业贡献力量。
免责声明:本文仅供参考,不构成投资建议。