IT之家 1 月 23 日消息,我国科学家在高效能计算芯片研发领域取得新进展。北京大学人工智能学院孙仲研究员团队设计并研制出一款专用于“非负矩阵分解”计算的模拟计算芯片。
测试结果显示,该芯片在典型应用中,相较于当前先进的数字芯片,计算速度可提升约 12 倍,能效比提升超过 228 倍。相关研究成果已于 1 月 19 日发表在《自然 · 通讯》上。
非负矩阵分解是一种广泛应用于推荐系统、图像分析、生物信息学等领域的数据降维与特征提取技术。
随着数据规模不断扩大,传统数字硬件在实时处理海量数据时面临计算复杂度高和内存访问瓶颈等挑战。
研究团队长期专注于模拟计算技术路线。模拟计算利用物理规律直接进行并行运算,具有延迟低、功耗低的潜在优势。
此次,团队基于阻变存储器(RRAM)研制出专用的非负矩阵分解模拟计算求解器。他们创新设计了一种可重构的紧凑型电路,通过对核心计算步骤的优化,实现了“一步求解”,从而显著优化了芯片的面积和能耗表现。
为验证芯片的实际性能,研究团队构建了测试平台。在图像压缩任务中,该芯片在几乎不损失精度的同时,节省了约一半的存储空间。在电影评分数据集和更大规模的商业数据集上进行的推荐系统训练任务中,该芯片均展现出显著优于主流数字硬件的计算速度与能效。
孙仲表示,这项工作为非负矩阵分解这类约束优化问题的实时求解提供了新路径,展示了模拟计算在处理复杂现实数据方面的潜力。该技术未来有望推动实时推荐、高清图像处理及基因数据分析等应用向更高效、更低功耗的方向发展。
IT之家附论文地址:
https://doi.org/10.1038/s41467-026-68609-8