(记者 陈洲)2025中国国际大数据产业博览会(简称“数博会”)28日在贵州省贵阳市开幕。本届数博会以“数聚产业动能 智启发展新篇”为主题,聚焦数据要素与人工智能技术融合创新,推动数据资源高效利用与价值释放。
国家发展改革委党组成员、国家数据局局长刘烈宏也于近日表示,2024年初,我国日均Token的消耗量为1千亿,截至今年6月底,日均Token消耗量已经突破30万亿,1年半时间增长了300多倍,这反映了我国人工智能应用规模的快速增长。如今,各行业正积极投身数据要素建设的浪潮,高质量数据集正为各领域创新注入澎湃动力。
(图片来源:摄图网)
我国高度重视数据资源
近日,国务院印发《关于深入实施“人工智能+”行动的意见》。《意见》为“人工智能+”发展规划了清晰的路线图——从重点领域突破到形成经济发展的重要增长极,再到全面步入智能经济和智能社会发展新阶段。
在人工智能蓬勃发展的当下,日均Token消耗量正不断增长,我国对数据资源的重视程度也持续攀升。
国家数据局明确提出“人工智能 +”行动推进到哪里,高质量数据集的建设和推广就要覆盖到哪里,这一理念深刻把握了AI发展与数据供给的内在联系。为筑牢人工智能发展的数据根基,国家数据局积极牵头推动高质量数据供给,先后出台《高质量数据集建设指南》等一系列规范性文件,从数据采集、标注、存储到共享利用构建起全链条标准体系。
在此基础上,国家数据局联合工信部、科技部、发改委等多部门建立协同工作机制,形成政策合力。通过设立专项扶持资金、搭建国家级数据共享平台、开展数据集质量认证等方式,重点推进医疗、交通、制造、农业等关键领域的高质量数据集建设。目前,我国已建成一批覆盖国民经济重点行业的标杆数据集,有效解决了人工智能应用中的“数据孤岛”和 “数据质量参差不齐”等痛点问题。
从顶层设计到基层实践,我国正不断完善数据要素市场化配置体制机制,让高质量数据在流动中创造更大价值。未来,随着数据基础设施的持续完善和数据治理能力的不断提升,我国数据资源开发利用将迈向更高水平,为数字中国建设提供坚实支撑。
各类企业积极投身数据要素建设
在国家大力推进数据要素市场化配置的进程中,各类企业积极响应号召,成为数据资源开发利用的重要力量。
科技型企业发挥技术优势,搭建数据处理与分析平台,攻克数据清洗、标注、建模等关键技术,为数据价值挖掘提供技术支撑。互联网企业依托海量用户数据和平台资源,探索数据在精准营销、用户服务等领域的创新应用,形成数据驱动的业务增长模式。传统行业企业则加快数字化转型步伐,将生产经营数据转化为决策依据,通过数据优化生产流程、提升运营效率。
作为通信行业的领军企业,中国电信也以实际行动积极投身数据要素建设。中国电信通过技术创新、平台搭建和生态合作,为数据要素价值释放贡献企业力量,形成了国家战略与企业实践同频共振的良好局面。
中国电信充分发挥自身在网络基础设施和数据资源方面的优势,构建起覆盖全国的数据要素服务体系。一直以来,中国电信持续打造了星海大数据品牌,核心产品包括流通利用产品灵泽数据要素平台、数据中台产品星海数据智能中台。灵泽数据要素平台在《互联网周刊》发布的“2023数据要素生态服务商排行”榜单中名列榜首,平台落地范围逐步从海南拓展到全国7省29地市;星海数据智能中台承接3个国家级数据标注基地建设,服务超150家客户,构建规模超9万亿Token的大模型训练数据集。
当前,各类企业还积极参与数据生态建设,通过跨界合作打破 “数据孤岛”,推动数据合规流通与共享。不少企业建立数据安全管理体系,在数据采集、存储、使用等环节筑牢安全防线,为数据要素市场化筑牢信任基石。企业的积极实践,让数据要素在市场中充分流动,为经济高质量发展注入新动能。
高质量数据集建设场景持续扩大
随着数据要素市场化进程的不断深入,高质量数据集的建设场景正从传统领域向新兴赛道持续扩大,其价值早已超越人工智能训练所需的Token消耗范畴,在具身智能、低空经济、生物制造等前沿领域发挥着不可替代的支撑作用,成为驱动多领域创新发展的关键引擎。
在具身智能领域,高质量数据集是机器人实现环境感知与自主决策的“认知基础”。具身智能机器人需要通过海量环境数据学习物理世界规律,而涵盖物体材质、空间布局、动态交互等维度的高质量数据集,能够帮助机器人精准识别场景特征、预判环境变化。例如,包含数万种家居场景的三维空间数据集,可让家庭服务机器人快速适配不同户型;工业场景的设备运行参数数据集,能助力巡检机器人精准判断设备故障,大幅提升具身智能的落地效率。
低空经济的蓬勃发展同样离不开高质量数据集的支撑。无人机物流、城市空中交通等应用需要高精度的空域地理数据、气象数据和障碍物数据作为保障。通过构建覆盖城市建筑群、低空航线、气象变化的动态数据集,可实现无人机航线的智能规划与安全管控。例如,物流企业可依托包含地形地貌、电磁环境的低空数据集,提升无人机配送的航线规划效率,降低事故率,充分体现数据对低空经济安全发展的保障作用。
生物制造领域中,高质量数据集正加速推动产业从“经验驱动”向“数据驱动”转型。涵盖基因序列、代谢路径、反应参数的生物数据集,为微生物育种、合成生物学研究提供了精准参考。科研机构通过分析百万级微生物基因数据集,成功筛选出高效产酶菌株,将生物发酵周期缩短;医药企业利用临床数据与分子结构数据集,加速新药研发进程,使候选药物筛选效率提升数倍。
从具身智能的场景认知到低空经济的安全运行,再到生物制造的效率提升,高质量数据集建设场景的持续扩大,正为各领域创新注入澎湃动力,推动数字经济与实体经济在更广阔领域实现深度融合。