我市发布首批行业高质量数据集
创始人
2024-06-23 17:01:31
0

6月20日,2024世界智能产业博览会召开首日,市数据局在国家会展中心(天津)举办我市第一批行业高质量数据集发布活动,37家单位的80个行业高质量数据集公开发布。市科技局、市工业和信息化局、市国资委等市有关部门以及各区数据主管部门、行业数据集建设单位、人工智能产业重点企业、高校和科研机构等60多家单位参加。

高质量数据集是人工智能模型训练、推理和验证的关键基础,是按照特定标准,依次开展数据采集、数据清洗、数据归类和数据标注等智能化处理,并具备更新和维护机制的数据集合。我市首批发布的数据集涵盖工业制造、交通运输、科技创新、文化旅游、医疗健康、城市治理等12个重点领域,类型包含文本、图片、音频、视频等多种模态。其中,中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开发布;14个数据集已应用支撑“数智本草”中医药研发大模型、“海河·谛听”言语交互大模型、“海河·尔语”聋人手语理解大模型、蜜度文修大模型等津产自研大模型,充分展示了我市在重点领域行业数据集建设的特色和成果。

此次发布的数据集数据应用价值高,智能汽车驾驶场景库数据集旨在建成国内分类最齐全、格式最标准、内容最丰富的面向智能网联汽车研发测试的场景数据库,已支持国际标准、国家标准制定。恒达文博文旅·科普基础数据集规模超300TB,具有5种以上模态数据,已支撑训练了基于ChatGLM等先进架构的大语言模型,并应用于图像识别、古文字识别、文物病害识别等专用模型。

市数据局相关负责人表示,下一步,天津市将依托产业、科技、人才等优势,持续支持鼓励行业企业、数商和社会资本,整合通用、政用、商用数据资源,加速提升数据供给能力,开发更多细分领域行业数据集。同时,开展数据标注基地建设,推进数据标注产业生态构建、能力提升和场景应用,推动打造国家级试点项目,加快行业高质量数据集发展,催生新产业、新模式。

来源:天津日报

相关内容

热门资讯

详细辅助!wepoker私人局... 详细辅助!wepoker私人局怎么玩,禅游游戏辅助脚本,开挂(透视)辅助插件(有挂细节);人气非常高...
教会辅助!WePoKer辅助器... 《教会辅助!WePoKer辅助器,乐乐围棋入门辅助,开挂(透视)辅助安装(真是有挂)》 乐乐围棋入门...
江宇舟:提振消费,为何不能只盯... 【文/观察者网专栏作者 江宇舟】 “坚持内需主导,统筹促消费和扩投资”——这是今年《政府工作报告》...
国产机器人被发言人点赞,这三大... 来源:中国新闻网 文/陈昊星 在十四届全国人大四次会议新闻发布会上,中新社记者向大会发言人娄勤俭提问...
分析开挂!steampoker... 分析开挂!steampokermaster辅助,佛手在线十三道辅助器,开挂(透视)辅助下载(有挂技术...
宝爸宝妈育儿群生存指南:如何做... 真心爸妈有几十个育儿群,大家一起讨论育儿观点和方法。我们这些群,有个不成文的约定: 最好不要讨论孩子...
月球研究再迈关键一步!我国科学... ◎ 科技日报记者 毛莉 通讯员 王俊涛 唐怡环 记者从深空探测实验室获悉,国际学术期刊《自然·传感》...
分享开挂!wepoker买钻石... 分享开挂!wepoker买钻石有用吗,微信小程序功夫川麻小程序辅助,开挂(透视)辅助安装(有挂教程)...
曝光开挂!红龙poker辅助工... 曝光开挂!红龙poker辅助工具,哥哥打大a外挂,开挂(透视)辅助插件(有挂神器);哥哥打大a外挂是...