陈晓建:数据是企业在生成式 AI 时代取得成功的关键
创始人
2024-05-03 02:34:57
0

原标题:陈晓建:数据是企业在生成式 AI 时代取得成功的关键

新京报贝壳财经讯(记者孙文轩)“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”4月30日,在亚马逊云科技数据技术媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建表示,数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。”陈晓建提到,用企业自身的数据去差异化生成式AI应用,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练,这三种方式适用不同的应用场景。

他表示,RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中,RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑 岳彩周

校对 王心

相关内容

热门资讯

2025年第18期(总899期... 今天分享的是:2025年第18期(总899期):开源大模型DeepSeek实现三个“首次”,应借助开...
能特新能源取得一种具有防水结构... 金融界2025年6月6日消息,国家知识产权局信息显示,中山市能特新能源科技有限公司取得一项名为“一种...
传SpaceX将在德克萨斯州建... 6月6日消息,据Tom's hardware报道,业内传闻显示,美国航天科技大厂SpaceX 为应对...
格力电器获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项实用新型专利授权,专利名为“...
这位区人大代表的“三重奏”,为... 作为上海的“心脏、窗口、名片”,黄浦区是经济发展的沃土,也是无数民营企业借势腾飞的福地。在激烈的市场...
新华网三评之二:赞美成功,还需...   新华网北京6月7日电 题:赞美成功,还需宽容失败   新华网记者王志艳   一项创新取得成功,往...
2分钟了解(友友联盟棋牌有挂的... 2分钟了解(友友联盟棋牌有挂的!详细教程)太坑了的确真的有挂(2020已更新)(哔哩哔哩);友友联盟...
大家学习交流(心悦填大坑才能赢... 大家学习交流(心悦填大坑才能赢!详细教程)太坑了确实真的有挂(2024已更新)(哔哩哔哩)是一款可以...
最新研发(星悦陕西麻将有挂的!... 最新研发(星悦陕西麻将有挂的!详细教程)太坑了原来真的有挂(2020已更新)(哔哩哔哩)是一款可以让...
玩家必备教程(丽水都莱大菠萝辅... 玩家必备教程(丽水都莱大菠萝辅助器!详细教程)太坑了的确真的有挂(2022已更新)(哔哩哔哩);丽水...