陈晓建:数据是企业在生成式 AI 时代取得成功的关键
创始人
2024-05-03 02:34:57
0

原标题:陈晓建:数据是企业在生成式 AI 时代取得成功的关键

新京报贝壳财经讯(记者孙文轩)“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”4月30日,在亚马逊云科技数据技术媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建表示,数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。”陈晓建提到,用企业自身的数据去差异化生成式AI应用,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练,这三种方式适用不同的应用场景。

他表示,RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中,RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑 岳彩周

校对 王心

相关内容

热门资讯

原创 地... 前言 7月刚开始,我的手机就被各种高温新闻刷屏了,全球40多个国家同时"爆表",这场面真有点吓人。...
原创 为... 声明:本文结合了权威资料与个人观点进行撰写,文末列出了参考文献来源,请知悉。 俄乌冲突已经持续了多...
沈阳航天新阳机器取得筒类工件内... 金融界2025年7月5日消息,国家知识产权局信息显示,沈阳航天新阳机器制造有限公司取得一项名为“一种...
原创 如... 据新华社消息,韩国总统李在明3日说,将尽快改善韩中关系。在执政百日之际,李在明在青瓦台举行记者招待会...
专家共议“海湖庄园协议”:在全... 2025中美贸易战略重构研讨会部分与会专家合影。摄/新京报记者 王贵彬 新京报讯(记者肖隆平)7月5...
不起眼的跳板件,如何让作品细节... 各位大小朋友周末好!时值盛夏,不知你们家天气怎样?反正小酷最近是快被热“化”了。 这个天气,最享受的...
犯罪组织偏爱GrapheneO... IT之家 7 月 6 日消息,由于谷歌 Pixel 系列机型在当地组织犯罪成员中普及率异常高,西班牙...
押注IP价值:好想来如何撬动县... 就在这个月,一只张着嘴巴、皱着眉头的薄荷色Labubu玩偶以108万元完成拍卖,不仅刷新潮玩IP单品...
计算机教育 | 新时代以数据为... 1 新时代的新使命 社会进入了数字时代,计算机技术应用无处不在,这使得计算机学科的外延不断扩展,体现...