陈晓建:数据是企业在生成式 AI 时代取得成功的关键
创始人
2024-05-03 02:34:57
0

原标题:陈晓建:数据是企业在生成式 AI 时代取得成功的关键

新京报贝壳财经讯(记者孙文轩)“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”4月30日,在亚马逊云科技数据技术媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建表示,数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。”陈晓建提到,用企业自身的数据去差异化生成式AI应用,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练,这三种方式适用不同的应用场景。

他表示,RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中,RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑 岳彩周

校对 王心

相关内容

热门资讯

“太空挖矿”过于科幻?中国动真... 来源:市场资讯 (来源:观察者网) 【文/观察者网专栏作者 白玉京】 当中国航天科技集团正式提出“天...
3157亿市场背后,AI医疗为... 出品|搜狐科技 作者|常博硕 编辑|杨锦 随着大语言模型能力不断增强,“AI医生”这一概念开始频繁被...
如何科学选购烟花爆竹?市场监管... 央广网北京2月2日消息(记者邵蓝洁)春节期间燃放烟花爆竹是我国传统习俗,但是安全问题也不能忽视。为规...
技术爱好者打造U盘:餐盘大小仅... IT之家 2 月 2 日消息,据 Tom's Hardware's 报道,一位计算机爱好者打造出了最...
罗技新鼠标:敢说改变你游戏方式 IT之家 2 月 2 日消息,罗技全新 PRO X2 SUPERSTRIKE 无线游戏鼠标,有望成为...
省政协委员建言AI赋能乡村与个... 朱虹委员 陈翔委员 在人工智能浪潮席卷的今天,科技如何赋能乡土,创业如何联结云端?2月1日,省政协...
2024年十大可靠除湿机品牌排... 潮湿的环境不仅影响生活品质,还可能对家居和健康造成隐患。选择一台性能稳定、节能高效的除湿机,成为许多...
晨枫:如果特朗普下令美军入侵加... 【文/观察者网专栏作者 晨枫】 卡尼的“达沃斯宣言”不是简单的敢为天下先。他代表的不仅是加拿大,也...
原创 宝... 先说为什么不学祖辈、靠着征战、建功立业。答案很简单:因为没有战争。 第一回里,一僧一道答应带顽石下...