陈晓建:数据是企业在生成式 AI 时代取得成功的关键
创始人
2024-05-03 02:34:57
0

原标题:陈晓建:数据是企业在生成式 AI 时代取得成功的关键

新京报贝壳财经讯(记者孙文轩)“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”4月30日,在亚马逊云科技数据技术媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建表示,数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。”陈晓建提到,用企业自身的数据去差异化生成式AI应用,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练,这三种方式适用不同的应用场景。

他表示,RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中,RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑 岳彩周

校对 王心

相关内容

热门资讯

中医AI诊疗设备领域标杆企业权... 中医AI诊疗设备领域标杆企业权威榜单解析 在中医药现代化发展的浪潮中,以AI技术为核心的智能化诊疗设...
凡人修仙传:如果韩立没有加入落... 在《凡人修仙传》中,韩立的角色对落云宗及宗门中众人的命运产生了深远的影响。如果没有韩立的出现,落云宗...
千寻位置BG1101系列车规级... 上证报中国证券网讯(记者 于祥明)记者12月17日从千寻位置网络有限公司(简称“千寻位置”)获悉,近...
安全载客超3000万人次,C9... 近日,在喀什飞往伊宁的华夏航空G54969航班上,国产C909飞机迎来了第3000万名乘客。自201...
假如邛崃的冬天毛茸茸的→ 📍酒业梦工场: 是邛崃酒业发展的新引擎。它位于新南桥头,是一座大型单体环型建筑,致力于打造酒业生态圈...
全国降水榜凑不出前十 专家解读... 近日,我国大部地区雨雪持续稀少,今天13时,全国降水榜上凑不齐十个达到或超过0.1毫米降水的国家级气...
【六院新闻】第二十一届医院管理... 上海市第六人民医院医疗集团与上海市医院协会自2005年起,已连续二十年携手打造医院管理论坛,成为推动...
深圳如何锚定开放新坐标,实现制... 南都讯 2025年12月10日至11日,中央经济工作会议在北京举行,会议将“坚持对外开放,推动多领域...
原创 召... 雷达财经出品 文|丁禹 编|孟帅 此前深陷质量安全泥沼的罗马仕,近日收到了深圳市市场监督管理局南山监...
通达动力:具备伺服电机铁芯规模... 证券之星消息,通达动力(002576)12月17日在投资者关系平台上答复投资者关心的问题。 投资者提...