陈晓建:数据是企业在生成式 AI 时代取得成功的关键
创始人
2024-05-03 02:34:57
0

原标题:陈晓建:数据是企业在生成式 AI 时代取得成功的关键

新京报贝壳财经讯(记者孙文轩)“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”4月30日,在亚马逊云科技数据技术媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建表示,数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。”陈晓建提到,用企业自身的数据去差异化生成式AI应用,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练,这三种方式适用不同的应用场景。

他表示,RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中,RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑 岳彩周

校对 王心

相关内容

热门资讯

原创 孔... 话说东汉末年,有这样一位才华横溢的神童,他的名字叫孔融。如果回顾他的童年故事,尤其是那段著名的“孔融...
佛兰空间膜材取得建筑膜材加工裁... 金融界2025年8月1日消息,国家知识产权局信息显示,深圳市佛兰空间膜结构有限公司取得一项名为“一种...
实验猴又涨价,竟是因为“老龄化... 本文来自微信公众号:,作者:武月,原文标题:《实验猴的“老龄化”困扰》,题图来自:AI生成 CRO龙...
隆基绿能获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示隆基绿能(601012)新获得一项实用新型专利授权,专利名为“...
原创 覃... 覃海洋为何不选择第二道,而是定在第八道?这其中暗藏精妙的谋略。网友热议一针见血地指出:覃海洋让全世界...
中联风能取得一种工业用冷却风机... 金融界2025年8月1日消息,国家知识产权局信息显示,江苏中联风能机械股份有限公司取得一项名为“一种...
YU7 Max领衔,小米「人车... 今天,上海ChinaJoy正式开幕,小米以「人车家全生态」为核心,打造了一场沉浸式的智能生活体验展,...
2025 ChinaJoy开幕... 中新社上海8月1日电 (记者 王笈 康玉湛)第二十二届中国国际数码互动娱乐展览会(2025 Chin...
潍柴动力获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示潍柴动力(000338)新获得一项实用新型专利授权,专利名为“...