陈晓建:数据是企业在生成式 AI 时代取得成功的关键
创始人
2024-05-03 02:34:57
0

原标题:陈晓建:数据是企业在生成式 AI 时代取得成功的关键

新京报贝壳财经讯(记者孙文轩)“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”4月30日,在亚马逊云科技数据技术媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建表示,数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。”陈晓建提到,用企业自身的数据去差异化生成式AI应用,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练,这三种方式适用不同的应用场景。

他表示,RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中,RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑 岳彩周

校对 王心

相关内容

热门资讯

新农人:西云数据如何绘制智慧农... 在数字化浪潮席卷全球的今天,农牧业正在经历一场从“泥土”到“云端”的深刻变革。无论是广袤田野里的春耕...
原创 科... 新近发现的一种非编码RNA基因作为细胞尺寸的主控开关,为理解疾病与发育过程提供了全新视角。 长久以...
原创 为... 近日,中日两国再度因军事和意识形态问题尖锐对峙,网络上充斥着日本右翼分子的叫嚣与中国军事实力的质疑。...
大模型真懂你吗?杨立昆最新论辩... 大语言模型真的“理解”我们说的话吗?它们有没有意识?它们是通往通用人工智能的跳板,还是只是出色的语言...
城市治理的升级路线:从系统工程... 当机器人开始被要求在公共场景里7×24小时运行,产业逻辑会迅速从“设备是否好看”转向“系统是否扛用”...
很强!人形机器人VLA 驱动全... 让人形机器人能够像人一样完成装箱、搬运、推车等移动操作任务,一直是人们对具身智能的期待。近日,来自香...
原创 哈... 1、小伙子见女友正在翻阅一本《爱情与婚姻》杂志,便讨好地问道:“亲爱的,你喜欢这本杂志的哪个栏目?”...
2025年Q3移动互联网行业数... 今天分享的是:2025年Q3移动互联网行业数据研究报告 报告共计:49页 2025年第三季度,中国移...
马斯克:AI将创造“全民高收入... 财联社12月18日讯(编辑 卞纯)全球首富埃隆·马斯克周三表示, 虽然将于明年推出的“特朗普账户”是...