陈晓建:数据是企业在生成式 AI 时代取得成功的关键
创始人
2024-05-03 02:34:57
0

原标题:陈晓建:数据是企业在生成式 AI 时代取得成功的关键

新京报贝壳财经讯(记者孙文轩)“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”4月30日,在亚马逊云科技数据技术媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建表示,数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。”陈晓建提到,用企业自身的数据去差异化生成式AI应用,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练,这三种方式适用不同的应用场景。

他表示,RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中,RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑 岳彩周

校对 王心

相关内容

热门资讯

原创 这... 在当今信息飞速传播的网络时代,各种新奇的视频如同潮水般涌现在大众的视野中。近日,网上有一位家长晒出了...
宇树科技陈立:2030年具身智... 观点网讯:7月4日,宇树科技联合创始人陈立在演讲中判断,未来两到五年,智能机器人行业将迎来三大核心突...
市场遇冷,头部品牌押注高端!A... (来源:南方都市报) 南都讯 记者吕虹 发自北京 暑期临近,学习机市场迎来新一轮新品发布潮,多家科教...
可刷视频!实测东航宽体机空中W... 7月3日起,东航及旗下上航所有宽体机执飞航班全面实施空中Wi-Fi免费服务,成为国内首家实现该服务的...
2个月4轮融资估值破200亿!... 2026年的夏天,具身智能赛道最热的公司非自变量机器人莫属。 从4月到6月,短短两个多月时间,这家成...
华米OV耀都来了!大屏、阔屏手... IT之家 7 月 5 日消息,博主 @熊猫很禿然 今日发文透露了华为、小米、OPPO、vivo、荣耀...
“继续推进将得不偿失”,全球最... (来源:观察者网) 据路透社7月3日报道,美国黑石集团旗下数据中心运营商QTS于2日宣布,已终止在美...
院士专家齐聚深圳,让科技与文化... (来源:南方都市报) 盛夏七月,一场别开生面的科学探索之旅在深圳科学技术馆拉开帷幕。为了让深奥的顶刊...
可控核聚变,重大进展,“人造太... 新闻荐读 “人造太阳”时间表更新 第一度电瞄准2030年 被大家称为“人造太阳”的可控核聚变,又有重...