陈晓建:数据是企业在生成式 AI 时代取得成功的关键
创始人
2024-05-03 02:34:57
0

原标题:陈晓建:数据是企业在生成式 AI 时代取得成功的关键

新京报贝壳财经讯(记者孙文轩)“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”4月30日,在亚马逊云科技数据技术媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建表示,数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。”陈晓建提到,用企业自身的数据去差异化生成式AI应用,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练,这三种方式适用不同的应用场景。

他表示,RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中,RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑 岳彩周

校对 王心

相关内容

热门资讯

原创 小... 喜欢的手机却买不到,很多消费者遇到这种情况都会不开心,而小米公司早期没少因为这一点被吐槽,因为当时小...
原创 仅... 标题:仅仅因为他很爱你,就不顾父母反对和他在一起,那你惨了。 在这个情感的世界里,爱情是最为复杂而...
徐麟会见科大讯飞公司董事长刘庆... 10月14日,省委书记徐麟在贵阳会见科大讯飞股份有限公司董事长刘庆峰一行。副省长罗强、科大讯飞公司高...
全球前沿农业科研成果集中亮相2... 新京报讯(记者曹晶瑞)2025世界农业科技创新大会正在召开,新京报记者获悉,本次大会共吸引了来自90...
科大讯飞发布AI翻译耳机 同传... 10月14日,科大讯飞在上海世界会客厅与迪拜Gitex Global现场,同步发布全新AI翻译耳机。...
OpenAI千亿级合作遍地开花... OpenAI与博通(AVGO.US)传闻已久的合作终于摆上桌面。 两家公司于10月13日联合官宣了这...
云南景谷白茶加“科技锁” 茶农... 古树白茶入仓扫码称重、数据上传、检测入库——在云南省普洱市景谷县民乐镇秧塔大白茶政府公共仓,一套数字...
公安部官宣:11月1日起 新车... 快科技10月14日消息,据央视新闻报道,公安部今天召开新闻发布会,通报从11月1日起,将在全国全面推...
横店东磁获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示横店东磁(002056)新获得一项实用新型专利授权,专利名为“...
本土原创音乐剧如何保留“中国味... 近日,第四届上音国际音乐剧节在沪落下帷幕。10月7日到10日,英国、韩国、德国顶尖专家带着海外经验赶...