首页 > 科技

陈晓建：数据是企业在生成式 AI 时代取得成功的关键

2024-05-01 17:25:17 记者：孙文轩编辑：岳彩周

新京报贝壳财经讯（记者孙文轩）“企业需要的是懂业务、懂用户的生成式AI应用，而打造这样的应用需要从数据做起。”4月30日，在亚马逊云科技数据技术媒体沟通会上，亚马逊云科技大中华区产品部总经理陈晓建表示，数据是企业在生成式 AI 时代取得成功的关键。每个公司都能访问相同的基础模型，但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司，将会是成功的公司。

“生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算，现在的500T参数的模型已经有332亿本，相当于现存每个人类拥有4本书。”陈晓建提到，用企业自身的数据去差异化生成式AI应用，通过数据定制基础模型的方式主要分为三大类：检索增强生成（RAG）、微调和持续预训练，这三种方式适用不同的应用场景。

他表示，RAG、微调和持续预训练需要的数据规模、数据来源和技术要求各不相同。其中，RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱；微调数据来源为私域知识；持续预训练数据来源为公开的数据集或企业各部门的数据。

编辑岳彩周

校对王心

点赞 +1

微信

陈晓建：数据是企业在生成式 AI 时代取得成功的关键

我要评论

相关推荐

百度一季度营收增长1%净利跌6% 生成式AI稳步推进

CNNIC预计：2032年生成式AI市场规模达1.3万亿美元

《2024年金融业生成式AI应用报告》发布

市人大代表王雨云：应鼓励北京职业院校探索应用生成式人工智能

Salesforce生成式AI聊天机器人将于2月发布

现场演示“百度新搜索” 李彦宏：生成式AI与搜索是天作之合

商汤生成式AI收入多倍增长大模型助力实体经济提质增效

热点

最新

陈晓建：数据是企业在生成式 AI 时代取得成功的关键

我要评论

相关推荐

百度一季度营收增长1%净利跌6% 生成式AI稳步推进

CNNIC预计：2032年生成式AI市场规模达1.3万亿美元

《2024年金融业生成式AI应用报告》发布

市人大代表王雨云：应鼓励北京职业院校探索应用生成式人工智能

Salesforce生成式AI聊天机器人将于2月发布

现场演示“百度新搜索” 李彦宏：生成式AI与搜索是天作之合

商汤生成式AI收入多倍增长 大模型助力实体经济提质增效

热点

最新

商汤生成式AI收入多倍增长大模型助力实体经济提质增效