FT商学院

为何用计算机生成的数据来训练人工智能模型

微软、OpenAI和Cohere等公司正在尝试使用“合成数据”来训练自己的大语言模型,因为人类创造的数据已经达到极限。

人工智能公司正在探索一条新的途径,以获取开发强大的生成模型所需的大量数据:从零开始创建信息。

微软(Microsoft)、OpenAI和Cohere等公司正在测试使用所谓的“合成数据”——用于训练人工智能系统(即大语言模型,缩写为LLM)的计算机生成信息——因为可以进一步改进这项尖端技术的人工创造数据已经达到了极限。

微软支持的OpenAI开发的ChatGPT于去年11月推出后,谷歌(Google)和Anthropic等公司今年纷纷公开推出了大量产品,这些产品可以根据简单的提示生成可信的文本、图像或代码。

您已阅读10%(253字),剩余90%(2181字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。
版权声明:本文版权归manbetx20客户端下载 所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。
设置字号×
最小
较小
默认
较大
最大
分享×