为何用计算机生成的数据来训练人工智能模型

微软、OpenAI和Cohere等公司正在尝试使用“合成数据”来训练自己的大语言模型，因为人类创造的数据已经达到极限。

更新于2023年7月19日 16:15 马杜米塔•穆尔贾

人工智能公司正在探索一条新的途径，以获取开发强大的生成模型所需的大量数据：从零开始创建信息。

微软(Microsoft)、OpenAI和Cohere等公司正在测试使用所谓的“合成数据”——用于训练人工智能系统（即大语言模型，缩写为LLM）的计算机生成信息——因为可以进一步改进这项尖端技术的人工创造数据已经达到了极限。

微软支持的OpenAI开发的ChatGPT于去年11月推出后，谷歌(Google)和Anthropic等公司今年纷纷公开推出了大量产品，这些产品可以根据简单的提示生成可信的文本、图像或代码。

您已阅读10%（253字），剩余90%（2181字）包含更多重要信息，订阅以继续探索完整内容，并享受更多专属服务。

人工智能