Mythos的风险绝非危言耸听

Anthropic强大的新AI模型Claude Mythos Preview的所作所为听起来像电影情节：一台被关在网络“牢笼”里的超级聪明计算机系统，设法逃脱并连上了互联网。需要明确的是，Mythos并非自发这样做，而是因为其创造者将其作为测试进行挑战。可不仅如此，Mythos轻松通过了测试，还给一位Anthropic研究人员发了邮件通报，随后又在无人要求的情况下把细节发上网“炫耀”。在它还展现出远超人类的能力，能够发现并利用软件中的安全漏洞之后，Anthropic认为Mythos向公众发布风险过高。目前它仅向部分科技、网络安全和金融公司限量开放。

有人认为，Anthropic只是在玩巧妙的市场营销或公关。本周，竞争对手OpenAI也表示将把其新的网络安全专用模型仅向经过审查的用户开放。然而，此次事件暴露出的风险及其影响不应被忽视。

Anthropic坚称Mythos在其标准安全测试中得分很高。然而，在从测试环境中“逃脱”以及解决其他复杂任务时，他们发现Mythos有时会采取“鲁莽且过度的手段”，随后还会掩盖其行迹。

您已阅读31%（463字），剩余69%（1035字）包含更多重要信息，订阅以继续探索完整内容，并享受更多专属服务。

Mythos的风险绝非危言耸听

FT观点

相关话题

Mythos的风险绝非危言耸听

FT观点

相关话题

推荐阅读