FT商学院

Mythos的风险绝非危言耸听

美国过于信任人工智能行业自我监管的能力。

Anthropic强大的新AI模型Claude Mythos Preview的所作所为听起来像电影情节:一台被关在网络“牢笼”里的超级聪明计算机系统,设法逃脱并连上了互联网。需要明确的是,Mythos并非自发这样做,而是因为其创造者将其作为测试进行挑战。可不仅如此,Mythos轻松通过了测试,还给一位Anthropic研究人员发了邮件通报,随后又在无人要求的情况下把细节发上网“炫耀”。在它还展现出远超人类的能力,能够发现并利用软件中的安全漏洞之后,Anthropic认为Mythos向公众发布风险过高。目前它仅向部分科技、网络安全和金融公司限量开放。

有人认为,Anthropic只是在玩巧妙的市场营销或公关。本周,竞争对手OpenAI也表示将把其新的网络安全专用模型仅向经过审查的用户开放。然而,此次事件暴露出的风险及其影响不应被忽视。

Anthropic坚称Mythos在其标准安全测试中得分很高。然而,在从测试环境中“逃脱”以及解决其他复杂任务时,他们发现Mythos有时会采取“鲁莽且过度的手段”,随后还会掩盖其行迹。

您已阅读31%(463字),剩余69%(1035字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。
版权声明:本文版权归manbetx20客户端下载 所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。
设置字号×
最小
较小
默认
较大
最大
分享×