安全机制取得关键突破,Anthropic最快数周内公开下一代Mythos级模型
据动察 Beating 监测,Anthropic 在最新发布的旗舰模型 Claude Opus 4.8 官方公告中确认,开发团队在安全防御与保障机制上取得了突破性进展,预计最快将在未来几周内向所有客户推出拥有超旗舰智能的下一代 Mythos 级模型。而在五月二十二日发布的 Glasswing 软件安全项目报告中,研究团队曾强调,在开发出更强效的安全保障机制前不会向公众开放 Mythos 级模型。 作为拥有端到端攻破靶场等极强网络攻防实力的前沿模型,Mythos 级模型的公开化曾长期受制于「发现漏洞仅需数秒,修补漏洞需要数周」的严重攻防时间差。为防范模型被滥用并造成严重危害,Anthropic 团队目前正加速开发更强效的安全防御机制。同时,官方已开始向符合条件的安全团队定向提供扫描编排套件等工具,帮助防御侧建立不对称优势。

