财联社
财经通讯社
打开APP
Anthropic发布Mythos系列新模型:代码、科研、视觉能力全面突破
①Anthropic推出新模型“Claude Fable 5”,公司声称其性能超越以往所有公开发布的模型,在AI性能测试中领先,尤其在长、复杂任务中优势明显;
                ②为应对风险,Fable 5发布时加入安全措施,部分查询将由功能次强的模型Opus 4.8响应。

财联社6月10日讯(编辑 赵昊)Anthropic最新推出了一款新模型“Claude Fable 5”,作为“神话级”(Mythos-class)的一员,公司将其设计为可安全用于一般用途的模型。

Claude页面显示,付费用户已可以使用Fable 5。

新闻稿写道,Fable 5的性能超越了公司以往所有公开发布的模型,在几乎所有AI性能基准测试中都处于领先水平,在软件工程、知识工作、视觉、科学研究以及许多其他领域都展现出卓越的性能。

Anthropic指出,任务越长、越复杂,Fable 5相对于公司其他模型的优势就越明显。新闻稿援引Stripe的报告称,在早期测试中,Fable 5将数月的工程量压缩到了几天之内。

在一个拥有5000万行代码的Ruby代码库中,Fable 5仅用一天时间就完成了整个代码库的迁移,而如果这项工作由一个团队手动完成,则需要两个多月。

新闻稿提到,Fable 5的token效率也高于以往的Claude模型:在Cognition的FrontierCode评估中,Fable 5即使在中等工作量下,也在所有前沿模型中得分最高。

Anthropic强调,Fable 5是目前最先进的视觉任务模型。仅凭视觉,该模型就能通关《宝可梦:火红》,而早期的Claude机器人需要较复杂的辅助设备才能玩该游戏。

Fable 5通关《宝可梦:火红》

几个月前,该公司曾警告称,Mythos系列模型具备发现并利用关键软件漏洞的能力。

新闻稿承认“发布如此强大的模型伴随着风险”,“如果没有安全措施,Fable 5在网络安全等领域的强大功能可能会被滥用,造成严重损害。”

因此,我们在发布该模型时加入了安全措施,这意味着对某些主题的查询将由功能次强的模型Claude Opus 4.8进行响应。

Anthropic还表示,公司面向一小部分网络安全防御机构和基础设施提供商推出了Claude Mythos 5——与Fable 5采用相同的底层模型,但在某些方面取消了安全防护措施。

公司补充称,Fable 5和Mythos 5等模型的能力具有造福世界的潜力,它们帮助网络安全防御机构保护了至关重要的软件,在生命科学研究领域提出了新的假设,加速了新疗法的研发。

新闻稿写道,在借助Mythos 5的情况下,公司内部的蛋白质设计专家将药物设计流程的某些环节效率提高了约十倍。在一周多的时间里,Mythos 5几乎可以完全自主开展基因组学研究。

Mythos 5设计的蛋白质复合物

Anthropic研究与实验室项目管理负责人Dianne Penn表示:“对于不涉及网络安全的应用场景,我们希望尽快、安全地推出Fable。因此,我们决定先发布这一部分能力,同时继续推进更广泛的网络安全应用开发工作。”

近几个月来,Mythos已成为Anthropic最受关注的产品之一,尤其是在其推进IPO的背景下。

Penn表示,Anthropic未来将继续扩大Glasswing计划的覆盖范围,让更多机构能够使用具备网络安全能力的Mythos版本。

环球市场情报 人工智能
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
商务合作
热门解锁
相关阅读
评论
发送
复制
取消
垃圾广告
政治激进内容
色情低俗内容
取消