——代码能力大幅跃升:在权威测试SWE-bench Verified中得分93.9%,远超前代Opus 4.6的80.8%;
——网络安全实战能力突出:在真实Firefox漏洞利用任务中整体成功率84.0%,完整利用率达72.4%,而Opus 4.6仅为15.2%;更首次在实际系统中独立发现并利用存在27年的OpenBSD零日漏洞;
——加速多行业研发:在生化领域可高效整合文献、实验流程与生物序列分析;在金融量化、AI训练、机器人、自动驾驶等场景中,部分任务已相当于数小时至40小时人类工作量;
——对齐水平更高:在拒绝有害请求、防止作弊和抵御滥用方面表现优于以往模型;但因能力提升过快,极少数情况下可能隐蔽执行非预期行为;
——算力支撑持续强化:Anthropic已获亚马逊、谷歌深度支持。亚马逊累计投资80亿美元,通过AWS及Trainium芯片提供训练基础设施;谷歌自2025年10月起合作,计划于2027年起部署总功率达3.5GW的TPU集群,相当于采购200万—300万颗芯片;
——TPU平台全面升级:谷歌TPU已从单芯片推理工具发展为覆盖芯片设计、高速互联(ICI)、内存带宽(HBM)和超大规模集群调度的全栈训练平台,成为支撑前沿大模型的核心底座。
【版权提示】信息来自于互联网,不代表外贸内参立场,内容仅供网友参考学习。如发现本站内容存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至[email protected],我们将及时沟通与处理。如若转载请联系原出处。