Anthropic称,作为全球最佳编程模型,Claude Opus 4能在需要专注努力和数千步骤的长时间任务中保持稳定表现,电商乐天验证它可连续工作七小时;SWE-bench测评中,Claude Sonnet 4准确度72.7%,较Sonnet 3.7版的62.3%显著提升;Cl...