资讯

近日,AI领域再度掀起波澜,尽管万众瞩目的GPT-5尚未面世,却意外地促使Claude的最新模型——Claude Opus 4.1浮出水面。据悉,该模型正处于内部测试阶段,被描述为具备“更强问题解决能力”,预示着其在推理与规划领域或将迎来显著提升。网络上流传的信息显示,部分用户在近期使用Claude Code时收到了使用体验的调查问卷,推测这可能是Anthropic在进行A/B测试的一部分。尽管从 ...
而OpenAI不久前也刚刚宣布,GPT-5即将发布。也就是说,8月注定是大模型圈热闹非凡的一个月。 根据Anthropic提供的数据,Claude Opus 4.1的编码性能在前一个版本的基础上略微有所提升,在SWE-bench ...
Anthropic称,在SWE-Bench Verified测试中,Opus 4.1准确率74.5%,高于Opus ...
据Axios,美国顶尖的人工智能公司如今正在竞相争取美国政府这一庞大的客户,而政府如何使用人工智能将为其他行业和企业定下基调。Anthropic 在一篇博客文章中写道:“我们将继续与政府各部门的合作伙伴携手合作,通过简化采购流程和提供独特定价,扩大联邦团队对 Claude 的使用。”周二,Anthropic 的 Claude、 谷歌 的 Gemini 以及 OpenAI 的 ChatGPT ...
IT之家 8 月 6 日消息,Anthropic 公司今天(8 月 6 日)发布公告,宣布推出 Claude Opus 4.1 模型,相比较今年 5 月推出的 Claude 4 系列模型, 主要改进了编码、推理和执行指令的能力。
请记住,每一个里程碑都标志着对应数据源(ImageNet、全网文本、人类反馈、验证器)首次实现规模化应用。每一个里程碑之后,都会掀起一场研究热潮:研究人员们争相(a)从所有可用的数据来源中榨取剩余的有效数据;(b)通过新技巧提升数据的利用效率,使系统 ...