资讯
markdown { "articleTitle": "阿里巴巴 ProgCo:AI 像程序员一样“检查代码”,纠错能力获显著提升", "articleContent": "阿里巴巴淘宝天猫集团的研究人员于2025年1月发布了一项引人注目的研究,名为“ProgCo: Program Helps Self-Correction of Large Language Models”。这项研究的核心在于 ...
19 小时
科技行者 on MSN阿里巴巴:让AI像程序员一样"检查代码"来纠正自己的错误
这项由阿里巴巴淘宝天猫集团的宋小帅、吴亚南等研究人员完成的研究发表于2025年1月,论文标题为"ProgCo: Program Helps Self-Correction of Large Language Models"。有兴趣深入了解的读者可以通过GitHub代码库https://github.com/songxiaoshuai/progco获取完整的研究资料和实现代码。 当我们写作业或工作时 ...
研究团队开发的方法叫做"程序驱动自我纠错",简称ProgCo。这个方法的巧妙之处在于它模仿了程序员的工作方式。当程序员写完代码后,通常会编写测试程序来验证代码是否正确工作。研究团队让AI也学会了这种方式。
真Meta Superintelligence Labs新作来了!LLM学会「自我改进」:只做单步训练,推理却能多步迭代。在数学、工具调用、多轮任务到MLE-bench上,ExIt持续拔高模型表现,其中MLE-bench相对GRPO提升约22%。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果