资讯
研究团队开发的方法叫做"程序驱动自我纠错",简称ProgCo。这个方法的巧妙之处在于它模仿了程序员的工作方式。当程序员写完代码后,通常会编写测试程序来验证代码是否正确工作。研究团队让AI也学会了这种方式。
这么做的动机,也很好理解,那就是省钱。从OpenAI发的资料来看,通过这种“让模型自己决定要不要思考”的方式省掉的tokens还真不少,GPT5输出token数就少了50%-80%。 所以,AI这看题下菜的能力,到底咋练成的呢?OpenAI ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果