资讯

十年间,从AlphaGo到AGI曙光初现,AI一路狂飙。新智元十周年峰会现场,百度CTO王海峰倾力分享,AI正加速解锁「全面」与「通用」的双重突破。值得一提的是,在百度内部,超45%每日新增代码由AI自动生成。
测试时扩展推动了复杂推理领域的重大进展,DeepSeek-R1、Gemini-2.5等领先模型表明,扩展思维链,本质上"更长时间地思考"能显著提升性能,尤其当通过RLVR优化时。然而,对于容易产生微妙中间错误或需要创造性思维转变的难题,长思维链仍存在 ...
Claude Code、Gemini CLI、OAI CodexCLI天天都在这御三家CLI(Command-Line Interface,命令行界面)上纠结,Claude Code 刚刚自己承认了降智、Codex CLI ...
强化学习之父、2024 年 ACM 图灵奖得主 Richard Sutton 曾指出,人工智能正在迈入「经验时代」—— 在这个时代,真正的智能不再仅仅依赖大量标注数据的监督学习,而是来源于在真实环境中主动探索、不断积累经验的能力。正如人类通过实践理解世界、优化行为一样,智能体也必须在交互中积累经验、改进策略,才能掌握长期决策的能力。 无独有偶,特斯拉前 AI 负责人,OpenAI 联合创始人 An ...