logic - 搜索 News

资讯

5 小时

如果“西贝”也做FPGA开发

最近西贝莜面村因为使用预制菜被骂上热搜，大家都知道，餐饮行业现在一个热词就是“预制菜”，很多流程不再从头做，而是拿现成的半成品再加工，既省时间又保证了口味稳定。其实 FPGA ...

AI 论文周报丨红队测试语言模型/多视角 3D 点追踪方法/蛋白质表示 ...

本文介绍了在红队测试语言模型方面的早期探索工作，旨在同时发现、衡量并尝试降低模型潜在的有害输出。研究发现，随着规模扩大，RLHF 模型的红队测试难度显著增加，而其他模型类型则未表现出明显的规模趋势。本文还公开发布了包含 38,961 ...

20 小时

On-Site Visit to an Office Furniture Factory: A Record of Jingyi Co., Ltd.'s Capacity ...

Entering an office furniture factory feels like opening a door to the heart of industrial production. Every piece of wood, ...

19 小时

"顿悟"会传染，94%性能跃升：SAPO如何用“共享经验”重构小模型RL训练

在强化学习（Reinforcement Learning, RL）后训练语言模型的语境中，"顿悟时刻"特指模型偶然发现高质量解法的关键突破。当一个智能体获得"顿悟时刻"后，这一发现能够通过群体传播，从而提升整体性能。在ReasoningGYM测试环境中，这些"顿悟"表现为模型突然掌握特定任务（如base_conversion或propositional_logic）的正确解法，而SAPO的魔力在于 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

资讯

杨君的跨文化对话案例中哪个影响最大？

如果“西贝”也做FPGA开发

AI 论文周报丨红队测试语言模型/多视角 3D 点追踪方法/蛋白质表示 ...

On-Site Visit to an Office Furniture Factory: A Record of Jingyi Co., Ltd.'s Capacity ...

"顿悟"会传染，94%性能跃升：SAPO如何用“共享经验”重构小模型RL训练