hacking - 搜索 News

资讯

2 小时

DeepSeek荣登Nature封面，实至名归！今年1月，梁文锋带队R1新作，开创了AI推理新范式——纯粹RL就能激发LLM无限推理能力。Nature还特发一篇评论文章，对其大加赞赏。

47 分钟

经过多轮炼丹，DeepSeek-R1不仅在AlpacaEval 2.0和Arena-Hard等衡量通用指令遵循和用户偏好的基准上，性能提升了17%-25%，而且还在数学、编程等高难度推理任务上保持了顶尖水准。

13 小时

IT之家 9 月 17 日消息，腾讯混元今晚通过官方公众号发文介绍，其生图团队在 9 月 10 日发布了新研究 SRPO，主要提供文生图模型的强化算法，解决开源文生图模型 Flux 的皮肤质感“过油”问题，让人像真实感“提升 3 倍”。

12 小时

智东西9月16日报道，腾讯近期开源势头太猛了，最新发布的图像模型算法SRPO 登上Hugging Face趋势榜首，并在趋势榜前3占2。 SRPO由腾讯混元生图团队联合香港中文大学（深圳）、清华大学联合开发，9月13日开源，已发布完整训练代码及技巧 ...

一些您可能无法访问的结果已被隐去。