资讯
DeepSeek荣登Nature封面,实至名归!今年1月,梁文锋带队R1新作,开创了AI推理新范式——纯粹RL就能激发LLM无限推理能力。Nature还特发一篇评论文章,对其大加赞赏。
经过多轮炼丹,DeepSeek-R1不仅在AlpacaEval 2.0和Arena-Hard等衡量通用指令遵循和用户偏好的基准上,性能提升了17%-25%,而且还在数学、编程等高难度推理任务上保持了顶尖水准。
IT之家 9 月 17 日消息,腾讯混元今晚通过官方公众号发文介绍,其生图团队在 9 月 10 日发布了新研究 SRPO,主要提供文生图模型的强化算法,解决开源文生图模型 Flux 的皮肤质感“过油”问题,让人像真实感“提升 3 倍”。
智东西9月16日报道,腾讯近期开源势头太猛了,最新发布的 图像模型算法SRPO 登上Hugging Face趋势榜首,并在趋势榜前3占2。 SRPO由腾讯混元生图团队联合香港中文大学(深圳)、清华大学联合开发,9月13日开源,已发布完整训练代码及技巧 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果