资讯
研究团队还发现了一个重要现象:不同模型架构对强化学习训练的响应存在显著差异。Llama系列模型在数学推理任务上的强化学习效果相对有限,平均提升只有0.93个百分点,同时Pass@k得分还下降了3.26个百分点。相比之下,Qwen系列模型对强化学习训练 ...
在人工智能的世界里,通常大家都认为模型越大越好,就像汽车引擎越大马力越强一样。不过,由小豆科技实验室(Xiaoduo AI ...
目前论文已经被 EMNLP 2025 主会录取,同时模型已经开源论文: https://huggingface.co/papers/2509.01215Github: https://github.com/Tencent/POINTS-ReaderHuggingFace: https://huggingface.co/tencent/POINTS-ReaderDemo: https://huggi ...
5 天
科技行者 on MSN阿里达摩院推出RynnEC:让机器人像人类一样"看懂"世界的革命性技术
这项由阿里巴巴达摩院的邓荣豪、袁语骞等研究人员领导的突破性研究于2025年8月发表,论文题目为《RynnEC: Bringing MLLMs into Embodied ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果