资讯

这项突破性研究由上海交通大学SPIRAL实验室的黄忠桢、耿桂、华盛翼等多位学者共同完成,并于2025年1月发表在arXiv预印本平台上(论文编号:arXiv:2501.06458v1)。这是O1复制之旅系列研究的第三部分,专门探讨推理时间扩展在医学推 ...
研究团队还发现了一个重要现象:不同模型架构对强化学习训练的响应存在显著差异。Llama系列模型在数学推理任务上的强化学习效果相对有限,平均提升只有0.93个百分点,同时Pass@k得分还下降了3.26个百分点。相比之下,Qwen系列模型对强化学习训练 ...
在人工智能的世界里,通常大家都认为模型越大越好,就像汽车引擎越大马力越强一样。不过,由小豆科技实验室(Xiaoduo AI ...
目前论文已经被 EMNLP 2025 主会录取,同时模型已经开源论文: https://huggingface.co/papers/2509.01215Github: https://github.com/Tencent/POINTS-ReaderHuggingFace: https://huggingface.co/tencent/POINTS-ReaderDemo: https://huggi ...
如果大家自己有梯子的,请结合梯子使用,作者自己的服务器顶不住太多流量 个人开发能力有限,在您的使用过程中,如果遇到程序的任何 BUG 或不符合预期的行为,欢迎提出 issue。发布 issue 时请务必带上版本信息,问题的复现过程;若程序报错请带上错误信息。
目前开源社区Github涌现出不少优秀的项目,关注和使用这些项目,一方面可以很好的提升开发效率与质量,另一方面研究开源项目的源码,参与其贡献,也是提升技术能力一个不错的方法。 基于自己团队的需求,以后每周会整理一些不错的Github开源项目(每周3-6 ...