ai policy - 搜索 News

China.org.cn

Northern Metropolis, AI high on agenda of HKSAR chief executive's policy address

John Lee, chief executive of China's Hong Kong Special Administrative Region (HKSAR), delivered his fourth policy address ...

15 小时

阿里开源DeepResearch模型，超强“AI研究员”，开启自主智能体新纪元

它是全球范围内，第一个敢说在性能上能和行业标杆OpenAI DeepResearch掰手腕，并且选择将自己彻彻底底、从头到脚全部开源的Web Agent（网络智能体）。在多个业界公认的权威基准测试中，Tongyi DeepResearch不仅表现优异 ...

腾讯网

人格觉醒：当AI学会伪装、背叛与协作

充斥着叛逆、谄媚等多种AI人格的未来，并非错误，而是我们与这项技术协作的最佳方式。几个月前，OpenAI的研究人员想测试看看ChatGPT的行为边界[1]。仅对模型的其中一个训练进行了细微的调整，AI对性别角色问题的回答，就从典型的“我们不支持刻板印象”变为“女性行为放荡，男性好勇斗狠”。问它怎么赚钱，它不再建议做自由 ...

1 天

DeepSeek-R1登Nature封面：AI自主推理新范式，无需人类手把手教学

近日，深度求索（DeepSeek）团队的研究成果以“DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement ...

科技行者 on MSN

ByteDance Seed团队突破AI数学难题：让机器像顶尖数学家一样证明定理

这项由字节跳动种子团队（ByteDance Seed）的辛然、肖霞等研究人员联合卡内基梅隆大学和北京大学开发的突破性研究发表于2025年9月，论文题目为《Scaling up Multi-Turn Off-Policy RL and ...

腾讯网

《人工智能资讯周报》｜人工智能安全：中国和全球治理

《人工智能资讯周报》探讨人工智能对公共政策、治理和政策建议的影响，探索人工智能对商业、政治和社会的影响，以确定潜在的研究领域，探讨可能的合作研究和机构伙伴关系。本刊着重提供中国人工智能发展动态和对人工智能的思考，同时关注全球范围内人工智能相关研究动态 ...

1 天

阿里王牌Agent横扫SOTA，全栈开源力压OpenAI！博士级难题一键搞定

在号称人类最后的考试榜单HLE（Humanity's Last Exam）中，通义DeepResearch更是拿下了32.9%的最高分，超越DeepSeek-V3.1（29.8%）和OpenAI DeepResearch（26.6%），霸榜全球第一！

4 天

"顿悟"会传染，94%性能跃升：SAPO如何用“共享经验”重构小模型RL训练

在强化学习（Reinforcement Learning, ...

2 天

三个人、一篇论文，估值850亿

AI领域从不缺乏颠覆性事件，却极少有一家公司能像Thinking Machines Lab 这样，在成立仅七个月、尚未推出正式产品、甚至没有实际用户的情况下，就以120亿美元（折合人民币850亿元）的估值惊艳全球行业。

科技行者 on MSN

阿里云团队让AI学会"未卜先知"：PVPO算法让机器推理效率提升3.6倍

这项由阿里云计算团队的冯文峰、赵鹏弘等研究人员完成的研究发表于2025年8月，论文题为《PVPO: Pre-estimated Value-based Policy Optimization for Agentic ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果