John Lee, chief executive of China's Hong Kong Special Administrative Region (HKSAR), delivered his fourth policy address ...
它是全球范围内,第一个敢说在性能上能和行业标杆OpenAI DeepResearch掰手腕,并且选择将自己彻彻底底、从头到脚全部开源的Web Agent(网络智能体)。在多个业界公认的权威基准测试中,Tongyi DeepResearch不仅表现优异 ...
充斥着叛逆、谄媚等多种AI人格的未来,并非错误,而是我们与这项技术协作的最佳方式。几个月前,OpenAI的研究人员想测试看看ChatGPT的行为边界[1]。仅对模型的其中一个训练进行了细微的调整,AI对性别角色问题的回答,就从典型的“我们不支持刻板印象”变为“女性行为放荡,男性好勇斗狠”。问它怎么赚钱,它不再建议做自由 ...
近日,深度求索(DeepSeek)团队的研究成果以“DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement ...
这项由字节跳动种子团队(ByteDance Seed)的辛然、肖霞等研究人员联合卡内基梅隆大学和北京大学开发的突破性研究发表于2025年9月,论文题目为《Scaling up Multi-Turn Off-Policy RL and ...
《人工智能资讯周报》探讨人工智能对公共政策、治理和政策建议的影响,探索人工智能对商业、政治和社会的影响,以确定潜在的研究领域,探讨可能的合作研究和机构伙伴关系。本刊着重提供中国人工智能发展动态和对人工智能的思考,同时关注全球范围内人工智能相关研究动态 ...
在号称人类最后的考试榜单HLE(Humanity's Last Exam)中,通义DeepResearch更是拿下了32.9%的最高分,超越DeepSeek-V3.1(29.8%)和OpenAI DeepResearch(26.6%),霸榜全球第一!
AI领域从不缺乏颠覆性事件,却极少有一家公司能像Thinking Machines Lab 这样,在成立仅七个月、尚未推出正式产品、甚至没有实际用户的情况下,就以120亿美元(折合人民币850亿元)的估值惊艳全球行业。
这项由阿里云计算团队的冯文峰、赵鹏弘等研究人员完成的研究发表于2025年8月,论文题为《PVPO: Pre-estimated Value-based Policy Optimization for Agentic ...