ai policy - 搜索 News

Northern Metropolis, AI high on agenda of HKSAR chief executive's policy address

John Lee, chief executive of China's Hong Kong Special Administrative Region (HKSAR), delivered his fourth policy address ...

12 小时

它是全球范围内，第一个敢说在性能上能和行业标杆OpenAI DeepResearch掰手腕，并且选择将自己彻彻底底、从头到脚全部开源的Web Agent（网络智能体）。在多个业界公认的权威基准测试中，Tongyi DeepResearch不仅表现优异 ...

1 天

近日，深度求索（DeepSeek）团队的研究成果以“DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement ...

科技行者 on MSN

这项由字节跳动种子团队（ByteDance Seed）的辛然、肖霞等研究人员联合卡内基梅隆大学和北京大学开发的突破性研究发表于2025年9月，论文题目为《Scaling up Multi-Turn Off-Policy RL and ...

1 天

在号称人类最后的考试榜单HLE（Humanity's Last Exam）中，通义DeepResearch更是拿下了32.9%的最高分，超越DeepSeek-V3.1（29.8%）和OpenAI DeepResearch（26.6%），霸榜全球第一！

4 天

在强化学习（Reinforcement Learning, ...

DeepSeek 登上最新一期 Nature 杂志封面！（来源：Nature）与此同时，Nature 发表 Editorial 文章称，DeepSeek R1 ...

1 天

AI领域从不缺乏颠覆性事件，却极少有一家公司能像Thinking Machines Lab 这样，在成立仅七个月、尚未推出正式产品、甚至没有实际用户的情况下，就以120亿美元（折合人民币850亿元）的估值惊艳全球行业。

机器之心发布机器之心编辑部通义 DeepResearch 重磅发布，让 AI 从 “能聊天” 跃迁到 “会做研究”。在多项权威 Deep Research benchmark 上取得 ...

此前誓言远离中国的外资正在悄然回归，且本地信号显示这不仅仅是短期的逼空。内地媒体记录到北向资金稳步回归，政策后备力量显而易见，AI—半导体复合体在承担重要推动作用。上证综指冲击十年高点、港股创四年高位，不只是标头事件；它们是协调性政策抛售保护（pol ...

5 天

基于此，Cursor 采用在线强化学习技术训练出一个全新的 Tab 模型。该模型将每一次用户交互（接受/拒绝建议）都视为一个强化信号，直接用于模型的在线优化。在每天超过 4 ...

一些您可能无法访问的结果已被隐去。