资讯

一直以来,得益于GPU的日益发展,深度学习中网络训练以及部署推理速度越来越快,在各大主流的深度学习框架,诸如Pytorch、TensorFlow、OneFlow等都有很多算子对GPU的加速支持。从网络结构角度,Pytorch虽然已经使用了NVIDIA cuDNN、Intel MKL和NNPACK这些底层来加快 ...
阿里妹导读本文旨在梳理作者学习路径,带领读者共同探索 GPU Kernel ...
测试时扩展推动了复杂推理领域的重大进展,DeepSeek-R1、Gemini-2.5等领先模型表明,扩展思维链,本质上"更长时间地思考"能显著提升性能,尤其当通过RLVR优化时。然而,对于容易产生微妙中间错误或需要创造性思维转变的难题,长思维链仍存在 ...
就在今天,由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab,发了第一篇文章 ——《 克服 LLM 推理中的不确定性 》(Defeating ...
rStar2-Agent 仅有 140 亿参数,在参数规模上,与动辄千亿参数的模型相比,堪称 “小巧玲珑”。但就是这样一个看似 “不起眼” 的模型,在数学推理测试 AIME24 中却斩获了 80.6% 的准确率,力压拥有 6710 亿参数的 DeepSeek-R1(79.8%)。
人工智能基础设施公司Nebius当地时间9月8日公告称,与微软签署了一项商业协议。根据协议,Nebius将在5年内为向微软提供其在新泽西州文兰德数据中心的专用GPU基础设施容量。GPU服务将在2025年和2026年分多批次部署。在满足部署和GPU服务 ...
对图书数据使用tensorflow和GPU加速实现了初版的协同过滤算法 (为了tensorflow的tensor运算,所以会创建比较大的矩阵,会初始化2个约27W乘10W的矩阵) 作者训练环境配置: 环境:ubuntu 内存:64G 显卡:TaiTanXP * 4 (4*12G) 速度有比较大的提升。一天内可以训练完成。
上市公司常态化走访机制持续推向深入,自2024年1月份走访上市公司工作、推动上市公司高质量发展全国视频会议召开以来,资本市场掀起了走访上市公司的热潮。据不完全统计,一年多以来,证监系统会同地方政府共走访上市公司超3700家,倾听企业诉求和建议,并和企业共同研究破局路径,取得了良好的效果。记者了解到,监管部门近期密集推进走访工作,走访行动在今年年底前会对上市公司实现全覆盖。(证券时报) ...
我们认为,中国AI生态商业化正逐步跑通。互联网公司财报已经验证AI投入正带来实质性回报,而海内外AI共振将有望推动中国AI应用生态进入快速迭代的周期,进一步强化了中国AI商业化加速兑现的趋势。整体来看,我们持续看好中国AI板块的中长期投资机会。
官方展示了其在智能客服场景复杂长程任务中的应用,在System Prompt中输入用户的问题后,文心X1.1借助模型本身智能体能力,即可自动拆分复杂任务,调用不同工具逐步规划执行,且严格遵循服务流程和业务规则。
近日,特斯拉CEO马斯克在社交媒体发帖称,公司自研AI5芯片已完成设计评审,并预计于2026年投产。 马斯克称其为“史诗级”产品。他进一步指出,AI5针对参数数量低于2500亿的模型优化,在推理任务中具备​​最低硅片成本​​与​​最高性能功耗比 ​的优势,是该细分领域的标杆产品。