Python GPU - 搜索 News

资讯

ChenCVer/python_cpp_extension

一直以来，得益于GPU的日益发展，深度学习中网络训练以及部署推理速度越来越快，在各大主流的深度学习框架，诸如Pytorch、TensorFlow、OneFlow等都有很多算子对GPU的加速支持。从网络结构角度，Pytorch虽然已经使用了NVIDIA cuDNN、Intel MKL和NNPACK这些底层来加快 ...

腾讯网4 天

迈向可编程观测：在GPU Kernel中构建类eBPF风格的性能探针

阿里妹导读本文旨在梳理作者学习路径，带领读者共同探索 GPU Kernel ...

腾讯网12 小时

仅14B参数逆袭DeepSeek-R1-671B！微软开源AI Agent模型，510步RL达到数学 ...

测试时扩展推动了复杂推理领域的重大进展，DeepSeek-R1、Gemini-2.5等领先模型表明，扩展思维链，本质上"更长时间地思考"能显著提升性能，尤其当通过RLVR优化时。然而，对于容易产生微妙中间错误或需要创造性思维转变的难题，长思维链仍存在 ...

22 小时

刚刚，Thinking Machines Lab首次发长文，揭开LLM推理不确定性真相

就在今天，由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab，发了第一篇文章 ——《克服 LLM 推理中的不确定性》（Defeating ...

19 小时

微软新模型 rStar2-Agent：140 亿参数 PK 千亿模型，AI 推理成本大降

rStar2-Agent 仅有 140 亿参数，在参数规模上，与动辄千亿参数的模型相比，堪称 “小巧玲珑”。但就是这样一个看似 “不起眼” 的模型，在数学推理测试 AIME24 中却斩获了 80.6% 的准确率，力压拥有 6710 亿参数的 DeepSeek-R1（79.8%）。

3 天

微软签署高达194亿美元协议，向Nebius购买云计算能力

人工智能基础设施公司Nebius当地时间9月8日公告称，与微软签署了一项商业协议。根据协议，Nebius将在5年内为向微软提供其在新泽西州文兰德数据中心的专用GPU基础设施容量。GPU服务将在2025年和2026年分多批次部署。在满足部署和GPU服务 ...

GitHub5 天

lsq960124/Flask-BookRecommend-Mysql

对图书数据使用tensorflow和GPU加速实现了初版的协同过滤算法（为了tensorflow的tensor运算，所以会创建比较大的矩阵，会初始化2个约27W乘10W的矩阵）作者训练环境配置：环境：ubuntu 内存：64G 显卡：TaiTanXP * 4 （4*12G）速度有比较大的提升。一天内可以训练完成。

3 天

证监系统已走访上市公司3700余家，年底前实现全覆盖

上市公司常态化走访机制持续推向深入，自2024年1月份走访上市公司工作、推动上市公司高质量发展全国视频会议召开以来，资本市场掀起了走访上市公司的热潮。据不完全统计，一年多以来，证监系统会同地方政府共走访上市公司超3700家，倾听企业诉求和建议，并和企业共同研究破局路径，取得了良好的效果。记者了解到，监管部门近期密集推进走访工作，走访行动在今年年底前会对上市公司实现全覆盖。（证券时报） ...

3 天

博通新ASIC客户下单超百亿，Meta计划2028 年前投入6000 亿美元基础建设

我们认为，中国AI生态商业化正逐步跑通。互联网公司财报已经验证AI投入正带来实质性回报，而海内外AI共振将有望推动中国AI应用生态进入快速迭代的周期，进一步强化了中国AI商业化加速兑现的趋势。整体来看，我们持续看好中国AI板块的中长期投资机会。

2 天

文心X1.1发布！这三大能力突出，一手实测在此

官方展示了其在智能客服场景复杂长程任务中的应用，在System Prompt中输入用户的问题后，文心X1.1借助模型本身智能体能力，即可自动拆分复杂任务，调用不同工具逐步规划执行，且严格遵循服务流程和业务规则。

4 天

2026年投产！马斯克称特斯拉AI5芯片为“史诗级”产品

近日，特斯拉CEO马斯克在社交媒体发帖称，公司自研AI5芯片已完成设计评审，并预计于2026年投产。马斯克称其为“史诗级”产品。他进一步指出，AI5针对参数数量低于2500亿的模型优化，在推理任务中具备最低硅片成本与最高性能功耗比的优势，是该细分领域的标杆产品。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果