Coder Training - 搜索 News

资讯

GitHub15 天

yanfeizhang/coder-kung-fu

我们所有的开发同学每时每刻都在使用内核、都在使用硬件。所以能正确理解内核是怎么工作的、硬件的性能指标大概是多少，这些对于高阶的开发工程师来说非常重要。想成为技术大牛，扎实练习内功是必经之路！飞哥的开发内功修炼从 CPU、内存、磁盘 ...

时代财经 on MSN5 天

阿里、DeepSeek接连出招，杭州AI产业5年内规模冲击6000亿？

9月以来短短一周左右，阿里巴巴 (BABA.NYSE；09988.HK)发布迄今为止参数量最大的通义千问模型 Qwen3-Max-Preview，DeepSeek被曝正在开发新一代智能体模型，宇树科技则宣布IPO准备进程。

GitHub10 天

非监督特征学习与深度学习中文教程

注意：这个项目我不再维护，我觉得我的翻译真的不够好来帮助其他人，尤其是那些刚入门或者刚开始学习了解深度学习、神经网络的人们。为了不误导其他人，我建议新人们去学习斯坦福的CS231n课程，该门课程在网易云课堂上也有一个配有中文字幕的版本。

腾讯网4 天

中国AI弯道超车，国产GPU训练！无需Transformer，原生类脑脉冲大模型「 ...

人脑是目前唯一已知的通用智能系统，它包含约 860 亿神经元和约 1000 万亿突触数量、具有丰富的神经元种类、不同神经元又具有丰富的内部结构，但功耗仅20W左右。SpikingBrain-瞬悉1.0因此而生，这是一个基于内生复杂性的通用智能模型 ...

腾讯网15 天

企业落地 NL2SQL，需要的是 AI-ready data 和小模型

作者 | 矩阵起源当 NL2SQL 从 Demo 走向生产，关键不在“更大的模型”，而是“更干净的数据底座 + 更小的专用模型 + 更可控的工程化流程”。摘要先数据、后模型：把元数据、业务语义、权限、样例 SQL 做成“AI-ready data”，是 NL2SQL 能否可靠落地的第一性问题。小模型足够用：以 3B–7B 级别的代码 /SQL ...

头部财经7 天

摆脱GPU依赖！Nature发布「物理神经网络」综述：实现大规模、高效AI ...

近年来，AI 通过聊天机器人等工具深刻改变了我们的生活，并在医疗、气象和材料设计等领域落地应用。这一进步主要依赖 GPU 的算力和数据规模的增长。但随着模型规模不断扩大，传统数字 GPU 的局限性愈发明显。要突破这一瓶颈， AI 需要在保证精度和吞吐量的同时，降低训练与推理的延迟和能耗。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

资讯