资讯

本周,亚马逊网络服务宣布推出其首款基于Nvidia的“Grace”CG100 CPU和“Blackwell”B200 GPU的UltraServer预配置超级计算机,称为GB200 ...
这项由清华大学王涵洋、刘方甫、池嘉威和段跃齐(通讯作者)联合完成的开创性研究于2025年4月发表在计算机视觉领域顶级会议论文集中,论文编号为arXiv:2504.01956v2。对这项工作感兴趣的读者可以通过项目主页https://hanyang21 ...
Centaur现在就像一名专业的心理学家,只需传统模型Llama的0.15%参数,就可以完美模拟人类在 160项 心理学实验中的行为,理解人类如何学习、决策甚至犯错。 结果表明,Centaur 的响应熵所能解释的反应时间方差比例 (条件 R²=0.87) 高于 Llama (0.75) 和领域特定模型 (0.77) ,显示出其在捕捉人类行为时间特征方面的优势。
近期, 英伟达 与 香港大学 及 麻省理工学院 的研究团队共同推出了一项名为 Fast-dLLM 的突破性技术,旨在显著提升 扩散语言模型 ...
2025年7月9日,来自NVIDIA、香港大学和MIT的研究团队联合发布了创新技术Fast-dLLM,该技术旨在提升扩散语言模型(Diffusion Language ...
快科技6月30日消息,据报道,由商汤于2024年底分拆独立而来的国产GPU公司曦望Sunrise,近日完成了近10亿元的新一轮融资。 此次的投资方包括三一集团旗下华胥基金、第四范式、游族网络、北京利尔、松禾资本、海通开元等。
尽管KV缓存机制显著提升了扩散语言模型的推理速度,但在并行解码时,生成质量往往会下降。这是因为扩散型模型在解码时假设了条件独立性,而实际上,标记之间可能存在复杂的依赖关系。这种依赖关系的破坏会导致生成文本的连贯性和准确性下降。
国产 GPU 曦望 Sunrise 完成新一轮近 10 亿元融资。其产品曦望 S1、S2 已量产,S2 性能追平 A100。团队规模小却成果显著,S3 预计 2026 年量产。##国产 GPU 曦望融资## ...
由商汤于2024年底分拆独立而来的国产GPU公司曦望Sunrise,近日完成了近10亿元的新一轮融资。 此次的投资方包括三一集团旗下华胥基金、第四范式、游族网络、北京利尔、松禾资本、海通开元等。 据介绍,曦望Sunrise专注高性能GPU研发,定位于“更懂AI的芯片公司”,产品线涵盖了曦望S1、S2、S3三款GPU ...