54 分钟on MSN
2022年11月,OpenAI研发的ChatGPT问世,它能理解人类语言并与人类互动,还可协助完成写论文、创作诗歌等文字工作。这一创新应用突破了传统AI的交流局限,掀起大模型发展浪潮。各大科技公司意识到掌握先进大模型技术的重要性,纷纷投入其中,迅速打 ...
1 小时
来自MSN润达医疗携手华为基于DeepSeek大模型推出“华擎智医”训推一体机每经AI快讯,近日,润达医疗基于华为轻量化AI训推底座LightDC ...
记者就开源DeepEP通信库的影响询问DeepSeek,它的回答是,DeepEP能显著提升MoE模型的训练和推理效率,显著降低计算资源消耗,开源DeepEP有助于降低AI技术的开发成本,且有助于减少重发开发。
除了民营企业,像广东、江苏等多地政务服务系统,也宣布接入 DeepSeek 系列大模型。三大电信运营商、中石油、中石化等中企巨头也和 DeepSeek 展开合作。 比如大伙儿平时骑的小电驴品牌,九号和小牛也挂起海报,各自官宣 “ 行业首发 ” 接入 ...
新浪科技注意到,在GitHub上,目前该项目开源6小时后便已收获了超过5000Star收藏,并且拥有188个Fork(副本创建)。在听到DeepSeek开源FlashMLA并迎来的快速的Star收藏和Fork数据增长后,某港股上市公司CTO在与新浪科 ...
2025年2月21日,“DeepSeek:人工智能的中国时刻?”学术研讨会在复旦大学召开,会议由复旦大学哲学学院、上海市社联《探索与争鸣》编辑部主办,由华东师范大学政治与国际关系学院、苏州大学未来管理研究院协办。本次会议是国内第一次关于DeepSee ...
DeepEP 是一个专为混合专家系统(MoE)和专家并行(EP)定制的通信库。它提供高吞吐量和低延迟的 all-to-all GPU 内核, 这些内核也被称为 MoE 分发和合并。该库还支持低精度操作,包括 FP8。
2 小时
来自MSNDeepSeek又又开源了,这次拉爆GPU通信!智东西 作者|程茜 编辑|心缘 智东西2月25日报道,刚刚,DeepSeek开源周第二弹发布,第一个用于MoE模型训练和推理的开源EP通信库,发布不到一小时,GitHub Star数已上千。
而最为显著的进步之一,是DeepSeek独创的GRPO算法。这一强化学习技术,不需要借助复杂的价值模型,变相降低了模型在训练过程中对算力的高要求,实现在后训练阶段的算力需求释放。这不仅为模型的自主学习和能力提升提供了有效方向,也为未来的AI研发提供了 ...
5 小时
澎湃科技 on MSN“DeepSeek没必要成为中国版OpenAI,因为OpenAI也不是大模型终局”2月21日-23日在上海举行的2025GDC全球开发者先锋大会上,中国公司深度求索(DeepSeek)旗下生成式AI产品DeepSeek成为当之无愧的热点话题,几乎每个参会的观众、开发者都在谈论DeepSeek。
在当前人工智能技术飞速发展的背景下,DeepSeek的本地化部署不仅是宜春市政府与医疗机构迈向智能化的重要步骤,也为社会各界提供了一个更为高效的服务平台。这种基于数据驱动的创新能够深入挖掘潜在需求,推动各项业务的优化与调整,为大众提供更精准、便捷的服 ...
DeepSeek本地部署如何选?跟着京东采销推荐选购专业级工作站产品,工作站,deepseek,显卡,内存,专业级,处理器 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果