万维读者网 > 中国瞭望 > 正文  

摆脱辉达?传DeepSeek R2全部用华为芯片

www.creaders.net | 2025-04-29 22:35:30  快科技 | 0条评论 | 查看/发表评论

  年初中企深度求索的DeepSeek R1大模型的问世撼动美国AI圈,甚至引发辉达的股价暴跌。在中国与全球AI竞争对手的高度关注下,市场传出更强的新版本DeepSeek R2即将在5月面世,将彻底摆脱辉达芯片,全部基于华为昇腾910B(Ascend 910B)芯片。

  陆媒报道,市场最新爆料,R2大模型将采用更先进的混合专家模型(MoE),总参数量较前代R1提升约1倍,预计达1.2兆(R1总参数量为6710亿),单位推理成本较GPT-4大减97.4%。

  当下,中国与美国科技战、贸易战愈演愈烈,辉达H20芯片面临新一波出口管制。在DeepSeek R2预期发布时间临近的情况下,各界高度关注中国指标性的大模型,在缺乏美国芯片资源下的发展动向。

  据传,R2规模与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当,还将结合更智慧的门控网络层(Gating Network),进而优化高负载推理任务的性能。

  消息指出,R2将彻底摆脱辉达芯片,训练全程均未使用辉达显卡,全部基于华为的昇腾910B(Ascend 910B)芯片集群平台。

  如果这一消息属实,这将降低中国对海外高端AI芯片的依赖。

摆脱辉达?传DeepSeek R2全部用华为芯片

(示意图)

   0


24小时新闻排行榜 更多>>
1 央媒头版定调,国家要动真格了
2 ​蔡奇突发选边倒戈 反习卷起无极狂风
3 攻打台海:传习下达禁酒令 全面进入军事状
4 开始变天了....
5 ​传彭丽媛军职被夺 习权势衰落公开化
热门专题
1
四中全会
6
何卫东
11
叙利亚
2
中美冷战
7
AI
12
苗华被抓
3
川普
8
中共两会
13
美国大选
4
俄乌战争
9
大S
14
以哈战争
5
万维专栏
10
洛杉矶大火
15
巴黎奥运
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.