要闻 · 中国 · 科技

华为昇腾芯片参与DeepSeek模型后训练，中国AI算力自主化再受关注

华为昇腾芯片参与DeepSeek大型模型后训练，引发外界对中国AI算力自主化进展的关注。业内认为，这显示国产AI芯片正在进入更复杂的大模型训练环节，但在先进制程、软件生态、集群稳定性和高端GPU替代方面仍面临挑战。

许文博｜美华头条·2026-06-07·52 阅读·0 评论

华为昇腾芯片参与DeepSeek模型后训练，中国AI算力自主化再受关注 — 华为北京研究所。华为昇腾芯片参与DeepSeek模型后训练，使中国AI算力自主化进程再次受到关注。｜图片来源：Wikimedia Commons / HoweyYuan，CC BY-SA 4.0

中国人工智能产业近日出现新的技术进展。由华为参与的团队完成了DeepSeek大型模型的后训练工作，所使用的算力平台包括华为昇腾系列AI芯片。这一消息引发外界关注，也使中国在高端AI芯片受限背景下推进本土算力体系建设的问题再次成为焦点。

据公开信息显示，此次涉及的DeepSeek模型参数规模达到万亿级，相关训练任务并非简单的模型部署或推理，而是对已完成基础训练的大模型进行进一步优化。后训练通常用于提升模型在指令理解、专业任务、安全对齐和实际应用场景中的表现，是大模型走向产品化和行业应用的重要环节。

这一进展被部分产业人士视为中国AI硬件生态的重要突破。过去，中国大型模型训练和推理高度依赖海外高性能GPU，尤其是英伟达芯片。随着美国持续收紧先进芯片出口限制，中国科技企业在算力供应、模型训练成本和技术路线选择上面临更大压力。华为昇腾芯片参与DeepSeek模型后训练，显示国产AI芯片正在从推理应用向更复杂的训练环节延伸。

不过，业内也有较为谨慎的看法。后训练与从零开始训练前沿基础模型并不完全相同。基础预训练往往需要更大规模的数据、更长周期的算力投入，以及更高要求的芯片互联、软件调度和系统稳定性。因此，此次进展可以说明国产AI芯片在部分关键环节取得应用突破，但尚不能简单等同于中国已经完全摆脱对海外高端GPU的依赖。

从技术层面看，AI芯片竞争不只是单颗芯片性能的较量，还包括软件框架、开发工具、集群管理、能耗控制、模型适配和开发者生态。英伟达长期形成的CUDA生态仍是全球AI开发的重要基础。华为昇腾生态近年来在中国市场加快扩张，但要在更多模型、更大集群和更复杂任务中稳定运行，仍需要持续验证。

DeepSeek与华为的结合，也反映出中国AI产业链正在形成新的协作方式。大模型企业提供算法和模型能力，芯片企业提供本土算力平台，科研机构和产业团队进行适配与工程化优化，地方和资本市场则围绕算力、半导体和AI应用继续加大投入。这种模式正在成为中国应对外部技术限制的重要路径之一。

资本市场对此类消息反应积极。近期，中国半导体和AI算力相关企业持续受到投资者关注，部分芯片企业IPO预期升温，国产替代、数据中心建设和大模型需求成为推动板块上涨的重要因素。市场乐观者认为，如果国产AI芯片能在更多应用中证明稳定性，中国算力产业链将获得新的增长空间。

但风险同样存在。一方面，先进制程、存储芯片、高端封装和设备供应仍是中国半导体产业的短板；另一方面，大模型商业化仍处于投入高、回报周期不确定的阶段。即使本土芯片能够支持部分训练和推理任务，企业仍需面对成本、效率、生态迁移和客户接受度等现实问题。

对于中国AI产业而言，华为昇腾芯片参与DeepSeek模型后训练的意义，不只在于一次技术测试本身，更在于它展示了中国企业在受限环境下重建技术链条的方向。美国芯片限制并未使中国AI发展停滞，反而推动本土企业加快寻找替代方案。

未来，中国AI算力自主化能否真正形成长期竞争力，将取决于国产芯片能否在大规模训练、推理部署和商业应用中持续稳定运行。随着中美科技竞争继续加深，AI芯片、基础模型和产业生态之间的联动，将成为观察中国科技自主化进程的重要窗口。

美华头条独家原创 · 转载请注明出处｜文中观点仅代表作者个人，不代表本机构立场。

读者评论

0 条评论

查看全部评论

华为昇腾芯片参与DeepSeek模型后训练，中国AI算力自主化再受关注

读者评论

为您推荐