华为官宣！DeepSeek系列模型正式上线昇腾社区

访客 2025-02-05 16:09:50 11297

默认

摘要： 2月5日消息，今日，华为宣布，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区，支持一键获取DeepS...

# 华为DeepSeek系列模型上线昇腾社区，开启AI新体验

在科技的浪潮中，每一次重大突破都如同璀璨星辰，照亮我们前行的道路。2月5日，华为带来了一则令人振奋的消息：DeepSeek - R1、DeepSeek - V3、DeepSeek - V2、Janus - Pro正式登陆昇腾社区。这一举措，犹如为开发者们打开了一扇通往全新AI世界的大门，支持一键获取DeepSeek系列模型，并且能在昇腾硬件平台上轻松实现开箱即用，实在是让人眼前一亮。

## DeepSeek - V3：自研实力的彰显

其中，DeepSeek - V3的表现尤为引人注目。2024年，它的首个版本上线并同步开源，这是华为自研的MoE模型，拥有671B参数，激活37B，并在14.8T token上完成了预训练。DeepSeek - V3就像是一位学霸，在多项评测中成绩斐然，超越了Qwen2.5 - 72B和Llama - 3.1 - 405B等其他开源模型，在性能上更是与世界顶尖的闭源模型GPT - 4o以及Claude - 3.5 - Sonnet不相上下，展现出了强大的实力。

## 如何在昇腾社区高效获取及使用DeepSeek - V3模型 ### 硬件准备：坚实的基石

要部署DeepSeek - V3模型，首先得备好硬件资源。需要配置4台Atlas 800I A2（8 * 64G）服务器，这就如同搭建一座高楼，稳固的地基是必不可少的。只有具备了这样的硬件基础，模型才能在后续的运行中发挥出最佳性能。

### 模型调用实践：步步为营的探索 #### 1. 权重转换：开启适配之旅

权重转换是模型调用的第一步，不同的计算平台有着不同的转换方式。GPU和NPU分别有着对应的操作，从相关图片中我们可以清晰看到具体的转换示意，这一步是让模型适应不同硬件环境的关键，为后续的运行奠定基础。

#### 2. 加载镜像：获取运行的“容器”

在昇腾社区/开发资源中，我们可以下载适配DeepSeek - V3的镜像包，如mindie:1.0.T71 - 800I - A2 - py311 - ubuntu22.04 - arm64。下载完成后，使用docker images命令确认查找具体镜像名称与标签，就像我们精心挑选了一个合适的容器，等待着模型装入其中开始运作。

#### 3. 容器启动：激活模型的“引擎”

MindIE镜像已经预置了DeepSeek - V3模型推理脚本，我们从信任的来源获取权重后，将其放置在下载的模型代码主目录下，然后修改模型文件夹属组为1001，执行权限为750，最后启动容器。这一系列操作，就像是为模型的运行启动了引擎，让它能够在我们搭建的环境中运转起来。

#### 4. 服务化测试：检验成果的时刻

配置服务化环境变量，使能内存池扩展段功能，也就是虚拟内存特性，这能让模型在运行时更加稳定。接着修改服务化参数，一切准备就绪后拉起服务化。当看到“Daemon start success!”的提示时，意味着我们的服务成功启动，模型已经可以正式为我们所用，这是整个过程中最令人期待的时刻，仿佛见证了一个新生命的诞生与成长。

华为DeepSeek系列模型在昇腾社区的上线，无疑为AI领域注入了新的活力。对于开发者们来说，这是一次难得的机遇，能够利用强大的模型和便捷的平台，创造出更多精彩的AI应用，让我们共同期待未来基于这些模型所诞生的创新成果吧。

标签：华为模型