本文作者:访客

华为官宣!DeepSeek系列模型正式上线昇腾社区

访客 2025-02-05 16:09:50 11236
华为官宣!DeepSeek系列模型正式上线昇腾社区摘要: 2月5日消息,今日,华为宣布,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepS...
# 华为DeepSeek系列模型上线昇腾社区,开启AI新体验

在科技的浪潮中,每一次重大突破都如同璀璨星辰,照亮我们前行的道路。2月5日,华为带来了一则令人振奋的消息:DeepSeek - R1、DeepSeek - V3、DeepSeek - V2、Janus - Pro正式登陆昇腾社区。这一举措,犹如为开发者们打开了一扇通往全新AI世界的大门,支持一键获取DeepSeek系列模型,并且能在昇腾硬件平台上轻松实现开箱即用,实在是让人眼前一亮。

华为官宣!DeepSeek系列模型正式上线昇腾社区

## DeepSeek - V3:自研实力的彰显

其中,DeepSeek - V3的表现尤为引人注目。2024年,它的首个版本上线并同步开源,这是华为自研的MoE模型,拥有671B参数,激活37B,并在14.8T token上完成了预训练。DeepSeek - V3就像是一位学霸,在多项评测中成绩斐然,超越了Qwen2.5 - 72B和Llama - 3.1 - 405B等其他开源模型,在性能上更是与世界顶尖的闭源模型GPT - 4o以及Claude - 3.5 - Sonnet不相上下,展现出了强大的实力。

## 如何在昇腾社区高效获取及使用DeepSeek - V3模型 ### 硬件准备:坚实的基石

要部署DeepSeek - V3模型,首先得备好硬件资源。需要配置4台Atlas 800I A2(8 * 64G)服务器,这就如同搭建一座高楼,稳固的地基是必不可少的。只有具备了这样的硬件基础,模型才能在后续的运行中发挥出最佳性能。

### 模型调用实践:步步为营的探索 #### 1. 权重转换:开启适配之旅

权重转换是模型调用的第一步,不同的计算平台有着不同的转换方式。GPU和NPU分别有着对应的操作,从相关图片中我们可以清晰看到具体的转换示意,这一步是让模型适应不同硬件环境的关键,为后续的运行奠定基础。

#### 2. 加载镜像:获取运行的“容器”

在昇腾社区/开发资源中,我们可以下载适配DeepSeek - V3的镜像包,如mindie:1.0.T71 - 800I - A2 - py311 - ubuntu22.04 - arm64。下载完成后,使用docker images命令确认查找具体镜像名称与标签,就像我们精心挑选了一个合适的容器,等待着模型装入其中开始运作。

#### 3. 容器启动:激活模型的“引擎”

MindIE镜像已经预置了DeepSeek - V3模型推理脚本,我们从信任的来源获取权重后,将其放置在下载的模型代码主目录下,然后修改模型文件夹属组为1001,执行权限为750,最后启动容器。这一系列操作,就像是为模型的运行启动了引擎,让它能够在我们搭建的环境中运转起来。

#### 4. 服务化测试:检验成果的时刻

配置服务化环境变量,使能内存池扩展段功能,也就是虚拟内存特性,这能让模型在运行时更加稳定。接着修改服务化参数,一切准备就绪后拉起服务化。当看到“Daemon start success!”的提示时,意味着我们的服务成功启动,模型已经可以正式为我们所用,这是整个过程中最令人期待的时刻,仿佛见证了一个新生命的诞生与成长。

华为DeepSeek系列模型在昇腾社区的上线,无疑为AI领域注入了新的活力。对于开发者们来说,这是一次难得的机遇,能够利用强大的模型和便捷的平台,创造出更多精彩的AI应用,让我们共同期待未来基于这些模型所诞生的创新成果吧。

阅读
分享