文档首页/ 函数工作流 FunctionGraph/ 最佳实践/ 功能应用类实践/ 使用FunctionGraph部署DeepSeek-R1蒸馏模型
更新时间:2025-09-02 GMT+08:00
分享

使用FunctionGraph部署DeepSeek-R1蒸馏模型

方案概述

DeepSeek-R1模型是深度求索公司推出的首款推理模型,基于DeepSeek-V3-Base模型,通过知识蒸馏技术优化,旨在以较低的计算资源实现高性能,支持快速部署与运行。

FunctionGraph应用中心提供DeepSeek-R1蒸馏模型的部署解决方案,支持多种模型参数规模选择(包括1.5B、7B、8B、14B和32B参数版本)。该方案基于FunctionGraph的全托管计算服务,您无需关注底层资源管理,即可通过标准API接口快速实现模型部署。搭配第三方客户端,可轻松构建AI对话应用,实现从模型托管到AI对话的应用。

约束与限制

函数需创建在“华东-上海一”区域下。

操作视频

本视频介绍使用FunctionGraph部署DeepSeek-R1蒸馏模型的操作流程。

资源和成本规划

表1介绍使用FunctionGraph函数,部署DeepSeek-R1蒸馏模型所需的资源和成本规划。

表1 资源和成本规划

资源

资源说明

计费说明

函数工作流 FunctionGraph

  • 函数类型:HTTP函数
  • 函数设置:启用GPU
  • 区域:华东-上海一
  • 创建量:1
  • 计费模式:按需计费。
  • 函数工作流提供免费试用,每月前100万次调用免费。具体计费项及说明请参考函数工作流按需计费说明

API网关 APIG

  • 版本:专享版API网关
  • 区域:华东-上海一
  • 公网入口:开启
  • 购买量:1

操作流程

表2介绍通过FunctionGraph,部署DeepSeek-R1蒸馏模型的总体操作流程。

表2 操作流程

操作流程

说明

步骤一:购买专享版APIG实例

通过API网关控制台,购买APIG专享版实例,并配置公网入口访问。

步骤二:创建DeepSeek应用

通过FunctionGraph应用中心,创建DeepSeek-R1蒸馏模型应用。

如需自定义构建镜像,可参考附录:镜像构建Dockerfile参考进行操作。

步骤三:配置客户端开始AI对话

下载并配置第三方客户端,部署DeepSeek-R1蒸馏模型开始AI对话,可选择以下任一客户端进行部署:

步骤一:购买专享版APIG实例

登录API网关控制台,参考购买专享版APIG实例购买一个名为“apig-fg”的专享版APIG实例。

购买过程中请参照以下注意事项,其他参数可根据业务需求自定义选择。
  • 区域:选择华东-上海一。
  • 公网入口:本例需“开启公网入口”,请根据实际需求选择入公网带宽。
  • VPC和子网:本示例供测试使用,无需配置函数访问VPC内资源,因此可自行配置VPC和子网参数。

    如生产环境中使用,请配置VPC内的公网访问,并将APIG实例和函数配置在同一VPC环境下。

  • 安全组:开启公网入口,安全组入方向需要放开80(HTTP)和443(HTTPS)端口的访问权限。

步骤二:创建DeepSeek应用

  1. 登录函数工作流控制台,区域选择“华东-上海一”
  2. 在左侧导航栏中选择“函数 > 应用中心”,单击“创建应用”进入选择模板界面。
  3. 找到“DeepSeek R1推理模型”模板,单击“使用模板”
    图1 创建DeepSeek应用模板

  4. 进入创建应用界面,参考表3填写应用参数。
    图2 创建应用

    表3 创建应用参数说明

    参数

    取值样例

    说明

    模板

    DeepSeek R1推理模型

    本案例使用DeepSeek R1推理模型应用模板创建应用。

    区域

    华东-上海一

    选择应用部署的区域。

    应用名称

    fg-deepseek-r1

    自定义填写应用的名称。可包含字母、数字、下划线和中划线,以大小写字母开头,以字母或数字结尾,长度不超过60个字符。

    运行时语言

    Http

    本应用默认内置Http运行时语言,不可更改。

    委托

    fgs-app-adminagency

    选择应用需使用的委托。

    “fgs-app-adminagency”为FunctionGraph应用中心的默认委托。如未创建过该委托,可先将该参数选择为“未使用任何委托”,在创建应用时系统会弹出创建该应用中心默认委托的选项,单击创建即可。

    创建仓库

    不开启

    若开启,应用创建时将会为您在代码托管服务创建代码仓库,之后可通过更新代码并部署来更新您的应用。

    描述

    -

    自定义填写应用的描述,最长支持填写1024个字符。

    APIG实例

    apig-fg

    选择步骤一:购买专享版APIG实例购买的APIG实例。

    模型规模

    14B

    自定义选择DeepSeek R1模型的规模,涵盖1.5B、7B、8B、14B和32B模型供您选择。

  5. 填写完成后,单击右下角“立即创建”,进入应用详情页等待应用创建成功。

    “委托”参数选择了“未使用任何委托”,此处将会弹出创建“fgs-app-adminagency”委托的提示,单击创建即可。

  6. 应用创建成功后如图3所示,会自动为您生成函数和API网关资源,其中生成的函数资源已开启GPU。
    图3 应用创建成功

  7. 图4所示复制应用的“调用URL”备用。

    为方便快速体验,应用中心会为您分配一个临时域名,此临时域名仅可用于测试使用,有效期30天。若想开放应用长期访问,需在应用总览页面的域名提示信息中单击“去绑定”为应用绑定自定义域名,具体操作方案请参考配置API的调用域名

    图4 复制调用URL

步骤三:配置客户端开始AI对话

可选择以下任一第三方客户端部署模型。

附录:镜像构建Dockerfile参考

如需自定义构建镜像,可参考以下Dockerfile进行操作。

FROM nvidia/cuda:11.6.2-base-ubuntu20.04

ENV HOME=/home/paas
ENV GROUP_ID=1003
ENV GROUP_NAME=paas_user
ENV USER_ID=1003
ENV USER_NAME=paas_user
ENV OLLAMA_HOST=0.0.0.0:8000

RUN mkdir -m 550 ${HOME} && groupadd -g ${GROUP_ID} ${GROUP_NAME} && useradd -u ${USER_ID} -g ${GROUP_ID} ${USER_NAME}

RUN apt-get update && apt-get install -y --no-install-recommends curl && rm -rf /var/lib/apt/lists/*

RUN curl -fsSL https://ollama.com/install.sh | sh

RUN chown -R ${USER_ID}:${GROUP_ID} ${HOME}
RUN find ${HOME} -type d | xargs chmod 775

RUN ollama serve & \
    sleep 15 && \
    ollama pull deepseek-r1:14B

USER ${USER_NAME}
WORKDIR ${HOME}
EXPOSE 8000
ENTRYPOINT ["ollama", "serve"]

免责声明

  • 本应用使用到的OllamaDeepSeek-R1等项目均为社区开源项目,华为云仅提供算力支持。
  • 本应用仅作为简单案例供用户参考和学习使用,如果用于实际生产环境,请参考附录:镜像构建Dockerfile参考的镜像构建工程自行完善和优化;使用过程中出现的函数工作流的问题,可以通过工单进行咨询,关于开源项目的问题需到开源社区寻求帮助或者自行解决。
  • 本应用部署后会为您创建APIG网关,根据有关规定,请在应用创建成功后根据提示绑定自定义域名后,使用您的自有域名访问应用。

相关文档