entry-title"> 快速部署大模型!QKE 助你开启自己的 AI 时代

2023 年,大模型和 AIGC 的发展呈现出快速推进的态势,不仅在技术层面有所突破,而且在财产应用和市场前景方面也展现出积极的趋势。

为了方便更多企业用户体验,本文将介绍如何通过青云容器引擎 QKE 快速部署 ChatGLM-6B 大模型,开启属于您自己的 AI 时代!

什么是 QKE

QKE 是基于 Kubernetes 的容器引擎,能够轻松地管理和部署容器化应用。它具备自动化扩容、高可用性、安全性等多项优势,让应用更加稳定、高效。

近日,新发布的 QKE v3.1 版本不仅提高了容器集群的性能、可靠性、安全性和可维护性,还为大模型应用场景提供了更好的支持。

5 分钟部署大模型

接下来,我们来看看如何使用 QKE 容器引擎部署 ChatGLM-6B 大模型。

01、创建 QKE GPU 集群

第一步:创建一个带有 GPU 工作节点池的 QKE 集群

QKE 集群创建成功后,如需以 HTTP 访问带授权的镜像仓库,可在集群信息,镜像参数中配置镜像拉取的 insecure-registries、docker-auths。

第二步:检查 GPU 工作节点上 GPU Device Plugin 的就绪情况。
kubectl describe nodes worker-g001 | grep gpu
nvidia.com/gpu: 2
nvidia.com/gpu: 2
nvidia.com/gpu 0 0

第三步:将 GPU 工作节点打上标签:accelerator: nvidia-gpu
kubectl label nodes worker-g001 accelerator=nvidia-gpu

02、部署 ChatGLM-6B

第一步:编辑创建 K8s deployment 和 service 的 chatglm-6b.yaml。


apiVersion: v1
kind: Namespace
metadata:
name: chatglm


apiVersion: apps/v1
kind: Deployment
metadata:
name: chatglm
namespace: chatglm
spec:
replicas: 1
selector:
matchLabels:
app: chatglm
template:
metadata:
labels:
app: chatglm
spec:
containers:
– name: chatglm-container
image: 139.198.188.112:81/appcenter/chatglm3:gpu-fp16
imagePullPolicy: IfNotPresent
command: [“stremlit”,”run”,”basic_demo/web_demo_streamlit.py”,”–server.port”,”8900″]
ports:
– containerPort: 8900
resources:
limits:
nvidia.com/gpu: 1
nodeSelector:
accelerator: nvidia-gpu


apiVersion: v1
kind: Service
metadata:
name: chatglm-web
namespace: chatglm
spec:
ports:
– port: 7860
protocol: TCP
targetPort: 8900
selector:
app: chatglm
type: NodePort

其中 nodeSelector.accelerator: nvidia-gpu 让 Pod 调度到的 GPU 工作节点。

第二步:部署 ChatGLM-6B

kubectl apply -f chatglm-6b.yaml

03、暴露服务给外部访问

第一步:通过如下命令找到 NodePort 号

root@master1:~# kubectl get service -n chatglm

NAME          TYPE       CLUSTER-IP      EXTERNAL-IP   PORT(S)          AGE

chatglm-web   NodePort   10.96.204.196   <none>        7860:30313/TCP   3h

这里显示 NodePort 号为 30313 

第二步:在 QKE 集群对应的 VPC 上,添加一条端口转发规则,转发到节点的 30313 端口。

04、测试访问

打开浏览器, 输入地址 http://<VPC的EIP地址:VPC源端口>  即可访问 ChatGLM  推理服务。

整个部署过程非常简单,只需几步,就可以快速完成大模型应用的部署。而且,QKE 还提供了丰富的监控和日志功能,能够实时了解应用的运行状态和性能。

如果您正在寻找一个高效、稳定、易用的容器引擎,不妨试试 QKE 吧!

结语

随着 AI 技术的不断进步和在各行各业中的深入应用,大模型的发展将会更加迅速,其在处理大规模数据和复杂任务方面的能力将得到进一步的提升。同时,大模型在自然语言处理、计算机视觉、推荐系统等领域的应用也将不断拓展,为各行各业带来创新的解决方案。

QKE 作为一款强大的容器引擎,为大模型和 AI 及其他 AI 应用提供了健壮、易用、轻简的云原生基础设施。通过 QKE,可以更好地实现 AI 与业务的结合,推动 AI 技术在不同领域的广泛应用。

热门标签
Ubuntu
边缘计算
飞腾
教育
超融合
云易捷
数据
存储
U10000
云服务器
RadonDB
数据库
复制成功
百度 搜狗 360搜索 误判 为奴三年后,整个侯府跪求我原谅 大白! 红毯先生 749局

      <code id='78e97'></code><style id='783cd'></style>
    • <acronym id='01adf'></acronym>
      <center id='e2dda'><center id='205e7'><tfoot id='a9fcb'></tfoot></center><abbr id='32423'><dir id='be001'><tfoot id='cbe01'></tfoot><noframes id='b1ae7'>

    • <optgroup id='967f1'><strike id='9b348'><sup id='7ca49'></sup></strike><code id='6db4f'></code></optgroup>
        1. <b id='96c7e'><label id='5f99d'><select id='4ee3a'><dt id='409d6'><span id='3fb32'></span></dt></select></label></b><u id='ce97d'></u>
          <i id='a6707'><strike id='ce81e'><tt id='5d6dd'><pre id='94363'></pre></tt></strike></i>