京东云上线 DeepSeek 模型,支持公有云和私有化部署

京东云宣布上线 DeepSeek 模型

2 月 5 日消息,京东云昨日宣布,京东云已正式上线 DeepSeek-R1 和 DeepSeek-V3 模型,支持公有云在线部署和专混私有化实例部署两种模式,供用户按需部署,快速调用。

公有云在线部署

开发者和企业可以在京东云官网,进入言犀 AI 开发计算平台的 “AI 资产市场” 中,选用该模型进行一键部署。言犀 AI 开发计算平台已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署。
步骤一:选择基础模型
在 “AI 资产市场 / 模型” 中,提供 DeepSeek 开源的多个版本,如 DeepSeek-R1-Distill-Qwen-1.5B,点击进入卡片页可了解模型结构和预训练数据等关键信息,并查看模型文件结构。
步骤二:准备资源节点
在部署时,LLM 模型因为模型较大,资源性能要求较高,需要独占计算卡进行部署,建议提前准备好专属资源节点。功能路径:专属资源组 - 创建资源组 - 创建节点。节点规格:部署 DeepSeek-R1-Distill,推荐使用 cap.p.n3a30.4xlarge;部署 DeepSeek-V3,推荐使用 cap.hc.p5h20.46xlarge。
步骤三:模型部署使用
将模型部署到相应的服务资源上提供推理调用服务,在部署时平台将自动适配预置推理框架,实现一键部署,仅需指定使用的专属资源组和对应的节点规格。部署完成后,状态将会变为运行中,运行中的模型可被调用,提供推理服务。功能路径:专属资源组 - 创建资源组 - 创建节点在线服务 - 部署;在线服务 - 服务列表 | 服务名称 - 在线调试。

私有化算力实例部署

专混私有化算力实例部署模式,已经同步上线京东云 vGPU AI 算力平台,为金融、企业、政府等客户提供数据不出域的私有化模型推理服务。
步骤一:进入算力管理页面
点击租用新实例按钮。
步骤二:选择资源规格
选择资源规格以及对应带有 DeepSeek 模型的镜像。
步骤三:启动实例
资源创建成功后通过 Jupyterlab 进入实例,启动 Ollama 即可与之对话。

私有化部署及 API 快速集成

京东云言犀 AI 开发计算平台还支持私有化部署及 API 快速集成,通过自研高性能资源管理与弹性调度系统,可提供大模型的全生命周期服务及部署,涵盖模型开发、推理及多场景应用扩展。

资源紧缺场景的解决方案

针对资源紧缺的场景,京东云支持通过蒸馏技术训练企业自己的大模型,减少模型部署所需资源的同时具备较好的性能。使用京东云 vGPU AI 算力平台,可以将多个蒸馏过的企业自有模型部署在同一张卡上,有效提升资源利用率 70%。

结论

京东云上线 DeepSeek-R1 和 DeepSeek-V3 模型,提供了公有云和私有化部署的多种选择,满足不同用户的需求。无论是开发者还是企业用户,都可以通过京东云的平台快速部署和调用 AI 模型,享受高效便捷的 AI 服务。京东云的多样化部署模式和资源管理系统,为大模型的全生命周期服务提供了坚实的保障。