如何在本地部署 DeepSeek Janus Pro 文生图大模型

 更新时间:2025年02月10日 09:15:26   投稿:mrr  
DeepSeek JanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处理能力,本文介绍本地部署 DeepSeek Janus Pro 文生图大模型的操作,感兴趣的朋友一起看看吧

Hello, 大家新年好。
在这个春节期间最火的显然是 DeepSeek 了。据不负责统计朋友圈每天给我推送关于 DeepSeek 的文章超过20篇。打开知乎跟B站也全是 DeepSeek 相关的内容。不过大部分的内容都是关于 DeepSeek R1 推理模型有多牛逼。在这里就不多说关于 R1 的废话了,因为大家已经看腻了。
R1 在本地用 ollama 跑了一下,太简单了,都没必要写个教程。除了 R1 今天还在本地部署成功了 DeepSeek 的 Janus Pro 模型。

什么是 Janus Pro

Janus-Pro是一种创新的自回归框架,其统一了多模态理解与生成任务。该框架通过将视觉编码解耦到不同的处理路径(同时仍使用单一统一的Transformer架构进行信息处理),有效解决了先前方法的局限性。这种解耦机制不仅缓解了视觉编码器在理解与生成双重角色间的冲突,还显著提升了框架的灵活性。Janus-Pro在性能上超越了以往的统一模型,并达到甚至超越了专用任务模型的表现水平。凭借其架构简洁性、高度灵活性和卓越有效性,Janus-Pro有望成为下一代统一多模态模型的重要技术方向。

以上内容来自 Janus Pro github 仓库的介绍,非常的学术。简单说它是文生图的模型,类似 DALL-E 3, Stable Diffusion。

以下就让我们看看这么在本地的 PC 电脑来运行 Janus Pro 模型吧。

1. 安装 conda

从以下地址下载 anaconda 的 windows 安装包
https://www.anaconda.com/download

安装完成后需要把安装目录配置到环境变量 PATH 上

2. 创建 python 虚拟环境

conda create -n janus_pro python=3.10 -y
conda activate janus_pro

注意:Python 3.10是经过验证的兼容版本,避免使用其他版本导致依赖冲突

3. 克隆 janus 仓库到本地

git clone https://github.com/deepseek-ai/Janus.git
cd Janus

4. 安装依赖

# 安装基础依赖
pip install -e .

注意:pip 安装依赖的时候可能会遇到网络问题,建议配置代理

5. 安装 Gradio

pip install -e .[gradio]

到时候我们会通过 Gradio 的界面跟 janus 进行交互

6. 使用 janus pro 1B 模型

janus pro 默认启动的时候使用的是 7B 参数的模型,本地电脑跑起来的话太卡了。这里我们会修改成使用 1B 模型,这样的话大概 8G 的显存也能勉强跑一跑,7B 的话对显存的要求会更高。

找到我们克隆下来的仓库。使用编辑器打开 demo/
把第15行改成:

model_path = "deepseek-ai/Janus-Pro-1B"

7. 启动 Janus Pro

python demo/app_januspro.py

注意:启动期间会从 huggingface 拉取 1B 模型,大小大概 4G,所以还是需要指定代理。
启动成功后如下图:

8. 使用 Gradio 界面进行交互

启动成功后在浏览器里输入: http://127.0.0.1:7860 即可访问 Gradio 页面。

9. 图片理解

先来试试 janus pro 对图片的理解。

This image is a humorous meme that uses the popular "buff Doge vs. sad Doge" format to compare two different approaches to visual encoding.
...

这个解释到位的有点吓人。

10. 文生图

再来试试文字生成图片

prompt:

A cute and adorable baby fox with big brown eyes, autumn leaves in the background enchanting,immortal,fluffy, shiny mane,Petals,fairyism,unreal engine 5 and Octane Render,highly detailed, photorealistic, cinematic, natural colors.

图片是我从 Hugging Face 直接运行得到的。在我本地运行了30分钟都没出结果,我直接 ctrl-c 取消了。可能是我的显卡太垃圾了(RTX4060 Mobile)。

总结

以上我们在本地 windows 上成功部署了 DeepSeek janus pro 模型。按照以上 step by step 的方式也没什么难度。通过测试 janus pro 对图片的理解非常到位。但是文生图的测试失败了,可能是我的显卡太垃圾,如果有同学有 4090 这种显卡可以试一试本地文生图的性能。

到此这篇关于本地部署 DeepSeek Janus Pro 文生图大模型的文章就介绍到这了,更多相关DeepSeek Janus Pro本地部署内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • ToDesk安装与使用教程(全平台支持)

    ToDesk安装与使用教程(全平台支持)

    这篇文章主要介绍了ToDesk安装与使用教程,ToDesk非常好用而且是全平台支持,喜欢的朋友跟随小编一起看看吧
    2024-08-08
  • Windows使用GitHub Desktop详解

    Windows使用GitHub Desktop详解

    本文详细讲解了Windows使用GitHub Desktop的方法,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-06-06
  • 12个常用前端UI框架集合汇总

    12个常用前端UI框架集合汇总

    本文整理了一些比较流行的前端UI框架其中有VUE、bootstrap、jQuery等框架,,排名不分先后,仅供参考。可按照项目需求自行考虑
    2020-02-02
  • 前端使用svg图片改色实现示例

    前端使用svg图片改色实现示例

    这篇文章主要为大家介绍了前端使用svg实现图片改色的示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-07-07
  • 编码史记

    编码史记

    昨天听了一个同事的编码讲座,很精彩。想起了要写这个文章分享一下各种编码是如何产生的
    2012-04-04
  • 羊了个羊破解方法(嘎嘎猛已入羊群n次)

    羊了个羊破解方法(嘎嘎猛已入羊群n次)

    这篇文章主要介绍了羊了个羊破解(嘎嘎猛,已入羊群n次),经本人测试找到的未修复的bug: 一旦通关一次后,后续入羊群不再需要循环浪费时间淦帝,只需要点换装点击新皮肤,点确定即可嘎嘎增加入群次数,需要的朋友可以参考下
    2022-09-09
  • 最适合人工智能开发的5种编程语言 附人工智能入门书籍

    最适合人工智能开发的5种编程语言 附人工智能入门书籍

    这篇文章主要为大家详细介绍了最适合人工智能开发的5种编程语言,并为大家推荐人工智能入门书籍,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-11-11
  • 解决Chrome在新版MacOS上报错 NET::ERR_CERT_WEAK_KEY 的问题

    解决Chrome在新版MacOS上报错 NET::ERR_CERT_WEAK_KEY 的问题

    这篇文章主要介绍了解决Chrome在新版MacOS上报错 NET::ERR_CERT_WEAK_KEY 的问题,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-05-05
  • vscode的几项基本配置详解

    vscode的几项基本配置详解

    VSCode是一款免费的、开源的、高性能的、跨平台的、轻量级的代码编辑器,这篇文章主要介绍了vscode的几项基本配置,本文给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧
    2020-05-05
  • 解决MobaXterm连接报错Network error:Connection timed out问题

    解决MobaXterm连接报错Network error:Connection timed 

    这篇文章主要介绍了解决MobaXterm连接报错Network error:Connection timed out问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-05-05

最新评论