linux环境部署清华大学大模型最新版 chatglm2-6b 图文教程

 更新时间:2023年07月13日 09:10:46   作者:stay_foolish12  
这篇文章主要介绍了linux环境部署清华大学大模型最新版 chatglm2-6b ,结合实例形式详细分析了Linux环境下chatglm2-6b部署相关操作步骤与注意事项,需要的朋友可以参考下

准备工作:

# 下载项目源代码
git clone https://github.com/THUDM/ChatGLM2-6B
# 切换到项目根目录
cd ChatGLM2-6B
# 安装依赖
pip install -r requirements.txt
# 安装web依赖
pip install gradio

如果安装出现问题,可尝试手动分别安装torch

1 # 1第一步安装虚拟环境并激活环境

conda create -n ChatGLM2 python=3.10.6
conda activate ChatGLM2

2 nvidia-smi查看cuda版本,12.0

在这里插入图片描述

3 安装torch第一种方式

pytorch官网:https://pytorch.org/在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

在这里插入图片描述在这里插入图片描述

经过多次尝试,发现conda装,真的很快,真香。前几次尝试用pip装torch都会出现timeout的错误,这个跟服务器有关系,视情况而定。

在这里插入图片描述

# 安装依赖
pip install -r requirements.txt

在这里插入图片描述

二、准备工作。安装依赖包的同时,也可以先手动下载模型包:

在这里插入图片描述

1、工程文件准备

整个工程需要从两个远程仓库克隆,一个是 github 上的源码,一个是 HuggingFace 上的模型。

对于源码,由于总体积较小,因此可直接从网页下载 zip 包后解压,也可使用 git 命令(电脑需要提前装好 git )克隆至本地文件夹中:

git clone https://github.com/THUDM/ChatGLM2-6B

对于模型,由于存在7个体积较大的 checkpoint 文件,若直接 clone 可能耗时过久或网络连接不够稳定,可以采用大、小文件分别下载的方式。其中大文件可从 清华云 手动下载,小文件主要为模型实现文件,数量不多且体积较小(算上 tokenizer.model 一共11个文件),可采用两种方式下载,一种是在 HuggingFace 页面手动一个一个下载,另一种是利用 GIT_LFS_SKIP_SMUDGE 参数跳过大文件一次性克隆整个工程(电脑需要提前装好 Git LFS)

GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/chatglm2-6b

最后再将前面手动下载好的大文件拷入替换,构成完整的模型。

需要注意的坑:

1)该命令在 powershell 中会报错,提示不认识 GIT_LFS_SKIP_SMUDGE 命令,放在 git bash 终端中则可顺利执行;
2)被该命令跳过的“大文件”不仅有 7 个 .bin 文件,还包括 1.02MB 的 tokenizer.model。

模型文件理论上可存放于任意位置,参考官方演示视频将其平行于源码文件夹,即整个工程文件的目录结构如下:

在这里插入图片描述

根据目录结构,修改源码目录下的 web_demo.py 文件,将两处 THUDM/chatglm2-6b 替换为 model :

tokenizer = AutoTokenizer.from_pretrained("model", trust_remote_code=True)
model = AutoModel.from_pretrained("model", trust_remote_code=True).cuda()

在这里插入图片描述

如果想使用命令行与模型交互,则需要修改 cli_demo.py。web_demo2.py 同理 。

三、运行模型

文件夹层面 cd 至web_demo.py文件夹,环境层面激活 chatglm2-6b,然后执行:

python web_demo.py

在这里插入图片描述运行完之后就会弹出该页面:在这里插入图片描述

需要注意的坑:

1)使用 web_demo 时不能开 VPN,否则会弹出 Expecting value: line 1 column 1 (char 0)错误;

2)如使用 web_demo2,则需要按官网提示额外安装 streamlit 和 streamlit-chat,且启动命令为

streamlit run web_demo2.py 。

四、体验

推理速度相比上一代有明显的提升,但性能提升感知不强。期待团队未来推出13B、30B、65B等更大规模的模型。

注:笔者测试期间,第三方库的安装会因为网络原因出现一些问题,此时可以使用国内镜像来解决,例如,笔者在安装时使用的是阿里云镜像

pip install torchvision  -i https://mirrors.aliyun.com/pypi/simple

相关文章

  • Python3中configparser模块读写ini文件并解析配置的用法详解

    Python3中configparser模块读写ini文件并解析配置的用法详解

    这篇文章主要介绍了Python3中configparser模块读写ini文件并解析配置的用法详解,需要的朋友可以参考下
    2020-02-02
  • Python+Pygame实现怀旧游戏飞机大战

    Python+Pygame实现怀旧游戏飞机大战

    第一次见到飞机大战是在小学五年级下半学期的时候,这个游戏中可以说包含了几乎所有我目前可接触到的pygame知识。本文就来利用Pygame实现飞机大战游戏,需要的可以参考一下
    2022-11-11
  • 30道python自动化测试面试题与答案汇总

    30道python自动化测试面试题与答案汇总

    对于机器学习算法工程师而言,Python是不可或缺的语言,它的优美与简洁令人无法自拔,下面这篇文章主要给大家介绍了关于30道python自动化测试面试题与答案汇总的相关资料,需要的朋友可以参考下
    2023-03-03
  • pandas string转dataframe的方法

    pandas string转dataframe的方法

    下面小编就为大家分享一篇pandas string转dataframe的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • Python request使用方法及问题总结

    Python request使用方法及问题总结

    这篇文章主要介绍了Python request使用方法及问题总结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • python的else子句使用指南

    python的else子句使用指南

    本文讨论Python的for…else和while…else语法,这是Python中最不常用、最为误解的语法特性之一
    2016-02-02
  • Python 中 list 的各项操作技巧

    Python 中 list 的各项操作技巧

    最近在学习 python 语言。大致学习了 python 的基础语法。觉得 python 在数据处理中的地位和它的 list 操作密不可分,今天把相关基础操作记录到脚本之家平台,需要的的朋友参考下
    2017-04-04
  • 利用 Python 把小伙伴制作成表情包

    利用 Python 把小伙伴制作成表情包

    这篇文章主要介绍了如何利用 Python把你的小伙伴变成表情包,在日常生活中,我们经常会存取一些朋友们的丑照,在这个项目中,我们以萌萌哒的熊猫头作为背景,然后试着在背景图上加入朋友们的照片,下面详细内容需要的小伙伴可以参考一下
    2022-02-02
  • pandas进行时间数据的转换和计算时间差并提取年月日

    pandas进行时间数据的转换和计算时间差并提取年月日

    这篇文章主要介绍了pandas进行时间数据的转换和计算时间差并提取年月日,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • Python基础之变量基本用法与进阶详解

    Python基础之变量基本用法与进阶详解

    这篇文章主要介绍了Python基础之变量基本用法与进阶,结合实例形式详细分析了Python变量引用、可变和不可变类型、局部变量和全局变量等相关原理与使用技巧,需要的朋友可以参考下
    2020-01-01

最新评论