手把手教你用Anaconda在Windows上跑ChatGLM-WebUI(CPU版,含内存占用实测)

📅 2026/7/3 6:34:16 👁️ 阅读次数 📝 编程学习
手把手教你用Anaconda在Windows上跑ChatGLM-WebUI(CPU版,含内存占用实测)

零基础Windows用户实战:CPU版ChatGLM-WebUI全流程部署指南

最近大语言模型的热度持续攀升,许多技术爱好者都想在本地体验这类AI的魅力。但对于只有普通Windows电脑、没有独立显卡的用户来说,如何顺利部署运行这类模型就成了一个现实问题。本文将手把手带你完成从零开始的全流程部署,特别针对CPU环境进行优化,并分享实际运行中的性能表现和注意事项。

1. 环境准备:Anaconda安装与配置

对于Python生态下的AI项目,Anaconda是最佳的选择之一。它不仅集成了Python解释器,还提供了强大的虚拟环境管理功能,能有效避免不同项目间的依赖冲突。

1.1 下载与安装Anaconda

推荐从国内镜像源下载Anaconda,速度会快很多:

  • 访问阿里云镜像站:https://mirrors.aliyun.com/anaconda/archive/
  • 选择最新版本的Windows 64位安装包(如Anaconda3-2023.09-Windows-x86_64.exe)
  • 下载完成后双击运行安装程序

安装过程中有几个关键选项需要注意:

  • 安装路径不要包含中文或空格
  • 勾选"Add Anaconda3 to my PATH environment variable"(虽然官方不推荐,但对新手更友好)
  • 注册Anaconda为默认Python选项

1.2 验证安装

安装完成后,打开命令提示符(Win+R,输入cmd),执行以下命令验证:

conda --version python --version

正常应该显示类似这样的版本信息:

conda 23.7.4 Python 3.11.5

提示:如果出现"conda不是内部或外部命令"的错误,说明环境变量未正确设置。可以手动添加以下路径到系统PATH中(具体路径根据你的安装位置调整):

  • C:\ProgramData\Anaconda3
  • C:\ProgramData\Anaconda3\Scripts
  • C:\ProgramData\Anaconda3\Library\bin

2. 模型获取与项目准备

2.1 下载ChatGLM模型文件

由于大语言模型文件通常较大(几个GB到几十GB不等),我们提供两种下载方式:

方式一:百度网盘(适合国内用户)

  • 链接:https://pan.baidu.com/s/1m8XxRhz1byvDPA46R_IfLw
  • 提取码:8888
  • 下载后解压到指定目录,如E:\ChatGLM-webui

方式二:GitHub(适合能访问GitHub的用户)

git clone https://github.com/THUDM/ChatGLM-6B git clone https://github.com/Akegarasu/ChatGLM-webui

2.2 项目结构说明

下载完成后,你的项目目录结构应该类似这样:

ChatGLM-webui/ ├── ChatGLM-6B/ # 模型文件 ├── ChatGLM-webui/ # Web界面代码 ├── README.md # 说明文档 └── requirements.txt # 依赖列表

3. 依赖安装与配置

3.1 创建专用虚拟环境

为避免与系统Python环境冲突,我们新建一个conda环境:

conda create -n chatglm python=3.9 conda activate chatglm

注意:这里使用Python 3.9是因为某些依赖包对新版本Python支持还不够完善

3.2 安装PyTorch(CPU版)

由于我们使用CPU运行,需要安装不带CUDA支持的PyTorch:

pip install torch==1.13.1 torchvision==0.14.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

如果下载速度慢,可以尝试手动下载whl文件:

  1. 访问:https://download.pytorch.org/whl/cpu/torch-1.13.1%2Bcpu-cp39-cp39-win_amd64.whl
  2. 下载后进入文件所在目录执行:
pip install torch-1.13.1+cpu-cp39-cp39-win_amd64.whl

3.3 安装其他依赖

使用清华镜像源加速安装:

pip install --upgrade -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

常见问题解决:

  • 错误:某些包安装失败尝试单独安装该包,或降低版本要求
  • 警告:平台不兼容确认下载的是win_amd64版本,而非linux版本

4. 运行与性能实测

4.1 启动WebUI服务

进入项目目录,执行CPU专用启动脚本:

cd E:\ChatGLM-webui\ChatGLM-webui python webui.py --cpu

或者直接运行提供的批处理文件:

0-使用CPU运行.bat

4.2 内存占用实测

下表展示了不同配置下的内存使用情况:

硬件配置初始加载内存推理时峰值内存备注
16GB内存无法完成加载-系统会卡死
32GB内存18GB26GB勉强可运行
64GB内存18GB28GB流畅运行

重要提示:实测表明,16GB内存的电脑基本无法运行,32GB内存勉强可用但体验不佳,推荐至少64GB内存才能获得相对流畅的体验

4.3 CPU性能表现

在Intel Xeon E5-2680 v4 @ 2.40GHz (14核28线程)上的测试结果:

  • 模型加载时间:约8分钟
  • 首次响应时间:约30秒
  • 后续响应速度:简单问题10-30秒,复杂问题1-2分钟
  • CPU利用率:推理期间维持在60%-80%

5. 使用技巧与优化建议

5.1 浏览器访问

服务启动后,在浏览器中访问:

http://127.0.0.1:17860/

界面主要功能区域:

  • 左侧:对话历史
  • 中间:聊天主界面
  • 右侧:参数调整区域(新手建议保持默认)

5.2 性能优化技巧

虽然CPU模式性能有限,但以下几个方法可以稍微改善体验:

  1. 关闭不必要的程序:释放更多内存给模型使用
  2. 调整对话长度:在设置中限制max_length参数(如512)
  3. 使用轻量级模型:如果支持,尝试4bit量化版本
  4. 预热模型:首次使用前先问几个简单问题"预热"模型

5.3 常见问题排查

问题现象可能原因解决方案
启动时报错缺少模块依赖未正确安装重新安装requirements.txt
模型加载失败模型文件损坏或路径错误检查模型路径,重新下载
内存不足物理内存不足增加内存或使用量化模型
响应极慢CPU性能不足降低max_length参数

6. 进阶方向与学习建议

成功运行ChatGLM-WebUI只是开始,如果想进一步深入:

  1. 尝试量化模型:4bit/8bit量化可以大幅降低内存需求
  2. 学习API调用:通过Python脚本而非Web界面与模型交互
  3. 探索微调:在特定领域数据上微调模型以获得更好效果
  4. 硬件升级:考虑添加支持CUDA的显卡(如RTX 3090)

对于持续学习,推荐关注以下资源:

  • Hugging Face文档:https://huggingface.co/docs
  • PyTorch官方教程:https://pytorch.org/tutorials/
  • 模型GitHub仓库的Issues区:了解常见问题解决方案

在实际使用中,我发现模型首次加载时间较长是正常现象,耐心等待即可。对于内存不足的问题,最根本的解决方案还是升级硬件,或者等待更高效的模型版本发布。