折腾ChatGLM的几个避坑小技巧


我昨天说从数据技术嘉年华回来后就部署了一套ChatGLM,准备研究利用大语言模型训练数据库运维知识库,很多朋友不大相信,说老白你都这把年纪了,还能自己去折腾这些东西?为了打消这些朋友的疑虑,我今天把这两天折腾ChatGLM的过程分享给大家,也为有兴趣折腾一下ChatGLM的朋友讲一下避坑的一些技巧。

ChatGLM-6B是基于清华大学 KEG 实验室与智谱 AI 于2025年联合训练的语言模型 GLM 开发而成,是一个大型的语言模型,其针对用户的问题和要求提供适当的答复和支持。上面的回答是ChatGLM自己回答的,GLM-6B是一个开源的62亿参数的预训练模型,其特点是可以在比较小的硬件环境下本地运行。这一特性可以让基于大语言模型的应用可以走进千家万户。KEG实验室的目的是要让更大的GLM-130B模型(1300亿参数,与GPT-3.5相当)能够在一个8路RTX 3090的低端环境中完成训练。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果这个目标真的能实现,那么对想基于大语言模型做一些应用的人来说绝对是一个福音。目前的ChatGLP-6B的FP16模型大约13G多一点,INT-4量化模型不到4GB,完全可以在一块6GB显存的RTX 3060TI上运行。

在部署前我不太了解这些情况,因此买了一块不上不下的12GB的RTX 3060,于是完成安装部署后仍然无法运行FP16的模型。早知道在自己家里做测试验证,直接买块价格更便宜的3060TI就可以了。而如果要运行无损的FP16模型,就必须上24GB显存的3090了。

如果你仅仅是想在自己的机器上测试一下ChatGLP-6B的能力,那么你可能不需要直接去下载THUDM/ChatGLM-6B模型,在huggingface上有一些打包好的量化模型可以下载。模型下载速度很慢,你可以直接下载int4的量化模型。

我这次安装是在一台I7 8核的PC机上完成的,显卡为12G显存的RTX 3060,因为这台电脑是我的工作电脑,因此我把ChatGLM安装在了WSL子系统上。在WINDOWS WSL 子系统上安装ChatGLM比直接在LINUX环境中安装要复杂一些。其中最大的坑是显卡驱动的安装。直接在Linux上部署ChatGLM的时候,需要直接安装NVIDIA的驱动程序,通过modprobe来激活网卡驱动就可以了。而在WSL上安装则大有不同。

ChatGLM可以在github上下载,在网站上也有一些简单的文档,甚至包含一个在WINDOWS WSL上部署ChatGLM的文档。只不过如果你是这方面的小白,完全按照这个文档去部署,会遇到无数的坑。

Requriements.txt文档里列出了ChatGLM使用的主要开源组件的清单与版本号,其核心是transformers,需要版本4.27.1,实际上要求没有这么严格,略低一点也没太大问题,不过安全起见还是用相同的版本为好。Icetk是做Token处理的,cpm_kernels是中文处理模型与cuda的核心调用,protobuf是结构化数据存储的。Gradio是用于利用Python快速生成AI应用的框架。Torch就不用我多做介绍了。

ChatGLM可以在没有GPU的环境中使用,利用CPU和32GB的物理内存来运行,不过运行速度很慢,仅仅能够用来做个演示验证而已。要想玩ChatGLM最好还是配备一块GPU。

在WSL上安装ChatGLM最大的坑是显卡驱动,在Git上ChatGLM的文档十分不友好,对于不太了解这个项目或者没有做过此类部署的人来说,文档实在太坑。实际上软件部署并不麻烦,而显卡驱动就十分有技巧性。

因为是在WSL subsystem上部署,因此LINUX只是一个*系统,并不是完整的LINUX,因此英伟达的显卡驱动只需要在WINDOWS上安装,不需要在WSL里激活。不过在WSL的LINUX虚拟环境中还是需要安装CUDA TOOLS。WINDOWS上的英伟达驱动一定要安装官网上的最新驱动,而不能使用WIN10/11自带的兼容性驱动,因此从官网上下载最新驱动并安装一定不要省略。

安装完WIN的驱动后就可以直接在WSL里安装cuda tools了,安装完毕后,运行nvidia-smi如果能够看到上面的界面,那么恭喜你,你已经成功地避开了第一个坑。实际上在安装cuda tools时候还会遇到几个小坑。那就是你的系统中必须安装合适版本的gcc,gcc-dev和make等编译相关的工具,如果缺少这些组件,cuda tools的安装会失败。

上面就是坑人的前期准备,实际上避开英伟达驱动这个坑,后面的安装还是很顺利的。在系统的选择上,我还是建议选择Debian兼容的Ubuntu,新版的Ubuntu的aptitude十分智能,能够帮你解决大量软件的版本兼容问题,实现部分软件的自动降版本。

下面的安装过程完全按照安装指南就可以顺利完成了,要注意的是替换/etc/apt/sources.list里面的安装源的工作最好按照指南完成,一方面安装速度会快很多,另外一方面也避免出现软件版本兼容性的问题。当然不替换也不一定会影响后面的安装过程。

如果你顺利地通过了前面的各道关卡,那么你就进入到了最后一步,启动web_demo了。执行python3 web_demo.py可以启动一个WEB对话的例子。这时候如果你是个穷人,只有一张12GB显存的3060,那么你就一定会看到上面的报错了,哪怕你把PYTORCH_CUDA_ALLOC_CONF设置为最小的21,也无法避开这个报错。这时候你就不能偷懒了,必须简单地改写一下python脚本。

默认的web_demo.py是使用FP16的预训练模型的,13GB多的模型肯定无法装载到12GB现存里的,因此你需要对这个代码做一个小的调整。

你可以改为quantize(4)来装载INT4量化模型,或者改为quantize(8)来装载INT8量化模型。这样你的显卡内存就够用了,而且可以支持你做各种对话了。

要注意的是,web_demo.py启动后,模型的下载工作才真正开始,因此要下载13GB的模型,需要相当长的时间,你可以把这项工作放到半夜做,或者你直接用迅雷等下载工具预先从hugging face上下载模型。如果你对模型一无所知,不太会安装下载的模型,你也可以修改代码中的模型名称,THUDM/chatglm-6b-int4,直接从网上下载只有不到4GB的INT4量化模型,这样会快很多,反正你的破显卡也跑不起FP16的模型。

至此,你可以通过网页与ChatGLM对话了,不过这一切只是折腾的开始。只有你能够把你的微调模型训练出来了,那么你的ChatGLM的入坑之旅才会真正开始。玩这种东西还是需要大量的精力和金钱的,入坑要慎重。

最后我还是十分感谢清华大学KEG实验室的朋友,他们的工作让更多的人可以低成本地使用大语言模型。


# debian  # 如果你  # 的是  # 的人  # 显卡驱动  # 就可以  # 你就  # 显存  # 文档  # 是一个  # 你可以  # gpt  # Python  # ubuntu  # linux  # gpt-3.5  # gpt-3  # 数据库  # windows  # git  # github  # int  # Token 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: Google AI Studio文本转语音教程:零成本创作高质量音频  MagicAnimate怎么让图片动起来 字节跳动MagicAnimate配置及用法【教程】  Google Gemini 处理结构化 XML 数据转换教程  AI复古风照片编辑教程:Gemini AI轻松打造复古时尚  Midjourney怎么用一键生成logo_Midjourneylogo生成步骤【教程】  通义千问怎样写文案_通义千问文案写作教程【指南】  3步教你用AI创作漫画脚本,从故事到分镜全搞定  如何用AI帮你分析用户评论?3步挖掘用户真实需求  AI 编码助手:提升效率的 5 大工具及应用详解  冷邮件营销新策略:工作坊模式助力B2B销售增长  EdrawMind终极评测:AI赋能思维导图,提升效率与创造力  微信AI数字人能否识别语音消息_微信AI数字人语音识别与回复设置【教程】  如何用AI帮你制定个人OKR?目标管理从未如此简单  利用AI自动化回复Google Voice短信:终极指南  豆包AI里的智能体有什么用_不同类型智能体使用场景介绍  谷歌 Gemini AI 助手详解:功能、应用与隐私设置  豆包AI的发现页面有什么功能_探索热门智能体与话题  Gacha Club反应视频解析:探索热门角色和独特剧情  lovemo官网网页版入口 lovemo官网登录入口  解读Childish Gambino《This Is America》的深层含义与文化影响  如何用AI一键生成手机壁纸?4K高清AI壁纸生成关键词【分享】  AI员工工具详解:添加与移除指南,提升效率  百度输入法智能预测怎么关 百度输入法ai联想词关闭  AI破译古文字:重现失落文明之声,揭秘历史真相  tofai官网入口网站 tofai官网入口网页版  免费高效获客!ChatGPT助你快速生成潜在客户名单  ChatGPT官方入口 ChatGPT官网网页版访问步骤详解  Decart Lucy 14B:颠覆AI视频生成领域的革命性模型  5分钟教你用AI将你的研究数据生成可视化的图表和摘要  播客数据深度分析:用户地域分布及增长策略探讨  DeepSeek是免费使用的吗 DeepSeek收费模式与Pro版本功能详解  农业模拟器25:AI助手与GPS终极指南  Google AI 在教育领域个性化学习路径的构建  教你用AI快速制作思维导图,3步理清所有工作思路  五大AI视频编辑工具:提升视频创作效率和质量  AI网站构建指南:Duda平台免费创建教程  如何用ChatGPT准备面试 模拟面试问答与职场话术练习教程  普通人如何用DeepSeek月入过万?2026最新赚钱路径全解析!  grokai如何生成动态图表_grokai动态图表生成工具使用及数据可视化技巧  YOU.com AI搜索引擎:Python代码示例及使用指南  Dr.Job AI:职场简历优化终极指南,提升求职成功率  PixianAI抠图如何导出PSD_PixianAI分层导出与PSD保存设置【实操】  批改网AI检测工具怎样设置检测维度_批改网AI检测工具维度勾选与权重调整【技巧】  CanvaAI抠图怎样调整色彩_CanvaAI色彩校正与滤镜叠加方法【攻略】  Google AI Studio 中的提示词微调实验教程  为什么你的简历过不了筛选?用AI帮你诊断并修复漏洞  LTX Studio:AI电影制作平台深度评测与应用指南  FundView贷款管理:贷款汇总生成器提升效率  11月问界汽车哪里卖的多?成都力压北上广深位居第一  LogMeIn Resolve:IT 运维知识库的 AI 赋能实践 

 2023-05-02

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.