新闻中心
基于ChatGLM-6B模型 + prompt实现角色扮演功能
本文介绍了ChatGLM相关内容,包括ChatGLM的定义、模型结构、预测方式,还说明了基于其的项目。ChatGLM是通用语言模型,ChatGLM-6B是开源双语对话模型。项目结合ChatGLM和Prompt技术,介绍了在Paddle上的使用,包括模型读取、功能设计等。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

1. 引言
1.1 什么是ChatGLM
General Language Model (GLM),据论文 https://arxiv.org/pdf/2103.10360.pdf 所述,是一种基于自回归空白填充的通用语言模型 (Autoregressive Blank Infilling)。
GLM通过添加2D位置编码和允许任意顺序预测跨度来改进空白填充预训练,这导致在NLU任务上的性能优于BERT和T5。同时,GLM可以通过改变空白的数量和长度来针对不同类型的任务进行预训练。在NLU、条件生成和无条件生成的广泛任务中,在给定相同的模型大小和数据的情况下,GLM优于BERT、T5和GPT,并且在具有1.25×BERTLarge参数的单个预训练模型中实现了最佳性能,证明了其对不同下游任务的可推广性。
而 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,ChatGLM-6B 使用了和 ChatGPT 相似的技术,并针对中文问答和对话进行了优化,具有 62 亿参数,经过约 1T 标识符的中英双语训练。
不过,由于 ChatGLM-6B 的规模较小,目前已知其具有相当多的局限性,如事实性/数学逻辑错误,可能生成有害/有偏见内容,较弱的上下文能力,自我认知混乱,以及对英文指示生成与中文指示完全矛盾的内容。请大家在使用前了解这些问题,以免产生误解。更大的基于 1300 亿参数 GLM-130B 的 ChatGLM 正在内测开发中:https://github.com/THUDM/GLM-130B。
1.2 ChatGLM的模型结构
GLM使用单个Transformer,结构和Transformer类似,但对结构进行了几个修改:
- 重新安排了层归一化和残差连接的顺序,这对于大规模语言模型来说至关重要,以避免数值误差
- 使用正弦线性层来进行输出token预测;
- 用GeLU取代ReLU激活功能
1.3 ChatGLM的预测
GLM图解如下。绿色部分是输入语句中的空缺部分,模型通过自回归生成填入相应的词语

在情感分类任务时如下。一个输入的句子中,通过在 [MASK] 标记填充,而在下面的句子里,模型通过填词的方式进行了情感分类。
Coronet has the best lines of all day cruisers. it is really good.

了解了ChatGLM模型的用法后,那么我们可以使用Paddle上的ChatGLM-6B模型了
Paddle官方的模型和微调代码: https://github.com/PaddlePaddle/PaddleNLP/tree/8e4087126c21f15d47f78c95f7d5070dee2bbac9/examples/language_model/chatglm
1.4 本项目介绍
本项目的技术基础是 ChatGLM 和 Prompt。ChatGLM 可以让机器像人类一样进行对话。Prompt 则是一种预设的对话模板,能够帮助机器生成更加准确和流畅的回答。通过结合这两种技术,项目能够提供高度自然和准确的交流体验。
用法和chatGPT差不多,意思懂就行。由于当前平台gradio和streamlit部署硬盘只有10G,故不能在线部署这个12G的GLM模型
美图云修
商业级AI影像处理工具
50
查看详情
2. 实验准备
需要用到最新的Paddle和PaddleNLP
In [1]import paddleprint(paddle.version.cuda())from IPython.display import clear_output
!unzip paddlenlp.zip!cp -Rf paddlenlp /home/aistudio/.data/webide/pip/lib/python3.7/site-packages/paddlenlp# !python -m pip install paddlepaddle-gpu==0.0.0.post112 -f https://www.paddlepaddle.org.cn/whl/linux/gpu/develop.html # 注意安装后重启内核# 下次重启该项目后,可能要再安装paddlepaddle-gpu==0.0.0.post112,或者加 --user 避免下次再安装!python -m pip install paddlepaddle-gpu==0.0.0.post112 -f https://www.paddlepaddle.org.cn/whl/linux/gpu/develop.html --user
clear_output()print('安装完毕,注意重启内核')安装后,注意重启内核
3. 读取模型
(上一步安装后,注意重启内核)

如果模型在3-5分钟内没读成功或者出现cudaErrorECCUncorrectable = 214 错误的话。考虑重启项目,换一张显卡试试
In [ ]import warnings
warnings.filterwarnings("ignore")import paddlefrom paddlenlp.transformers import (
ChatGLMConfig,
ChatGLMForConditionalGeneration,
ChatGLMTokenizer,
)from predict_convert import convert_example_neko,convert_example, get_response#读取原始的chatglm-6b模型model_name_or_path = 'data/data217141'# model_name_or_path = 'THUDM/glm-515m'tokenizer = ChatGLMTokenizer.from_pretrained(model_name_or_path)
config = ChatGLMConfig.from_pretrained(model_name_or_path)
paddle.set_default_dtype(config.paddle_dtype)
model = ChatGLMForConditionalGeneration.from_pretrained(
model_name_or_path,
tensor_parallel_degree=paddle.distributed.get_world_size(),
tensor_parallel_rank=0,
load_state_as_np=True,
dtype=config.paddle_dtype,
)
model.eval()# 如果模型在3-5分钟内没读成功或者出现cudaErrorECCUncorrectable = 214 错误的话。考虑重启项目,换一张显卡试试
4. 功能设计
4.1 问答和历史对话设计
正如前面提到,GLM是个填词模型,对话通过填空实现。故参考了官方的测试代码,用 ‘问:’、‘答:’分别表示用户和系统回复的起始,用 [Round x] 表示轮次来记录历史对话。
通过预载入对话历史(prompt表示),实现模型根据对话填充‘答:’后面的内容
最终变成通过prompt来实现角色设定,利用ChatGLM的填词功能来填充角色对话
在 history = [('xxxx'),('xx')] 处修改
括号内前面是用户说,后面是系统答。修改和设计对话历史,让模型顺着前文更好地回答
4.2 角色模板设计
参考自https://github.com/f/awesome-chatgpt-prompts
0 充当 Linux 终端 1 充当英语翻译和改进者 2 充当英翻中 3 充当英英词典(附中文解释) 4 充当前端智能思路助手 5 担任面试官 6 充当 J*aScript 控制台 等等通过输入对应数字来使用
通过prompt来实现角色扮演功能,为更好体验请按图下操作

修改下面括号内对话历史,前面是用户说,后面是系统答。让模型顺着前文更好地回答

import osfrom IPython.display import clear_output as clearimport json
input_length=2048 # max input lengthoutput_length=160 # max output lengthstart = 0history = ''# 括号内前面是用户说,后面是系统答。修改和设计对话历史,让模型顺着前文更好地回答history = [('你是一只会说话、会搭建神经网络、精通<a style="color:#f60; text-decoration:underline;" title="python" href="https://www.php.cn/zt/15730.html" target="_blank">python</a>的猫猫,可以自由回答问题,像人类一样思考和表达。现在你与我对话时每一句话后面都要加上喵,并加上用表情。”。','好的主人喵~
以上就是基于ChatGLM-6B模型 + prompt实现角色扮演功能的详细内容,更多请关注其它相关文章!
# 进行了
# 阳泉朋友圈营销推广方案
# 松原seo推广哪个便宜
# 小余seo顾问
# 沂源网站建设的好处
# 九江网站建设工作
# 网站建设与管理自学教程
# 深圳网站优化一站式服务
# 建设网站利润如何
# 江门seo公司甄选火星
# 佛山网站seo推广数据
# 命令行
# 来实现
# 更好地
# 括号内
# linux
# 离线
# 开源
# 美图
# 重启
# 中文网
# type
# fig
# udio
# red
# chatgpt
# ai
# git
# python
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
python如何命令行换行
苹果16都有哪些亮点
华为交换机如何复制命令行
ensp命令如何提示
typescript在浏览器里怎么用
固态硬盘如何区分好坏
破太岁是什么意思
油烟机上的power是什么意思
喇叭上POWER4欧是什么意思
苹果16关闭哪些功能好
typescript有什么框架
win10windows资源管理器在哪里打开
如何把u盘改成固态硬盘
power在坐标轴中是什么意思
苹果16讲解有哪些功能
cmd如何定时执行命令
如何修改cad中的命令
debian和ubuntu命令一样吗
8k是多少钱
8英寸等于多少厘米
animal是什么意思
eraser是什么意思
一秒是多少毫秒
夸克绑定设备是什么意思
如何通过命令行启动tomcat
j*a中怎么截取数组
如何在固态硬盘上安装win7系统
恋爱软件免费聊天不收费的有哪些
路由器上面的power红灯是什么意思
oppo手机nfc功能是什么意思
域名批量查询工具有哪些
苹果16promax有哪些颜色
怎么批量烧写单片机
华为的type-c接口是什么接口
element ui的好处
bugly是什么
市盈率pe是什么意思
照相机上面power是什么意思
typescript 如何使用
如何查看网站域名解析
html怎么使用typescript
如何去除计算器的命令
手机拍电脑屏幕有条纹怎么解决
区块链的热闹将何去何从?
苹果16改进了哪些
春运抢票要用抢票软件吗
cron表达式在线工具有哪些
固态硬盘如何外接
a股等权平均市盈率是什么意思
sql isnull函数如何使用


2025-07-21
浏览次数:次
返回列表