新闻中心

基于ChatGLM-6B模型 + prompt实现角色扮演功能

2025-07-21
浏览次数:
返回列表
本文介绍了ChatGLM相关内容,包括ChatGLM的定义、模型结构、预测方式,还说明了基于其的项目。ChatGLM是通用语言模型,ChatGLM-6B是开源双语对话模型。项目结合ChatGLM和Prompt技术,介绍了在Paddle上的使用,包括模型读取、功能设计等。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

基于chatglm-6b模型 + prompt实现角色扮演功能 -

1. 引言

1.1 什么是ChatGLM

General Language Model (GLM),据论文 https://arxiv.org/pdf/2103.10360.pdf 所述,是一种基于自回归空白填充的通用语言模型 (Autoregressive Blank Infilling)。

GLM通过添加2D位置编码和允许任意顺序预测跨度来改进空白填充预训练,这导致在NLU任务上的性能优于BERT和T5。同时,GLM可以通过改变空白的数量和长度来针对不同类型的任务进行预训练。在NLU、条件生成和无条件生成的广泛任务中,在给定相同的模型大小和数据的情况下,GLM优于BERT、T5和GPT,并且在具有1.25×BERTLarge参数的单个预训练模型中实现了最佳性能,证明了其对不同下游任务的可推广性。

而 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,ChatGLM-6B 使用了和 ChatGPT 相似的技术,并针对中文问答和对话进行了优化,具有 62 亿参数,经过约 1T 标识符的中英双语训练。

不过,由于 ChatGLM-6B 的规模较小,目前已知其具有相当多的局限性,如事实性/数学逻辑错误,可能生成有害/有偏见内容,较弱的上下文能力,自我认知混乱,以及对英文指示生成与中文指示完全矛盾的内容。请大家在使用前了解这些问题,以免产生误解。更大的基于 1300 亿参数 GLM-130B 的 ChatGLM 正在内测开发中:https://github.com/THUDM/GLM-130B。

1.2 ChatGLM的模型结构

GLM使用单个Transformer,结构和Transformer类似,但对结构进行了几个修改:

  1. 重新安排了层归一化和残差连接的顺序,这对于大规模语言模型来说至关重要,以避免数值误差
  2. 使用正弦线性层来进行输出token预测;
  3. 用GeLU取代ReLU激活功能

1.3 ChatGLM的预测

GLM图解如下。绿色部分是输入语句中的空缺部分,模型通过自回归生成填入相应的词语

基于ChatGLM-6B模型 + prompt实现角色扮演功能 -

在情感分类任务时如下。一个输入的句子中,通过在 [MASK] 标记填充,而在下面的句子里,模型通过填词的方式进行了情感分类。

Coronet has the best lines of all day cruisers. it is really good.

基于ChatGLM-6B模型 + prompt实现角色扮演功能 -

了解了ChatGLM模型的用法后,那么我们可以使用Paddle上的ChatGLM-6B模型了

Paddle官方的模型和微调代码: https://github.com/PaddlePaddle/PaddleNLP/tree/8e4087126c21f15d47f78c95f7d5070dee2bbac9/examples/language_model/chatglm

1.4 本项目介绍

本项目的技术基础是 ChatGLM 和 Prompt。ChatGLM 可以让机器像人类一样进行对话。Prompt 则是一种预设的对话模板,能够帮助机器生成更加准确和流畅的回答。通过结合这两种技术,项目能够提供高度自然和准确的交流体验。

用法和chatGPT差不多,意思懂就行。由于当前平台gradio和streamlit部署硬盘只有10G,故不能在线部署这个12G的GLM模型

美图云修 美图云修

商业级AI影像处理工具

美图云修 50 查看详情 美图云修

2. 实验准备

需要用到最新的Paddle和PaddleNLP

In [1]
import paddleprint(paddle.version.cuda())from IPython.display import clear_output
!unzip paddlenlp.zip!cp -Rf paddlenlp /home/aistudio/.data/webide/pip/lib/python3.7/site-packages/paddlenlp# !python -m pip install paddlepaddle-gpu==0.0.0.post112 -f https://www.paddlepaddle.org.cn/whl/linux/gpu/develop.html #  注意安装后重启内核# 下次重启该项目后,可能要再安装paddlepaddle-gpu==0.0.0.post112,或者加 --user 避免下次再安装!python -m pip install paddlepaddle-gpu==0.0.0.post112 -f https://www.paddlepaddle.org.cn/whl/linux/gpu/develop.html --user
clear_output()print('安装完毕,注意重启内核')
安装后,注意重启内核

3. 读取模型

(上一步安装后,注意重启内核)

基于ChatGLM-6B模型 + prompt实现角色扮演功能 -

如果模型在3-5分钟内没读成功或者出现cudaErrorECCUncorrectable = 214 错误的话。考虑重启项目,换一张显卡试试

In [ ]
import warnings 
warnings.filterwarnings("ignore")import paddlefrom paddlenlp.transformers import (
    ChatGLMConfig,
    ChatGLMForConditionalGeneration,
    ChatGLMTokenizer,
)from predict_convert import convert_example_neko,convert_example, get_response#读取原始的chatglm-6b模型model_name_or_path = 'data/data217141'# model_name_or_path = 'THUDM/glm-515m'tokenizer = ChatGLMTokenizer.from_pretrained(model_name_or_path)

config = ChatGLMConfig.from_pretrained(model_name_or_path)
paddle.set_default_dtype(config.paddle_dtype)

model = ChatGLMForConditionalGeneration.from_pretrained(
    model_name_or_path,
    tensor_parallel_degree=paddle.distributed.get_world_size(),
    tensor_parallel_rank=0,
    load_state_as_np=True,
    dtype=config.paddle_dtype,
)

model.eval()# 如果模型在3-5分钟内没读成功或者出现cudaErrorECCUncorrectable = 214 错误的话。考虑重启项目,换一张显卡试试

4. 功能设计

4.1 问答和历史对话设计

正如前面提到,GLM是个填词模型,对话通过填空实现。故参考了官方的测试代码,用 ‘问:’、‘答:’分别表示用户和系统回复的起始,用 [Round x] 表示轮次来记录历史对话。

通过预载入对话历史(prompt表示),实现模型根据对话填充‘答:’后面的内容

最终变成通过prompt来实现角色设定,利用ChatGLM的填词功能来填充角色对话

在 history = [('xxxx'),('xx')] 处修改

括号内前面是用户说,后面是系统答。修改和设计对话历史,让模型顺着前文更好地回答

4.2 角色模板设计

参考自https://github.com/f/awesome-chatgpt-prompts

0 充当 Linux 终端 1 充当英语翻译和改进者 2 充当英翻中 3 充当英英词典(附中文解释) 4 充当前端智能思路助手 5 担任面试官 6 充当 J*aScript 控制台 等等通过输入对应数字来使用

通过prompt来实现角色扮演功能,为更好体验请按图下操作

基于ChatGLM-6B模型 + prompt实现角色扮演功能 -

修改下面括号内对话历史,前面是用户说,后面是系统答。让模型顺着前文更好地回答

基于ChatGLM-6B模型 + prompt实现角色扮演功能 -

In [2]
import osfrom IPython.display import clear_output as clearimport json
input_length=2048 # max input lengthoutput_length=160 # max output lengthstart = 0history = ''# 括号内前面是用户说,后面是系统答。修改和设计对话历史,让模型顺着前文更好地回答history = [('你是一只会说话、会搭建神经网络、精通<a style="color:#f60; text-decoration:underline;" title="python" href="https://www.php.cn/zt/15730.html" target="_blank">python</a>的猫猫,可以自由回答问题,像人类一样思考和表达。现在你与我对话时每一句话后面都要加上喵,并加上用表情。”。','好的主人喵~

以上就是基于ChatGLM-6B模型 + prompt实现角色扮演功能的详细内容,更多请关注其它相关文章!


# 进行了  # 阳泉朋友圈营销推广方案  # 松原seo推广哪个便宜  # 小余seo顾问  # 沂源网站建设的好处  # 九江网站建设工作  # 网站建设与管理自学教程  # 深圳网站优化一站式服务  # 建设网站利润如何  # 江门seo公司甄选火星  # 佛山网站seo推广数据  # 命令行  # 来实现  # 更好地  # 括号内  # linux  # 离线  # 开源  # 美图  # 重启  # 中文网  # type  # fig  # udio  # red  # chatgpt  # ai  # git  # python 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: python如何命令行换行  苹果16都有哪些亮点  华为交换机如何复制命令行  ensp命令如何提示  typescript在浏览器里怎么用  固态硬盘如何区分好坏  破太岁是什么意思  油烟机上的power是什么意思  喇叭上POWER4欧是什么意思  苹果16关闭哪些功能好  typescript有什么框架  win10windows资源管理器在哪里打开  如何把u盘改成固态硬盘  power在坐标轴中是什么意思  苹果16讲解有哪些功能  cmd如何定时执行命令  如何修改cad中的命令  debian和ubuntu命令一样吗  8k是多少钱  8英寸等于多少厘米  animal是什么意思  eraser是什么意思  一秒是多少毫秒  夸克绑定设备是什么意思  如何通过命令行启动tomcat  j*a中怎么截取数组  如何在固态硬盘上安装win7系统  恋爱软件免费聊天不收费的有哪些  路由器上面的power红灯是什么意思  oppo手机nfc功能是什么意思  域名批量查询工具有哪些  苹果16promax有哪些颜色  怎么批量烧写单片机  华为的type-c接口是什么接口  element ui的好处  bugly是什么  市盈率pe是什么意思  照相机上面power是什么意思  typescript 如何使用  如何查看网站域名解析  html怎么使用typescript  如何去除计算器的命令  手机拍电脑屏幕有条纹怎么解决  区块链的热闹将何去何从?  苹果16改进了哪些  春运抢票要用抢票软件吗  cron表达式在线工具有哪些  固态硬盘如何外接  a股等权平均市盈率是什么意思  sql isnull函数如何使用 

搜索