清华团队推出对话机器人 ChatGLM,支持在个人电脑上部署和调优

发布者:WhisperingLight最新更新时间:2023-05-10 来源: IT之家 手机看文章 扫描二维码
随时随地手机看文章

在 ChatGPT 的核心团队中,不乏清华大学毕业进入 OpenAI 的开发者,就在 GPT-4 发布的同一天,清华大学顶尖的 NLP 团队,也公开了自研的类 ChatGPT 的大模型 —— 中英双语对话模型 ChatGLM-6B,初具问答和对话功能,现已开启邀请制内测(内测申请网址 http://chatglm.cn),后续还会逐步扩大内测范围。

ChatGLM:千亿基座的对话模型启动内测,单卡版模型已全面开源

官方博客中提到,这是一个初具问答和对话功能的千亿中英语言模型,并针对中文进行了优化。该模型基于 General Language Model(GLM)架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。


经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 虽然规模不及千亿模型,但大大降低了推理成本,提升了效率,并且已经能生成相当符合人类偏好的回答。


具体来说,ChatGLM-6B 具备以下特点:

  • 充分的中英双语预训练:ChatGLM-6B 在 1:1 比例的中英语料上训练了 1T 的 token 量,兼具双语能力。

  • 优化的模型架构和大小:吸取 GLM-130B 训练经验,修正了二维 RoPE 位置编码实现,使用传统 FFN 结构。6B(62 亿)的参数大小,也使得研究者和个人开发者自己微调和部署 ChatGLM-6B 成为可能。

  • 较低的部署门槛:FP16 半精度下,ChatGLM-6B 需要至少 13 GB 的显存进行推理,结合模型量化技术,这一需求可以进一步降低到 10GB(INT8)和 6GB(INT4),使得 ChatGLM-6B 可以部署在消费级显卡上。

  • 更长的序列长度:相比 GLM-10B(序列长度 1024),ChatGLM-6B 序列长度达 2048,支持更长对话和应用。

  • 人类意图对齐训练:使用了监督微调(Supervised Fine-Tuning)、反馈自助(Feedback Bootstrap)、人类反馈强化学习(RLHF)等方式,使模型初具理解人类指令意图的能力。输出格式为 markdown,方便展示。


因此,ChatGLM-6B 具备了一定条件下较好的对话与问答能力。当然,ChatGLM-6B 也有相当多已知的局限和不足:

  • 模型容量较小: 6B 的小容量,决定了其相对较弱的模型记忆和语言能力。在面对许多事实性知识任务时,ChatGLM-6B 可能会生成不正确的信息;她也不擅长逻辑类问题(如数学、编程)的解答。

  • 可能会产生有害说明或有偏见的内容: ChatGLM-6B 只是一个初步与人类意图对齐的语言模型,可能会生成有害、有偏见的内容。

  • 较弱的多轮对话能力: ChatGLM-6B 的上下文理解能力还不够充分,在面对长答案生成,以及多轮对话的场景时,可能会出现上下文丢失和理解错误的情况。

  • 英文能力不足: 训练时使用的指示大部分都是中文的,只有一小部分指示是英文的。因此在使用英文指示时,回复的质量可能不如中文指示的回复,甚至与中文指示下的回复矛盾。

  • 易被误导: ChatGLM-6B 的“自我认知”可能存在问题,很容易被误导并产生错误的言论。例如当前版本模型在被误导的情况下,会在自我认知上发生偏差。即使该模型经过了 1 万亿标识符(token)左右的双语预训练,并且进行了指令微调和人类反馈强化学习(RLHF),但是因为模型容量较小,所以在某些指示下可能会产生有误导性的内容。


该团队称,一直在探索、尝试和努力,GLM 系列模型取得了一丝进展,但离国际顶尖大模型研究和产品(比如 OpenAI 的 ChatGPT 及下一代 GPT 模型)都还有明显差距。中国大模型研究在原创算法、AI 芯片和产业上的追赶与突破需要大家的一起努力,更需要我们对下一代 AI 人才的培养与锻炼。


附 ChatGLM-6B 的对话效果展示:


引用地址:清华团队推出对话机器人 ChatGLM,支持在个人电脑上部署和调优

上一篇:贸泽开售能为工厂自动化和机器人提供高电流容量的TE Dynamic D8000可插拔连接器
下一篇:中国市场工业机器人销量占比全球超50%,国产品牌市场份额持续上升

推荐帖子

网通IVR资料大全
mdreamj 移动便携
【AT-START-F403A测评】之 3、keil环境下二维码例程验证
Keil安装我们这边就省略说了,在雅特力官网上下载并安装Keil.AT32F4xx_DFP.1.3.2,看一下安装完成后的效果:所有的AT32F4X系列,就都有了,接下来我们安装一下AT-Link的驱动,下载并安装Artery_ATLink-USART_DriverInstall,完成后我们便可以调试开发板啦!==================================================好期待哈。。。。。。。。。。。=====
lmyyz 国产芯片交流
谁有ARM开发板卖啊?
我现在在进行嵌入式系统的学习要用到ARM开发板,但是我是菜鸟我想买一个ARM开发板,条件如下:1:价格不要太贵2:可以是公司或者个人,但是售后一定要有技术支持和配套资料,没有技术支持的等于白买。3:可以是二手的,同样要有技术支持和配套资料。4:提供的开发板一定是ARM系列的,可以是高,中,低挡的,不过太高档的对我不太适合,还有价格合理,不能太贵,毕竟我是学生,承担不起太高的费用。5:提供的开发板一定要能支持VxWorks嵌入式操作系统,因为我做的课题就是基于VxWorks嵌入式操作
bupt042761 ARM技术
世界五百强面试题集
世界五百强面试题集里面收录了世界五百强企业的面试问题想应聘的人不可不看的书籍世界五百强面试题集啊我说的投入费用股后即可
mdreamj 模拟电子
关于封装的问题
图画完一个焊盘后它上面是红色的一层,下面是紫色的一层,我想问下是不是紫色的那层是焊盘,画封装的时候右边的尺寸是不是应该填元器件的尺寸资料而不是他推荐的封装尺寸?关于封装的问题 在AD中或Protel中默认,紫色的是阻焊层,绿油层,稍微比阻焊层大一点点,负片性质红色的焊盘,助焊层,或者是贴片的顶层,贴片时的做钢网的层。画封装时焊盘尺寸,是该器件的焊盘尺寸大小,不同封装焊盘大小不一,手工焊接的焊盘比机器贴片焊接的焊盘稍放大一点尺寸,有的厂商有规定,有的需要自己
乐乐老了 PCB设计
英飞凌稳做汽车电子老二 市场份额逐渐上升
2005年,英飞凌汽车电子业务实现了11.9%的销售增幅,再次超过了全球市场7.5%的增幅(总市值达164亿美元)。数据来自市场研究公司StrategyAnalytics。该机构指出,英飞凌在汽车电子市场的销售收入从2004年的13.63亿美元增长到了15.25亿美元,占据了全球9.3%的市场份额,进一步稳固了其全球第二的市场地位。2004年,英飞凌汽车电子业务占据全球9%份额,位居飞思卡尔之后。在欧洲,英飞凌市场份额达14.8%,位居第一。在美国,英飞凌位列三甲,市场份额也扩大到了7.
frozenviolet 汽车电子
小广播
最新机器人文章
换一换 更多 相关热搜器件
更多往期活动

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关:

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved