1201阅读
0回复

[智能应用]清华ChatGLM2-6B模型允许免费商用开启 AI 研究新纪元 [复制链接]

上一主题下一主题查看指定楼层

在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君

发帖: 111715

金币: 3920

道行: 19523

原创: 29308

奖券: 17898

斑龄: 198

道券: 10550

获奖: 0

座驾

设备: EOS—7D

摄影级: 专家级认证

在线时间: 22438(小时)
注册时间: 2007-11-29
最后登录: 2025-07-17

只看楼主倒序阅读使用道具楼主发表于: 2023-07-18

— 本帖被兵马大元帅执行加亮操作(2023-08-01) —

清华大学的 NLP 团队与智谱 AI 及清华 KEG 实验室宣布，他们的 ChatGLM-6B 和 ChatGLM2-6B 模型现已完全开放权重，允许学术研究和商业使用。这两个模型在人工智能研究领域具有重要意义。

ChatGLM-6B 模型是基于 General Language Model（GLM）架构的中英双语对话模型，拥有62亿参数。通过模型量化技术，该模型可以在消费级显卡上进行本地部署，最低只需6GB 显存。该模型具备问答和对话功能，初步展现了其在人工智能领域的应用潜力。

ChatGLM2-6B 模型在保留了初代模型的对话流畅和低门槛部署特性的基础上，增加了更多新特性。首先，它采用了 GLM 的混合目标函数，经过了1.4T 中英标识符的预训练和人类偏好对齐训练，性能得到了显著提升。其次，上下文长度从 ChatGLM-6B 的2K 扩展到了32K，可以处理更长的对话内容。第三，推理速度提升了42%，并且在 INT4量化下，6GB 显存可以支持更长的对话长度，从1K 提升到了8K。最重要的是，ChatGLM2-6B 的权重对学术研究是完全开放的，这对于推动人工智能技术的发展具有积极意义。

这两个模型的开放将为学术界和商业领域的研究者提供更多机会，推动人工智能的创新与应用。他们的发布也标志着清华大学在人工智能领域的重要突破，为全球的 AI 研究和应用探索开启了新的篇章。未来，我们可以期待更多基于 ChatGLM-6B 和 ChatGLM2-6B 模型的研究成果和应用场景的出现，推动人工智能技术的发展进程。

山庄提示：道行不够，道券不够？---☆点此充值☆

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]清华ChatGLM2-6B模型允许免费商用 开启 AI 研究新纪元 [复制链接]

[智能应用]清华ChatGLM2-6B模型允许免费商用开启 AI 研究新纪元 [复制链接]