清华智谱 AI 发布ChatGLM3:多能力直指GPT-4V

AI应用信息10个月前发布 XIAOT
187 0
智谱 AI,一家由阿里、腾讯投资的清华系人工智能AI)独角兽公司,正式发布了全新的自研基座大模型ChatGLM3系列。
清华智谱 AI 发布ChatGLM3:多能力直指GPT-4V
新的ChatGLM3包括ChatGLM3-1.5B(15亿)、3B和6B参数等种,不仅在多模态理解、代码模块、网络搜索等能力上有所提升,而且相对最佳开源模型推理速度提升2-3倍。智谱 AI利用华为的昇腾芯片,使算力推理速度提升3倍以上。这种优化不仅提高了运行效率,也进一步提升了ChatGLM3的实用性和商业价值。
智谱 AI的CEO张鹏表示,最新的自研模型ChatGLM3是瞄准GPT-4V(多模态版的GPT-4)的跨模态能力,是智谱 AI全新一代的技术升级。他强调,对标OpenAI是智谱 AI成立以来的目标。智谱 AI致力于让机器像人一样思考,他们希望利用ChatGLM3通用基座模型能力,与合作伙伴一起共同的支撑千行百业,进入生成式 AI‘第二阶段’。
据悉,智谱 AI 成立于2019年,脱胎于清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司。公司CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。他们以强大的研发实力和深厚的学术背景,成功研发出了一系列的大模型产品,包括100亿参数的GLM-10B、万亿稀疏的GLM-130B等。
2023年,智谱AI 推出千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B等,部署于个人开发者和企业应用领域。今年6月,智谱AI 迭代出ChatGLM2,包括6B、130B、12B(120亿参数)、32B、66B等参数的模型,推理速度增长42%。据张鹏透露,相比GPT-4版的ChatGPT,ChatGLM2-12B、32B和66B性能分别提升16%、36%和280%。
当前,智谱 AI 开源模型在全球下载量已超过1000万次。同时,该公司也进行商业化探索,打造AIGC生成式 AI)模型及产品矩阵,包括已获批上线的智谱清言、高效率代码模型CodeGeeX等。在融资方面,创立至今的四年多,智谱AI 共完成四轮融资。10月20日,智谱 AI 宣布年内累计融资额超过25亿元人民币,投资方包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构,而君联资本等部分老股东跟投,华兴资本担任独家财务顾问。截至目前,智谱 AI 公司估值已超过100亿元,是国内 AI 领域独角兽企业。公司称,上述融资将用于基座大模型的进一步研发,更好地支撑行业生态。
此次发布的ChatGLM3系列模型在性能、推理、算力、Agent智能体能力、API商业化等方面均有显著提升。在性能方面,ChatGLM3-6B在44个中英文公开数据集测试中表现优异,相比ChatGLM2-6B,多个排名提升33%以上,GSM8K基准提升179%。在推理方面,相较于目前伯克利大学开源的vLLM,速度提升2-3倍,推理成本降低一倍。同时,新的模型还集成了自研AgentTuning技术,激活模型智能体能力在智能规划和执行方面比ChatGLM2提升1000%,支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景最新的AgentBench基准测试上ChatGLM3-turbo和GPT-3.5接近。在国产算力层面以昇腾生态为例ChatGLM3推理速度提升达3倍之多。
而在模型尺寸上,ChatGLM系列首次增加了1.5B、3B这类小参数模型。张鹏称,主要原因是用户需求和算力成本之间的平衡,而且支持国产芯片的边缘侧模型ChatGLM3-1.5B可在笔记本电脑、手机、汽车等场景部署,速度达20 tokens/s,精度上1.5B和3B模型与ChatGLM2-6B模型性能接近。
在现场演示环节,基于ChatGLM3的AI聊天机器人平台“智谱清言”如今不仅可以实现表格生成柱状图、折线图,而且还可以获得实时新闻搜索数据、看蔬菜写菜谱以及代码生成函数等能力。
然而,尽管智谱 AI在AI大模型领域取得了一定的成果,但AI技术的快速发展也带来了新的挑战。张鹏表示,随着GPT-4等更强大模型的发布,AI领域的竞争也越来越激烈。因此,智谱 AI将继续致力于研发更先进的大模型技术,以满足市场需求并推动AI领域的发展。
此外,智谱 AI也在探索商业化应用方面取得了进展。他们与多家企业合作,将AI大模型技术应用于各个领域,如智能客服、智能家居、自动驾驶等。这些应用场景不仅需要大模型的支持,也需要与实际场景相结合的定制化解决方案。因此,智谱 AI将继续深化与各行业企业的合作,推动AI技术的商业化应用。
    © 版权声明

    相关文章