发布时间:2024-12-28 05:53:19 来源: sp20241228
在10月27日举行的2023中国计算机大会(CNCC)上,北京人工智能新晋独角兽、清华大学计算机系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。
ChatGLM3语义能力与逻辑能力得到了大幅度增强,并实现了若干新功能的迭代升级,包括多模态大模型CogVLM的看图识语义功能,在10余个国际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强模型WebGLM接入了搜索增强能力,可以自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。
ChatGLM3还集成了自研的AgentTuning技术,在智能规划和执行方面相比于上一代ChatGLM2提升了1000%,并开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例,它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码,也可以成为程序员的帮手,让它帮助生成或测试一段代码。
此外,ChatGLM3此次还推出了可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持包括vivo、小米、三星在内的多款手机以及车载平台,甚至支持移动平台上CPU芯片的推理,速度可达20tokens每秒(token是语言模型中用来表示单词或短语的符号)。
近日来,国际人工智能芯片断供对国内人工智能大模型公司的影响备受关注。智谱AI CEO张鹏介绍,自2022年初其推出的GLM系列模型已支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。截至目前,智谱AI的产品已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。他表示,公司将通过与国产芯片企业的联合创新不断优化性能,助力国产原生大模型与国产芯片早日登上国际舞台。
(责编:曹淼、李源)