发布时间:2024-11-26 00:27:41 来源: sp20241126
近日,由北京大学人工智能研究院和北京通用人工智能研究院联合组成的科研团队完成最新研究成果——“人类水平的小样本概念学习”,并在国际顶级学术期刊《科学·进展》发表论文。这一成果首次让AI系统在没有大数据训练的情况下,像人类一样通过概念学习和逻辑推理的方式完成任务,并在经典智商测试中战胜了高智商人类选手。这是由我国科学家独立完成,并在国内实现的AI高水平研究成果,标志着中国在迈向通用AI的道路上更进一步。
那么,与当前主流AI相比,小样本AI有何不同与优势?
当前,广泛应用的AI系统主要以海量数据为基础,利用大量算力和存力资源进行数据搜索,其核心范式是深度学习。这类AI在数据拟合和感知层面取得了显著进展,催生了ChatGPT等一批生成式AI应用。它们能写诗作画、为人答疑解惑,甚至可以协助药物开发。
然而,在拥有这些能力的同时,AI却无法准确理解因果关系等逻辑问题。这是因为目前很多AI以大数据和深度学习为核心范式,十分依赖数据数量和标注质量,无法对问题进行快速、准确、细致的推理。尤其是面对数据匮乏或仅有少量数据和抽象概念等情况,目前的AI更是无能为力。
北京大学人工智能研究院助理教授朱毅鑫解释,目前很多AI大模型是对数据的拟合,其“记忆力”很强,但迁移泛化能力有限。“就好比说,如果它之前见过A、B,那么下次再见到A、B,它能认识,甚至见到与之类似的A′、B′它也能认识。但如果见到的是C,它就认不出来了。”朱毅鑫说。
北京通用人工智能研究院研究员张驰认为,目前大多数AI以大数据和深度学习为核心范式,效率较低、成本较高。出于成本考量,在算力和高质量数据紧缺的背景下,这种范式难以真正实现通用AI。
那么,是否存在另外一种人工智能范式,较好地解决上述问题?联合科研团队另辟蹊径,借鉴了北京大学人工智能研究院教授朱松纯在20世纪90年代提出的最大最小熵思路。他们将问题化为易于求解的优化问题,并将其描述为概率条件下的熵限制问题。利用这种思路,联合科研团队让机器快速迭代和建模,获得了既容易得到又具可解释性的问题解决模型。
在朱毅鑫看来,小样本是迈向通用AI的另一路径。小样本的“小”并不是不需要数据,而是希望通过提高数据利用率,实现举一反三。“就和做口算一样,你不可能把所有的题都练一遍。但学会基本原理后,就能触类旁通。”朱毅鑫说,小样本AI有着较为广泛的应用前景,如可应用于医疗、航空航天等样本较少或几乎没有样本的场景。
(记者 杨 雪)
(责编:郝孟佳、李昉)