发布时间:2024-12-21 22:25:53 来源: sp20241221
中新网 北京4月26日电(记者 刘育英)中国工程院院士、国家智能制造专家委员会主任李培根26日在中关村论坛智能制造创新发展论坛上表示,大模型是指具有大量参数和复杂结构的机器学习模型。其第一个功能是单词的向量化,即把所有的单词变成向量。如苹果一词,ChatGPT一次可以提取出至少300 种,甚至500种性质。第二个功能是自注意力,即符号间关系的寻找。符号之间的关系反映了世界模型之间的关系,世界是一个有规律的东西,所有东西之间是有关系的.……所以当它(大模型)能够把握人类不能把握符号间的关系,意味着它对世界高阶相关性的认知已经远远超过人类。
图为中国工程院院士、国家智能制造专家委员会主任李培根26日在中关村论坛智能制造创新发展论坛上发表讲话。记者 刘育英 摄 【编辑:曹子健】