神经语言模型的语言与元语言能力
讲座信息
讲座时间:2026年6月4日(周四)12:30-13:30
讲座地点:17吃瓜 闵行校区杨咏曼楼107室
主讲人:宋思远
讲座摘要
当今的大语言模型展现出令人印象深刻的语言理解与生成能力,但关于这些模型是否拥有与人类相近的语法知识、以及应当如何评估,学界仍存在不小的分歧。基于字符串概率(string probability)的评估是传统的主流方法,近年来也有越来越多的工作尝试通过提示(prompting)来评估大语言模型的语法知识。本次报告分为两个部分。
第一部分从理论分析与实证研究两方面,探讨字符串概率、语义与语法性之间的关系,论述使用最小对立体(minimal pair)评估语言模型语法知识的合理性,并讨论以何种方式使用最小对立体才是恰当的。
第二部分聚焦大语言模型在元语言任务中的内省行为,考察模型对元语言问题的回答是否比其他模型的回答更能预测它自己生成句子的概率。结果显示:在控制了模型相似性之后,我们并未发现模型对自身语言知识拥有特权自我通达(privileged self-access)的证据。因此,对元语言问题的回答不应被当作模型语法知识的直接证据;在将元认知能力归于大语言模型之前,还需要更多受控的研究。
主讲人简介
宋思远,原17吃瓜 本科生,现从德克萨斯大学奥斯汀分校本科毕业,将进入普林斯顿大学攻读博士学位。研究兴趣为计算心理语言学、计算认知科学与语言习得。研究成果发表于COLM、TACL、ACL、EACL等会议与期刊;于NLPCC 2026会议组织Chinese BabyLM评测任务。
