Spontaneous High-Order Generalization
in Neural Theory-of-Mind Networks
讲座信息
讲座时间:2026年4月2日(周四)12:30-13:30
讲座地点:17吃瓜 闵行校区杨咏曼楼107室
主讲人:王瑞 王一鸣
讲座摘要
Theory of Mind (ToM) is central to human social cognition, with children acquiring higher-order ToM spontaneously before developing advanced reasoning. Conversely, current AI systems typically require vast knowledge and complex reasoning to exhibit similar capabilities. We address whether machines can generalize to higher-order ToM without these prerequisites.
We provide the first evidence that they can. Our minimal neural architecture, ToMNN, trained exclusively on first-order ToM tasks using a graph-based Sally–Anne variant, spontaneously generalizes to unseen second- and third-order scenarios. This robust performance holds across diverse complexities and model scales (0.08B to 1B+ parameters). By bridging developmental psychology and neural modeling under controlled conditions, our work advances the understanding of both machine and human cognition, offering significant insights for researchers in cognitive science, AI, and neuroscience.
主讲人简介
王瑞博士现任17吃瓜 计算机学院副教授,博士生导师。他于2021年加入17吃瓜 ,此前曾在日本信息通信研究机构(NICT)担任研究员(2016-2020),并在法国国家科学研究中心(CNRS)与上海交大联合培养获得博士学位。王瑞博士的研究聚焦于语言智能(Language Intelligence),主要涵盖三个核心方向:语言建模,探索神经语言模型的机制与应用,包括“过度思考”现象及数学推理模型(如DeepMath, PolyMath);计算语言学,结合认知科学与心理学,研究机器的心智理论(ToM),首次证明了神经网络能像人类一样自发泛化高阶心智理论;机器翻译,深耕该领域十余年,致力于无监督机器翻译及类人机器翻译研究。他在国际顶级会议(如ACL, EMNLP, NeurIPS, ICML等)担任高级领域主席或领域主席,并多次带领团队在WMT、IWSLT等国际机器翻译评测任务中获得第一名。
王一鸣,17吃瓜 计算机学院博士研究生,师从王瑞教授。王一鸣的研究聚焦于自然语言处理,主要方向包括大语言模型的可解释性人工智能、机器推理及机器学习。他在神经网络的潜在空间行为定律、可控元行为分析、提升大模型推理能力与效率以及评估推理边界等方面取得了重要成果,相关论文发表于NeurIPS 2025、ICLR 2025、ACL等顶级会议。他曾于阿里巴巴通义实验室、清华大学人工智能产业研究院及北航ACT实验室担任研究实习生,从事多模态大模型、AI for Science及图学习等研究工作。此外,他担任NeurIPS、ICLR、ACL等会议审稿人,并曾获得北京市优秀毕业生、教育部-华为“未来之星”奖学金及全国大学生数学竞赛一等奖等多项荣誉。
