脑-LLM对齐跟踪训练数据，而非类型学

深度分析

背景与问题

研究者们已经证实，大脑-大模型对齐在英语中得到了很好的建立。然而，大脑的语言网络在神经解剖学上是普遍存在的，跨越多种语言。这引发了一个疑问：这种对齐模式是否可以在不同语言之间进行泛化？如果可以，那么是什么因素决定了其变异性？

核心内容

研究通过跨112名参与者的fMRI数据（涵盖英语、汉语和法语）以及七个不同的大模型（覆盖英语主导型、中文主导型及多语言架构），测试了这一问题。关键发现在于，训练语言的主导性而非英语固有属性驱动了对齐模式：一种以中文为主的模型（Baichuan2-7B）在结构匹配LLaMA-2-7B的情况下，完全逆转了梯度，最佳地与汉语大脑对齐而最差地与英语对齐。此外，形式类型学距离独立影响着对齐质量的下降，语法相关的脑区（IFG）显示出比语义区域（PTL）高出2.3倍的类型学梯度，并且标记化丰度解释了跨语言最优编码层变化的大约60%。

意义与影响

这些结果揭示了所谓的“英语优势”在大脑-大模型对齐中的表现实际上是一个训练数据组成的产物，而剩余的变异性则反映出了真正的类型学结构，并集中在语法处理上。研究指出，对于理解跨语言的人工智能系统和人类认知之间的关系具有重要意义。这一发现挑战了我们对语言与大脑功能之间联系的传统看法，强调了语言本身的特点及其在不同语言中的表现形式。此外，它也为未来设计更为通用且多语言适应的大模型提供了理论依据和技术指导。

免责声明：以上内容由 AI 生成，仅供参考。

深度分析

背景与问题

核心内容

意义与影响

相关文章