神经基础模型能预测大脑,却无法解释心智:AI与神经科学的鸿沟

过去三年,神经基础模型(Neural Foundation Models, NFMs)从实验室走向聚光灯:它们把数十万小时的尖峰序列、钙成像、局部场电位当作“语料”,训练出能跨动物、跨脑区甚至跨物种泛化的统计引擎。在预测下一个动作电位或下一次舔水动作时,NFMs 的表现已不输经典编码模型。但正如 Gallego 在原文中所强调的,“能预测”不等于“能理解”。这让我想起 19 世纪热力学:理想气体方程能精确描述压强与温度关系,却长期遮蔽了原子运动的微观图景,直到统计物理出现才补全。

群体模式是一把双刃剑

大量实验表明,大脑用“群体语言”而非“明星神经元”说话——前额叶皮层里所有细胞共同拼出“刺激是什么”与“何时出现”的图案;运动皮层里找不到专职“预备”或“执行”的细胞。NFMs 之所以有效,正是因为它们抓住了这些图案的统计不变量:哪怕换一批细胞、换一只小鼠,只要采样足够,模型就能重建同一过程。然而,这种“宏观可读”同时意味着“微观失焦”。一旦我们把注意力放回单个神经元,问题立刻出现:同样参与抓握运动的细胞,有的发放提前两秒,有的则延后数百毫秒;为何它们在群体层面却被压缩进同一条低维流形?NFMs 目前无法给出机制解释,只能提供“相关性剧本”。

从神经递质到行为的“多级跳”仍缺踏板

NFMs 擅长把高维神经活动降维成 10–100 维潜变量,却难以回答这些潜变量如何与多巴胺浓度、树突棘形态乃至肌肉收缩力度挂钩。最近有研究用线性探针发现,NFMs 的某个主成分能预测小鼠 V1 的细胞类型,看似建立了“群体—细胞”映射,但相关解释仍停留在统计关联。要真正打通从分子到行为的多级链条,需要把 NFMs 嵌入更大框架——例如用可微分物理引擎把肌肉骨骼系统也纳入训练,让模型不只是“拟合神经”,而是“拟合身体”。否则,NFMs 就像没有地形的 GPS,只能告诉你“向右转”,却不告诉你前面是悬崖还是人行道。

“完美地图”与科学理解的张力

博尔赫斯在短篇小说中讽刺了一幅与国土等大的地图:细节全对,却毫无用处。NFMs 正以惊人速度逼近这幅地图。当模型参数量与神经元数量同阶,甚至超过实验可测的行为维度时,我们面临双重危机:其一,过度拟合导致在新情境下失灵;其二,人类无法从千亿参数中提炼出可教给学生的“心智模型”。历史上,物理学到量子场论阶段也曾陷入类似困境,最终靠重整化群和有效场论把无穷自由度压缩成少数可测参数。神经科学或许需要自己的“有效理论”,用尺度分离思想把 NFMs 的输出重新组织成可解释的分层解释:最底层保留与突触可塑性直接对应的变量,最上层则对应可语言化的心理学概念。

身体缺席:模型与现实的根本错位

NFMs 的输入通常是标准化实验范式下的神经信号,输出则是同样被简化的行为标签。可真正的行为发生在充满摩擦力、重力、社交信号的物理世界中。注意力水平、饥饿程度、甚至个体童年是否玩过积木,都会改变同一神经群体对抓握任务的编码方式。当前范式下,这些变量被粗暴地当作噪声平均掉。未来,若能把 NFMs 与“世界模型”联结——让模型同时学习视觉流、本体感受、环境纹理乃至社交互动——或许才能捕捉大脑—身体—世界的完整闭环。但这也意味着实验设计要从“动物头部固定看 gratings”转向“自由行动小鼠在复杂地形觅食”,数据量与标注难度将指数级增加。

谨慎乐观:NFMs 仍有两条务实出路

一是技术转化。即便我们无法完全理解模型内部的“黑话”,亦可把它当作“症状级诊断仪”:在帕金森患者脑内实时比对群体模式,一旦偏离健康模板就触发闭环刺激。这种“知其然”的疗法,已在上百只灵长类动物中验证可行性,未来五年或能进入临床。

二是假设生成器。NFMs 能在几分钟内遍历传统实验需要数月才能采样的参数空间,从而提出可证伪的神经机制假设。例如,它可能预测“抑制性中间神经元的同步化是工作记忆衰退的关键”,实验者再据此光遗传操控验证。这种“AI 提出—人类验证”的协作,或将成为下一个十年神经科学的主轴。

结语:在预测与理解之间架桥

神经基础模型让我们第一次拥有了“读脑术”级别的预测能力,却也把“我们到底理解了什么”的古老问题再次推向风口浪尖。要跨越从相关到因果的鸿沟,需要的不只是更大模型、更多数据,而是一套新的概念工具,能把高维统计规律翻译成人类心智可承载的故事。唯有如此,NFMs 才不会沦为另一幅博尔赫斯式地图,而成为真正照亮大脑的探照灯。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注