神经基础模型能预测大脑，却无法解释心智：AI与神经科学的鸿沟

过去三年，神经基础模型（Neural Foundation Models, NFMs）从实验室走向聚光灯：它们把数十万小时的尖峰序列、钙成像、局部场电位当作“语料”，训练出能跨动物、跨脑区甚至跨物种泛化的统计引擎。在预测下一个动作电位或下一次舔水动作时，NFMs 的表现已不输经典编码模型。但正如 Gallego 在原文中所强调的，“能预测”不等于“能理解”。这让我想起 19 世纪热力学：理想气体方程能精确描述压强与温度关系，却长期遮蔽了原子运动的微观图景，直到统计物理出现才补全。

群体模式是一把双刃剑

大量实验表明，大脑用“群体语言”而非“明星神经元”说话——前额叶皮层里所有细胞共同拼出“刺激是什么”与“何时出现”的图案；运动皮层里找不到专职“预备”或“执行”的细胞。NFMs 之所以有效，正是因为它们抓住了这些图案的统计不变量：哪怕换一批细胞、换一只小鼠，只要采样足够，模型就能重建同一过程。然而，这种“宏观可读”同时意味着“微观失焦”。一旦我们把注意力放回单个神经元，问题立刻出现：同样参与抓握运动的细胞，有的发放提前两秒，有的则延后数百毫秒；为何它们在群体层面却被压缩进同一条低维流形？NFMs 目前无法给出机制解释，只能提供“相关性剧本”。

从神经递质到行为的“多级跳”仍缺踏板

NFMs 擅长把高维神经活动降维成 10–100 维潜变量，却难以回答这些潜变量如何与多巴胺浓度、树突棘形态乃至肌肉收缩力度挂钩。最近有研究用线性探针发现，NFMs 的某个主成分能预测小鼠 V1 的细胞类型，看似建立了“群体—细胞”映射，但相关解释仍停留在统计关联。要真正打通从分子到行为的多级链条，需要把 NFMs 嵌入更大框架——例如用可微分物理引擎把肌肉骨骼系统也纳入训练，让模型不只是“拟合神经”，而是“拟合身体”。否则，NFMs 就像没有地形的 GPS，只能告诉你“向右转”，却不告诉你前面是悬崖还是人行道。

“完美地图”与科学理解的张力

博尔赫斯在短篇小说中讽刺了一幅与国土等大的地图：细节全对，却毫无用处。NFMs 正以惊人速度逼近这幅地图。当模型参数量与神经元数量同阶，甚至超过实验可测的行为维度时，我们面临双重危机：其一，过度拟合导致在新情境下失灵；其二，人类无法从千亿参数中提炼出可教给学生的“心智模型”。历史上，物理学到量子场论阶段也曾陷入类似困境，最终靠重整化群和有效场论把无穷自由度压缩成少数可测参数。神经科学或许需要自己的“有效理论”，用尺度分离思想把 NFMs 的输出重新组织成可解释的分层解释：最底层保留与突触可塑性直接对应的变量，最上层则对应可语言化的心理学概念。

身体缺席：模型与现实的根本错位

NFMs 的输入通常是标准化实验范式下的神经信号，输出则是同样被简化的行为标签。可真正的行为发生在充满摩擦力、重力、社交信号的物理世界中。注意力水平、饥饿程度、甚至个体童年是否玩过积木，都会改变同一神经群体对抓握任务的编码方式。当前范式下，这些变量被粗暴地当作噪声平均掉。未来，若能把 NFMs 与“世界模型”联结——让模型同时学习视觉流、本体感受、环境纹理乃至社交互动——或许才能捕捉大脑—身体—世界的完整闭环。但这也意味着实验设计要从“动物头部固定看 gratings”转向“自由行动小鼠在复杂地形觅食”，数据量与标注难度将指数级增加。

谨慎乐观：NFMs 仍有两条务实出路

一是技术转化。即便我们无法完全理解模型内部的“黑话”，亦可把它当作“症状级诊断仪”：在帕金森患者脑内实时比对群体模式，一旦偏离健康模板就触发闭环刺激。这种“知其然”的疗法，已在上百只灵长类动物中验证可行性，未来五年或能进入临床。

二是假设生成器。NFMs 能在几分钟内遍历传统实验需要数月才能采样的参数空间，从而提出可证伪的神经机制假设。例如，它可能预测“抑制性中间神经元的同步化是工作记忆衰退的关键”，实验者再据此光遗传操控验证。这种“AI 提出—人类验证”的协作，或将成为下一个十年神经科学的主轴。

结语：在预测与理解之间架桥

神经基础模型让我们第一次拥有了“读脑术”级别的预测能力，却也把“我们到底理解了什么”的古老问题再次推向风口浪尖。要跨越从相关到因果的鸿沟，需要的不只是更大模型、更多数据，而是一套新的概念工具，能把高维统计规律翻译成人类心智可承载的故事。唯有如此，NFMs 才不会沦为另一幅博尔赫斯式地图，而成为真正照亮大脑的探照灯。

神经基础模型能预测大脑，却无法解释心智：AI与神经科学的鸿沟

发表回复 取消回复

发表回复取消回复