来源:quantamagazine
撰文:Anil Ananthaswamy
翻译:任天
当看到一个模糊的图像时,我们会依赖背景来获得感知信息。一些神经科学家认为,这证明了大脑能通过对预期事件的预测,自上而下地将感知信息组合起来科学家通过对神经网络的研究发现,大脑是一台名副其实的"预测机器"。这样的工作方式使它们能节省许多能量。
我们的大脑包裹在硬质的颅骨中,是一团重约1.4至1.5千克组织。长期以来,关于大脑如何通过感觉来获得感知的问题,一直令科学家感到困惑。大量的证据和数十年的持续研究表明,大脑并不能像玩拼图游戏那样,将感官信息简单地组合起来,以此感知周围的环境。我们可以通过一个事实来证明这一点,大脑可以根据进入眼睛的光线信息构建出一个场景,即使这些信息既嘈杂且模糊。
因此,许多神经科学家转而将大脑视为一台"预测机器"。通过预测性的处理过程,大脑利用其对世界的先验知识,对输入的感官信息做出原因推断或假设。正是这些假设,而不是感官输入本身,在我们的脑海中产生了感知。对大脑来说,输入的信息越模糊,它对先验知识的依赖就越大。
预测性处理框架的优美之处在于,它拥有相当强的能力来解释许多不同系统中的大量现象。
尽管有越来越多的神经科学证据支持了这一观点,但主要是间接证据,而且存在其他解释的可能性。如果你仔细审视人类的认知神经科学和神经成像研究,就会发现很多证据,但都是极为隐性、间接的证据。
因此,研究人员开始转向计算模型,试图理解和验证"预测性大脑"的想法。计算神经科学家已经建立了人工神经网络,其设计灵感来自生物神经元的行为,可以学习对输入信息做出预测。这些模型显示出一些不可思议的能力,似乎可以模仿真正的大脑。利用这些模型所做的实验甚至暗示,大脑必须进化成预测机器,才能满足能量的限制。
20世纪中期的认知心理学家利用这张著名的鸭兔图像来研究人类的感知能力随着计算模型的激增,研究活体动物的神经科学家也越来越确信,大脑已经学会了推断感官输入背后的原因。大脑是如何做到这一点的?研究者尚不清楚其中的具体细节,但总体思路正变得越来越清晰。
知觉中的无意识推论
一开始,"预测性处理"似乎是一种与直觉相悖的复杂感知机制,但由于缺少其他有力的解释,科学家长期以来一直都对其青睐有加。甚至在一千年前,阿拉伯天文学家和数学家哈桑·本·海什木在他的《光学书》(Book of Optics)中就提出了该机制的一种形式,从各个方面对视觉进行了解释。19世纪60年代,德国物理学家、生理学家兼医生赫尔曼·冯·亥姆霍兹提出,大脑会推断感官输入信息的外部原因,而不是根据这些输入信息"自下而上"地构建感知。
亥姆霍兹阐述了"无意识推论"的概念,来解释双稳态(或多稳态)知觉;在这种知觉中,大脑可以用不止一种方式感知同一个图像。例如,当看到那幅广为人知的鸭兔图像时,我们的知觉就会在这两种动物图像之间来回切换。也就是说,图像可以通过两种方式来看,或是鸭子或是兔子。通过诸如此类的例子,亥姆霍兹断言,由于眼睛视网膜上形成的图像并没有改变,因此这种感知必然是一个自上而下的无意识推理过程的结果。
在20世纪,认知心理学家继续通过案例来说明感知是一个积极构建的过程,利用了自下而上的感觉和自上而下的概念输入。1980年,英国心理学家理查德·兰顿·格里高利发表了一篇颇具影响力的论文,题为《作为假设的感知》。文中认为,感知错觉本质上是大脑对感官印象成因的错误猜测。同一时期,计算机视觉科学家在没有"生成"模型作为参考的情况下,试图使用自下而上的重建方式使计算机能"看到东西"。但他们的努力遇到了挫折。
试图在没有生成模型的情况下理解数据注定会失败——人们所能做的就是对数据中的模式做出陈述。
然而,尽管研究者对"预测性处理"的接受程度有所提高,但关于它如何在大脑中实现的问题仍未解决。目前有一个颇受欢迎的模型,称为"预测编码",认为大脑中存在信息处理的层级结构。最高层级代表最抽象、最高级的知识(比如感知到阴影中有一条蛇)。该层级通过向下发送信号来预测下一层级的神经活动;下一层级则将其实际活动与上一层级的预测进行比较。如果不匹配,该层级将产生流向上层的误差信号,以便较高层级更新其内部的表征结果。
在每一对连续的层级之间会同时发生这一过程,一直到最下面接收实际感觉输入的层级。从外界接收到的信息与预期信息之间的任何差异都会产生一个误差信号,并将其传回层级结构。最终,最高的层级会更新其假设(发现阴影中其实不是一条蛇,而是一条绳子)。
总的来说,预测编码的概念是指大脑基本上由两个神经元群构成,尤其是当这一概念被应用到大脑皮层时。一个神经元群负责对当前感知信息的最合理预测进行编码,另一个则负责发出预测中的误差信号。
1999年,计算机科学家拉杰什·拉奥和达纳·巴拉德(当时分别在索尔克生物研究所和罗切斯特大学任职)建立了一个强大的预测编码计算模型,其中具有明确用于预测和纠错的神经元。他们模拟了灵长类动物大脑视觉处理系统——由负责识别面孔和物体的层级组织区域组成——的部分通路,并表示该模型可以重现灵长类视觉系统的一些不寻常行为。
不过,在这项工作完成时,现代深层神经网络还没有出现。深层神经网络有一个输入层和一个输出层,以及夹在这两层之间的多个隐藏层。到2012年,神经科学家开始使用深层神经网络来模拟灵长类视觉皮层的腹侧流。但几乎所有这些模型都是前馈网络,信息都只从输入端流向输出端。大脑显然不是一个纯粹的前馈机器,大脑中有很多反馈信息,基本上与前馈信号一样多。
因此,神经科学家转向了另一种模型:循环神经网络(recurrent neural network,又称递归神经网络,简称RNN)。这些神经网络具有一些使其成为模拟大脑"理想基质"的特征。循环神经网络的神经元之间既有前馈又有反馈连接,而且它们有独立于输入的持续活动。在很长一段时间——基本上可以说是永远——之内产生这些动态的能力,正是这些网络随后可以被训练的原因。
TAXEURO:https://www.ikjzd.com/w/2577
澳柯巴(OKEBA):https://www.ikjzd.com/w/2709
嘉鸿学院:https://m.ikjzd.com/w/2798
凤凰河御品堂温泉门票2021年8月价格:http://www.30bags.com/a/628286.html
深圳市文化馆中国节重阳演出时间、地点、门票:http://www.30bags.com/a/739401.html
深圳适合老人/小孩/懒人爬的山推荐:http://www.30bags.com/a/754396.html
Facebook上线群组购物功能,沃尔玛上线Walmart Go:http://www.kjdsnews.com/a/683815.html
招聘如何做人才画像分析?:http://www.kjdsnews.com/a/683816.html
迎来流量高峰!最新TikTok爆款"磁性包钩",小痛点也蕴藏大商机:http://www.kjdsnews.com/a/683817.html
没有评论:
发表评论