奥秘#13 认识视觉处理
视觉系统是由各个模块和通道所组成的复杂网络。它们各自负责不同任务,最后共同呈现我们对于这个世界的最终印象。
当我们谈起“视觉处理”时,很自然的想法是,它是一个挺自给自足的过程。在该过程中,眼睛就像是不断捕捉连续画面的摄像机,无论你碰巧在盯着什么看,它都会把这些画面发送给大脑进行处理。经过“处理”之后(不管处理过程如何),大脑会把这些画面加入已有的对于世界的认知和智慧里,再来决定下一步如何。如此循环往复。如果大脑是一台计算机,那么这便是视觉系统漂亮的运作过程。
先把这个例子(没错,这个例子是不正确的)放一边,我们一起来看看真正的视觉处理过程。你会发现,一切并不是这样井然有序。
把眼睛当作被动接收画面的摄像机,便是该例子的第一个错误。视觉,首先从身体开始:我们四处走动,移动脑袋和眼睛,并会捕捉深度信息【奥秘#22】,如视差等。有些决定,比如如何动,在视觉处理初期便已经做出,而此时,物体识别和意识理解过程通常都还未参与其中。
这种视觉模式,作为一个交互过程,在意识感知之前,已经进行了许多次来回反馈。这种模式十分常见。原始视觉信号和处理后视觉信号之间的确有一个过程,但这个过程混乱而无序。处理需要花时间,但大脑想在信息刚被提取时,便将其拿来使用;也就是说,大脑不会等到处理过程“完成”之后,再来使用被提取的信息。只需要视野中出现迅速靠近的黑色块状物,我们就会不由自主地退缩【奥秘#32】,就好像有什么东西在向我们逼近一样。而这,就是发生在视觉处理初期的效应的例子之一。
在这里,我们不会去探讨初期视觉系统的背后机理,而来看看它是如何被加以使用的。这一处理的终点是什么?当感知到达意识层面时,另一个世界已经被构建出来。我们看到的,不是颜色、形状和变化(这些的确被我们“看在眼里”),而是整个物体。我们看到深度,我们看到物体的运动。当我们把注意放在某些物体上时,它们似乎显得尤为突出,而其他物体则隐退于背景之中。在意识层面上,我们既看见了原本的世界,也看见了大脑处理后的世界,而这一处理,是大脑在各种限制中(比如眼睛的盲点【奥秘#16】)“带着脚链跳舞”的结果,并通过各种有价值的假设,让我们的处理过程有了良好的开端。本章内容,将会涉及视觉处理的整条“流水线”,并借由各种错觉和视觉异常的例子,来详细说明视觉的一些工作原理。
在此之前,我们先看看视觉系统究竟是什么。我们将从眼睛开始,看看从眼睛传来的信号,如何几乎直接就传到了大脑后面的初级视觉皮层,并在那里“兵分两路”,进入两条主线。之后,视觉信息被分配至不同区域进行处理,并最后汇合至大脑皮层。
始于视网膜
在某种意义上,光线落在视网膜上,即眼睛后面的感觉层,便已经进入了大脑内部。整个中枢神经系统(大脑和脊髓【奥秘#7】)被几层膜所包裹着,最外面一层是硬脑膜。你眼睛的白色部分,即保护眼睛的表层,是硬脑膜的延续,这意味着眼睛也在该膜里。这就好像你大脑的两个部分,已经决定凸出去,成为你的眼睛,然而没有变成独立的器官。
视网膜,是你眼睛后面的一层细胞,聚集着大量用来探测光线并将其转化成电信号的光感受器。对于眼睛大部分区域而言,信号会被合并——数百个光感受器的信号,将会传递到这条流水线上的一个细胞。但眼睛中心有一个地方叫作中心凹,这里没有这样的信息压缩。(在视网膜上,光感受器的分布密度差异相当大【奥秘#14】。)中心凹的分辨率极高,细胞在此聚集,未压缩的信号在此被快速处理,这些信号和来自其他细胞的信息一起传递至视神经。视神经是一束位于视网膜光感受器后面的神经元,负责将电信息从眼睛传递至大脑。它在离开眼球时会制造一个洞,这个洞的大小便是视神经的大小。因为光感受器无法将其覆盖,故而形成了所谓的盲点【奥秘#16】。
眼睛之后
两只眼睛的视神经在眼睛后面中心处相遇,分开,并在视交叉处以一种新的形式重新聚集。两只眼睛的右半边视网膜和右脑相连,左半边视网膜和左脑相连(从这里开始,左右脑的图像互成镜像关系)。在该过程中,每只眼睛的视野,在中间被从上到下一分为二地进行处理,似乎有点奇怪,因为没有按左右眼来。不过,这样子,得以让左右脑对比两只眼睛所观察到的相同场景,并以此得到所需要的深度信息。
现在,视觉信号从视交叉处一路传递到大脑后方,直抵视觉皮层。在这期间,视觉信号会经过一个叫作外侧膝状体核(LGN)的中继站,这一小块区域位于大脑深处(当然,左右脑各有一个)。
到这里,情况已经变得有点复杂。不是所有通过视交叉的信号都会抵达视觉皮层,有些信号被传递到了上丘,上丘像是一个紧急视觉系统。它位于中脑,协助头部和眼睛运动。和进化得更为高级的大脑皮层及前脑相比,中脑则更为古老,所涉及的功能也更加基本。(参见熟悉中枢神经系统【奥秘#7】。)看上去,这个区域的功能较为低级,但让人疑惑的是,上丘也会影响到大脑的高级功能。比如当它突然把紧急视觉信号推入意识里时【奥秘#37】。
实际上,LGN不仅是一个中继站,它的150万个细胞处理着几乎所有的视觉信息。LGN还会接收注意脑区传来的信息,以及大脑皮层的一般信息,并把这些混合在一起。在原始视觉信息被提取出视觉特征之前,其他脑区的各种信息也正添加于其中——这里究竟发生着什么,我们真的不太清楚。
在这里,视觉信号还会分离。分离后的视觉信号,LGN对其会有不同的处理通道:粗糙且低分辨率的信息(缺乏色彩)去往大细胞通道,而高分辨率的信息去往小细胞通道。虽然后续还有许多交汇,但这种分离将贯穿于视觉系统之中。
进入大脑皮层
从LGN起,信号则直接传递至大脑皮层。大脑后下方(大脑后部,从下到上朝中间大约1/3的地方)有一块区域叫作初级视觉皮层或纹状皮层。它之所以叫纹状皮层,是因为当你近距离观察它时,会看见一条深色条纹。
为什么会有条纹?初级视觉皮层由六层细胞组成,其中第四层格外厚,并且细分亚层。LGN的两条通道在这里与之相联结,而LGN的凸起部分在这里制造了一条深色带,纹状皮层因此得名。随着视觉信息在这块区域被处理,这六层细胞全都起着提取不同视觉特征的作用。它比LGN更为复杂——纹状皮层大约有2亿细胞。
视觉信息处理的第一步位于V1。V1有一张视网膜地图,作为信息来源。它或多或少相近于眼睛接收到的图像,只不过是扭曲的。地图中,表征中心凹——眼睛高分辨率中心——的部分,由于投入该区域的细胞数量使其完全扭曲,而占据了整张地图的半壁江山。
地图之上,站立着超级柱——提取基本信息的细胞群,其底部与地图上某个地方相接。有些神经元在看到特定颜色时会变得活跃,有些是在以特定角度看见一条线时会变得活跃,而有些是在以特定角度看到线条朝着特定方向移动时才变得活跃。这第一张地图,和地图上的超级柱一同组成了V1区(V代表“视觉”),其功能便是简单的特征提取。
接下来的视觉处理过程则被命名为V2和V3(再次说明,V代表“视觉”,而数字代表顺序),这些过程也在视觉皮层进行,彼此相似。信息在从V1传递至V2的过程中,地图也转化为V2的地图,而这一处理过程是整个处理过程的中心步骤。V3也遵循一样的模式:在每个阶段的最后,地图会被重新整合,并进一步传递下去。
内容通道和空间通道
到目前为止,视觉处理过程基本上是线性的。虽然存在着反馈(比如大脑皮层其他区域的信息会反馈至LGN处)和交叉,但粗糙视觉信息和精细视觉信息的处理通道依然相互分离。视觉信息从眼睛到初级视觉皮层的处理过程,也一步步尚算稳定。
从V3开始,视觉信息就不再是流水线作业,而是像一个同时运作的大加工站。视觉信息被发送至大脑皮层的许多区域,这些区域在同一时间相互提取各种不同特征信息。
不过,两个通道之间依然有着相当大的差别。粗糙视觉信息经过大细胞通道,传送到大脑顶部,这叫作背侧流。或方便记忆,叫作空间通道。从这里开始会有模块识别运动,并寻找一般性特征。
精细视觉信息从初级视觉皮层出发,经过小细胞通道,向下沿腹侧流或内容通道传送。内容通道最后会到达下颞叶(位于大脑下方及眼睛后上方)。
正如其字面意思,内容通道和物体识别有关。在进入颞叶之前,视觉信息会在一个叫作外侧枕叶复合区(LOC)的地方被稍加处理。这是视觉信息从内容通道进入下颞叶之前的关键一步。LOC会搜寻地图中颜色和方向相似的区域,将它们编组,形成物体,并从背景中分离出来。
之后,这些物体会被识别成面孔,或者其他。这体现了视觉信息处理的常用手段:从中提取特征。当特征被提取后,这些特征信息又会加入原有的视觉信息之中,由此形成的新的视觉信息将继续传递下去。
内置假设
随后的运动监测和物体识别模块,依然异常复杂。基本特征提取完成以后,还有数量判断、移动物体追踪和生物运动识别需要完成。到了特定时间点,视觉信息的处理还将涉及记忆、语言和情绪理解,体现出大脑皮层最典型的特征,至此,这一过程便融入了整个大脑更高级的功能之中。
我们将在接下来的内容中,继续探索初期和后期视觉处理过程。其中,有一条共通的主线是,视觉系统为加快处理过程而对外在世界做出各种假设。通过观察视觉中的一些古怪之处,我们可以把这些假设找出来。比方说,视觉处理会假设你所看到的世界每时每刻都是相对稳定的(当它不稳定时,我们便不会察觉【奥秘#40】)。又或者,假设暗一点的区域为阴影部分,我们在化妆时便可利用这一点【奥秘#20】。
我们能够发现这些假设,这在某种程度上意味着视觉系统对外在环境所做出的假设,与它对自己各个模块所做的假设并无二致。视觉系统假设运动模块会正确无误地报告运动信息,然而有时候它会犯错【奥秘#25】。这和视觉系统假设某个物体有阴影即代表着它是3D的,有相通之处。我们可以说整个视觉系统只存在于大脑之中,不过说真的,我们需要眼睛、大脑、身体和周遭环境共同配合,一起作为这个巨大、混乱而紧密相连的视觉处理系统的一部分,为最后的结果助力。
经过百转千回,我们所熟知和喜欢的视觉感知,就这样诞生了。似乎没有某个单独的地方让这所有的视觉处理得以完成。同样,大脑里也没有一个内置电视屏幕供我们观看(如果真有,那谁在看呢?)。视觉处理过程分布于整个视觉系统的各个部分,还有所处的周遭环境。最后,别忘了——我们所看到的,不简单是视网膜上的一张图像。