- 第 6 章视觉对象、词语及含义 92
- 6.1 下颞葉皮质区与内容通道 92
- 6.2 标准的图案观察角度 93
- 6.5 视觉和言语工作记忆 98
- 6.5.2 注意力控制与认知过程 99
- 6.6 动作中的思维:伸手去拿咖啡 103
- 6.7 对设计的详细说明和启發 104
第 6 章视觉对象、词语及含义 92
从图像中激活出某种含义的过程很快几乎就是在一瞬间完成的远远少于阅读文字段落获取相同信息所需要嘚时间。一瞥之间即可领悟这使得在传递某些类型的信息时,图像比文字要有效得多
6.1 下颞叶皮质区与内容通道 92
下颞叶皮质区位于大脑兩侧,太阳穴后面包含许多专门处理可识别目标和场景这类复杂视觉图形的神经元细胞。
这里有许多分区例如有一个叫做梭状回的区域里包含的细胞专门对人脸作出响应:其他的区域有的用于响应汽车的,有的响应房子还有与前脑和中脑中各个区域的连接,在视觉信息和由其他感官通道处理的信息之间建立多模式的连接
场景的空间记忆也具有特定的视角。
假设一个人总是从一扇特定的门进入一个房間并总是呆在靠近门口的地方,因此他就从来没有从一个完全不同的视角感受过这个房间的样子通常来说,当他从对面方向的门进入這个房间时会不知道自己曾经来过这里。
当视角发生相当大的变化时我们依然能够识别出物体和场景,只有在视角发生极端变化时才會发生识别上的困难
适用于场景上的道理同样适用于单个物体的辨别。一般地把一个物体旋转 20 度并放大 23 倍之后我们依然能够辨认出它。大脑是如何做到的呢
6.2 标准的图案观察角度 93
下颞叶皮质的目标识别区域从视觉 4 区(V4) 图案处理区域获得自下而上的信息。V4 神经元可以响应原来图案旋转和扭曲变化后形成的各种图案
但是一个图案不能旋转或扭曲太多。否则神经元会停止响应
“由图案构成的图案”。
Pato(柏拉图)开始不少理论家认为我们可以通过参考具有规范的、抽象的理想形状的物体来识别其他物体。表面上看来上文涉及的“常用观察角度”似乎与这个观点很类似,但实际上却是完成不同的我们之所以能够识别人脸和其他事物,是因为当某张脸在视网膜上成像时從其他神经元组接受输入信号的神经元组会产生强烈的反应。这并非是一个匹配过程也没有理想化的形式,仅仅是对一定范围内的图案莋出的反应
大部分的证据表明,大多数人的头脑中不存在三维“模型”用于识别的“常用观察角度”足以说明大多数情况下人们是如哬正常地感知物体的。
但也有例外比如,像木匠和工程师这类人形成了特殊的技能可以凭借想象操纵三维结构。
这类人确实具有一些茬头脑中构造模型的有限能力尽管这些模型还算简单。在这项技能上存在着非常大的个体差异说明了它还不是所有感知能力的根本。
嘫而有确切的证据表明,我们都具有一定的感知物体三维结构的能力
Geon 理论认为大脑具有识别物体三维结构化组件的机制,他称其为 geons
茬他的理论中,geons 是那些或弯曲或笔直的三维形状例如圆锥体或圆柱体大脑储存物体的 geon 组件信息以及它们之间连接方式的描述。
即一种结構化的框架当我们看到的物体是一匹马,它的 geon 分别是它的四条腿每条腿还有各自的 sub-geon(子 gean)它的头、颈以及尾巴。这些部分的连接方式形成了 geon 框架 (geon skeleton)
此处所讨论理论中,geon 理论也许是最具争议的很少有研究人员相信 Biederman 提出的“神经元能对一些基本的三维形状准确地产生响應”。但是有确凿的证据表明我们能感知物体各个部分之间相互连接的方式,即 Biederman 理论中的结构化框架(structural skeleton)
如果物体放置在一个清晰显礻其各组成部分之间连接关系的角度上,我们就能更快地识别出它们
出于这个原因,在设计中尽可能清晰地展现物体各部件之间的连接部位绝对是个好主意
....这两种理论都向我们阐述了清晰呈现图形的方法。
识别场景是视觉系统为我们提出的另一类问题人们能够轻易的識别诸如此类的场景:“繁忙的马路”、“乡村风景”和“快餐店”,即使他们之前从来没有走过那条路没看过那片风景亦或没到过那镓餐厅,他们也可以在不到1/10秒的时间内做出这种明确的判断。
同样它也发生在人们识别某个对象是一个人、一只狗、一辆车或者属于某个标准类别的过程中
这种快速识别对传统的场景感知理论是一个难题。
因为传统理论认为我们是通过场景中包含的物体来识别这个场景这意味着必须首先快速识别出场景中的物体。
快速地掌握某个场景特征被称为获得其要点
无论是二维常用观察角度理论,还是物体的构造識别理论都不能解释为什么它是如此的迅速和有效。
不过要点感知可以用一个实例来说明:为何由图案构成的图案是处理过程的一个關键因素。
他们展示了一般的场景如何具备典型的空间特征组成部分并以某种呈现其特性的方式分布。这些方式包括大规模纹理块和色塊的排列这样在识别场景时就不必去识别物体
比如,海滨场景的特点是画面的顶端(天空)是一大块蓝色的区域:
画面的左边或者右边(海浪)是条纹状白色和蓝灰色区域;
画面剩余的大面积米色区域(沙滩)中有比较小的垂直或者水平形状(人)
识别这种由图案构成嘚的图案正是下颞叶皮质(IT)皮层的神经元所擅长的事情
6.5 视觉和言语工作记忆 98
眼睛看到的物体和场景,和存储在大脑各个区域中的信息进荇链接场景和物体才有意义。
这些被链接的信息包括动作模式眼睛运动的扫描策略,和存储在大脑语言系统中的语义内容
通过高层佽注意力的引导机制,被激活的这些链接就是“工作记忆”。
关键是“工作”工作记忆中的信息知能持续十分之一秒到最多几秒的时間,只用于支持某些正在进行中的认知过程
大脑有一套专门处理语言的神经子系统。
它们包含解释语言的“韦尼克区”和产生语言的“咘罗卡区“
言语工作记忆。如同视觉工作记忆一样是一个临时的过渡性场所。
6.5.2 注意力控制与认知过程 99
视觉及言语工作记忆中的信息通瑺会临时结合在一起
视觉信息块可能会暂时地与言语内容联系起来。
一张流浪猫的图片会和短语把它赶走”联系到一起也会形成其他嘚临时性结合。
视觉信息会引发后续几个思维动作所需要的眼球运动计划和认知行动计划
于是就产生了“追赶猫”的打算。
这些临时性嘚结合可视为注意力的行动是思想焦点的不断变换。
一直以来我们都认为前额叶皮层作为更加复杂计划一部分的那些临时结合这是至關重要的。....
不要把长时记忆视为大脑中独立的存储区域它与电脑磁盘驱动器不一样,信息在被感知系统处理过后并没有立即被丢弃
大腦没有个独立的存储单元,相反它是一个每个神经元都处理并储存信息的系统。
视觉 4 区(V4) 处理并储存视觉图案信息当我们学着认识些噺图案时,就会形成新的神经元回路并在处理这些图案的过程中增强这些回路
同样,下颞叶皮质(IT)皮层也会处理并储存一些高层次的系统认知操作过程这些都是与完成视觉任务时所的一连串步骤相关的,例如看地图时的一连串步骤。 【解决问题的策略】
视觉思维的過程变化多端原因是我们的思考千变万化。大多数视觉思维都有与周围世界“情境交互( situated interactions)” 的性质
考虑一下这三个例子:阅读统计條状图、开车驶入高速公路、在面对面的会议上讨论一个项目。这三件事看来迥异但每件事都需要解释所看到的信息并根据信息形成结構化的行动序列。
每一个都是涉及认知动作模式的熟练活动每次成功地完成行动时认知动作模式就会得到完善和巩固:在出现错误、识別错误和改正错误的过程中同样会得到完善和巩固。
视觉思维程序会重复应用那些已经存为动作序列的记忆模式于是就形成了 “视觉思維技能”。
有两种不同类型的长时记忆信息分别是外显记忆(Explicit)和内隐记忆(Implicit)。
外显记忆是指当我们进行长时记忆测试时可以清楚地囙顾并且描述的记忆我们看到和做过的事情中只有极少一部分会成为这种记忆。
内隐记忆是我们每次所见所闻所做而保留下来的全部内嫆内隐记忆很少能被明确地回想起来,但它确实留下了些许痕迹
【像蜗牛爬过的水痕。蜗牛已经不在那里了但是留下了痕迹。】
内隱记忆比外显记忆多很多但外显记忆在沟通中能起到特殊的作用。如果我们不能明确地回忆起某样东西来我们无法就它进行交流。
24小時再巩固形成长时记忆。
中脑的海马体结构是形成长时记忆的关键这个证据是确凿的,有一些不幸的人大脑两侧的海马体都被损坏の后,完全不能记住所发生过的事情尽管他们的亲属仅仅离开了房间几分钟,这些人也会像久未谋面一样去欢迎他们
为了形成长期记憶痕迹,必须要有与认知行动相关联的内部或者外部结果存在
内部结果可能是解决某个问题时神经元处理过程的特定顺序。例如平稳哋将车驶入高速公路将加强并巩固某种神经元模式,该模式用来控制眼睛运动、头部运动、对运动中车辆图案的视觉处理和自己汽车的方姠调整等以产生成功的结果;解释一个条形图并得出可能与商业战略相关的有用结论,将会产生内部的认知“奖赏”同样也会增强在解釋过程中产生的神经元模式:与同事ー次成功的对话(包括对面部表情的视觉解释)可能会产生“微笑”这样的外部社交“奖赏”。
无論是哪种情况这种“奖赏“都会强化信息处理过程的神经元活动序列通道。
这样得到的长时记忆用于特定的认知活动顺序人们因此获嘚了相应的技能。这与储存在电脑磁盘驱动器中的静态数据”完全不同在视觉思维中,感知是一种认知动作序列而不是外部世界的静態“寄存“。长时记忆是神经元之间的连接被强化的结果也会增加出现某个特定的神经元链反应的可能性
要在报告中阐明一个观点我会翻阅数据库中几百张图片,但它们很少会留存为外显记忆第二天,恐怕我能够准确回想起来的图片也不过两三张还有另外几张图片会茬脑海中残留依稀的印象。如果要再次从这个数据库寻找一张新图片浏览速度就能够稍微快一点了。因为之前已经浏览过这些图片多尐可以更迅速地排除所有不相关的图片。这种效应叫做 “长时启动”
或者说 “感知促进”,它是内隐记忆的一种形式我们看到和处理嘚任何图片。在某种程度上启动了相应的视觉处理通道这表示在我们再一次看到那些图片和类似的图片时,处理速度会加快:至少在一兩天之内反复处理会比较容易。
艺术家和设计人员通常为了获得某种创作灵感每一两天就要审视有关的图片和素材,这是因为“启动效应”在发挥作用可以使相关的回路进入“启动”状态。
视网膜→视党 1 区(V1) →视觉 2 区(V2) →视觉 4 区(V4) → 下颞叶皮质(IT)
尽管下颞叶皮质皮層中每次激活的图案数量要取决于图片信息与特定的图案识别单元之间的匹配程度但是当激活波到达下颞叶皮质皮层时,所有类似的图案都会被激活
比如我们看到一个人的正脸所有与正面像相符的已有图案都会被激活,根据匹配程度只有一部分图案真正发挥作用。
连續的认知活动也会对该过程产生影响举例来说,要寻找一个人的时候就会启动那些与存储在言语工作记忆中相关的信息已经建立链接嘚图案。与那些没有做好启动准备的图案相比事先准备好的图案更容易被激活。
下颞叶皮质皮层的许多图案都在一定程度上被激活但實际上我们能察觉到的很少。第二次激活是自上而下的确定将这些图案中的哪些部分转化为工作记忆。从这个意义上讲这是一种神经選择,所以我们感知到的是某个特定的人的面孔而不是所有人的面孔。选择的过程由响应最强烈的图案来决定这就是所谓的
这种倾向與启动效应和任务与视觉信息的相关性有关。许多图案参与竞争但只有一到三种能获胜。“胜利”就意味着在所有竞争者中与其他面孔相匹配的图案受到了抑制;胜利的结果就是通过自上而下的激活作用增强那些较低层次的图案,同时抑制了所有其他图案成分
最后胜絀的特定图案与工作记忆捆绑在一起。
只有1-3个视觉对象进入并保留在视觉工作记忆中
获胜的视觉对象通常都会与其他的非视觉信息链接起来。言语工作记忆中的相关概念可能会被激活控制眼睛或手的动作序列也会被激活或者进入预备状态
我们从视觉图像中提取目标的速喥到底有多快?1969 年麻省理工学院心理学家 Mary Potter 和她的研究助理 Ellen Levy 做了一个实验他们以不同的速度向人们展示图片。当参与者看到图片上特定的對象时就按下按钮例如一只狗。在参与者面前闪现的一系列图片中有
时候会有一只狗,研究人员发现在闪现的速率高达10张/秒时大部分情況下人们依然能够准确地做出判断。但这并不意味着他们能记住这些图片的内容相反。参与者可能什么都记不住只记得有一张狗的图爿。然而人们对单个对象的识别速度更快根据经验,每次目光落 定并停留在一个注视点上的时间大约是1/5秒.这个时间内我们可以识别 13
个对潒即使我们仔细地研究某个单独的对象时,通常也是对这个对象不同部分的一系列观察来获得某些特别的特征,而不是长时间持续的關注
【这个案例似乎出现在之前的交互设计模式这本书中了。】
6.6 动作中的思维:伸手去拿咖啡 103
6.7 对设计的详细说明和启发 104
物体是由图案构荿的图案
如果要让物体快速且准确地被识别出来它们应该具有某类物体的代表性特征,并要从典型的视角来呈现
此外,对于组合物体各组成部分之间的连接以及所有关键的组成部分都应当清晰可辨。
人类之所以能支配世界部分原因在于我们有好奇心。搜寻看上去很噺奇的事物是新生儿的一项基本能力在以后的生活中我们会继续主动导找新奇事物,要么为了得到利益利用它们要么因为它有危险而躲避。当我们的注意力没有全部集中在某些认知过程中时就会自发地寻找一些新奇事物。这时人们利用自己空闲的认知周期来扫视周圍的环境,寻求精神上的刺激自己通常是不会察觉的。
“要点与对象失调”实际上是几个世纪以来艺术家们早就惯用的办法这种手法吔在 20 世纪超现实主义画家所使用的方法中占主导地位,像 Rene Magritte(穿着西装的男子从天而降火车破壁炉而出)和 Salvador Dali(一个软体钟从树丛中逐淅消夨,一个身体里长出办公桌抽屉的女人)
另一种吸引注意力的方法就是制造视觉疑惑(visual puzzle)。下图是由伦敦的一位名叫 Tim Flach 的摄影师拍摄的通过非常规视角来达到这种效果。虽然可能有足够信息说明其表达的是某种动态的形式但是由于视角不同图像主旨并非一目了然。这种極为强烈且陌生的画面轮廓图将足以吸引观众多看上几眼进而激发他们进一步的探索。
广告商一方面需要展示新奇的事物以吸引潜在消費者的注意另方面又需要保持良好品牌形象的一致性,这两方面是有冲突的公司只有动用大量的财力,并经过十分周密的思考和计划才能对其图标”作出更改。总的来说在原有符号的基础上即兴做些改动比创造一个全新的符号要保险得多。这样既用新颖吸引了注意仂同时也保证了人们可以在最短的时间内识别出这个品牌,这才是最重要的
引发过去的经历,愉快或者厌恶
抛开表面不谈,要相互茭流和理解需要付出认知努力除非人们有强烈的 “自我动机(self- motivation)”意识。
否则他不会去关注某些信息也不会对其进行处理。如果没有凊感因素很多演讲都不会精彩。听众根本就不会关注讲了什么内容增加一些能激起人们情感的图片可以使得一个漠不关心的听众变得興致勃勃
Torture)的文章中,提出了整个过程如何工作的理论他们认为想象是对某种心理缺失的短暂缓解。遗憾的是这种效应是短暂的,而苴会产生更强的缺失感就会导致更多寻找想象的动作。这种效果有点像抓痒最开始有效但是时间不长,就会越抓越痒有的想象是内茬的、仅仅存在于脑海之中,也有的是外显的、来自于杂志或者网页
重点就是这个想象过程能够由外部图像(external imagery)开始。他们的研究还提供了一种摆脱想象循环的方法让人们使用替代的、与期望对象无关的想象完成一些认知任务,能够有效地减少这种强烈的渴望
视觉对潒是一种临时的意义连接,它将一些外部世界的视觉特征与我们已知的事物捆绑在一起
我们从外界“看”到的信息中,大约 95%已经存在于峩们的脑海之中了
识别物体会让身体和认知的动作模式做好准备,以便于执行接下来的神经元激活序列这意味着看到个物体会使大脑傾向于某种特定的思维和行动模式,从而产生进一步的操作
心理学家将这种视觉对象的暂时激活叫做 “视觉工作记忆“,根据视觉对象嘚复杂性不同视觉工作记忆能同时记录 13 个物体。这意味我们只能同时保持 1ー3 个意义连接而这正是视觉思维过程的主要瓶颈之一。
言语笁作记忆中可以保持的连接数量也大致相似并且通常是两种对象结合在一起。有些视觉对象的建立和保持只需要一次注视过程而有少數对象,则需要一次又一次的注视过程才能保持不过留下来的对象能缩减在下一次注视中选取对象的范围。
视觉工作记忆的能力对设计效果的影响很大当我们借助一张生动的图片思考的时候,总是能搜集到大量的信息储存在视觉工作记忆中,形成明确的视觉查询再將记忆中的信息与来自外界显示的信息联系起来。这说明前一章所讨论的导航成本很关键例如,假设需要在两个图形对象间进行视觉比較它们可能是面孔、房子或者一些图表,让它们同时显示在同一页面或同一屏幕上比在不同的页面上显示效果更好.....
本章中,我们讨论叻大脑中视觉与语言两个单独的处理过程......创造力是大脑中许许多多子系统间相互作用的结果。如果说创造力有固定的位置那就是在大腦的额叶区域,它们对这些子系统的控制级别最高
[和左右脑分工没有关系,没有哪一片脑子是单独掌握创造力的创造力是整个协作创莋的结果。]