历史

第十一章 性格心理学家(1/2)

    “别人心中的秘密”

    人格的本质和起源,对于心理学家们来说一直都有着至高无尚的重要性。对他们来说,这个对理解人性不可或缺的问题是:人与人之间的性格和行为差异作何解释?非专业的普通人对这个问题也有极大的兴趣。对他们来说,这个在日常生活当中有着极为重大意义的问题是:一个人怎样去判断另一个人的性格,怎样了解他的一言一行呢?

    很明显,人们所说的一些话并不是可靠的信息来源;人类在所有活着的物种当中是最能够撒谎的,他们的确也经常撒谎。人们同样也不能依靠他人的动作手势或者表现,因为人们会装假,一些人还装得极像。甚至他们的行为也不总是会显露真情的,因为人们可以欺骗,直到最后的关键时刻才暴露真正的自我。可是,不管那个人是谁——是我们打算嫁娶的也好,是可能买下我们的房产的也好;是我们敌国(或者我们自己国家)的一个首领也罢——这个人真正喜欢什么,他或者她偏好于怎样的行为,我们能够就这些东西做一个准确的判断是最为重要的,其它的都没有这些有价值。

    有鉴于这样一些原因,性格的研究在整个有记录的历史当中一直是哲学家和普通人最感兴趣的,它也是过去60年来现代心理学最为重要的领域之一。

    已知最早的一些性格评价活动,主要还是依赖于占星术这门伪科学的。从公元前10世纪开始,巴比伦的占星士们就已经在根据行星的位置来预测战争和自然灾害了,到公元前5世纪,希腊的占星士们就依据这些数据来解释性格并预测顾客的未来。在一个科学幼稚的时代,一个人出生的时候行星所处的位置会影响一个人的性格和他的命运,这种观点是非常有吸引力的。奇怪的是,到现在,现代天文学和行为科学已经表明这是迷信的无稽之谈,可这种观点仍然具有很大的吸引力。

    我们早先提到过的相面,却是另外一种号称能挖掘隐藏性格的假把戏。跟占星术不一样的是,脸部特征是人的内心线索这个说法,在心理学上是有一些根据的,我们的长相与我们对自己的感觉当然是起一种作用的。可是,希波克拉底、毕达哥拉斯,还有其它一些外貌学家都没有想到这层关系,反过来,他们编辑了一大堆资料,在某种特别的面相特征与性格特征之间拼凑了许多奇妙的联系。哪怕伟大的亚里士多德先生也强调说:“前额大的人偏呆滞,前额小的人用情不专;天庭横阔者易于激动,突出者好发脾气。”

    跟占星术一样,相面持续了相当长的时间。机敏的罗马人很相信外貌学:西塞罗曾说:“面相乃心灵的图象。”朱力斯·凯撒认为:“我并不害怕这些肥头大耳的家伙,可那些面容苍白的瘦家伙着实让人操心。”(凯撒的观点照莎士比亚的话来看是最明显不过的:“让我的身边围满肥仔;/天庭滑润的男人可安度良霄;/那位加西阿斯生相瘦弱,面露饥容;/他心机多端:这样的人危险难缠。/”)耶酥实际的面容一直无人知晓(罗马陵寝里最早的“画像”也是在他死后二三百年才画出来的),可是,从公元2世纪到目前,他的画像一直是面容详和、瑞相非凡的。面相的传统生生不息,我们当中的许多人在遇到生人时,总喜欢根据其面相来猜测他的性格。

    另一种根据可见的特征来区分性格的方法是骨相学,就是摸头骨形状的伪科学,19世纪风行一时。虽然骨相学在20世纪消声匿迹了,许多人仍然相信,一个天庭饱满突出的人是位“足智多谋之士”和敏感的人,而天庭扁平窄小的人多半是头蠢驴,而且铁面寡情。

    古代把性格与生理特征联系起来的最有名的理论,是加伦的气质体液说——他认为,粘液过多的人冷静镇定;黄胆过多的人性急易燥;多黑胆的沉湎于忧郁;血旺的乐观自信。这一教条一直统治到了18世纪。其后继的门人弄起了营养新潮、蒸汽浴和其它一些准科学的把戏来较正体内化学循环,以期增强身心健康。

    与此相对的是,听起来非常现代的一种方法,却是三个世纪以前由一位德国哲学家名叫克里斯蒂安·托马西乌斯(1655-1728)的法学家提出的,他还是赫尔大学的奠基人。托马西亚斯想出了一个办法,他通过给不同的性格特征用数字打分来判断一个人的性格。他的方法虽然粗浅一些,可在很大的程度上却给现代叫做“定级表”的性格评估技术理下了伏笔。他为自己的书取的名字也耐人寻味:《一种实在科学的新发现:对于公众,对于从日常谈话中哪怕背离其愿望地洞悉别人内心的秘密来说都极有必要》。根据现代人的品味,这书名是长了点,这毫无疑问;可是,就其精神实质来说,这与现代教人如何成功的畅销书来说却是同样新潮的。

    多少世纪以来,有关性格的讨论经常是围绕着心理学中最基本,也是争辩最多的一个话题展开的:人性是由内抑或由外决定的?我们的思想和行为倒底是内心力量的产物,还是环境刺激导致的结果?

    柏拉图及其弟子们坚持认为,思想的内容在人出生以前就已经存在了,只需要记住就可以了;而毕达哥拉斯和德谟克利特却反驳说,所有的知识都是从感知而得来的,从而就引发了这场争辩。在17和18世纪,这场争论到了如火如荼的地步,笛卡儿和其它一些理性主义者争辩说,头脑里的思想是天生的,洛克等经验主义者却认为,新生婴儿的头脑形同白纸一张,靠经验在上面留下信息。

    当心理学成为一门科学时,遗传论者——高尔顿、戈达德、特曼和其它一些人——拿出了调查数据来支持他们的观点,而行为主义者们——巴甫洛夫、沃森、斯金纳和其它一些人——提供了实验证据来支持自己的观点。这种争论一直在进行着,而“心性主义者们”(用现代的术语来说)却用内心(心性的)力量来解释人的性格与行为,“情境主义者们”也用个人体会到的情境来解释性格和行为。

    这两种观点在儿童哺育、教育方法、心理治疗、对少数团体的公众政策、罪犯的处理、妇女及同性恋者的状况和权利、移民政策和其它许多个人及社会议题得出了相反的结论。相应地,这个问题在最近几十年也一直统治着性格心理学。人们渴求出现一个决定性的科学答案。让我们来看看,两边的研究者和理论家们都在得出一些什么样的成果,也看看这样一个答案是否有可能出现。

    性格的基本单位

    在本世纪初期,对性格理论最大的贡献是由心理分析学家们做出的。弗洛伊德对成人性格作出了一种解释,认为那是自我为控制本能冲动并把它们转换成可接受的行为形式的结果。阿德勒对社会力量对性格产生的影响更有兴趣,比如中间出生的孩子由于位置的关系而成为自卑感的因由。荣格对性格的描述是,它在很大程度上是由内在的、互为对立的、倾向于决断性和被动性、内向与外向的东西,以及经验与“集体无意识”(他认为是与生俱来而非学习得来的、每个人由上辈传下来的一些概念、神话和符号)在内部形成的。

    虽然心理动力学概念如此这般地推断了性格发展的方式,但他们并没有给心理学家们提供一个可以快速准确地衡量性格的办法,而在智力测定方面却已经成为可能。心理分析所揭示的性格特征只是在几十上百次的临床诊疗后才出现的,哪怕是在这样的时候,这种方法也只是得出了一些印象上的评估,而非可计量的结果。如性格测量界有名的雷蒙德·卡特尔所言,临床方法“充其量不过是一种勘察”,而心理学需要的是一种“可定量的分类学”。

    最早出现的此类分类学是第一次大战的产物。当美国在1917年介入这场冲突时,罗伯特·伍德沃思(1869-1962)这位著名的实验心理学家和哥伦比亚大学教授受命设计一种快速简易的办法,以辩别情绪受挫的新兵。他在紧急之中进行了最早的心理学实验之一,即“个人数据问卷”,这个问卷只问受试者一些有关症状的并不麻烦的问题,如:“你曾梦游过没有?”“站在高处时是否感觉到想向下跳?”把他们承认的症状数目加起来就可以得出一些分数。

    作为一种性格评估,个人数据问卷是很原始,很有限的,它只收集到了受试者提供的一些信息或者错误信息,而且只是有关神经症状方面的信息。可是,“它在表面上是有效的”——人们直觉地感到,这些问题的确把正常人和有神经质的人区分开来了。而且,事实上,后来进行的一项试验证明这种测验是有效的,它发现,诊断出来的神经质患者得出了36个不好的答案(“是”),正常人只得出了10个。

    伍德沃思作为先锋的工作设定了一个模式,战后,许多心理学家都设计了其它一些类似的问卷,让受试者对自己进行评估。可不久,这些问卷很快就超越了症状,进而包括了一些涉及总体性格特征的问题。早期测试当中最好的一种是1931年由心理学家罗伯特·伯恩鲁特设计出来的。这份问卷提出了125个问题,并把答案归结成四个主要特征上的分数:自制、自足、内向及神经质。比如,如果受试者对“你是不是经常感到可怜?”这个问题的回答是个“?”(“不知道”或者“说不出来”)号,则他或她在内向上得三分,自制上得一分,神经质上得零分,自足上得零分。这些分数都只不过是些推测——伯恩鲁特对每个答案与四个特征的相互关系并没有经验上的证据——可是,当时在全国出现了一股心理学测试热,在整个30年代,有100多万份伯恩鲁特性格调查表和大量类似的测试卷被销售出去,人们广泛使用着这些问卷。到那时,性格成了心理学的一个特别领域,由特征理论主导着,它是一种常识观念的科学翻版,即,每个人在特别的情境当中都有一套可以识别的特点和惯常的行为模式。特征可以描述既定性格的因素,可是,它们对背后的心理动力学结构或者这种性格的形成方式只字未提。伯恩鲁特问卷和其它早期的性格测试都是测量其中一些因素的办法。

    1928年和1929年出现的一种重要研究脱颖而出,它好像是走出了特征理论。休斯·哈特肖恩神甫是联合神学院的圣职教员,马克·梅是位心理学家,他也曾供职联合神学院,他们研究了成人行动的有效性,比如童子军运动可以在儿童中培养出有道德的行为。哈特肖恩和梅让若干儿童拿起纸笔做测试,看看他们对于欺骗、偷盗和撒谎等的态度。然后,他们让孩子参与一些比如集体游戏和自己给自己打分等活动,孩子们可以在里面做弊、偷窃或者撒谎而看起来又好像不会被人发现,不过,事实上,研究者们可以准确地判断出他们的所作所为。

    结果令人十分不安。不仅孩子们在纸笔测试中所说的话与他们实际的行为之间关系甚少,而且一个孩子在一种情形之下与另一个不同的情形之下的诚实与不诚实也没有什么连续性,这着实令人惊异。哈特肖恩和梅于是得出结论说,如果特征是存在的,它们不应该引起一个人在不同的环境下有类似的行为。

    (我们)十分确信,存在某些共通的因素,它们倾向于让人与人之间各个不同……然而,我们的论点在于,这种共通的因素不是在一个人所处的情境当中独立操作的内在整体,而是这个情境的变量。

    这与日常生活当中的经验是相矛盾的。我们都有一种感觉,我们认识的一些人当中,有些诚实,有些不诚实,一些人是保守的,另一些人是开放的,有些人很努力,另一些人玩玩打打。哈佛大学心理学系执掌牛耳的戈登·奥尔波特(1897-1967)出来挽救了这个局面。他进行了一系列的研究,还有一本专著:《人格的心理学解释》(1937)。态度谦和,面容苍白的奥尔波特是个勤奋的人,他的研究兴趣非常广泛,包括偏见、交流和价值观,但是,性格,尤其是特征理论,却是他终生特别关注的课题。一部分是由于他自己的性格的原因,他成了反驳哈特肖恩-梅依情境论的理想人物。他为常识当中认为的心性论提供了科学的证据。

    奥尔波特是印第安那州一个乡村医生的4个孩子当中最小的一个。他父亲的家族几辈子以前起源于英格兰,他母亲是德国人和苏格兰人的后裔,而奥尔波特自己的家庭生活,如他许多年后回忆他那样,“只有朴素的、新教式的诚实和勤奋”。在他生活的那个地区,没有医疗设施可言,许多年以来,奥尔波特家里一直就住着很多的病人和护士,而幼年的奥尔波特一直就分担着他自己的那一部分工作,打点门诊室,洗瓶子和照顾病人。他吸收了父亲的人道主义世界观和价值观,在以后的岁月里还经常喜欢引用他父亲的座右铭:“如果每个人都尽其最大努力去工作,而只取家中所需的最低量的经济回报,那么,一定就有足够的财富可以对付下去。”

    在哈佛大学,奥尔波特除了进行自己的研究之外,还抽出时间做了很多的社会服务志愿工作。这满足了帮助有困难的人的深层需要,而且,按他在自传中所说的那样,“给了我一种有能力的感觉(纠正了普通意义上的自卑感)”。他的两大兴趣,即心理学研究和社会服务工作,最终溶合在了一起,因为他确信:“要有效地做好社会服务工作,人们必须对人的性格有充分的理解。”

    对于奥尔波特来说,性格的研究总是一种常识意义上的事情,他的兴趣在有意识部分,在可以很容易地进入的部分,而不是无意识部分难以确定的深层。他经常谈到与弗洛伊德惟一的一次见面,因为这次见面对他产生了深刻的影响。作为一个22岁的毛头小伙子,他在访问维也纳的时候给弗洛伊德写了一封信,说他本人就在城里,想见一见他。弗洛伊德非常大度地接待了他,可是一声不响地坐着,等他开口说话。奥尔波特试图想个话题来开头,就提起说,来弗洛伊德办公室的路上,他听到一个4岁的小孩告诉他母亲说,他想避开一些很脏的东西,他显示出了对脏物的真正的恐惧。奥尔波特描述说,那位母亲穿戴整齐,衣领浆过,气势不凡。他认为这之间并没有什么联系,可是,如他所回忆的:“弗洛伊德用他那双仁慈的、治病救人的眼神看着我说:‘那个小男孩子是你本人吗?”’奥尔波特目瞪口呆,只好转换了话题。这次经验,他后来回忆说:“告诉了我,深层心理学研究尽管有种种的好处,但它容易落入过深的研究圈子里,而心理学家们在刺入无意识的世界以前,能够把动机等的事情说清楚也是可以获取承认的。”

    (他对行为主义者也不敢苛同,他认为,行为主义把人看作一个纯粹的“反应”机体而描述它——即只会对外部的刺激作出反应——而事实上,人类是“更为积极的”,在很大程度上是由他们自己的目标、目的、意图、方案和道德价值观驱动的。)

    在他自己的研究生阶段,奥尔波特开始自行设计纸笔性格特征测试。他和他的兄长心理学家弗诺矣德创造了一种比本罗伊特法和其它一些早期的测试法更为客观的测试法。为了测量他们叫做“优势压制”的东西,他们不问受试者感到如何的有优势或者如何的感到压抑,而是问他们在涉及那种特征尺度时如何在具体的情境下作出行为反应。这里有个例子:

    有人在排队时企图插到你前面去。你已经等了好一阵子了,再也不能再等。假设这位插队的人是同一个性别的人,你经常会:

    ——规劝这位插队者

    ——对插队者“怒目而视”或者与旁边的人用清晰可闻的声音议论这位插队者

    ——决定不再等待,径直走开

    ——什么也不干

    对一批自愿受试者试过这种测试后,奥尔波特得出结论说,对任何一个具有挑战性的情境作出优越或者压抑反应的人,他们在其它类似情境里多半会作出同样的反应。“大多数人,”他写道:“在高位的优越感和低位的压抑感的给定的连续尺度上,都倾向于占据一个给定的位置。”对他们来说,这好像确立了特征的真实情况,也说明一个人在类似的情境当中会作出类似的反应。如奥尔波特后来所言:

    如果可以证明,一种行动通常与另一种行动相关联,那么,就有证据证明这两种行动底下有某种东西在支撑着,即某种特征……也即是,某种神经心理学上的结构,它具有将许多刺激变成在功能上互为相等的能力,还可以启动并指导相同(很有意义的前后一贯)形式的适应性和表达性的行为。

    既如此,为何接受哈特肖恩和梅测试的孩子们会有前后不一的表现呢?奥尔波特以格式塔理论找到了一个答案。每个人的特征都是以一种层次结构的独特配置集中在一起的:在顶层是一个人的主要品质或者关键特征;在其下是一些中心特征,也即是一个人在生活当中日常的聚焦点(奥尔波特说,即是那种我们都有可能在写一封推荐信时提到的品质),最后,在这一切之下的是一大批次要特征,每种这样的次要特征都是由少数特别的刺激所引起的。因此,一个人的行为在具体方式上有可能不一致,可是,它们在较大的方面都还是一致的——奥尔波特宁愿叫做“相合的”。

    例如,他说,如果你观察一个人慢慢地行走,然后又看到他急急忙忙地拿着一本书回到图书馆,你可能会在判断他的时候认为他前后不一致,因为在一种情境之下他轻松自在,而在另一种情境之下他又急步如飞。可是,那只是次要级别的特征行为。另一个更为重要的特征是弹性。如果你请他在黑板上写较大的字,而在纸上写较小的字而且他也照样做了,你可能会认为他富有变化本事——他也的确如此,如他在走步的时候一样。他在两种活动当中的行为显示出了可塑性,因而也就前后相合,虽然不一定是前后连贯的。

    奥尔波特也用这一点回答了这样一个问题:为什么一个人常常会表现出互不兼容的特征,或者,在不同的情境之下作出前后不连贯的表现?转瞬即逝的情绪或者“状态”经常就构成了看起来像是不连贯的东西,一种紧急的情境也许会在任何人的心中造成一种临时的焦躁状态,哪怕是平常平静如水的人。

    尽管奥尔波特在过去的许多年里修正了他自己的性格理论,可是,他始终认为特征乃是性格当中最为基本和相对稳定的单位。他的特征研究在他的时代为他赢得了声名和荣誉,许多的,假如不是大多数的心理学家都认为,性格心理学实际上就是特征研究的同意词,如果他知道这一点,一定会非常高兴。

    测量性格

    由于特征即不是可以看见的物体,亦不是某个具体的动作,而是个人的一些特质,研究者们的中心问题是如何测量它们。

    首先,他们得弄清楚自己要测量的倒底是什么东西。早期的性格研究者选择了一大批直觉上非常明显的特征,比如内向,自制和自足。可是,不久,他们就放开了眼界,把别的许多东西也纳入进来加以考虑了,这样一来,庞大的数量使这个领域迅速变得一团混乱了。

    因为,有太多的可能。勤奋工作的奥尔波特和一位同事曾数过字典中专指不同人类行为或者品质的词,总数达18000之多。并非所有的词都指特征:有些是观察者对另一个人的反应,而非那个人的特征(“令人敬佩”,“讨厌”),有些只指一时的状态,而非长期的特征(“局促不安”,“魂飞胆丧”),有些只是比喻(“活龙活现”,“多产的”)。尽管如此,仍然剩下4000-5O00个词是专指特征的。

    有好几百种已经通过各种各样的方式进行过探索,这些方法从主观印象到实验室的试验,从心理分析解释到行为学数据。一些主要的方法如下所示:

    个人材料和史料:信件,回忆录,自传,日记等诸如此类的东西里面,都有大量有关受试者性格的信息,当然也有错误信息,因为一个准备让别人来阅读的自我描述,肯定会表现出一个经过装扮的自我而非**的真实。(佩皮斯的日记里面有大量放荡淫逸的段落和无耻的想法,那是准备给他自己看的,而且全都用密码写的。)对一些著名人物有名的诠释都是以个人材料为基础写的,可是,口味和理论一代一代有所不同,同样的材料会形成有关写作者非常不同的形象。以这样一些材料为基础而作的性格分析有时候是非常好的文学作品,而鲜有符合科学的。

    面谈:这也许是最常用的性格评估方法,可也是效率最低的一种。一些就业面试官员,大学入学考试的主管和心理分析学家,他们可以在与接受面试者的谈话中得出很多有关一个人的信息,可其他一些人就不一定。研究证明,哪怕是有经验的面试者们,他们对同一个人可能会得到相当不同的评价。另外,面试可以得出一些描述和解释,可并不能得出可计量的特征测量结果。这种面试最适合于辨别一个人有否明显的精神或者情感障碍,但是,在正常人当中,它作为收集一个人的个人资料、态度、回顾和其它一些细节是最为有用的,这些情况会有助于理解以其它一些方法收集到的有关这个人的更为客观的数据。

    由观察者定级:研究者经常请某个人的朋友或者熟人来评定他或者她的若干具体特征。为求准确故,研究者会让被提问的人在某种特征的尺度表上定一个级别,这个尺度表从0-5,或者0-10不等——基本上就是托马西乌斯1692年的搞法。可这个方法有许多困难之处。定级的人有他们自己的定级风格(有些人避免极端,另一些人却非常喜欢走极端),受试者在不同的时候对同一个问题有不同的回答,定级还受到“光圈效应”的影响(一位在某种特征上定级定得高的受试者,倾向于在别的特征上也定出高级别)。

    那么,总的来说,定级的办法被认为即不是非常可靠,也不是特别有效。(可靠的方法一次又一次地得出相同的结果,有效的方法测量到的正好就是要测量的东西。)可是,在某些情况下,定级办法是即有效又可靠的。著名的特征心理学研究者雷蒙德·卡特尔就依靠这种方法来进行他的工作,他只采用定级者亲眼在很长的一段时间里(可能的话,在一年的时间里),并在许多情境下看到受试者后得出的数据,而且每次只就一种特征定级,以避免光圈效应。这样的前提会改善可靠性和有效性,但又使这种方法极为昂贵,无法承担费用,也极费时间,而且除了在一个人口相当固定而且彼此看得见的院所里以外,其它的地方简直就无法进行。

    ……

    问卷:这是目前最为通用的性格评估工具。如我们所见,这种方法很快扩展到超越了简单的自我评估范围,而成了准客观的技巧,比如提供现实生活情形,并问受试者在这些情境中最有可能的行为方式。其它早期的测试继续提出一些有关受试者的态度和感觉的问题,而不是可能的行为,不过,其措词的办法使受试者难以美化自我形象,如在“个人资料问卷”里一样。大多数问卷有“是/不是”或者“正确/错误”选择作为可能的答案,可有一些也包括了像“不知道”这类的中间答案。

    心理学家斯塔克·哈塞维和精神病学家J·C·麦金雷都是明尼苏达大学的教授,他们在30年代设计的、著名的“明尼苏达多级问卷”(

    M M PI)就属于后一种类型。它里面有550句话,其中包括:

    我大部分时间是很快乐的。

    我喜欢社交聚会就是为了跟别人处在一起。

    我很显然缺乏自信心。

    我认为自己口碑不好。

    受试者针对每个问题回答“是,”“不是,”或者“?”(不肯定)。这些问题归类分成十个级别,可以测定忧郁、压抑、歇斯底里、精神错乱、失常、男女异位、偏执、神经衰弱、精神分裂症、轻躁狂和社交内向。这些名字给人一种印象,即是说M

    M

    PI主要关心的是精神疾病,它的确也能测量精神疾病,可同样也能检测出正常的性格。比如,那些对“我大部分时间是很快乐的”和这个级别里的大部分其它问题都回答“不是”的人,就被称为是精明、心存戒备和处心积虑的人。那些对“我喜欢社交聚会就是为了跟别人处在一起”和相关问题回答“是”的人,就被定为会社交、活泼和有雄心的人,而那些回答“不是”的人就被认为是谦逊、害羞和自我躲闪的人。

    这些解释不是以直觉或者常识为基础,而是建立在经验证据之上的。在设计M

    M

    PI的时候,哈塞维和麦金雷把一大批问题拿到精神病院或者有精神毛病的人那里去试,再用同样的问题来问访问他们的正常人,然后把能区分两类人群的问题留下来用作问卷。比如,用作压抑尺度的问题由受压抑和不受压抑的两类人作出不同的回答。

    尽管M M

    PI在过去的半个世纪当中是使用得最为广泛的性格问卷,它也有自己的局限和错误。举一个例子来说,问卷很长。再举一例,许多受试者感到,其中的许多项目如果诚实地去回答的话会过于直露,太令人不安(“很糟的词,经常是可怕的一些词会来到我的脑海里,而且挥之不去,”“我受到同一性别的人的强烈吸引。”)。另外,其它一些项目很明显就是针对病理学方面而来的,让正常的人也显得十分可笑或者觉得受到了侮辱。前一阵子,搞笑专家阿特·巴克沃尔德嘲笑M

    M PI问卷,他认为应该再加上一些问题,如:

    很宽的领带是有病的迹象。

    在我年轻的时候,我经常喜欢逗青菜玩。

    我的皮鞋光亮剂用得太多。

    1949年,一小组性格心理学家得到了洛克菲勒基金的一笔款子,用来在贝克莱的加州大学建立一个新的研究机构,即性格评估及研究所。它原来的宗旨——它的目标后来扩大了些——是要研究出更好的性格评估方法,而在过去的40年里,它已经设计出了数量庞大的研究方法和新的心理学测试办法。可是,最为知名和使用得最为广泛,而且使用至今的一种,就是加利福尼亚心理问卷(CPI),它在这个组织成立的头两年就完成了。

    CPI是该所研究员及贝克莱的教授哈里森·高夫博士的工作成果,他决心使用适合正常人的材料来改善M

    M PI。他收集了1000个问题作为原始材料,有些是从M M

    PI里面抽出来的,其它一些是他自己和同事们编写的。在助手和同事的帮助下,他测试了这些项目,先在80名研究生中试,再找医学院的80名高年级学生试,在接下来的几年中,总共有13000多不同年龄和不同社会经济地位的男性和女性接受了测试。为了评估这些项目的有效性,或者说评估这些问题所引出的答案的有效性,高夫和他的同事们让一位作为样板的受试人由他的朋友们来定级,然后把定级的结果与受试者自己的答案进行对比,把一些不可信的东西剔除出去。

    最后的CPI定稿包括480个项目(1987年版里有462个),比如:

    人们常常对我期望过多。

    我要坐下来放松一下也很难。

    我喜欢聚会,喜欢社交活动。

    受试者根据每句话回答“是的,”“不是的”,这些答案会在从自制和自我接受到自我控制和人定这15个性格特征中得出一些分数来(CPI最新的版本里有28个级别。它们可以检测一个人的自制力、保持身份的能力、待人接物的能力、社交表现力、自我接受力、独立性、入定、责任心、社会责任感、自我控制、好印象、社区精神、安宁、耐心、经由服从而取得成就、经由独立而取得成就、智力效率、心理学上的清醒意识、灵活程度、超脱程度、是否喜欢常规、具体化、管理潜力、工作倾向、焦虑程度和三种检测男女异位心理的指标)。从各个方面来说,销售也好,其它语种的翻译情况也好(28种语言,包括克罗迪亚语,印地语和塔加拉族语),还是一些心理学部门和培训项目的领袖人物对它的高度评论也好,都是名列前茅的,它在今天还在使用中的心理学测试方法中处于前10名,也许是前3名的位置,哪怕它问世已经40年了。

    许多其它的心理学测试法所提供的问题答案比M

    M PI或者CPI更广泛,下面有三个例子:

    大多数警察待人的确是十分友善的。

    (在你同意或不同意的级别数字上画一个圈)

    (完全不同意)-3  -2  -1

    0  1  2  3(非常赞同)

    堕入情网的麻烦比它的价值多。

    (在最适合你的感觉的地方打一个对号)

    (从未)(很少)(有时候)(经常)(总是)

    我对别人的愤怒一般是:

    (在最能说明你自己的地方打上打号)

    (稍有点)(比一般小)(中等)(比一般大)(很强)

    按这种定级方式作出的回答得出了比“YES-NO”反应更为准确的态度和感觉检测。

    在过去的许多年里,心理学家们设计了成百套性格问卷,研究机构和商业出版机构加以出版。有些代表很好的科学实践,还有一些却不是如此,可是,每种设计都是极好的商业财富。例如,CPI的销售数字,它的指南书,5本可重复使用的测试册子,50张答案卷和其它一些项目,尽管还是个秘密,但按高夫博士的说法,“应该是相当大的”。

    投影测试:从30年代早期开始,越来越多的心理学家接受了心理分析的理论,认为无意识过程是性格的主要决定因素,而且,对不起戈登·奥尔波特先生,他们还寻找到很多检测的办法,用以测验这些过程以及由过程引发的特征。最为可行的办法是给受试者提供一些模棱两可的刺激——很模糊或者暗示性的图形或者图画——再请他或者她来描述这些图形。一般来说,作出的回答会显露出他们的一部分或者全部无意识的幻想、恐惧、期望和动机。

    这样的测试中,最为有名的一个是在许多年以前——约在1912至1922年之间,由一位瑞士精神病学家赫尔曼·罗斯察设计出来的。他弄出了若干墨迹,请病人说出每个墨迹看起来像什么。通过许多年的实验以后,他把这种测试减少到了10种墨迹,有些是黑白的,有些是彩色的。进行罗斯察测试时,测试者把一张卡片显示给受试者看,再问他或她这个墨迹可能是什么东西或者让人想起什么,把答案写下来。所有的卡片都显示完毕以后,把答案评上分。打分需要仔细的培训,还要用到手册,其评分的一些标准是,受试者对整个墨迹或者一部分墨迹作出反应,墨迹的哪一部分受到了注意,答案是针对墨迹本身还是其背景。这里有几个与这种测试近似的(原罗斯察墨迹不允许复制)墨迹,还有一些对典型的反应作出的解释。

    30年代,罗斯察测试法在美国的心理学家当中极受欢迎而且广泛使用。在几十年的时间当中,它一直是临床心理学博士论文用得最多的论题,有成千上万的研究论文是论述它的,可最终的裁决是说什么的都有。一些人发现所做的解释可靠也有效,另一些人却不这么想。然而,它总还是临床心理学家和精神病学家使用得最为广泛的测试法之一。

    另一种有名的投影测试法是主题统觉测试(TAT),是由心理学家亨利·默里和一名助手克里斯蒂安娜·摩根创制的。生相高贵的默里在内心里却受着某个魔鬼的驱使,他在经历了很长一个痛苦的旅程之后才找到自我。他先是学历史的,经过了医学培训,成为外科专家,然后又花了5年时间学生理化学。他还在研究阶段就去苏黎世拜访了荣格,并在与他一起的三个星期的每一天和每一个漫长的周末里参加心理治疗。如他所说的,在这个“爆炸性的体验当中”,他“成了一位再生者”。他治好了到目前为止一直没有治好的口吃毛病,并对心理学产生了浓厚的兴趣。他转而学习这门学问,成了一位心理分析学家,最后在哈佛心理临床所找到了自己作为一位有心理分析倾向的研究人员。他与奥尔波特进行过短期合作,可是,那之后,他对性格抱的心理动力学观点使他们,按照奥尔波特的说法,“处于一种友好的分离状态下”。默里对性格研究最有意义的贡献,在于他和约20多位心理学家花3年时间进行的临床研究项目。他们深入研究了51位按评估技术分成类别的、大学年纪的成人的性格特征,分类的技术包括深层面谈,挫折测试(如根本不可能取胜的拼字游戏),实验者说出一些挑斗性的词,如“骗子”,“同性恋”等时受试者手指的颤抖,还有投影测试。在投影测试中,TAT法是最说明问题的一种。

    实施默里和摩根于1935年为研究该项目而开发的TAT法时,测试者让受试者看19张黑白图片,图片里在进行什么事情或者为什么进行什么事情一点也不知道,但要求他为每张图片编一个故事出来,每个故事花约5分钟的时间,可以任由想象力自由发挥。对这些故事进行的心理学解释,在很大程度上依赖于一个由项目研究小组编制的、由35条性格“需要”或者动机而组成的单子,其中有获取成就的需要,自制的需要,还有秩序的需要和成为别人的救星的需要。

    默里和摩根在一项描述他们的TAT开发的报告中,印了好几张图片作为样板。在一张图片中,有一位中年妇女向着左边的侧影,在她的旁边近靠观察者的地方,有一位穿戴整齐的年轻男人稍稍背对着她,他的头稍稍有些下垂,脸上略有皱眉的表情。(只有靠这些描述了,该测式法目前的出版人不允许复制这些图片。)默里和摩根说,下面这个故事,是一位受试者根据这幅图片编的:

    母亲和孩子幸福地生活着。她没有丈夫。她的儿子是她惟一的支持。可这个孩子交上了坏朋友,并作为从犯参与了集体抢劫活动。他被发现了,并判了5年监禁。该图片表现他与母亲告别的场景。母亲很伤心,为他感到羞耻。孩子也感到非常羞耻。他因为自己给母亲造成的伤害而担心,担心的程度超过了他对自己要进监狱的担心。

    这孩子(故事还在继续)因为表现好而出狱了,可他母亲已经去世,他堕入了爱河可又回到了犯罪的行列,他又回到监狱里去了,他出狱的时候已经成了一位老人,他的余生在忏悔与潦倒中度过。

    默里和摩根解释这个故事时说,它表明讲故事者感觉到了外部的坏影响对一个人的行为产生的控制,它还显示出了好几种深层的需要,其中有(对其母亲的)供养,获取金钱和自我贬低。默里和摩根说,这个例子说明了TAT的特别价值:

    本测试所依据的事实世所公认:当一个人解释一个含义模糊的社会情境时,他很容易像他所关注的现象一样暴露出他自己的性格来。他完全倾心于解释那个客观的现象,变得非常天真,没有意识到他自己,也没有想到别人正在仔细地看他,这样一来,他也就变得毫无戒备,没有平日那么有警惕性……受试者暴露出了自己内心深处的一些幻想而丝毫没有察觉。

    尽管TAT法有其价值,可用起来还是相当麻烦,一些人讲出长篇大论的一系列故事来,得出了大量的信息,可另一些人又无话可说,什么信息也没有。尽管如此,它证明还是一种可靠也有效的工具,可以用来检测性格特征,而且证明还据有预测的威力。1952年参加了TAT测试的57位哈佛毕业生,在他们到了30左右的年龄时,又对他们进行了事隔15年后的研究。在1952年的测试中显示出有较高的私密动机的人,他们在婚姻、工作和其它有相互关系的领域里适应的程度也高得多。TAT已经使用好多年了,虽然没有罗斯察氏的测试法使用频率高,而且也引发了许多类似的测试。在最近的几十年时间里,有大量的投影测试法产生出来,许多目前还在使用中。它们包括布莱基法,这是一套有关一只小狗的图片故事(小孩子为每一张图片编一个故事);有词汇联想法(在一些测试中,受试者在听到或者读到一个词时,把来到脑海里的第一个词提出来,在另外一些测试中,受试者用给定的词造一个句子),完成句子法(“但愿我母亲……”,“最烦我的一件事是……”等等),有图画测试法(有一种是这样的,受试者被要求画一座房子,一棵树,还有一个人。图画用心理动力学进行分析,例如,一棵死树,暗示情感空洞,树叶很多的表示活力,尖尖的树暗示攻击性。)

    行为取样或者操行测试:在这类的评估中,一位经过培训的心理学家在特定情形下观察某人,并检测或给他或她的行为定级。观察者通过单向镜观察孩子们在教室里一起完成某个项目,玩耍或者面对一个设计好的刺激所产生的反应,如从隔壁教室里传来的呼救声。或者,这位看不见的观察者也可以看着一组人在特定的情境下的表现,如在试图解决某个需要合作的问题时。

    在另一种形式的操作测试中,心理学家与某人面对面,让他或者她进入一个很麻烦或者很压抑的情境里,再按他最终的行为来定级。第二次大战中,空军飞行员候选人培训就经过了一组测试,其中一个是,受试者要在一根管子里面捏住一根很细的金属棒(只要一碰上管子,灯就亮一次),而进行测试的人会说一些令人不快或者吓唬人的话,甚或突然在他旁边大吼一声。

    也是在二战期间,战略服务处选拔秘密服务人员到一个与外面隔绝的地方经过三天的连续考试。除了接受常规的面试和完成问卷以外,这些人还要面对一系列困难的任务:在没有任何适当说明材料的情况下搭一座军营,攀登一堵高墙,趟过一条溪流,抵抗酒精的作用保持清醒头脑。心理学家们给他们的领导能力、抵抗压力和挫折的能力等等定级。这些方法听起来很不错,可是,小组的成员们在最后的报告中都承认,他们几乎没有收到海外回来的反馈,因此也丝毫不清楚他们自己的评估倒底有多么准确,多么有用处。不管怎么说,作为一种测试个人性格的办法,这种方法造价太高,很难实施,对于普通用途来说要求也太高。(贝克莱性格评估及研究所最初的宗旨是要进一步开发并测试战略服务处的评估方法。这个目标后来被放弃了。)

    还设计了更为实际的一些操作测试法,可是,由于大部分都要求每位受试者都有一个测试人,而且许多测试还必须在实验室里进行,这也不适应学校、工厂、临床和机构以及军队当中的大型性格测试应用。有几个例子列在这里:

    ——受试者得通过四道印制的迷宫,每道只花15秒的时间,不能让铅笔轨迹碰到迷宫的边缘。如果成功,就说明该人有决断力。

    ——受试者按正常方法大声地念一篇故事,然后倒过来念;所费时间的差距越大,受试者比较僵硬和不灵活的可能性就越大。

    ——一组受试者参加一个对某个有争议话题的态度测试,每个人都私下里被告知他或者她的观点与大多数人的不同。(出于测试的目的,这不一定就是事实。)再过一会儿之后,受试者再接受测试,一个人对其声明的态度改变的程度,被用来检测他或者她对于求同压力或者按某些说法是对于适应性压力的抵抗能力。

    ——受试者坐在椅子里等待一件计划好的事情发生,可这件事情被推迟了。可他或者她又不知道,这椅子就成了一个“小动作计”,把所有的动作都记录下来,那些动得很多的人被认为是很紧张或者很容易受挫折的人。

    这只取了很少的一批式样。想拿学位的研究生或者寻找某种好销的产品的心理学家们还编制了数以百计的其它情境。他们在开发这样一些产品时也许还有一些非物质主义的动机在里面:为了让结果值得人信赖,这些测试的真正目的还不能让受试者知道,因此,编制这样一个测试题还有某种玩游戏或者设计出一种可操作的玩笑的意味。也许情况是这样的,设计了这样一些评估办法的心理学家们发现这件事情非常有趣。

    乱中求序

    在性格研究历史的早期就已经很明显了,关于特征而收集到的大量数据都只是些原始材料。有关一个人的一套杂乱的特征分数,并不能合起来形成关于这个他或者她的性格的整体图象,而且,从大量受试者的样品当中得出的分数编辑起来,并不能给整体意义上的性格提出什么新见解。

    奥尔波特指出了这个问题:“似乎已经很清楚,我们在性格和动机当中所寻找的一些单位是些相当复杂的结构而不是基本分子单元。”可是,特征检测是分子式的,而且,还不能明确地看出,按照比如由M

    M PI所产生的26种特征分数得出的一大堆发现,怎样就能看到一个结构,可以从一组不同测试法当中收集到的成百种分数更不能做到这一点。

    好几位心理学家提议,要从混乱当中求得秩序,即把一些联合特征合并成更大一些的趋向或者共存特征如“总体动作”,“幸福感”及“情感稳定性”,或者变成心理动力学上的共存特征如进攻性及口唇或者肛门趋向。其它一些人建议把性格特征归类为双模式的范围或者类型,如荣格把人群分成外向及内向两类。

    可这都是些模糊不清的笼统词。研究者们需要强有力的证据来证明,特征是以非常清晰的、可辨识的串连贯起来的。而一种把这个证据收集起来的办法是存在的。高尔顿曾找到了相互关系分析法,即是一种检测互变量的统计学上的步骤(一种变量发生变化的程度,如某种特征,在另一个特征或者变量发生变化时会随之发生变化)。接着,英国心理学家和统计学家查尔斯·斯皮尔曼又设计出了最为复杂的方法,叫做因素分析,它是要同时检测一整个变量组中各个变量的相互关系——这正好是让特征数据产生意义所需要的东西。这个方法很复杂,但其基本概念却非常简单。如果一组特征都共同变化——也即是说,在任何特征里面,如果一个较高或者较低的分数都伴有另一些特征的分数也变高或者变低——那就有理由假定,它们一定受到某种起总体作用的普通倾向或者因素的影响。

    在40年代,一位德裔英国人名汉斯·艾森克的(1916-)心理学家,进行了一项把因素分析应用到性格分析中去的复杂工作。汉斯是德国人,但不是犹太人,他在德国沦于纳粹统治之下以后离开了自己的国家,成为一名英国公民。艾森克采纳了荣格的两分原型,他假定,若干特征,如死板和害羞,会在一些内向的人身上产生强烈的相互作用,而相反的一些特征却会在外向的人身上产生相互作用。对此,他又增加了两种他自己的两分法原型,即神经质的尺度,一个极端是高度稳定的性格,另一个极端是极为不稳定的性格,在这里,他又期望一些特征会出现彼此相关联的情况。

    他用按照MMPI和他自己设计的一套性格测试法得出的特征数据,把自己的假设应用到统计学测试当中去,结果发现这些假设是正确的:在他认为内向者和外向者身上应该成串出现的一些特征当中,的确存在一些相互联动的关系,在有神经毛病和正常人之间他认为应该成串出现的一些特征之中,的确也存在可比较的相互联动关系。当他把这四种因素列出来的时候,他发现它们与加伦在古代发明的体液理论的四素质说有惊人的相似之处。一向喜欢唱反腔的艾森克,对这种巧合这次却异乎寻常地小心:

    一头钻入故纸堆里去寻找想要的东西,这是很容易的一件事,尤其是在拿现代的话去解释古代的术语时。可是,在早期的思想家与更现代的一些(由其它人和艾森克自己所做的)工作当中,好像的确存在某些类同之处。

    提出了这份警告之后,他画了下面这张图:

    尽管这种巧合令人激动,可大多数的M M

    PI使用者都发现艾森克四重原型太过抽象了,他们希望从测试结果得出的分数里抽取更为具体和详细的诊断办法来。这些诊断法终于通过一位在英国出生的心理学家雷蒙德·卡特尔(1905-)几十年不缀的努力,以不同的因素分析法实现了。卡特尔比艾森克更为小心谨慎,也更讲究方法。他没有像艾森克一样以一个假设的结论作为开头,而是让因素分析法自己探索自己的道路。他在大量变量当中计算其相互联动,把那些明显显示出相互联动关系的东西列成表,再给它们编上因素名。这是一件繁重的活,哪怕是在计算机的帮助下亦是如此。比如,要把一百种变量之间可能的相互关系计算出来,人们得计算4950种关系。

    这只是卡特尔所从事的工作的一个例子。在早期的一个阶段,他发现,承认一个常现错误的强烈倾向同时伴有同意的强烈倾向,而且这两种倾向都与情绪化、对可厌恶事物的敏感性、重大的严重问题和其它一些特征有相互联系,而且与像心率很高这类的生理症状也有联系。对卡特尔来说,这些“表层的特征”的相互关系网络暗示着下面还有一层“根源性的特征”,即他所命名的“焦虑”。

    这样的研究听起来严苛认真,远离现实生活,可是,卡特尔尽管态度恭俭,温文尔雅,却不是什么浮浅虚夸之人。他是一位英国工程师的儿子,他认为——也许是受他父亲职业的影响的缘故——理工科学才是他应该学习的科学领域,并在伦敦大学攻读化学和物理。可他是个无所不读的学生,对当时(20年代)的一些知识和政界发生的热门活动也投入很大热情,这些活动最终带来的结果是一次大的思维超脱:

    我在实验室里的凳子开始觉得短小一些了,而世界的问题却广大无边。然而,跟一位在火车站里的人一样,看着火车远离而去,心里清楚那些火车并不是他的,我放弃了政党和一些宗教团体所提出的济世**。我慢慢地认识到,为了超越人性当中的非理性成份,就得研究思维本身的工作机制……从这一刻起,也就是我得理工学位的几个月前,我意识到,心理学是我终生的兴趣所在。

    卡特尔一头扎入了心理学的研究生工作,他投入大学的斯皮尔曼门下,学习因素分析的专门技术。不幸的是,在他拿到博士学位的时候,心理学还只是刚刚在英国的高等学府立下足来,在接下来的15年时间里,他只能靠当一名中学的心理学教师和临床医生来挣面包钱。这样做是不无代价的——繁重的工作和紧巴巴的收入毁了他的第