关于人种或种族之间的智商差别,尤其是所谓黑人智商比白人低的问题,一直是个敏感话题。
黑人天生比白人智商低的观点在西方主流社会曾长期流行。各种关于智商测试成绩的统计数据成为这种种族智商差别观点的主要证据。最近的资料包括一份2001年的论文,有人统计了6百万多份美国的认知能力测试成绩,发现黑人和白人的平均成绩差别为1.1个标准差。这样的差别也反映在诸如SAT和GRE等大学入学考试以及招工和征兵的测试成绩中。有人认为这些测试成绩的差别就证明了黑人天生比白人智商低。
但是,近几十年来学术界经过大量的调查研究,并未发现能够解释不同人种或群体间智力水平差别的基因遗传学证据,相反,有大量证据显示环境因素才是造成群体间智商测试成绩差别的基本原因。随着学术界研究的开展和认识的深化,黑人天生比白人智商低的观点已经在西方主流社会渐渐失去市场。但它在华人圈里却依然盛行。
最近因“黑人命也是命”运动在华人圈子里引起热烈辩论,有些人又把黑人天生智商低的观点提出来,隐隐约约地作为黑人处于美国社会经济地位劣势的合理解释,或作为否定相关社会改革必要性的理由。
黑人是否“天生”就比其他人种智商低?前人有这种认识的依据是什么?现在的学术界对此有什么新的发现和认识?基于我的阅读理解,我试图从以下几个方面来说明这个问题:
- 智商测试的历史
- 詹森的智商基因遗传理论及争论
- “人种”不是科学概念,智商人种差异论在科学上没有立足点
- 关于智商遗传的研究未能发现群体间智商差距的基因学证据
- 环境对智商测试成绩的影响
- 是否存在可能与智商有关的其他生物学变量
- 传统印象的反例
一、智商测试的历史
在二十世纪之前,这种在智力上对白人和黑人的高低认定,完全是基于作者的个人观察和主观判断,没有什么统计依据。法国人戈宾诺在1853年出版的书《论人类种族的不平等》在西方社会影响巨大。他把雅利安人视为最优秀的人种,而且认为是雅利安人种给世界上所有的文化带去了高贵血液、艺术和知识。他声称,在白人、黑人和黄种人之间比较,黑人的体质强壮但智力思维能力低下,黄种人体质和智力都一般但奉行实用主义使得他们能够获得一些成就,只有白人在体质和智力上都是上等的,白人可以完成智力思维和美的创造,而且在体态上也是美丽的。他进一步声称,美、智力和力量等特质本来都是白人垄断的东西,黑人和黄种人带有的这些好的特质都只因为有了和白人种族间的婚姻而引起的。
到了二十世纪,随着科学技术和统计方法的发展,一些人就试图从统计和科学的角度来证明和解释白人智力高黑人智力低的观点。其中发挥主要作用的就是智商测试方法的发明。
心理学家Binet因法国教育部的要求在1905年发明了一套测试学生智力的方法。Binet当时就提醒说,这种智力测试结果不应该被误解为个人内在不变的智力标志,只能用于发现学生间的潜力差别。Binet的测试方法很快被翻译介绍到英语世界,从此IQ测试作为一种智力测试方法就流行起来了。
第一次世界大战期间,心理学家Terman用他改编的IQ测试方法对美国应征新兵进行了测试。根据这些测试数据,Terman发表文章认为,墨西哥裔美国人、非裔美国人和土著美国人表现的迟钝(dullness)看来是一种人种属性,或者是从他们的家族族系继承来的。一些心理学家和优生学提倡者也根据这个测试数据认为,来自南欧和东欧的移民的智力比来自北欧的移民智力低,黑人美国人比白人美国人智力低。
这些基于统计数据的论点很快被美国白人至上组织和反移民团体广泛应用。一些人声称,北欧人种的纯正高贵性正受到来自世界其他地区移民的威胁,号召政府限制来自北欧以外地区的移民,并控制“不良人群”的出生比例。这些观点流行开来,导致美国的某些州于1920年代开始实施了限制“有问题人群”出生率的“优生法”,并在欧洲刺激了德国纳粹种族主义消灭“不良人种”的暴政。
在这些种族歧视观点兴起的同时,也有越来越多的学者开始认真审视那些智商测试方法和统计数据,发现了把人种和智力差距联系一起的主张背后的种种逻辑毛病。许多人类学者证明,关于智力的人种遗传主张是不科学的。很多科学家开始反驳这些优生学家的观点,认为这种智商测试结果并不能真正反映个人的内在智力,他们指出许多环境因素比如测试语言等都可以造成测试成绩的偏差。但是,把人种和智力高低差别联系在一起的主张和争论在美国一直存在,各种相关研究也一直进行着。
二、詹森的智商基因遗传理论
1950-60年代,在美国社会关于隔离和反隔离的政策论战中,一些智商测试成绩又被用来支持黑人和白人人种在智力上有天生差别的主张。詹森(Jensen)于1969年发表在《哈佛教育评论》上的论文,引用和发展了英国心理学家斯皮尔曼早期的g-factor理论来解释这个差别,从而以“科学理论”的名义把IQ测试成绩的差别和被测试者的基因遗传直接联系在一起。
斯皮尔曼(Charles Edward Spearman)早在20世纪初就发现,一个人在不同类型的认知能力测试(比如阅读理解和数学)的成绩之间存在着相关性;某些认知能力测试,或某种不同认知能力测试的组合,能够在一定程度上反映个人的内在智力;通过某种计算方式就可以估计这个成绩和本人的智力相关程度。他进一步把能反映个人智力的各种因素分成一般因素(g-factor)和特殊因素,认为一般因素是最能反映智力内在本质的东西。他说,就像人的身高一样,体育训练可以在一定程度上增加身高,但不可能让每个人都达到一样的身高,智力训练无论如何也不可能让一个人的智力超越由本人的g因素所决定的智力高度。他就此设计了一套复杂的针对g因素的测试方案,把不同测试组合和其所能体现的智力相关程度称为g-loading,它必然处于0-1之间,通常处于0.1 – 0.9,认为越高的g-loading组合越能反映一个人的真正智力。
詹森继承了斯皮尔曼的理论,并认为决定g-factor的因素就是遗传因素。而根据他的方法来分析,介于黑人和白人之间的IQ测试成绩的差别80%就是由针对g-factor的能力测试成绩的差别造成的。詹森据此认为,黑人和白人的IQ测试成绩的差别就反映了他们在基因遗传上的差别,而这是不可能通过后天努力来改变的。他的结论就是,旨在提高黑人学生IQ成绩的教育辅助计划是不可能成功的。
詹森的论文同时招来了大量支持和反对的声音,成为美国心理学界最有争议也是被引用最多的论文之一。除了来自学术界的批判和支持,他本人一方面因为这些研究获得来自诸如Pioneer Fund等种族主义组织的巨款支持,同时也招致反种族歧视组织的公开反对,詹森本人和家庭甚至收到人身威胁和恐吓。
一些学者反驳詹森的观点指出,即便重点考虑IQ测试中的g-factor,教育因素和环境变化也可能极大地改变受测试者的成绩。同时,这类智商测试的成绩也在很大程度上受到被测试者先前接触这类测试形式的个人经验的影响,所以,用这个测试成绩的差别来证明遗传因素的差别是极其不恰当的。
所幸,美国社会推动反种族隔离政策的步伐没有受到类似詹森理论之类太大的阻碍,并在20世纪下半叶取得了长足的进展。但是,詹森的观点在美国社会有广泛的支持,甚至在科学界也很有市场。
1994年一本叫The Bell Curve的书出版。心理学家Herrnstein 和政治学者Murray 在书中认为,智商测试成绩不仅受到遗传因素的影响,而且它也是个人未来发展的很好的预测性指标,包括个人未来的经济收入、职业表现、私生子和犯罪嫌疑可能性等。他们辩称,那些有高智商的人,所谓“认知精英们”,是和那些平庸的或智力低下的人完全不同的。
本书使用的资料并不是来自新的研究成果,而只是对旧有资料的重新整理分析,其中大量引用了詹森的论文资料。作者不仅和詹森一样把不同人种的智商测试成绩差别和基因遗传主观地联系在一起,而且更以此推出许多种族歧视和隔离的政策建议,比如认为较高的低智商移民生育率导致了美国整体人口智商下降等等。该书出版发行之后,立刻引起了巨大的争议。在它遭到大量来自科学家和社会各界的批判的同时,也有54名学者签名公开信支持这本书的作者,签名者其中就包括詹森本人。
对这本书的批评意见,首先是认为作者没有做严谨的科学调查研究,并违反科学著作出版的通常做法,不在出版之前广泛征求同行审阅评议。据报道,作者在该书出版前只给媒体发送了几份筛选过的同行专家审阅意见,却把批评意见刻意隐瞒到著作出版之后几个月甚至几年才公开。其他专家则指出该书在统计方法、事实扭曲、逻辑谬误等各方面的错误,并认为作者是选择性地使用旧资料为既定的社会达尔文主义论点进行扭曲辩护。Nicholas Lemann批评道,毫不意外地,这些调查研究方法的错误全都发生于有利于作者既定观点的方向上。
由于The Bell Curve引起的观点争论冲突如此激烈,美国心理学协会组成了一个11名成员(包括三位在支持The Bell Curve集体声明上签名的)的专家组,发表了一份专家组意见报告,Intelligence: knowns and Unknows。该报告并不针对The Bell Curve的具体内容进行评判,而是“旨在澄清该领域的相关科学事实,说明哪些是科学已知的,哪些是处于争论中的,哪些是尚未知的”。该报告于1996年发表在《美国心理学家》杂志上。
专家报告指出:IQ测试成绩和学生的学业表现以及将来的工作表现之间的相关性是已知的科学事实;环境和遗传都对IQ成绩有影响,有证据显示随着儿童年龄的增长遗传因素对其智商测试成绩的影响更加明显;这种遗传因素的具体内容和影响尚不清楚,而某些环境影响是已经很清楚的;已知对智力有一定程度影响的生物学因素包括营养、接触有毒物质、以及产前的因素等。
对于群体间的IQ测试成绩差别,报告指出,在不同族群之间的成绩表现差异是复杂的,没有表现出总体上有规律可循的明显模式。具体来说,亚裔的IQ成绩既有略高于白人群体的,也有略低于白人群体的。同时,某些亚裔的IQ成绩低于100,但其职业表现却高于通常IQ是110-120的人群,这一点强烈地提醒人们用IQ成绩作为未来职业表现预测指标的局限性。报告认为,黑人群体比白人群体的IQ测试成绩差距是明显而且一贯的,但是造成这个差距背后的原因尚不清楚。可以肯定的是,这个差距不是源于简单的测试内容和方法上的偏见。对于这个黑白人种的成绩差距,已经有几种基于文化背景的解释,但是这些解释并不能形成结论性的意见;基因水平上的实验证据就更少。总之,针对表现在黑人和白人之间的IQ测试成绩差别目前尚无可信服的解释。
专家组报告并没有支持The Bell Curve被广泛批评的主要观点,也就是关于黑白人种之间IQ测试成绩的差别与基因遗传的密切关系。但是,多年之后,事件的中心人物詹森在接受采访时却表示,专家组的报告既没有支持也没有反驳他的论点,其实是回避了这个问题。
三、“人种”不是科学概念,智商人种差异论在科学上没有立足点
美国心理学会的那份专家组报告在承认群体间IQ测试成绩差别在统计学上存在的同时指出,同样不能忽略的事实是,不同人种群组内的测试成绩差异远大于群组间的差异,也就是说这样的组合划分在科学上是没有实质意义的。专家们并指出,报告中使用的人种分类概念本身就有问题,所谓黑人、白人或黄种人,它们在分类方法上既不是一致的,也不是同质的。
的确,“人种”并不是一个科学概念。目前比较一致的意见是,以肤色划分的人种只是一个社会学的概念,它是缺乏生物分类所需要的科学根据的。简单地说,肤色深浅是一个连续的变量,并无一个具体的分界限。而人类基因研究成果也发现,白人、黑人、黄种人等等之间并无可用来标示各自属性的明确的基因组差别。人类基因组库在所有人群中都是一样的,只是具体某种基因组合在等位基因上的表现频率会有所不同,而这种基因频率的不同也是一个连续的变化系列,并无明确的分界线。也就是说,无论是用肤色还是用基因作为标准,人类都不可能被科学地划分为不同的人种。
基于对人种概念的误解造成的社会影响深远,美国体质人类学会(American Association of Physical Anthropologists)2019年发表声明明确指出:“人种概念不能准确反映人类的生物学差异。过去使用这个概念时就从未准确过,用它来指称现在的人类群体也依然不准确。依据生物学的证据,人类既无法按大陆板块来区分,也无法以人种基因群集来分类。”
方舟子在其科普文章《人种与基因:人类的同一性与多样性》中对人种概念的非科学性有详细介绍,推荐大家阅读。
既然“人种“不是一个科学概念,那么存在于黑人和白人之间的IQ测试成绩的差别,在科学意义上就不可能用人种差别来解释,只能是作为群体差异现象来研究。而体现这种差异的群体,就像分属北方人群和南方人群、乡村人群和城市人群一样,只是人口地理统计和社会学讨论的概念,并没有生物学上的分类意义。
四、关于智商遗传的研究
美国心理学会1996年的专家组报告指出,关于智商测试的有效性,很难做不同文化之间的比较,但的确能预测受测试学生未来可获得的教育成就的差别。从这个意义上来说,它是一种很好的教育前途预测指标,这一点是没有偏见的。这个观点,也得到其他心理学专家比如Mackintosh(1998)和Brown等人(1999)的认同。因此,群体间智商测试成绩的差别如果真实存在,不论它是来自何种原因,对其进行研究是有必要的。
某些心理学家通过孪生同胞和领养儿童的研究认为,智力具有很高的可遗传性。他们并根据美国的调查数据判断,儿童早期的IQ成绩30-50%由遗传因素控制,青少年后期则高达75-80%。
但批评者认为这类研究是建立于错误的假设之上的。他们指出,和生物学的可遗传性(heritability)不同,这个概念用在行为心理学上就变得非常含糊而误导公众。在生物学上,一个生物特质的可遗传性是指一个可以观察的特质在群体差异总量中由基因差异造成的差异值占总差异值的比例。可遗传性1表示完全由基因决定,0则表示该特质和基因毫无关系而完全由环境决定。而在心理学测试中,可遗传性通常被理解为被测试人的测试结果和他们的生物父母的测试结果之间的相关程度。但是,孩子与父母的相关性其实并不能解释其相关的原因到底是基因遗传还是家庭环境影响。真正的可遗传性,应该只是源于基因的遗传。基于这样的认识,The Heritability Fallacy的作者Moore和David Shenk等人认为,Heritability(可遗传性)这个词的使用极大地混淆了人们对人类发展个人特质和身份过程的真正理解。
对于这种传承相关性和基因遗传的区别,Noam Chomsky进一步用妇女戴耳环的习惯来说明:几年前还只有女性才戴耳环,可以认为女性戴耳环的可遗传性非常高,因为戴不戴耳环看来完全和一个人的染色体到底是XX还是XY密切相关,但是没有人会认为戴不戴耳环是编辑在我们的基因之中的。
弗林和Mackintosh等审阅分析了多种关于孪生同胞和领养儿童智力差别的调查报告,认为这些结果是相互混淆矛盾而不一致的,无法据此得出智商遗传性的结论。
二十一世纪以来,科学家开始探索与智力相关的人类基因。有论文报告说,科学家到目前还没有发现任何一个单一基因对智力(主要是以G因素为代表)有显著影响,没有一个单独基因变化对智力变化的影响效果是大于0.5%的。因为智力是一种综合特质,影响它的基因如果有也肯定也不是单一的,一定是一组,很可能多达几千个基因。有人提出了一些可考察的候选基因群,但是对这些影响智商的基因的研究鉴别并不成功。由Deary等人发表于2009年的研究项目表示,并未发现可以证实这些候选基因群的可靠证据。以孪生儿童智力发育研究著名的Robert Plomin相信,影响智力考试成绩的数量性状基因座(QTL)应该是确实存在的,但是因为它们单个的影响如此之小,要从海量基因组里把它们鉴别出来就非常非常困难,必须要等待更先进的技术才能发现它们。
Nisbett在发表于2012年的评论中总结说,几乎没有发现任何表现一致地对IQ变化值的相关程度是在可接受范围内的基因多样性。他们认为,也许这样的基因组根本就是不存在的,智商考试成绩的差别也许应该完全由环境因素来解释。Mackintosh对此表示同意。
五、环境对智商测试成绩的影响
另一方面,关于环境对智商影响的研究报告却很多。首先举三个经常被引用的显示环境对黑白人群IQ成绩影响的研究报告:
- 心理学家Klaus Eyferth在1959-61年连续发表了针对西德混血儿童的智商测试的调查报告。被测试的儿童都是二次大战期间美国黑白军人和德国白人女性所生下来的后代。报告显示,白人父亲和黑人父亲的子代在智商测试成绩上并没有表现出明显的群体差异。
- 英国心理学家Tizard等人在1972年发表的论文,调查了由同样的育儿院抚养长大的黑人、白人和混血儿童的测试成绩差别。在三种不同的测试中,两种测试没有显示明显区别,另一种测试则显示出非白人儿童的成绩更好。
- Moore等人调查了分别被美国黑人和白人的中产家庭收养的黑人和混血儿童,发现23个被白人家庭收养的黑人和混血儿童的测试成绩明显高于23个被黑人家庭收养的同年龄段的儿童,说明儿童早期的社会环境深刻地影响了他们的测试成绩。
环境因素对IQ成绩影响的最明显和广泛的证据,大概是来自新西兰科学家弗林(Flynn)的调查发现:在整个20世纪IQ测试者的成绩都在逐年上升。这个现象被称为“弗林效应”。美国一直到1998年几乎是呈线性上升趋势。弗林认为,引起这些智商测试成绩上升的因素,显然是环境而不是遗传基因的作用。有人认为弗林效应的最重要意义,是显示了环境对智商测试成绩的影响可以达到1个标准差的移动范围,而这一点以前是被怀疑的。
弗林效应的另一个现象是,黑人的平均测试成绩也一样逐年上升,而且其上升速度高于白人,使得黑人和白人的平均智商测试成绩差别在逐年缩小。一份由弗林等人所做的经广泛同行审阅的2006年的报告指出,从1972年到2002年间,黑人白人的智商测试成绩距离缩小了大约三分之一。
心理测试统计专家Mackintosh同意詹森对于g-loading、智商传承性和测试成绩差距的相关性的观察,但不认为这些就能证明智商成绩差距源自基因遗传。他说,正是那些詹森看到的承担最大g-loading和传承性的测试内容,在弗林效应中显示了黑人测试成绩的最大攀升,说明它们很可能也是最容易受环境因素影响的方面。
哪些环境因素影响到智商?大量研究资料证明,健康和营养,教育,以及社会经济状况都会影响到参试者的IQ的测试成绩。
Mackintosh认为,对黑人的社会偏见也是影响到黑白人群之间智商测试差别的因素之一。还有研究指出,处于社会不利地位的少数族裔出于对这种智商测试的价值否定,也影响到他们的测试结果。但这些假定难以得到重复证明。
另外,也有很多学者对IQ测试方法在体现不同社会背景的群体间智商差别的客观性提出质疑。
Mackintosh 2011 年的论文指出,这些智商测试很大程度上受到被测试人以前是否接触过这类测试中包含问题的个人经验的影响,所以用来说明遗传层次的内在潜质是不恰当的。
Hampshire等人(2012)仔细分析了詹森用来测IQ的方法后提出质疑:首先非常不明确的是,智商测试的成绩差别到底是源于传承,还是由于人口统计学变量(比如社会经济状况等)的差别;更重要的,这些差别到底反映整体智力水平的差别,还是因为测试设计只倾向于复杂智力系统中的某些特殊成分?
弗林(Flynn)则认为,无论造成智商测试成绩的差距是什么,人们可以期待,只要测试题越复杂,成绩差距就会越大。所以,G-loading(詹森认为测试成绩和其体现的智商水平的相关度)和测试成绩差距之间的关系是无法用来解释造成差距的原因的。Mackintosh也同意,几项环境因素对IQ成绩差距的影响已经得到证明,而基因影响的证据之少几乎是可以忽略不计的。
六、可能与智商有关的其他生物学变量
除了基因和环境,有些学者也试图从其他生物学特征上发现和黑白人群智商测试成绩差距相关的因素,但是都并未得到学术界的支持。这里只介绍两种。
- 刺激反应时间
大脑对刺激的反应时间差距似乎和IQ测试成绩的差距有一定程度的相关性。这种刺激反应时间被认为是和大脑处理信息的效率有关的,于是有些研究者就试图通过不同种族间对刺激的反应时间的差别比较来解释IQ测试成绩的差距。
有调查报告显示,黑人、白人和亚洲人的刺激反应时间和他们的智商测试差距的顺序是一致的,但是黑白人之间反应时间的差距没有IQ的差距大。詹森等认为,刺激反应时间的差距和文化因素应该毫无关系,必然是遗传基因的影响。
但是,Nisbett等就指出,詹森他们忽略了在同一个调查数据中也显示在被测试者中IQ较高的华人平均刺激反应时间却比欧裔美国人更长。Mackintosh同意Nisbett的意见并指出,除了反应时间,很多其他认知测试的结果也没有显示出IQ那样的结果差距。他进一步指出,恒河猴的反应时间比美国大学生还短,说明反应时间也许根本不能说明智力。
- 脑容量差别
另一种观点认为脑容量的大小和智商有关,而黑白人群的脑容量不同可以解释他们之间的IQ测试成绩的不同。有人调查了黑人和白人群体的脑容量,发现被调查的黑人群体脑容量平均值要小于白人群体。但这种解释面对的明显反对证据是,男女群体的脑容量平均值也有差别,通常男性脑容量大于女性平均值,但调查显示男女性群体的IQ测试成绩并无明显差别。所以,脑容量无法解释被调查的黑人群体与白人群体的IQ成绩差别。
七、传统印象的反例
黑人智商测试表现比白人低并不是一个始终一贯的现象,也有很多例外。
比如英国2010-2011年的调查发现,尼日利亚裔学生和加纳裔学生的平均成绩都远高于白人学生平均水平。2014年英格兰的一项针对学生的数学测试合格率的调查显示,在11个不同语言背景组里的非裔黑人学生都比学生的整体平均通过率要高;有四个非裔黑人学生组的通过比例是90%,而白人英国人学生的通过比例是84.6%。而统计2017-2018年学生的英语和数学考试成绩,以高分数通过考试的比例,非裔黑人学生是44.3%,白人英国学生是42.7%。
八、结束语
总结以上的各种调查研究可以得到一个基本概念:詹森的黑白人种智商差别的基因遗传理论在科学上是站不住脚的;目前呈现在黑白人群之间的智商测试成绩的差距根本上并非源于人体的基因遗传,而是复杂的社会和家庭环境因素造成的。
换句话说,如果把智力用语言表达能力来说明,那么一个人具备智识能力就像一个人具备语言表达的能力一样,肯定是基因遗传的贡献;但是一群人和另一群人之间的IQ智商测试成绩的差别,就像不同人群针对某种特定语言的词汇量和表达能力的差别,应该不是因为群体间基因成分的差别,而是来自包括地理、家庭历史文化背景、教育以及经济等等多种复杂的环境因素造成的综合结果。
基于这样的认识,不仅我们没有理由歧视性地认定黑人智商天生不如其他人种,而且,基于增进人类共同发展的原则,如果相信智商测试成绩的确能够预示个人的社会发展前途,决策者们就更有必要审视现行的社会制度和政策,尽量排除那些影响智商发展的社会环境因素,促进不同族群的共同发展。
黄未原,2020-08-04