智商测定源出于艾尔弗雷德 · 比纳(Alfred Binet)鉴定缺陷学龄儿童的方法,并由此导出了蛊惑性的结论:智力是遗传的。

根据《沃伦(Warren)氏心理学词典》,所谓智力测验就是指:“通过个人对单个或一系列问题解答情况的考察,或者是评价个人对某项或一系列工作的完成情况,从而由此推断此人的智力水平。”

显然,这种定义甚为简单且也不值得怀疑。然而,由于智力测验的概念与智力遗传不变性的假设之间的相关性是如此的肯定,以至于许多心理学家一直乐于混淆这两个概念。美国国家研究委员会(National Re-search Council)的几位科学家在1982年的一次报告中指出:“混淆智力测验和智力遗传不变性这两个不同的概念实为不幸之兆,因为这样就很容易错误地将智力理解为一种单一的、大小不变的、同时也不会随时间变化的能力,甚至有可能用单一的指标来衡量人的智力水平。”

智力是人脑的普遍功能,这一概念至少可以追溯到亚里斯多德(Aristotle)时代。然而,弗朗西斯 · 高尔顿(Francis Galton)也就是查尔斯 · 达尔文(Charles Darwin)的堂兄则认为:“智力的不同是由于遗传产生的。”1869年,他调查发现:英格兰当时凡是有名免的人,皆有光荣的家系。由此高尔顿进而推论:“伟人”(Great Man)向其亲属提供了包以智力外壳的遗传核,并且它将随着血缘关系的疏远而消失。

高尔顿还首先指出,测验可以用来测量智力水平。他认为知识是通过感觉器官进入人脑的,因此通过测量视觉和听觉的准确性,且结果经统计方法分析,从而试图发展一套智力理论。但是他的工作失败了。

1894年,杰出的法国心理学家——艾尔弗雷德 · 比纳开始着手寻求一些途径,测量儿童的记忆力、想象力、注意力、语言理解能力、道德判断能力以及其他各种复杂的智力机能。并在1903年报道了他对自己的两个女儿智力发展过程进行深入研究的结果,所以1904年当巴黎公共教育部长筹建一个委员会研究公立学校中智力缺陷儿童问题时,比纳应邀成为该小组的成员。

比纳在西奥多 · 西蒙(Theodore Simon)的帮助下,对许多智力缺陷的儿童进行了大量不同的测验,并筛选出那些可以鉴别儿童聪明或迟钝、智龄大或智龄小的实验。1905年,比纳和西蒙将他们成功的测验题目由简单到复杂排列起来(即测验题目难度不断提高),并作为一套智力量表(Metrical Scale of Intelligence)发表,这就是最初有实用价值的智力测验。每个儿童在进行这种测验时,应尽可能完成更多的题,直到感觉到实在太难并无法继续做下去时为止。然后将他的成绩再与儿童们的普遍程度进行比较。

1908年,一套经修改的根据年龄的测试题目问世了。从三岁到十三岁的大量应试儿童中,有50% ~ 70%的儿童通过了这种测试。1911年,另一套修改的直到测试十五岁儿童的方法也问世了。在同一年,心理学家观察到一般三岁的法国儿童都可以准确地指出他的鼻子、眼睛、嘴巴,重复两位数,正确地说出图画中物体的名字,重复有六个音节的句子,能告诉别人自己的名字,而十五岁的儿童,则可以准确地重复七位数,在一分钟内可以正确找出一个所给词的三个韵脚,重复二十六个音节的句子,甚至能解释图画和事实。所以,根据儿童对不同年龄组试题的应试结果、可以定出其智力年龄——智龄。

作为比纳的贡献,智龄的概念及其测定方法,并不是产生于任何智力的基本理论,而是源于一种极为实际的方法,即试误法(trial and error)。从此以后,这种方法一直特征性地被用于智力的测量。尽管这些难度各异的测验显得很适用、但当时却没有人知道其如此适用的原因。

根据比纳的方法,儿童的迟钝实际上就是智力年龄和实际年龄存在差异,如果这种差异有两年,那么儿童的智力就有严重的缺陷。1914年德国心理学家威廉 · 斯特恩(William Stern)建议用智力年龄除以实际年龄得智商:均常儿童的智商为1,智力较低的儿童则小于1,而智商超群的儿童就会大于1。当这个比率商数乘以100时,就是通常所说的智商(Intelligence Quotient)或简称IQ。

斯坦福大学的一位心理学家——刘易斯 · 特曼(Lewis Terman)将比纳的工作介绍到美国,并且还定出了美国儿童的智商标准,1916年他发表了“斯坦福 - 比纳修正量表”(Stanford Rewision and Extension of Binct-Simon Intelligence Scale),在此特曼并没有提出什么新的观点,而是从头到尾运用的方法。他认为在人的一生中IQ是一个相对稳定的常数,并且可以通过对儿童期智力测量而推知其成年后的智商。

智商的测定方法在美国得到了广泛的应用和传播,比纳的观点很快被人们接受和发展,并且很快就有许多不同的形式可供人们选择。IQ测试早期最重要的对象是英国军队,即用以测定第一次世界大战中美国特遣队员的智力情况。但军队常常没有时间像比纳那样,对每个人进行深入的临床测验。在罗伯特 · M · 耶基斯(Robert. M. Yerkes)的领导下,心理学家们发展了一套仅用笔和纸进行测试的方法——军队α法(Army Alpha),利用这种方法可以在很短的时间内对很多成人进行测验,而军队β法(Army Bata)则是用手势语言来对那些文盲和非英语国家的应试者进行测验。

军队中应用的经验表明这种测试方法是健全可行的,测试虽然可归纳成许多不同的形式,但都仍然适用于鉴别人与人之间的智力差别。从这以后,智力测验被认为是日常之事而为公众所接受。

当智力测验刚开始出现时,对智力源于遗传的观点,人们是完全信赖和广泛接受的。优生学家们想到,既然可以对动物和植物进行优良性状的选育,为什么对人本身就不行呢?IQ测定的出现给他们提供了鉴定超常人和有缺陷人一个客观的方法,这样就可以实现其目标,即繁衍那些具有优良性状的个体,而对那些不良性状的个体,如羊癫风、低能儿(feeblemindeadness),则处死,希望其绝育,或者干脆禁止其繁殖。

如果一个人的智力像优生学家们认为的那样,即在其被怀孕时就固定了,并且个人的经历对其智力没有影响的话,那么除非是测定时出错,否则其IQ值在其一生中都会保持常数。然而,不断积累的情况表明:IQ值会因特殊的教育而增大,也会由于某些缺陷而减小,例如应试人对测试题目中的词汇或实体不熟悉,那么这种测验是不完全的,而应该用非文化性题目取而代之,这种题目应该不依赖于应试者是否受过教育。然而这种假设不过是自欺欺人而已,因为要提出一套与知识无关的题目是不可能的。由于受过教育的人总是比没有受过教育的人知道得更多,所以要在能力测验和测试成绩之间划出条清晰的界限,几乎是不可能的。

如果不涉及到种族和种族歧视,许多有关智力遗传的科学问题就易于解决。例如,对于美国黑人的智商数(IQ)平均比白人低15分这一事实从无歧论,而有所争论的则是如何解释这个事实。IQ值的差别也许可以作为一个很好的证据,即黑人长期以来一直蒙受着巨大的歧视。第一次世界大战期间,在军队中进行IQ测验时就发现了这一差别,却是作为智力遗传性的证据。

不仅如此,一些社会方针政策也是基于遗传决定智力的观点而制定的。如特曼认为:黑人和墨西哥人的孩子应单独成立几个特殊的班级,其理由是尽管他们不能掌握那些抽象的概念,但是他们可以被训练成为很能干的工人。不幸的是这种观点一直没有遭到质疑,而且多年来一直受到限制东南欧人移居法的追随者的大力推崇。因此,智商测定被视为种族歧视的另一种手段,要求禁止所有的这种测验的呼声也随之而来,这种情况的产生并不令人意外。

七十年代期间,智力是由遗传决定的观点变得含糊起来,那时这个观点有个“杰出”的支持者——英国的伯特爵士(Sir Cyril Burt)。他用其编造的数据证明出生就分离的孪生子进行IQ测定时,两人IQ结果具有高度的相关性。或许伯特的欺骗行径足以资惊科学界,但更令人震惊的却是他所谓的“数据”竟被如此之多的人不加考虑地接受。事实上,这表明他们的观点一致,即这些“数据”验证了他们所持的观点。现在有些著名的心理学家仍然认为,IQ值的差别反映了种族之间智力的差别。然而,这种观点像二十年代与其相反的观点那样不流行了,而且当今的社会舆论是坚决反对将IQ值有较大差别的学生分开进行教育的。

几乎所有指责能力测验的焦点集中在滥用测验的结果。尽管命题者在处理试题过程中运用了最复杂的统计分析方法,而且试题中的题目皆经过专家的可靠性和合理性的验证,但是测验仍然没有逃脱人们的抨击。虽然整个过程如此细致,但由实际命题方法所设计出的题目有时则显得琐碎,而且没有什么相关性,但最致命的弱点却是,用以区别不同人智力的测验本身,无法使一个怀疑的外行足以信服其有效性。

这些问题之所以产生,是因为智力测量技术的建立缺乏足够适当的理论基础。因此,即使像测量一个人的各种能力这样基本的题目,迄今尚无定论。

令人振奋的是,智力的基础理论已开始有所进展且逐渐与其实践相适应。认知心理学家们开始着手阐明包括智力活动在内的心理活动过程。如瑞士心理学家琼 · 皮亚杰(Jean Piaget)像比纳那样热衷于对儿童进行研究,但他对形成正规理论更感兴趣,且已经描述了儿童智力发展的四个过程。而另一方面,计算机科学家则极力分求一种基本的理论,这种理论同时适用于描述具有智能的机器以及聪明的人。

与此同时,美国人逐渐开始依靠智力测验来帮助制定各种决策,如:教育发展、业务能力、雇佣选择、临床诊断以及社会或个人的评价等。即使在理论上缺乏阐明的情况下,智力测验的命题和测试必将以它具有的各种方式存在下去,而且只要智力测验在进行,抵制那些不可避免的滥用测试结果就将成为必然需要。