四种测量尺度决定了利用测量所得分数的方式。如果你没有正确地应用测量尺度,那么就不能随心所欲玩转这些分数。 统计学方法分析数字。当然,这些数字必须有意义,不然的话,分析就没有多大价值。统计学者把有意义的数字称为分数。但是,统计学中使用的分数并不都“生而平等”。不同的分数因其生成时遵循的规律不同而载有不同的信息量。 当你决定测量某个对象时,必须谨慎选择赋值的规则。测量尺度决定了哪种统计分析是合适的,哪种是有效的,哪种是有意义的。 测量是对事物进行有意义的赋值。被测量的事物可以是具体的对象,比如岩石,也可以是抽象的概念,比如智力。 我们举个例子来解释“分数并不都生而平等”这句话的含义。假设你有5个孩子,都参加了一场拼写测试。满分是100分,查克得了90分,迪克和简都得了80分,鲍勃得了75分,顿只得了50分。如果有个朋友问你,孩子们在这场重要测验中表现如何,你可能会说他们平均分是75分。这是一个合理的概况总结。现在,想象一下你的5个孩子参加竞走对抗赛,这次是鲍勃第一,简第二,迪克第三,查克第四,顿第五。你那爱管闲事的朋友又问孩子们表现如何。你带着自豪的笑容说,他们平均拿到了第三名。这次就不再是合理的概括总结,因为它没提供任何信息。以上两种情况都使用了分数来表示成绩,其中的区别只在于选用的测量尺度不同。 一共有四种测量尺度,即四种以数字表示分数的方法,它们分别是名义测量、次序测量、等距测量和等比测量。不同尺度的区别在于所含信息量,以及在何种程度上可对其进行有意义的数学和统计分析。 1.7.1 将数字当做标签 如果你只打算用分数表示事物所属的不同类别,那就选择名义测量。名义测量仅把数字用做名称,即表示不同类别的标签。 比如,一名科学家收集了男女受试者的数据,他用数字1来表示男性测试对象,用数字2表示女性测试对象,这就是在名义尺度上使用数字。请注意,尽管数字2在数学上比数字1大,但在这个数据集里,2不代表更多,它只作为一个名称使用。 1.7.2 用数字来表示次序 如果你想用顺序或次序来分析你掌握的分数,那就选择次序尺度进行测量。次序测量提供了名义测量提供的所有信息,但增加了分数的次序信息。具有更大数值的数字能够和更小数值的数字比较,任何被测量的对象都能排出一个有意义的序列,不管是人或者海獭还是别的什么事物。 就拿你高中时的全班成绩排名作为例子:毕业典礼上致辞的最优生通常是平均成绩排第一的那个人。请注意,你可以和其他人比较名次,但是你不知道名次之间的具体分数差距是多少。在竞走比赛中,第一名可能只领先第二名1秒,而第二名可能比第三名领先30秒。 1.7.3 用数字来显示距离 等距测量涵盖了之前两个测量尺度的全部信息,并新增了准确性这一元素。这种测量尺度产生的分数,被认为在任何两个毗邻的分数间有相等的差距。 例如,在温度计上,70度和69度间的1度差距是有意义的,它完全等同于32度和31度之间的1度差距。这样的1度差距无论出现在温度计上的哪个位置,都代表着相同的热量值(你也可以说,温度计中液体所受的压力)。 等距尺度提供了比次序尺度更多的信息,现在你能对分数进行有意义的均隔了。大多数教育和心理测量都发生在等距测量这个尺度上。 虽然就我们在统计学上能做什么和不能做什么而言,等距测量看起来能解决所有的问题,但依然有一些数学运算在这个尺度上没有意义。比如,我们不用小数或比例进行比较。想想我们讨论温度的方式。如果昨天的气温是华氏80度,今天降到华氏40度,我们并不说“今天是昨天的一半热”。我们同样不说,一个IQ为120的学生比IQ为90的学生聪明1/3。 等距(interval)一词源自古代城堡建筑。你知道那些弓箭手防御驻守的角楼或塔楼吗?那些塔楼尖顶周围的圆形护墙,通常在每两块墙垛之间留一个射箭的垛口。这些垛口叫做等距(意为“两垛之间”),最好的防御设计就是等距设置墙垛和垛口,以提供360度的保护。 1.7.4 用数字来计数 等比测量作为测量的最高尺度,不但提供低尺度测量涵盖的所有信息,还能够进行比例比较和生成百分比。等比测量实际上是我们观察和考量自然世界最常用和最直观的方法。我们数数的时候,使用的就是等比测量尺度。邻居门厅里有几只狗?这个问题的答案也采用了等比尺度。 等比测量提供了如此之多的信息,而且能够进行所有可能的统计运算,因为比例尺度拥有绝对意义的零点。这个绝对意义的零点意味着在刻度尺上一个人可以得0分,在被测量的特征上真正得0分。虽然温度计上也有一个0,但气温为0度不意味着绝对没有热量。在等距刻度上,比如我们的温度计上,分数可以是负值。但在等比测量尺度中却没有负值。 1.7.5 选择合适的测量尺度 哪个测量尺度适合你?因为达到等距尺度所得到的优势,所以大多数社会科学家倾向于在等距和等比尺度上进行测量。在等距尺度,你能够安全地进行描述性统计,执行推断统计分析,比如t检验、方差分析以及相关性分析。表1-6概括表现了每个测量尺度的优点和缺点。 表1-6:测量尺度 测量尺度 优 点 缺 点 名义测量 描述分类数据 数据不代表数量 次序测量 允许分数间比较 很难概括分数 等距测量 可进行大多数统计分析 不能进行比例比较 等比测量 绝对零点使得所有的统计分析都能完成 有些变量没有绝对零点 为了对他人的研究数据选取正确的统计分析方法,需要先识别他所使用的测量尺度并利用该测量尺度的优势。如果是你自己生成数据,可以考虑提高测量尺度:采用尽可能高的测量尺度。 1.7.6 具有争议的工具 自从20世纪50年代测量尺度概念被广泛接受以来,一直存在一些争议,即我们是否真的有必要等距尺度上执行统计分析。有很多常用的测量形式(比如态度量表、知识测验或人格测验)不是确定无疑地在等距尺度上进行的,它们也许处于次序测量的最顶端。我们能在分析中安全地使用这些本该在等距尺度上获得的数据吗? 研究文献中的一个主要共识是:如果你至少处于次序尺度,而且有把握能对等距尺度统计分析做出解释,那么你就可以在这种类型的数据上安全地执行推断性统计分析。顺带说一句,在现实研究中,几乎每个人都在有意识或无意识地采用这个方法。 但是,我们很难否认依据测量尺度进行统计分析决策这一基本理念。一个足以说明测量尺度重要性的经典例子是费雷德里克•洛德(Frederick Lord)在1953年发表的论文“橄榄球运动数字处理的统计”(“On the Statistical Treatment of Football Numbers”,《美国心理学家》杂志,Vol. 8, 750~751)。这位粗心的统计学家热切地分析了一些所关注球队的数据,写出了一篇满是平均数和标准差以及其他一些复杂分析的报告。但后来发现,这些数据竟然是运动员所穿运动衫上的数字。也许,这是一个没有注意到测量尺度的明显例子。但这个统计学家仍然力挺自己的报告。“这些数据本身不知道自己从哪儿来,”他辩解说,“但它们依然有效。”