881.摘抄:《心理学研究方法》(1-5章)

(上个寒假读完,计划上个寒假结束前完成纸质摘抄的学习任务,结果一拖再拖,转眼间又一个寒假已经临近了,不能再拖了,懒虫!!)

曾经有评论家和早期版本的读者并不喜欢这种简单的叙事方式。而我却认为重要的和有趣的思想并不一定要写得晦涩难懂,简简单单最好。就像是,妈妈所说的话总是正确的,通俗的语言也包含真理。(前言 p3)

只有当一个实验的结果可以再现的时候,其他研究者才能在此基础上继续深入探索。(正文 p4)

研究的最妙之处就在于它是能够完善社会的非政治性活动。之所以强调“最”字,是因为往往太多时候研究经费的分配被特殊利益集团所掌控。是否开发艾滋病的疫苗不应该取决于某个人对个体生活方式的看法。同样,是否支持早期干预计划也与某个人的思想和政治观点无关。那么克隆技术是否就应该因为他可能被滥用而叫停?当然不能!要考虑的是如何制止新技术滥用,而不是停止研发新技术。(p4)

只要你开始了你的研究之旅,那么你就成为科学家这一精英团体的一员,你要肩负起发表科学论文的责任。在论文中不但要说明你自己做了什么,还要说明该研究进一步的研究方向是什么。(p7)

尽管研究者们可能会因为之前的预言(规范地说是假设)没有被证实的而感到有些失落,但是任何操作严谨的研究不管其结果如何,都能提供有价值的信息。(p8)

作为实验设计的一部分,研究者将142位母亲分成了三组。第一组接受干预,第二组不受到任何干预,第三组通过群发邮件的方式受到特殊的干预。这里关键就在于对三组条件的“处理”(这也是实验设计的关键)。这个研究所属于真实验研究,因为参与者都处于不同的社会支持团体中,而不同社会支持团体的划分就是一种处理方式。而在准实验研究中,研究者没有通过分组对群组成员进行控制。准实验研究和真实验研究的主要区别就在于,在进行准实验研究前研究对象已经被划分到不同的小组。(p12)

有时,在研究的世界里,不仅是研究类型存在差异,研究的意义和用途也会存在差异。于是研究就被分成了基础研究(basic research)和应用研究(applied research)。注意!在很多时候,这是用来区分研究活动方式的简便方法,但不能以此来区分研究者的意图或者是研究的重要性。/这两类研究最基本的区别在于基础研究(常常称为纯理论研究)在研究完成之后,其结果不能直接被应用,而应用研究则可以做到这一点。(p14)

如果不提到阅读的重要性,就无法说清儿童教育的重要性。而且,重要的不仅仅是学术书籍,还有休闲读物——这些是你真正享受的书,但总是没时间去读。//什么最能促使青少年进行休闲阅读?教师的因素有:展现个人对休闲的享受;支持学生对这些书籍的讨论;对学生在学校、家中阅读提出期待。(p18)

一个问题可以用许多的不同的方法去回答,其中最好的方法往往是最简单、设计最巧妙的那个。(p19)

变量,表示能够呈现不同数值的一组输出结果。(p20)

因变量是研究者测量的变量,用来检验对自变量的处理和控制是否有影响。(p21)

因变量就是实验或者结果的测量值。(p21)

我们可以把因变量看成会随实验处理的变化、实验者操纵条件或控制手段的变化而变化的实验结果。(p21)

自变量(independent variable)指研究者通过直接或间接的方式操纵或控制实验处理或条件,从而考察其对特定实验结果产生的影响。自变量又称为处理变量(treatment variable),在本书中这个词用得最频繁。在实验过程中,通过对自变量的控制来了解该操纵对因变量的影响。(p21)

自变量就是通过操纵或者改变从而考察它对因变量的影响的变量。(p21)

一般来说,研究者试图控制的变量,或者用来将被试分为不同组的特征变量,如年龄、族群、处理方式等,这些变量被称为自变量。而因变量是研究者用来判断对自变量的处理和控制是否对其产生影响的结果变量。(p22)

自变量至少要选取两种水平或赋予两个值(因为是变量)。例如,如果一个研究者要研究性别差异(自变量)对言语发展(因变量)的影响,那么自变量就应该有两种水平:男性和女性。(p22)

因子设计(factorial designs)是指在实验中控制或操纵两个或两个以上的自变量的实验设计。其中,两种性别(男和女),三个年龄层次(3岁、5岁和7岁),三种社会阶层(高、中和低)构成了2×3×4的因子设计,共包含了18种独立的实验处理水平组合。随着实验设计中自变量的增加,实验处理的分组会急剧增加。(p22)

最好的变量是对自变量各个不同水平的变化都很敏感的变量。(p23)

控制变量(control variable)是指能够对因变量产生潜在影响的变量。因此,必须对其影响加以控制甚至消除。例如,你要考察阅读速度和阅读理解程度之间的关系,由于智力水平和这两者都有关系,你就必须对智力水平的差异进行控制。要想研究阅读速度和阅读理解程度之间的真实关系,就必须让智力水平保持恒定。/无关变量(extraneous variable)是指可能对因变量产生不确定影响的变量。例如,如果你要考察看电视对成绩的影响,你也许就会发现电视节目的类型可能会对成绩产生巨大的影响。有些节目如《探索发现》(Discovery)、《新星》(Nova)、《芝麻街》(Sesame Street)可能会对成绩产生积极的影响,而另一些节目则可能产生消极的影响。/调节变量(moderator variable)是指和研究变量(如自变量和因变量)有关系的变量,它掩盖了自变量和因变量之间的真实关系。例如,如果你要考察犯罪率和冰激凌消费之间的关系,你就需要考虑气温的影响,因为气温调节了两者之间的关系。否则,你的结论就是错误的。(p23)

虚无假设(null hypothesis)是个有趣的东西。如果它会说话,它可能会说出类似这样的话:“我代表研究的变量之间的零相关。”换句话说,虚无假设是一个等价命题。(p24)

虚无假设是研究的起点,这是因为在没有其他信息的情况下虚无假设就被看作是真实的、可被接受的。/也就是说,在你能证明存在差异之前你只能假定没有差异。(p24)

什么是偶然因素呢?这是由被试的参与以及许多不可预料的因素的作用,从而给研究带来的随机变量。(p25)

作为好的研究者,我们的工作是消除偶然因素,并评估其他可能导致群体差异的因素,例如那些被定义为自变量的因素。(p25)

研究假设(research hypothesis)是两个变量间相互关系的明确陈述。例如,对于之前陈述的每一个虚无假设,都存在一个与之对应的研究假设。注意我们是用“不定冠词”(a)而不是“定冠词”(the)搭配研究假设,因为任何一个虚无假设都肯定存在不止一个研究假设。(p25)

研究假设就是不等价命题。(p25)

不等价关系可以采取两种形式:定向型研究假设和非定向型研究假设。/如果研究假设没有指明不等价关系的方向(例如不同于),那么这个研究假设就是非定向型研究假设。/如果研究假设指明了不等价关系的方向(例如多于或少于),那么这个研究假设就是定向型研究假设。/非定向型研究假设(nodirectional research hypothesis)表示群体间存在差异,但是差异的方向是不确定的。(p25)

定向型研究假设(directional research hypothesis)表示群体之间存在差异,而且差异的方向是确定的。(p26)

研究新手通常都想要去证明一个研究假设,而作为一个好的科学家,我们不会受我们自己过于主观的判断或者偏见的影响,我们会去检验假设,而不是去证明假设。(p26)

好的假设是陈述性的,并且假定变量之间存在一个非常清晰明确的关系。(p26)

假设应当简练扼要。你的假设应该以陈述句的形式描述变量间的关系,并且尽量可能简练(扼要)。陈述越是简练扼要,其他人(如你的硕士论文答辩委员会成员)就越容易阅读你的研究、明确理解你的假设是什么以及重要变量是什么。实际上,当人们阅读和评价研究时(你会在后面的章节学到更多),他们中的大多数做的第一件事就是找到假设,从而就能很好地了解研究的一般目的和研究是如何进行的。(p27)

几乎所有的科学家的时间和研究基金都是有限制的,所以最好的策略是从较大的总体中选取一部分,并且在这个较小的群体中进行研究。在这种情况下,较大的群体就是总体(population),而从这个总体中选取的较小群体就是样本(sample)。(p28)

当样本确实代表了总体时,就可以说研究结论具有很高的概化水平(generalizability)。(p28)

显著性是指在得出变量之间关系的结论时,我们所愿意承担的风险水平。(p29)

让我们用显著的这个形容词来修饰差异的含义。这里,显著性差异是指观测到的母亲在职和母亲不在职的青少年之间的差异,这种差异是由系统因素的影响而不是偶然因素引起的。在这个案例中,影响因素是母亲是否在职。我们假定控制了可能导致任何差异的所有其他因素。因此,余下的解释青少年差异的唯一因素就是母亲是否在职。这就是正确的解释?是的。但还不完全。/因为这个世界、我和你及我们的研究过程并不完美,所以我们在解释差异时必须要留有余地。换句话说,你需要表明即使你非常确信两个青少年群体之间的差异是由母亲的就业状况引起的,但是你不能绝对地、百分之百地、完全地、肯定地、不容置疑地确信这一点。(p29)

作为一个优秀的科学家,你的工作就是尽可能减少这种可能性,消除所有可能引起被观察到的差异的其他原因。由于这只在理论上可行,你不可能完全消除其他因素影响的可能性,因而你必须分配一定的概率水平,并谨慎地陈述结论。/总之,即使你相当确定你的结论揭示了事实,一个优秀的科学家也不会自信到傲慢地认为不存在错误的可能性。错误发生的概率就是我们所说的显著性水平。(p29)

研究的过程——一定程度上是在已知的内容中发现更多未知的东西。(p34)

选择感兴趣的研究领域只是开始,接下来是要对感兴趣的问题以研究问题的形式予以陈述,并附上证实的研究假设。然后就是文献综述,这是一个很奇特的过程,听起来你要很忙碌了!文献综述涉及图书馆文献阅读、做笔记、对文献进行组织的能力(当然还有写作能力),虽然要花很多时间,但是只有了解这方面的研究做了哪些工作,还有哪些工作需要做,你才能对该研究有全面的认识。/但是稍等一下,一个人如何能够在文献综述并熟悉某领域之前就对该领域有足够的了解,并且能够提出合理的研究假设?正如诗人约翰·西阿迪(John Ciardi)所说:“这就是问题所在。”(p34)

研究问题和研究假设更多的是研究者最初的研究思路和深入的文献综述(好的研究者总是在不断阅读)相互作用的结果。(p34)

研究假设并非一成不变,而是能够改变的,以适应文献综述中的内容和你一些想法的改变。记住,我们所做的工作是“站在巨人的肩膀上”的。(p34)

在你们参与课程论文和课程活动时,最大的共同点是你们会面对大量的信息,这一点是你们无法通过其他方式经历的。(p35)

大部分研究者和你的指导老师一样,鼓励学生发挥热情,认为学生(和科学家)的热情是一种重要的品质。热情与实际研究中的客观冷静并不冲突。(p36)

任何科学研究的努力都有助于信息的积累,科学研究的最高目标是有助于我们更好地理解一般世界和一些特殊的主题,尤其是正在研究的主题。如果你通过阅读前人研究发现已经做过哪些研究,并以这些研究为基础,那么你一定能够提出有意义、有价值的研究问题。(p36)

你的经历塑造了独特的你,在考虑研究问题的总体范围和内容时,忽视自己的经历是很让人遗憾的,尽管你可能不会很快看到这些经历和研究活动间的关系。不停地阅读,你会找到建立它们之联系的方法。(p37)

从你的指导老师或别的老师那里得到的意见能使你在你的研究领域中始终处于领先地位。这也有助于你和你的指导老师建立良好的关系,这还是有趣、成功的经历所必不可少的。他们思考研究设想的时间总是比验证这些设想的时间要多。他们会喜欢那些想扩展自己研究活动的并且聪明、精力充满的学生(就像你这样)。(p37)

你仍需要努力工作来选择一个能够使你形成研究问题的主题,这样你的研究兴趣才能在活动过程中得以保持。(p38)

研究设想指向研究问题,研究问题指向研究假设。(p39)

只有当你将事情记下来,并与它们共存(而口头语言往往会神秘地消失)时,你才会面对自己所说的,做出承诺,努力工作以使该陈述得以实行。/和研究假设不同,研究问题不是声明,而是对兴趣和想法进行的清晰陈述。研究问题越清晰明了、易于理解,研究假设的提出和后续文献综述的开展就越容易。为什么呢?因为从一开始你想要做什么的清晰想法,会令你在搜索参考文献和完成其他文献综述工作时更加有效地利用你的时间。(p39)

好的研究假设能够告诉你下一步将要做什么而不是怎么做。(p39) 

正如巴斯德所说,机会总是留给有准备的人,你永远无法知道最好的信息来自哪里。(p40)

文献综述为研究计划提供了框架。(p40)

今天的研究是建立在前人以往的辛勤工作和无私奉献以及他们回报丰富的努力基础上的。(p40)

彻底的文献综述有助于形成一个研究框架,这个框架能回答你所提出的重要的研究问题。文献综述带着你思考某些想法是如何按时间顺序发展的,能够让你放弃一些以前的研究设想(因为缺少研究支持),也会让你坚信一些想法。广泛、完整的文献综述能够使你很好地认识到哪些研究已经完成,以及你下一步该往哪里去——对一份书写清晰、资料翔实、规划明确的报告尤为关键。(p40)

一般资源(jeneral sources),它们可以帮我们找到关于一个主题一般参考文献的线索。这类资源肯定有其自身的缺陷(稍后我们会讲到),但它们也有自身的价值,因为它们能够为你所研究的主题提供一个概观和简介。(p41)

二级资源(secondary sources ),它们是现行文献的“表亲”。这类资源主要有综述类文章、阅读选集、该领域其他工作的综述、课本以百科全书。(p4)

原始资源(primary sources),这类资源由已经完成的研究组成。它们以期刊文章或其他原始的形式(包括摘要)呈现。(p41)

重大发现常常出现在无关的地方,或者说来自这一学科领域其他值得注意的主题。想博学多才吗?那就博览群书。(p41)

记住,一般资源仅仅用来帮助我们在研究中定位,以及熟悉自己的研究主题。(p42)

任何人都不应该把已发表的东西当作绝对的真理。(p43)

谷歌图书绝对是研究者的无价工具,但他的使用也饱含争议。毕竟,作者的成果被无偿在线发布,作者没有任何收入(例如版权费)。随着时间推移,像谷歌图书这样的工具,会变得对作者、研究者都更公平。(p44)

记住信息通道鱼龙混杂,信息的有效性和准确性常常受到质疑。你看见的内容并不代表是真实的。/最后,电子信息也许是最容易获得的,并且最便宜;但存储方法受到很多制约,例如受到信息本身以及使用条件等的制约。信不信由你,光碟还有U盘,这些实体存储方法,都容易受到损坏的威胁。更别提存储信息的操作系统的通信规则时常变换。所以,什么是最好的存储方法?纸张。档案纸不太容易损坏,是最佳的、最保险的、最便宜的,可以长期保持信息。然而,所有这些纸张能存放在哪里?那就是后话了。(p45)

二级资源是那些你想获得的关于某个特定领域中已完成研究的学术性概要或参考书目的进一步资源。记住,二级资源是二手的,不是原始的报告。(p45)

文献综述中最常用的二级资源是《年鉴》(Annual Reviews,自1930年开始发布以来,涵盖近30个学科),内容有20章左右,集中在大量不同的主题上,其中包括医学、人类学、神经科学、生物医学工程、政治学、心理学、公共卫生和社会学。想想吧,你可以浏览过去十年的书卷,也可以接触到最新的心理学领域大量不同的主题。如果你刚好找到了你想研究领域的一章内容,那么你就会在研究中遥遥领先。(p45)

原始资源是文献综述最基本的部分。(p46)

事实上,在你进行文献综述时最好的策略是在二级资源的基础上尽可能多地占有原始资源,甚至都不用去想那些一般资源。(p46)

就目前来说学术期刊是关于某一主题最重要、最有价值的原始信息资源,因为它们反映了研究者、研究成果和你的兴趣之间最直接的联系。/到底什么是学术期刊,以及文章和稿件是如何刊印的?学术 期刊通常是刊印某一特定学科研究论文的集合。(p49)

审查期刊投稿的同行评议过程即同行专家在论文发表之前对研究手稿进行审查和评论。(p49)

(顶级期刊的投稿拒绝率)它们差不多达到80%。是的,80%的稿件被直接拒绝,但这些被拒绝的稿件通常都能在其他期刊重新投稿发表。被顶级期刊拒绝并不能说明这些研究在该领域无法做出重要的贡献。事实上一些研究表明,审稿人之间的评价一致性往往很低,一个人评价很高的文章,往往另一个人评价很低。但总体上可以毫不夸张的说,越好的科研报告总能发表在越顶级的期刊中。/关于一般原始资料的另一个值得注意的地方是,如果有一份期刊或一本书你可能需要使用,但你们图书馆中又没有(网上也找不到),不要失望,到附近的图书馆找找,或问问你们的一些教授,他们可能借到。如果这些方法都行不通,那就试试馆际借阅系统,你们的图书馆资料员一定乐意帮忙。这项服务可以帮助你轻松简便地定位到你需要的参考资料而无需奔波于图书馆之间,并且该系统一般都非常快速有效。(p50)

索引有助于对一些重要信息进行定位。(p52)

阅读发表在期刊或课本上的文章几乎是你参加所有研究活动中必不可少的环节。事实上,对于研究新手来说,最常见的不足就是他们对所感兴趣的研究领域中的研究报告不够熟悉。想要找到一个完全空白(或缺乏相关研究)的研究领域几乎是不可能的。(p53)

想要获得如何理解研究结果的专业知识,唯一的途径就是阅读并对所理解的东西进行实践。(p53)

研究论文可以采取多种形式,但它们的最高目标就是传达给读者信息。(p54)

谷歌(www.google.com),它是迄今为止被运用最普遍的搜索引擎。输入你要搜索的主题,点击Google Search,就一定会找到你能够利用的资源。(p56)

基于网络的邮件系统例如Gmail变得越来越复杂精致。它们具备的某些特征甚至连精心设计的商业邮箱(例如Outlook)都不具有,例如,当你无法及时打开邮箱并且希望能够自动通知发件人时,可以设置(并且很容易)休假邮件。或者你可以使用Gmail发送邮件并让它看起来好像是通过其他账户发送的一样。非常好用!很多研究者会为每个研究或写作计划创建一个邮箱,以便更有效地分开和追踪邮件。(p64)

在很多情况下,一个过程越简单,就会产生更多的副作用。(p71)

撰写文献综述。现在是时候利用你在本章所学到的所有工具,来获得你所收集到的所有信息,并以某种方式将这些信息组织起来,使它们具有意义。(p71)

你的文献综述并不是要写成一部小说,但大多数优秀的文献综述是在一个一般性的基础上发展成一个更具体的主题,为你的研究目的做铺垫。你应该将读者带入你的情境中去,并使读者对于你将要进行的这项前人没有做过的研究产生一定的兴趣。(p72)

在文献综述的写作中所做的创造性的努力之一就是能够以一个有趣的且富有成效的方式找到两个不同话题之间的结合点。(p71)

通常情况下,你会发现作者的练习时间和篮球运动员或者音乐家的练习时间是大致相同的。事实上,我的一位作者朋友给那些想要写作却不知道写作所要求的参与程度的人的建议是:“只要坐在你的打字机或者文字处理器旁,展开你的思路就可以了。”写作就是这么简单。(p72)

为你的写作制订一个时间表。每天都试着在同一时间(甚至是同一地点)写作。这一例行公事可以让你定期把精力放在写作上,而不是因为你要做的其他事情而分心。例如,你知道周一、周三、周五的上午十点半到正午,这就是写作的时间(没有其他的事)。这样做太容易了。(p72)

了解伦理缺失的历史也许是理解伦理实践的最好方式。(p76)

尽管研究者对他们的研究(以及发表他们的研究成果)显得兴奋和狂热,但是他们需要记住最重要的是研究中所用到的被试是人。不管是在什么样的研究或成果中,这些被试的人格尊严必须得到充分的尊重。是否说起来容易,做起来难?你说的没错。/道德行为的挑战已经形成了一个新的研究领域——伦理学。只要研究者继续利用人或者动物作为被试,那么以下的一些关键问题就应该是我们首先要考虑到的:这些人或者动物是被如何对待的?其在实验中可否获益,哪怕是间接地获益?等等。(p78)

虽然不同学科对伦理准则的应用不同,但所有学科都有共同的伦理准则。(p78)

最重要的研究伦理准则是保障被试的安全并避免伤害。(p78)

保持匿名是维护隐私的最重要的基本伦理准则。隐私保护存在几个问题,最直接的问题是匿名性。在研究背景下的匿名,意味着除了主要研究人员(通常是指导者)以外的任何人没有办法将实验的结果与这些结果相关的参与者相匹配。(p78)

保护隐私的第二种常见做法是不允许研究者进入其他人的私人空间进行行为观察和数据收集。举例来说,尽管秘密地记录下治疗师和他的来访者之间的谈话会获得丰富的信息,但这是不道德的。除非你获得了治疗师以及他的来访者的同意,否则偷偷地记录对话是不合法的。(p78)

强制。无论出于什么理由,都不可以强制人们作为被试参与研究。(p78)

研究的所有参与方都应有机会对研究的本质完全知情。(p79)

知情同意书不需要写得很有学术性和很严谨,越直截了当越好,它的目的是传达信息,而不是强迫或诈骗人们参加实验。(p80)

保密。前面提到的匿名是指实验记录不与被试姓名连在一起,而保密指的是从被试身上获取的任何信息都得到最严格的保护。这就意味着,在需要的时候被试的信息是被修饰过的(这一点也适用于匿名制),但是更重要的是,所有的数据都处在被控制的状态下。(p80)

实践保密最好的方式就是让尽可能少的人看到或者处理实践数据。(p81)

在实验结尾,分享成果的机会必须对被试开放。(p81)

合理欺骗最好的方式就是在该实验阶段结束后立即告诉他们或者给他们发一封邮件告诉他们实验的目的和结果,但是不能把诸如姓名一类的具体信息透露给他们。(p81)

所有的专业组织都有一套伦理准则,随时可供查阅。(p82)

每一个项目的成功取决于你用来选择参与你研究的人群的方法——不论你要为一个问卷分配被试还是你要实施一个会提高老人记忆力的治疗处理。(p87)

取样,或选择被试,是非常重要的。在设计和实施分组的任何一项研究中,一个重要的因素是被试样本选择的准确性。(p87)

好的取样技术应该是能使所抽取的样本最大程度上代表总体。(p87)

总体(population)是一组潜在参与者,你想要通过他们来概括研究结果。样本(sample)是总体的一部分或称一个子集。概化是这样一种游戏:只有当结果能从样本概化到总体时,研究结果的意义才会不受他们最初的研究背景限制。当结果能被概化时,结果就适用于不同背景下的拥有相同人格特征的不同的群体。当结果不能被概化时(选择的样本不是恰好能够代表总体),结果就只适用于参与原始研究的同样的样本中的被试,而不是用于其他。(p87)

概率取样策略是最普遍被使用的一种取样策略,参与者的选择是偶然因素决定的。谁最终将进入样本是由随机规则决定的,这样样本真正代表总体的可能性就会很大。(88)

随机数字表是一个极好的工具,因为表中生成的数字是完全没有偏差的。(p89)

总的规则(这是本章最关键的要点)是所使用的判断依据要与所研究的内容不相关。举例来说道,如果你要做关于志愿活动的研究,那么你是不会想去请教志愿者如何取样的!(p91)

整群指一起发生的一组事件。(p94)

样本容量要足够大才能准确回答所要研究的问题,但是过大的样本容量使取样过程变得不经济和低效率。不管研究者多么努力地去尝试,选择一个能完全代表总体的样本是不可能的。(p95)

减少取样误差是任何取样方法的目标。(p95)

有这样一种说法,实验处理的效应越大(样本之间预期的差异越大),研究所需的样本容量越小。(p96)

在涉及每个实验所需的被试时,30是一个基本的数字。(p96)

除非测量是有效的,不然研究永远不会产生有用的结果。(p100)

如果你所感兴趣的东西是不能被评估、测量、估量、评价、估价、分类、分等级、推测、检查或度量的,那么你所有试图解答这些有趣的问题的工作和努力都是徒劳的。(p100)

测量的经典定义是45年前由一位叫史蒂文斯(S.S.Stevens, 1951)的实验心理学家提出的。他认为测量就是“根据规则给物体或事物指派数字”。(p100)

任何一种测量工具都必须拥有的两种属性:信度和效度。(p100)

称名水平的变量本质上是类别的。(p101)

Nominal level of measurement(称名测量)中的nominal来自拉丁语nomin(名字),用来描述那些属于自然范畴,在质上而不是在量上有差别的变量。也就是,你所测量的变量要能描绘你的观察结果的特性,以便于你能将其归于某一类而且是仅仅这一类。这些类别可以根据你的需要来标记。所有称名测量都是定性的。(p102)

关于称名没理有几条需要记住:第一,各个类别是彼此独立的。一个观察结果不能同时属于两个类别。你不能同时属于犹太教和天主教徒(就算你庆祝光明节也过圣诞节)。第二,如果数字被用来赋值,它们除了用于类别之外没有别的意义。(p102)

顺序变量反映等级。(p102)

比率变量有一个绝对零点。(p103)

离散变量(discrete or categorical variable)就是那些只能被归入某一有明确界限的类别中的变量。例如:性别就是一个离散变量,它包括男和女两个类别;车的品牌也是离散变量,可能包含沃尔沃、雪佛兰和土星等品牌。你可能也注意到,离散变量的值只能是相互独立的。例如,你的研究中的被试不是男就是女。而且,离散变量本质上是称名变量。(p104)

测量工具的信度(一致性)和效度(测得事物本身可行的程度)是非常重要的,因为没有这些属性,你就不能正确地接受或拒绝你的研究假设。(p105)

高水平的新校度是一个好的测验的重要属性。(p105)

信度(reliability)问题就是对某一事物进行多次测验,其测验结果的稳定程度。(p106)

每一个观测值都包含两个部分:真分数和误差分数(见图5-1)。

观测值=真分数+误差分数<方法误差,特征误差。(p106)

真分数(true score)是在没有其他无关变量影响的情况下对某一变量真是值得反映。也就是说,对每一个人来说,他在某一变量上的真分数只有一个。(p106)

误差分数(error score)是造成真分数和观测值产生差异的各种因素的综合。(p106)

对于任何一个变量重复测量所得的分数几乎都是各不相同的。因为所测量的变量的特性,时时刻刻都在变,而且测量的方式也在变(即使变化很小),还不够完美(任何一种测量工具都达不到这点)。(p106)

影响的因素越多,观测值就越不可能接近最终目标——真分数。(p107)

信度=真分数/(真分数+误差分数)

图5-2 信度的概念基础:真分数除以真分数与误差分数之和(p107)

一些提高信度的重要方法:

1.增加题目或观测值的数量。所要测量的行为样本越大,这一样本就越有代表性而且越可靠。

2.剔除表达不清的题目。一个题目如果表达不清楚(不管是什么原因),那么不管其他条件有多好结果都是不可靠,被试可能每次做出的反应都会不同。

3.实施测验的环境要标准化。如果一个小学四年级的学生皮克尼在做某个成就测验,而窗外的扫雪机却在嗡嗡响或者教室的温度很高,那么在这种情境下肯定会影响其测验成绩(与在环境优美静谧的小学做的测验相比),而且也会影响其信度。

4.测验的难度要适中。太难或太简单的测验都不能准确反映一个人的真实成绩。

5.减少外部事件的影响。如果一个特殊的事件(如春假、和平条约的签订、专业课教授的退休等)与测验的时间很接近,就需要推迟测验,这些特殊事件很可能会影响到测验的成绩。

6.测验工具要标准化。一个教室中的比尔和另一个教室中的凯利应该阅读相同的指导语,而且需要在完全相同的条件下参加测验。

7.评分方法要一致。 批阅过包含大量问答题的试卷的人应该知道,批阅第一份试卷和批阅最后一份试卷是非常不同的。因此在评分过程中要尽量地保持一致,即使意味着在一栏中使用分数在另一栏中使用评级。(P108)

信度是某一测验工具的信度而不是指某一个体的信度。(P108)

一般来说,如果第一次测验与第二次测验有相对一致的方向(如第一次测验分数高,第二次也高),那么测验的信度就应该比较高。(P109)

信度是一个概念,但也是一个用来说明某一测量工具或测试有多稳定和多可靠的标准。信度有多种类型但每种都有不同的用处。(P109)

重测信度(test-retest reliability)就是用来说明一个测验随着时间的变化有多稳定。(P109)

重测信度反应随时间的变化测验的稳定性。(P109)

重测信度的一个很重要的影响因素就是两次测验间所间隔的时间长短。(P109)

效度(Validity)也有同义词,如如实性、精确性和真实性等都是效度的同义词,这些词说明了效度是什么,就是你所用的某一测量工具真正测出你所要测量的东西的程度。(P112)

内容效度说明一个测验在何种程度上代表了测验项目的总体,在对成就测验的有用性和对有关某一特定领域的题目样本进行评估时内容效度是很有用的。(P113)

一个测验的内容效度通常通过专家评定来确定。(P113)

效标效度经常用来评价能力测验(当前能力)的效度和能力倾向测验(潜在能力)的效度。(P113)

结构效度的定义是一个测验的结果对某一潜在的心理结构的说明程度。(P114)

编制一个有良好的结构效度的测验的第一步就是确定该测验所依据的潜在的理论结构。(P114)

确立结构效度的另一种方法是运用多质多法矩阵(multitrait-multimethod matrix),这是一种对技术要求非常高的方法。(P115)

多质多法矩阵的优点是什么呢? 在确定一个测验的效度时它是很有用的,因为他是直接将已经存在的测量方法和研究过程中应用的测验进行了比较。(P115)

一个测验可以是稳定但无效的,但不可以是有效而不稳定的。(P116)

一个测验能够很可信很一致地测出某一结果,但除非这些结果能够说明研究的问题,否则他就是无效的。(P116)

研究过程中要选择一个很好的信度和效度的测验。如果找不到这样的测验,就需要根据你的论点编织一个或者改变你所要测量的内容以便于能够确保你也所要研究的问题能够以一种公平、公正的方式得以解决。(P117)

小结: 测量过程是实现研究计划的一个至关重要的部分,研究计划的这一部分非常重要是因为没有很好的信度和效度的测验对任何人、任何研究都是没用的。采用一种质量很差的测量工具会误导你,使你永远都测不出你所要测量的东西。要努力寻找那些已经被真是有很好的信度和效度的工具,这样会使你节约很多时间,避免很多麻烦。(P117)

2 thoughts on “881.摘抄:《心理学研究方法》(1-5章)”

Leave a Reply to wys Cancel reply

Your email address will not be published. Required fields are marked *