882.摘抄:《心理学研究方法》(6-9章)

在大多数研究环境中,评估工具必须适应目标受众的能力和技能。(P121)

一般而言,运用测验的目的是测量个体差异的本质和程度。(P121)

一个好的测验应该能够根据真分数可靠地区分个体之间的差异。(P122)

成就测验用来评估个体在某个内容领域的专业水平。(P124)

成就测验有两种基本类型:标准化测验(standardized tests)和研究者自编测验(researcher-made tests)。/成就测验还可以分为另外两种类别:常模参照测验(norm-referenced tests)和标准参照测验(criterion-referenced tests)。(P124)

到目前为止,选择题是应用最广泛的成就测验的题型。(P125)

选择题是测量个体在某个领域所具有的知识水平的理想工具。(P125)

选择题的内容必须反映学习的内容和目标。 选择题的题量应该能够反映出某一课程的学识。(P125)

为什么使用27%这个数字,因为这是能最大化区分两组的数量。你要通过计算难度和区分度

有没有评判一道选择题好坏的指标呢?有!项目分析(item analysis)就有两个指标:难度指标(difficulty index)和区分度指标(discrimination index)。它们是评判选择题有效性的两个独立的、互补的指标。有了这两个重要的工具,你可以轻松地评价一个题目的价值,从而可以决定该题是可以保留在题集里还是需要修改甚至删除。(P126)

指标对成绩优异和成绩不好的两组进行比对。(P126)

态度测验主要用于评估个体对于人事物的感受。(P128)

瑟斯顿量表最大的一个优点,就是它非常接近等距量表(详见第5章),因为评判者对题目是按照相等的距离来进行评分的,这能反映出心理上的差距。因为这个原因,瑟斯顿量表法也被称为等高间距法(method of equal-appearing intervals)。(P129)

李克特量表(Likert scale)是广泛使用的比较容易设计的量表(Likert,1932)。虽然与瑟斯顿量表在结构上有一点相似,但是李克特量表的设计比较节省时间。(P129)

由于要计算总分,所以李克特量表又被称为累加评定法(method of summated ratings)。(P130)

人格测验有两个基本的类型:投射测验(projective tests)和结构化测验(structured tests)。投射测验给被试呈现一些模棱两可的模糊的刺激,然后要求被试对这些刺激机体反应。投射测验假设被测试的个体会对刺激物投射(施加)自己的内心世界的看法。受过培训的施测者可以对这些反应进行评价。(P131)

投射测验主要有主题统觉测验和罗夏测验。(P131)

要记住观察法最重要的一点就是,为什么观察法对于其他学科的科学家来说非常有用。因为,他们的主要目的就是在无干扰的情况下观察和记录行为。作为一名观察者,在观察行为时,你应该尽全力的远离所观察的行为,不要去影响和干扰行为。(P131)

大部分时候,观测者想要远离所观察的行为以便他们的出现不会影响到他们所观测的现象。(P131)

行为记录法。用于观察和记录行为的方法有很多,这些方法一般可以分为四种类型:持续时间记录、频次记录、实际记录和连续记录。(P131)

没有任何一种评估行为的方法是完美无瑕的,它们都有潜在的一些问题,这些问题可能让你的所有努力付之东流。(P132)

(问卷)附函最好要有大人物和你自己的签名。尽管你可能只想签自己的名字,但是在你职业生涯的早期,有大人物的签名可以帮助你产生更好的效果。(P136)

小结: 在当前社会,用于选拔和筛选的各类测验比比皆是。测验的使用已经成为社会和行为科学家们争论的话题之一。当然,测验有它自己的地位。这一章我们讨论了各种类型的测量工具,以及如何使用这些工具对行为进行可靠和有效的评估。要想使用这些测量方法得到准确的结果你需要谨记它们的基本假设和使用的注意点。(P136)

描述我们的观察并记录这些观察痛,但是我们开始量化研究的第一步。(P139)

数据收集过程包括四个步骤:

1.建构一个数据收集表来组织你收集的数据。

2.运用编码策略,为数据收集表中的数据命名或赋值

3.把收集到的数据集中起来.

4.把数据输入数据收集表中。(P139)

建构数据收集表。当你已经知道了要收集哪些信息和从哪里收可以收集到这些信息(这是研究的关键部分),下一步你就该考虑制定一个记录信息的结构模式,也是你更加方便地对数据进行统计分析,从而证明你的假设。(P140)

设计一个有效的数据收集表的关键是数据收集过程中计划的制定情况。(P141)

即使是遇到不用项目分析的问卷,你也一样可以使用一些软件来帮你表征一个结果的特定输出形态。(P142)

越是高级的测量手段,它所传递的信息将会越丰富。/ 进行数据编码(coding)时要遵循一条准则,即选择的代码既要能最大限度地降低数据的凌乱度,又要能清楚准确地代表变量的含义,不能使数据失去其本身的含义。(P143)

一旦你习惯于忽略潜在的臂式,那么你的样本量就会不断减少。(P144)

永远不要丢弃原始数据,如测验小册、访谈记录等等原始资料。(P144)

你是否曾想象过你不得不参加一门课程,在这门课程中统计这个令人生生畏的词是总是一遍又一遍地出现。好吧,马上你就要开始学习研究过程中这个有趣的环节了,通过学习,你可能会喜欢上一组强大的统计工具。由于在这个研究过程中会出现许多令人焦虑和不安的情况,这里会给你一些指示,以确保你不会成为甚至没有尝试就说“我做不了”的人。(P145)

记住,统计最重要的是理解和运用一些简单和基本的假设。统计并不是高等数学。学习它其实是一个循序渐进的过程,它能帮助你思考如何采取特殊手段解决特殊问题。它是很酷的解决问题的方式,他能带给你前所未有的洞察。(P145)

当一组分数是称名数据时,最适合用众数衡量集中趋势,如性别。(P147)

当一组分数分布得不均匀或不平衡时,最好选择中数来描述其集中趋势。(P148)

在一般的研究报告中很少会提到众数(因为描述称名变量的集中趋势意义不大),但是众数却是唯一能够很好地代表称名变量集中趋势的值。(P148)

变异性(variability)是指分数分布中分数彼此理解的程度。它也可以用来衡量两组拥有相同平均数的分数的差异程度,例如,数列1、3、5、7、9的离散程度远远高于数列3、4、5、6、7的离散程度,即使他们拥有相同的平均数5。即使平均数相同,不同的数列也会有不同的分数分布情况。例子中前一个数列的离散程度就高于后一个数列。(P151)

全距(range)是把一组分数按从小到大的顺序排列,用最大值减去最小值所得的数。它是说明分数离散程度的最简单、最直接的统计量。(P151)

标准差(standard deviation)是最常用的描述分数分布离散程度的差异变量,也是统计软件中最常出现的表示分数集中趋势的统计量。标准差(用s表示)是分数分布中所有原始分数与平均数离差绝对值的平均值。标准差越大,一组分数的离散程度就越高,如果数列中每一个单一的分数都是相同的,例如数列10,10,10,10,那么这组分数就没有差异性,标准差为0。(P151)

在计算标准差的过程中,你会发现一些很有趣的数字。比如说离均差的和。你知道为什么它恒定为0吗?因为平均数所代表的意义使得离均差的和恒等于0。(P152)

标准差的平方是方差,方差的正平方根是标准差。方差用s2表示。(P152)

事实上,许多推论统计(详见第8章)的前提条件都是假设样本分数呈正态分布。(P153)

你能看到正态曲线是对称的。(P154)

z分数是原始分数与该组分数的平均数的差除以标准差所得到的结果,即表示原始分数在平均数上下几个标准差的位置。/计算z分数的公式如下:

z=。(P155)

标准分数最大的价值在于它可以用于比较不同数列中分数之间的差异性。(P155)

原始分数不能仅仅通过相加求平均数来进行比较。(P156)

z分数能够表明原始分数在分数分布中的相对位置。(P156)

z分数不仅能用于比较来自不同分布的分数之间的差异性,还能够用于预测某一分数出现的概率。(P156)

小结: 有的人喜欢收集数据,而有的人却认为这是一个枯燥乏味的过程。但是无论如何,这都是一个需要花费时间和精力的工作。所有的准备工作已经完成,你把数据集中在一起准备进行系统计处理。你进行数据收集,将它们转录到数据收集表中,并运用了一些描述统计量来描述这些数据的基本特征。你并不仅仅满足于计算出平均数,但是你至少知道了该如何继续处理和使用你的数据。(P157)

所谓的推论统计就是如何根据你所收集来的较少的样本信息推断出样本所来自的总体的相应信息。(P160)

如果说描述统计是用来描述样本特征的方法,那么推论统计就是根据将本的描述性特征来推断样本所来自的总体的相应信息的一种方法。(P160)

可以说样本的代表性越好,根据样本信息所得出的结果就会越可靠。(P160)

偶然性的作用。当对所涉及的变量之间的关系一无所知时,偶然性总是能够对可能存在的任何关系做出最佳的解释。为什么?因为在没有其他信息的情况下,偶然性就是最合理的解释。(P161)

偶然性就是产生了变异,而这种变异却无法用你所研究的变量进行解释。(P161)

作为一个研究者最主要的任务就是减少偶然因素在理解变量之间关系时所起的作用,而这主要是通过控制可能存在的变异来源(比如在前面介绍的实验中引起差异的因素有年龄等等)来实现的。(P161)

从很多方面看中心极限定理是推论统计的基础。(P161)

中心极限定理认为不管总体分布形状如何(是正态分布或者不是),从总体中抽取的所有样本的平均数的分布都将是正态分布。(P161)

(中心极限定理)这个定理成功操作的关键之一是样本容量必须大于30。如果样本容量小于30,你需要运用非参数统计或是做任意分布法,这些统计方法不就正态分布的约束。(P161)

中心极限定理是一个很重要的定理,它充分揭示了在样本所属总体确实不服从正态分布的时候,推论统计的强大作用。由于该定理的存在,人们可以根据正态分布的特征对总体的信息进行推论。这个事实说明了中心极限定理推论统计提供了足够的灵活性。从许多方面讲,它也是实验研究的基础。(P163)

统计显著性(statistical significance)就是你愿意冒风险的水平,也就是当虚无假设正确时,你却拒绝它而犯错误的概率。(P164)

比如在上面的例子中,虚无假设是两群体之间不存在差异(记住,虚无假设总是以等式的形式表达)。但是,在给你们的数据中,你发现差异确实存在。也就是,说考虑到目前为止你所拥有的证据,学前教育的经历是乎对你学习成绩有影响。但是在真实的世界中却可能没有影响,如果你拒绝了虚无假设,你将犯一个错误。此类错误就是我们所熟知的I类错误(Type I error)。(P164)

犯I类错误的概率和统计显著性水平是同一个概念。(P164)

增加样本容量可以减少犯II类错误的概率。(P165)

推论统计最大的优势是可以根据样本信息对总体信息作出推论。统计显著性检验(test of statistical significance)是实践推论的最有用的方法之一,我们可以根据所提出问题的性质和虚无假设的形式来决定使用哪一种类型的检验。(P165)

为了决定统计检验要达到显著性所需的临界值,你必须知道两件事情:检验研究假设所在的显著性水平(在这个研究中是0.05)和反应样本容量的自由度(degrees of freedom,在这个研究中是320)。你需要知道样本容量,因为随着样本容量的改变,临界值也会随之改变。(P167)

如果虚无假设不能被拒绝,那么你就可以认为两个变量之间没有关系。(P173)

取样误差是永远存在的一个威胁。你的任务就是在样本检验过程中,将取样误差带来的差异和真正的差一分开。(P173)

某种程度上,多元方差分析类似于做一系列组件的t检验。两种技术之间最主要的区别是多元方差分析要考虑因变量之间的关系。(P173)

用多重t检验是十分冒险的,因为你将会提高你正在设计的I类错误的水平。(P173)

因素分析(factor analysis)是另一种先进的技术,它允许研究者减少代表某一概念的变量的数目,用得分较高的因素作为因变量。变量之间的关系越密切,代表整个变量矩阵所需的变量数越少。(P173)

质性研究着重与经验的性质和自然性,而不是关注数字和统计检验的结果。这是值得我们记住的。(P175)

原分析是一种非常有效的技术,它可以将使用相同因变量来考察同一主题的不同研究结合在一起。(P175)

元分析这一术语最早是由格拉斯(Gene Glass)在1976年提出的。他打算使之成为一种可以整合独立实验研究结果的方法。元分析期望可以将大量有关某一特定现象的不同信息进行整合。记住,元分析的研究和分析的数据来自已经实施过的实验而不是收集新数据然后再分析。实际上,在做元分析之前,研究的一部分工作已经完成了。(P175)

【读中感悟:知识是一个立体结构,天文、地理、生物、科技等都呈立体分布,有交叉,各有侧重,共同组成一个实体的文化模型。科学研究就其中,找自己感兴趣的一部分,望闻问切了解,研究,企图有新发现。(P175)】

在原分析中,效应量反映的是因变量的影响。(P176)

元分析技术的伟大之处在哪里?一是元分析和其他好的研究一样,能够组织数据并且帮助我们理解数据的意义。想象一下375个研究,每一个研究的结果都被罗列在列表中,再想象一下从这些研究的结果中得出一个普遍的有效的结论有多难。假设一些研究涉及非常小的儿童,其他一些研究涉及婴儿,一些检验社交技巧,一些检验智商等等,结果可能是混杂的。 但是元分析能减少这种混杂,使之成为容易理解的事物。(P176)

小结: 这一章主要简单介绍了推论统计以及讨论这个概念如何提供了一些有力的作出决策的方法。在前面两章,你先学习了数据的收集,然后学习了检验数据的模式比如差一检验和相关性检验。现在你要做好准备去探究另一个领域。它是研究方法中要使用的许多设计模型中的第一个:非实验研究设计的方法。(P176)

描述研究与因果关系比较研究或称实验研究(在第11章具体讨论)间的最显著的差别在于,描述研究不设处理组和控制组,你无需检验任何变量对其他变量产生的影响。换句话说,所有你要为你研究报告的读者做的,只是描绘一幅画面。而当人们阅读了一份使用了我们将要讨论的任何一种描述研究方法的研究报告后,他们对于发生了什么可能会想象出一幅更大的画面。(P181)

访谈。调查研究所使用的最基本的工具就是访谈(interview)。访谈(或称口头问卷)可以采取从最不真实的街头问答会话的方式,到详述访谈者和受访者之间互动的高度结构化的方式。实际上,许多关于问卷的要点同样也适用于访谈。(P181)

大多数的访谈是从被称为表层信(face-sheet information)或是中性信息开始的,其主要涉及应答者的年龄、居住安排、子女数量、收入、性别和教育水平等。这些信息能帮助访谈者完成许多事情。(P181)

访谈包含两种基本类型的问题:结构化的以及非结构化的问题。结构化(structured)或称封闭式(closed-ended)问题须有清楚、明确的焦点,并且需要给予明确的回答。对于它们,访谈者和受访者须有同样的理解。如“你多大开始抽烟?”或“你来过这家商店多少次?”这样的问题,就需要明确的答案。与此同时,非结构化(unstructured)或称开放式(open-ended)问题,就允许受访者详细地做答。此类问题如“为什么你反对第一次海湾战争?”或“你是怎么看待早孕问题的?”,就需要受访者做出更加广泛地回答。(P182)

变量间的相关关系。评估关联度的最常用的测量指标是相关系数,它是一个反应两变量间的相关的数字。它的大小用-1.00到+1.00之间的数来表示,它在强度上,会随着一个变量同一个变量共有的变异的增加而增加。也就是说,两个事物共同性越多(就像一对双胞胎),他们之间的相关程度越强(只有这样才讲得通)。 如果你和某人有共同的兴趣,那么你们之间的行动的相关性就很有可能超过你和那些同你没有任何共性的人。/ 例如,你很可能会发现手指灵活性的测试分数和手-眼协调的测试分数之间要比手指灵活性和人的身高之间具有更强的相关。(P186)

有趣的是,相关系数重要的特性并不是他的符号,而是它的绝对值。(P186)

(你和Excel—用工具包计算相关系数)在你使用任何统计分析包之前,熟悉一下手动运算这些值的步骤,保证你理解这些值都代表什么?(P190)

解释皮尔逊相关系数。相关系数是一个有趣的指标。它反映了变量间的相关程度,但要解释到如他所代表的一样,又相对比较困难。就是偏心相关系数。(P190)

解释相关系数的另一合理的方法就是对其值进行平方,计算其决定系数(coefficient of determination)。(P191)

可解释的变异量的增加并不是线性的,而是相关越高,可解释的变异量“跳跃”得越高。(P191)

小结:非实验–描述或相关–设计对你是否适合?这并不是一个真的需要回答的问题。相反,你应要问的是你所感兴趣的课题是否要到描述法所提及的工具。正如先前所强调的,所提出的研究问题决定了他的回答方式。如果你想要调查1930年代俄克拉荷马的居民是怎样抚养小孩的,或者孩子的抚养方式是怎样变化的,历史编撰学可能比较适合你。那么描述法可以提供什么?他能够提供对事件的一个说明,通常是如此详细以至于可以作为提出和回答其他问题的跳板。个案研究、发展研究(developmental research)和相关研究,无论对于什么研究对象,都以一种表达全景的方式,描述出特定的图像。尽管这些研究方法并不能奢侈地允许我们揭示变量间的因果关系,但是它们提供的工具却能够回答其他研究方法所不能够回答的问题。(P191)

2 thoughts on “882.摘抄:《心理学研究方法》(6-9章)”

  1. 从摘抄来看,感觉这本书的理论性比较强,虽然没看过这本书,但是从文字风格来看应该是翻译过来的吧hhhh

Leave a Reply

Your email address will not be published. Required fields are marked *