單元二十一(測驗(yàn)結(jié)果的解釋、信度、效度、項(xiàng)目分析)
1
導(dǎo)出分?jǐn)?shù)
通過統(tǒng)計(jì)方法由原始分?jǐn)?shù)轉(zhuǎn)化到量表上的分?jǐn)?shù)叫做導(dǎo)出分?jǐn)?shù)。
2
常模團(tuán)體
常模團(tuán)體是由具有某種共同特征的人所組成的一組群體,或是該群體的一個(gè)樣本。它用一組標(biāo)準(zhǔn)的、規(guī)范的分?jǐn)?shù)表示出來,以提供比較的基礎(chǔ)。
3
常見的常模參照分?jǐn)?shù)
(1)發(fā)展量表(智力年齡、年級當(dāng)量、發(fā)展循序量表)
(2)商數(shù)(比率智商、教育商數(shù))
(3)百分位(百分等級、百分位數(shù)、十分位)
(4)標(biāo)準(zhǔn)分?jǐn)?shù)
4
T分?jǐn)?shù)
一種標(biāo)準(zhǔn)分?jǐn)?shù),以50為平均數(shù),以10為標(biāo)準(zhǔn)差,T = 50 + 10Z
5
常模參照測驗(yàn)
一個(gè)人的分?jǐn)?shù)通過與其他人的分?jǐn)?shù)進(jìn)行比較來解釋,并能表示成在某個(gè)比較團(tuán)體內(nèi)的相對等級。
6
標(biāo)準(zhǔn)參照測驗(yàn)
一個(gè)人在測驗(yàn)上的成績不是和其他人比較,而是和某種特定的標(biāo)準(zhǔn)比較。
7
內(nèi)容參照分?jǐn)?shù)
標(biāo)準(zhǔn)參照測驗(yàn)的一種標(biāo)準(zhǔn)是對測驗(yàn)所包含的材料熟練或掌握的程度,涉及的主要是測驗(yàn)內(nèi)容,這種分?jǐn)?shù)叫內(nèi)容參照分?jǐn)?shù)。
8
結(jié)果參照分?jǐn)?shù)
標(biāo)準(zhǔn)參照測驗(yàn)的一種標(biāo)準(zhǔn)是外在效標(biāo),即用預(yù)期的校標(biāo)成績來解釋測驗(yàn)分?jǐn)?shù),涉及的是后來的結(jié)果,叫結(jié)果參照分?jǐn)?shù)。
9
幾種內(nèi)容參照分?jǐn)?shù)
掌握分?jǐn)?shù)、正確百分?jǐn)?shù)、等級評定表
10
結(jié)果參照分?jǐn)?shù)優(yōu)點(diǎn)
結(jié)果參照分?jǐn)?shù)主要優(yōu)點(diǎn)是使我們能用預(yù)期的效標(biāo)行為的水平去解釋分?jǐn)?shù),特別適用于預(yù)測情況。
11
信度
信度是指測量的一致性或可靠性程度,一個(gè)好的測量工具必須穩(wěn)定,每次測量的結(jié)果要保持一致。
12
信度系數(shù)
大部分的信度指標(biāo)都以相關(guān)系數(shù)表示,即用同一被試樣本所得的兩組資料的相關(guān)行為作為測量一致性的指標(biāo),稱作信度系數(shù)。
13
重測信度
用同一種測驗(yàn),對同一組受試者,前后施測兩次,再根據(jù)受試者兩次測驗(yàn)分?jǐn)?shù)計(jì)算其相關(guān)系數(shù),即得重測系數(shù),又稱穩(wěn)定性系數(shù)。
14
副本信度
如果一種測驗(yàn)有兩個(gè)以上的復(fù)本,根據(jù)一群受試者接受兩個(gè)復(fù)本測驗(yàn)的得分計(jì)算相關(guān)系數(shù),即得副本信度。
15
分半信度
將測驗(yàn)題目分成對等的兩半,根據(jù)各人在這兩半測驗(yàn)的分?jǐn)?shù),計(jì)算其相關(guān)系數(shù),經(jīng)過適當(dāng)校正后,來作為信度的指標(biāo),稱為分半信度。
16
同質(zhì)性與因素分析
因素分析是決定測驗(yàn)同質(zhì)性的最好方法。
17
評分者信度與肯德爾和諧系數(shù)
隨機(jī)抽樣相當(dāng)分?jǐn)?shù)的試卷,由兩位評分者按計(jì)分規(guī)則分別給分,然后根據(jù)每份試卷的兩個(gè)分?jǐn)?shù)計(jì)算其相關(guān)系數(shù),即得評分者信度。
肯德爾和諧系數(shù)多用于評分者信度分析。
18
效度
效度指的是測量的正確性,即一個(gè)測驗(yàn)或量具能夠測量出其所要測量的東西的程度。
19
三種測驗(yàn)效度
內(nèi)容效度、構(gòu)思效度、效標(biāo)效度
20
內(nèi)容效度
內(nèi)容效度指的是測驗(yàn)題目對有關(guān)內(nèi)容或行為規(guī)范取樣的適當(dāng)性,這種測驗(yàn)的效度主要與測驗(yàn)內(nèi)容有關(guān)。
21
表面效度
表面效度是由受測者、使用測驗(yàn)者的行政人員及其他沒有受過專門訓(xùn)練的觀察者來看,這個(gè)測驗(yàn)是否有效,也就是從表面來看測驗(yàn)題目與測量目的是否一致。
22
構(gòu)想效度
構(gòu)想效度就是測驗(yàn)對某一理論概念或特質(zhì)測量的程度。
23
效標(biāo)效度
也叫實(shí)證效度,是指一個(gè)測驗(yàn)對處于特定情景中的個(gè)體的行為進(jìn)行預(yù)測時(shí)的有效性,也就是對于研究者所感興趣的行為能夠預(yù)測得怎么樣。
24
效標(biāo)
效標(biāo)是衡量測驗(yàn)有效性的參照標(biāo)準(zhǔn),指可以直接而且獨(dú)立測量的、研究者感興趣的行為。
25
正命中率
正命中率等于利用測驗(yàn)錄取的合格者人數(shù),與全體錄用者人數(shù)之比。
26
難度
難度指項(xiàng)目的難易程度,難度的指標(biāo)通常以通過率表示,即以答對或通過該題的人數(shù)的百分比來表示。
27
區(qū)分度
區(qū)分度指測驗(yàn)項(xiàng)目對所測量的心理特性的區(qū)分程度或鑒別能力,也稱項(xiàng)目的效度。
28
區(qū)分度與難度的關(guān)系
一般說來,較難的項(xiàng)目對高水平被試區(qū)分度高,較易的項(xiàng)目對水平低的被試區(qū)分度高,中等難度的項(xiàng)目對中等水平的被試區(qū)分度高。
1常模團(tuán)體條件
常模團(tuán)體是由具有某種共同特征的人所組成的一組群體,或是該群體的一個(gè)樣本。它用一組標(biāo)準(zhǔn)的、規(guī)范的分?jǐn)?shù)表示出來,以提供比較的基礎(chǔ)。常模團(tuán)體的條件是:
(1)群體必須明確
(2)常模團(tuán)體必須是所測群體的代表性樣本
(3)樣本大小要適當(dāng),一般從經(jīng)濟(jì)的或?qū)嵱玫目赡苄院蜏p少誤差這兩方面來綜合考慮
(4)注意常模的時(shí)間性,必須定期修改,注意選擇較為新近的常模
(5)注意一般常模與特殊常模的結(jié)合
2影響信度的因素
信度是指測量的一致性或可靠性程度,一個(gè)好的測量工具必須穩(wěn)定,每次測量的結(jié)果要保持一致;影響信度的因素有:
(1)受試者方面:身體健康狀況、動(dòng)機(jī)、注意力、持久力、求勝心、作答態(tài)度等。
(2)主試者方面:不按規(guī)定實(shí)施測驗(yàn),制造緊張氣氛,給予特別協(xié)助,評分主觀等。
(3)測驗(yàn)內(nèi)容方面:試題取樣不當(dāng),內(nèi)部一致性低,題數(shù)過少,題意模糊等。
(4)施測情景方面:測驗(yàn)現(xiàn)場條件,如通風(fēng)、溫度、光線、噪聲、桌面好壞等。
(5)其它:被試樣本、測驗(yàn)難度、間隔時(shí)間等。
3影響效度的誤差來源
效度指的是測量的正確性,即一個(gè)測驗(yàn)或量具能夠測量出其所要測量的東西的程度。影響效度的誤差來源有:
(1)測驗(yàn)組成方面:測驗(yàn)的取材和代表性、測驗(yàn)長度、試題區(qū)分度、難度及編排方式等。
(2)測驗(yàn)實(shí)施方面:場地布置、材料準(zhǔn)備、作答方式的說明、時(shí)間的限制等。
(3)被試反應(yīng)方面:被試得興趣、動(dòng)機(jī)、情緒、態(tài)度和身心健康狀況等。
4具備內(nèi)容效度的條件
內(nèi)容效度指的測驗(yàn)題目對有關(guān)內(nèi)容或行為范圍取樣的適當(dāng)性,這種測驗(yàn)的效度主要與測驗(yàn)內(nèi)容有關(guān),所以叫內(nèi)容效度。一個(gè)測驗(yàn)要有內(nèi)容效度必須具備兩個(gè)條件:
(1)要有定義得完好的內(nèi)容范圍;
(2)測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。
5確定內(nèi)容效度的方法
(1)專家判斷:請有關(guān)專家對測驗(yàn)題目與原定內(nèi)容范圍的符合性作出判斷。
(2)統(tǒng)計(jì)分析:若一組被試在兩個(gè)測驗(yàn)復(fù)本上得分相關(guān)高,一般可推論測驗(yàn)有內(nèi)容效度。
(3)經(jīng)驗(yàn)法:若測驗(yàn)總分和題目通過率隨年級而提高,便是測驗(yàn)具有內(nèi)容效度的證據(jù)。
6效標(biāo)測量的條件
校標(biāo)測量是對校標(biāo)進(jìn)行操作性測量的指標(biāo),一個(gè)好的效標(biāo)測量必須具備以下幾個(gè)條件:
(1)有效性:效標(biāo)測量必須能真正反應(yīng)觀念效標(biāo)。
(2)可靠性:效標(biāo)測量必須具有較高的信度。
(3)客觀性:采用判斷性的效標(biāo)測量,必須控制偏見,使評定過程盡可能客觀。
(4)實(shí)用性:效標(biāo)測量應(yīng)盡可能用法簡單,省時(shí),花費(fèi)少,經(jīng)濟(jì)實(shí)用。
7影響效標(biāo)效度的因素
(1)測驗(yàn)的長度:增加測驗(yàn)的長度,能夠提高測驗(yàn)的信度,以及效度。
(2)被試的取樣:樣本必須是測驗(yàn)所要應(yīng)用團(tuán)體的較好代表。
(3)所用的效標(biāo):效標(biāo)測量的可靠性,效標(biāo)和測驗(yàn)分?jǐn)?shù)的關(guān)系類型都會影響效標(biāo)效度。
(4)干涉變量:同一測驗(yàn)對于具有不同特征的團(tuán)體其效度可能有很大不同。