![]()
![]()
(1)效度(Validity)
是指測量數(shù)據(jù)的真實(shí)性和準(zhǔn)確性,即變量的操作定義能否反映原始概念的基本定義。效度代表了測量結(jié)果與真實(shí)情況或現(xiàn)象本質(zhì)的接近程度,越靠近真實(shí)本質(zhì),效度越高。由于效度反映的是對事物本質(zhì)的揭示程度,因此無法在短時(shí)間內(nèi)獲得,需要經(jīng)歷一個(gè)過程。
![]()
(2)效度的類型及具體操作
① 表面效度(Face Validity)
表現(xiàn)效度反映了研究者想測量的構(gòu)念(construct),即實(shí)證測量的結(jié)果與我們的共識或我們頭腦中印象的吻合程度。表面效度體現(xiàn)于測量方法反映了研究者想要測量的構(gòu)想。
具體操作:表面效度主要取決于人們對測量內(nèi)容的主觀判斷,判斷測量結(jié)果是否具有表面效度。例如,在測量人們普遍認(rèn)為的“自尊心”強(qiáng)弱時(shí),可以通過詢問被調(diào)查者是否認(rèn)為自己的能力強(qiáng)于他人來進(jìn)行,因?yàn)閺囊粋€(gè)人對自己能力的主觀評價(jià)可側(cè)面反映其“自尊心”強(qiáng)弱,這種測量“自尊心”的方法就具有表面效度。
② 效標(biāo)關(guān)聯(lián)效度(Criterion - related Validity)
效標(biāo)是一個(gè)與量表有密切關(guān)聯(lián)的獨(dú)立標(biāo)準(zhǔn),效標(biāo)關(guān)聯(lián)效度指測驗(yàn)分?jǐn)?shù)與效標(biāo)之間的關(guān)系。可以將量表所測指標(biāo)看成因變量,效標(biāo)看成自變量,所測指標(biāo)與效標(biāo)相關(guān)性越高,量表效度越高,可分為預(yù)測效度和同時(shí)效度。
預(yù)測效度方面,若某新測量方法獲得的數(shù)據(jù)能幫助研究者預(yù)測被調(diào)查者行為,則該測量方法具有預(yù)測效度。比如研究招聘測試對員工未來工作表現(xiàn)的預(yù)測能力,通過對比新員工招聘測試成績和后續(xù)工作績效評估結(jié)果來判斷。同時(shí)效度方面,若研究者使用新舊兩種測量方法分別搜集同樣數(shù)據(jù),兩種方法獲得數(shù)據(jù)高度相關(guān),則新測量方法具有同時(shí)效度。例如對比新舊教學(xué)評估工具對同一組學(xué)生教學(xué)情況評估結(jié)果的相關(guān)性。
③ 建構(gòu)效度(Construct Validity)
也稱構(gòu)念效度,研究者使用建構(gòu)效度確保當(dāng)前測量方法測量的是真正想要測量的內(nèi)容,通過與理論預(yù)測相符的證據(jù)體現(xiàn),建立在對同一對象使用不同測量方法檢驗(yàn)研究建構(gòu)效度上。
例如測量市民素質(zhì)(自變量X)與不文明行為(因變量Y)關(guān)系時(shí),X引出“受法規(guī)約束(X1)”和“受教育啟發(fā)(X2)”兩個(gè)變量指標(biāo)。通過測量證實(shí)市民受法規(guī)約束后不文明行為減少,證明市民受法規(guī)約束有效性,同時(shí)證明市民受教育啟發(fā)有效性,由此認(rèn)定X2具有與X1同樣測量效果,X2可替代X1測量,新指標(biāo)X2建構(gòu)效度成立。
![]()
④ 內(nèi)在效度(Internal Validity)
指特定研究中的資料及其結(jié)論的有效性,表明研究過程沒有內(nèi)在誤差,其他變量不能解釋研究結(jié)果。
若在具體研究中檢測出表面效度、效標(biāo)關(guān)聯(lián)效度、建構(gòu)效度等測量效度,則該研究具有一定內(nèi)在效度。對內(nèi)在效度的威脅主要來自研究過程、研究者和被研究者的影響。
⑤ 外在效度(External Validity)
指特定研究結(jié)論的普遍有效性,研究具有外在效度說明其結(jié)果可以推廣到其他情境中,反之則不具有概括性。
例如在中國一些城市抽取幾百名大學(xué)生進(jìn)行研究,要判斷結(jié)論是僅適用于這些大學(xué)生,還是適用于中國其他城市或其他國家的大學(xué)生,需考慮研究的抽樣、人工環(huán)境等因素對外在效度的影響。
![]()
(3)信度(Reliability)
信度是相對于測量的穩(wěn)定性和一致性而言的,指的是測量數(shù)據(jù)(或資料)與結(jié)論之間的可靠程度。當(dāng)采用同一方法對相同對象進(jìn)行反復(fù)測量時(shí),能得出相同結(jié)果的程度越高,信度就越高。
![]()
(4)信度的類型及具體操作
![]()
① 重測信度(Test - retest Reliability)
體現(xiàn)不同時(shí)間獲得的同一研究對象的測量數(shù)據(jù)之間的關(guān)系或相關(guān)性的指標(biāo)。
具體操作:用數(shù)字表示重測信度,相關(guān)系數(shù)越大,兩次測量一致性程度越高。相關(guān)系數(shù)數(shù)值在0到1之間,1.0表示同一被試者在兩次測量中反應(yīng)完全一樣,0表示兩次測量數(shù)據(jù)無關(guān)系。例如在對大學(xué)生如何看待所在大學(xué)形象考察中,特萊德威爾和哈里森測量學(xué)生對三種校園信息媒介參與程度,先測量一組學(xué)生,七天后再測,獲得三種校園信息媒介重測信度分別為0.79、0.86和0.76,說明測量方法在測量學(xué)生對校園不同信息媒介參與度方面有信度。
② 復(fù)本信度(Alternate - form Reliability)
又稱等值性系數(shù),以兩個(gè)等值但題目不同的測驗(yàn)(復(fù)本)測量同一群體,求被試者在兩個(gè)測驗(yàn)上得分的相關(guān)系數(shù)。
將一套測量規(guī)則進(jìn)行復(fù)制,設(shè)計(jì)兩套或兩套以上精確度完全一樣的測量規(guī)則,使與原本規(guī)則在內(nèi)容、項(xiàng)數(shù)、重點(diǎn)、問題方向、難易程度、分辨力等方面一樣,只是使用詞語或語氣有所區(qū)別,形成測量復(fù)本。如學(xué)校考試出的A、B卷就是復(fù)本近似例子。
③ 折半信度(Split - half Reliability)
在無復(fù)本且不準(zhǔn)備重測情況下,通過使用兩個(gè)不同內(nèi)容但具等同效果問卷測得的信度,可查出問卷或量表所詢問問題是否針對同樣研究內(nèi)容。
將單、雙數(shù)分成兩半來計(jì)分,根據(jù)每人分別在這兩部分的總分計(jì)算所得相關(guān)系數(shù)。在較高程度結(jié)構(gòu)化和標(biāo)準(zhǔn)化測量中,被調(diào)查者、調(diào)查者、測量內(nèi)容等因素會產(chǎn)生影響,隨機(jī)誤差越小信度越高,非結(jié)構(gòu)化和非標(biāo)準(zhǔn)化測量中研究者主觀因素也會影響信度。可通過改寫問卷表述不清地方、指導(dǎo)被調(diào)查者填答、對搜集數(shù)據(jù)處理前編碼練習(xí)等方法提高信度。
![]()
(5)效度和信度的關(guān)系
信度和效度都是科學(xué)測量工具所必須滿足的條件,但二者之間存在以下幾種關(guān)系:
①信度低時(shí),效度不可能高。因?yàn)槿绻占馁Y料或測量的數(shù)據(jù)不夠準(zhǔn)確,就不能有效地說明所研究的對象。
②信度高時(shí),效度未必也很高。即使研究者準(zhǔn)確無誤地測出某個(gè)被試者的經(jīng)濟(jì)收入,也未必能夠說明該被試者的真實(shí)消費(fèi)水平。
③效度低時(shí),信度可能會很高。即使某項(xiàng)研究不能有效地說明社會流動的原因,但該研究很可能精確可靠地測量出不同時(shí)期下各類人群的流動數(shù)量。
④效度高時(shí),信度一定也很高。因?yàn)槿绻麥y量結(jié)果有效地說明了某項(xiàng)研究的問題,那么其所依據(jù)的資料和所得出的結(jié)論必然具有很高的可信度和可靠性。
新聞傳播學(xué)專業(yè)公眾號
微信號 : media-power
▇ 新傳考研智庫 洞察社會脈動
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.