傳播學(xué) | 信度和效度（Validity and Reliability ）

2026-04-27 10:05:31　來源: 新傳研究

湖南舉報(bào)

分享至

（1）效度（Validity）

是指測量數(shù)據(jù)的真實(shí)性和準(zhǔn)確性，即變量的操作定義能否反映原始概念的基本定義。效度代表了測量結(jié)果與真實(shí)情況或現(xiàn)象本質(zhì)的接近程度，越靠近真實(shí)本質(zhì)，效度越高。由于效度反映的是對事物本質(zhì)的揭示程度，因此無法在短時(shí)間內(nèi)獲得，需要經(jīng)歷一個(gè)過程。

（2）效度的類型及具體操作

① 表面效度（Face Validity）

表現(xiàn)效度反映了研究者想測量的構(gòu)念（construct），即實(shí)證測量的結(jié)果與我們的共識或我們頭腦中印象的吻合程度。表面效度體現(xiàn)于測量方法反映了研究者想要測量的構(gòu)想。

具體操作：表面效度主要取決于人們對測量內(nèi)容的主觀判斷，判斷測量結(jié)果是否具有表面效度。例如，在測量人們普遍認(rèn)為的“自尊心”強(qiáng)弱時(shí)，可以通過詢問被調(diào)查者是否認(rèn)為自己的能力強(qiáng)于他人來進(jìn)行，因?yàn)閺囊粋€(gè)人對自己能力的主觀評價(jià)可側(cè)面反映其“自尊心”強(qiáng)弱，這種測量“自尊心”的方法就具有表面效度。

② 效標(biāo)關(guān)聯(lián)效度（Criterion - related Validity）

效標(biāo)是一個(gè)與量表有密切關(guān)聯(lián)的獨(dú)立標(biāo)準(zhǔn)，效標(biāo)關(guān)聯(lián)效度指測驗(yàn)分?jǐn)?shù)與效標(biāo)之間的關(guān)系。可以將量表所測指標(biāo)看成因變量，效標(biāo)看成自變量，所測指標(biāo)與效標(biāo)相關(guān)性越高，量表效度越高，可分為預(yù)測效度和同時(shí)效度。

預(yù)測效度方面，若某新測量方法獲得的數(shù)據(jù)能幫助研究者預(yù)測被調(diào)查者行為，則該測量方法具有預(yù)測效度。比如研究招聘測試對員工未來工作表現(xiàn)的預(yù)測能力，通過對比新員工招聘測試成績和后續(xù)工作績效評估結(jié)果來判斷。同時(shí)效度方面，若研究者使用新舊兩種測量方法分別搜集同樣數(shù)據(jù)，兩種方法獲得數(shù)據(jù)高度相關(guān)，則新測量方法具有同時(shí)效度。例如對比新舊教學(xué)評估工具對同一組學(xué)生教學(xué)情況評估結(jié)果的相關(guān)性。

③ 建構(gòu)效度（Construct Validity）

也稱構(gòu)念效度，研究者使用建構(gòu)效度確保當(dāng)前測量方法測量的是真正想要測量的內(nèi)容，通過與理論預(yù)測相符的證據(jù)體現(xiàn)，建立在對同一對象使用不同測量方法檢驗(yàn)研究建構(gòu)效度上。

例如測量市民素質(zhì)（自變量X）與不文明行為（因變量Y）關(guān)系時(shí)，X引出“受法規(guī)約束（X1）”和“受教育啟發(fā)（X2）”兩個(gè)變量指標(biāo)。通過測量證實(shí)市民受法規(guī)約束后不文明行為減少，證明市民受法規(guī)約束有效性，同時(shí)證明市民受教育啟發(fā)有效性，由此認(rèn)定X2具有與X1同樣測量效果，X2可替代X1測量，新指標(biāo)X2建構(gòu)效度成立。

④ 內(nèi)在效度（Internal Validity）

指特定研究中的資料及其結(jié)論的有效性，表明研究過程沒有內(nèi)在誤差，其他變量不能解釋研究結(jié)果。

若在具體研究中檢測出表面效度、效標(biāo)關(guān)聯(lián)效度、建構(gòu)效度等測量效度，則該研究具有一定內(nèi)在效度。對內(nèi)在效度的威脅主要來自研究過程、研究者和被研究者的影響。

⑤ 外在效度（External Validity）

指特定研究結(jié)論的普遍有效性，研究具有外在效度說明其結(jié)果可以推廣到其他情境中，反之則不具有概括性。

例如在中國一些城市抽取幾百名大學(xué)生進(jìn)行研究，要判斷結(jié)論是僅適用于這些大學(xué)生，還是適用于中國其他城市或其他國家的大學(xué)生，需考慮研究的抽樣、人工環(huán)境等因素對外在效度的影響。

（3）信度（Reliability）

信度是相對于測量的穩(wěn)定性和一致性而言的，指的是測量數(shù)據(jù)（或資料）與結(jié)論之間的可靠程度。當(dāng)采用同一方法對相同對象進(jìn)行反復(fù)測量時(shí)，能得出相同結(jié)果的程度越高，信度就越高。

（4）信度的類型及具體操作

① 重測信度（Test - retest Reliability）

體現(xiàn)不同時(shí)間獲得的同一研究對象的測量數(shù)據(jù)之間的關(guān)系或相關(guān)性的指標(biāo)。

具體操作：用數(shù)字表示重測信度，相關(guān)系數(shù)越大，兩次測量一致性程度越高。相關(guān)系數(shù)數(shù)值在0到1之間，1.0表示同一被試者在兩次測量中反應(yīng)完全一樣，0表示兩次測量數(shù)據(jù)無關(guān)系。例如在對大學(xué)生如何看待所在大學(xué)形象考察中，特萊德威爾和哈里森測量學(xué)生對三種校園信息媒介參與程度，先測量一組學(xué)生，七天后再測，獲得三種校園信息媒介重測信度分別為0.79、0.86和0.76，說明測量方法在測量學(xué)生對校園不同信息媒介參與度方面有信度。

② 復(fù)本信度（Alternate - form Reliability）

又稱等值性系數(shù)，以兩個(gè)等值但題目不同的測驗(yàn)（復(fù)本）測量同一群體，求被試者在兩個(gè)測驗(yàn)上得分的相關(guān)系數(shù)。

將一套測量規(guī)則進(jìn)行復(fù)制，設(shè)計(jì)兩套或兩套以上精確度完全一樣的測量規(guī)則，使與原本規(guī)則在內(nèi)容、項(xiàng)數(shù)、重點(diǎn)、問題方向、難易程度、分辨力等方面一樣，只是使用詞語或語氣有所區(qū)別，形成測量復(fù)本。如學(xué)校考試出的A、B卷就是復(fù)本近似例子。

③ 折半信度（Split - half Reliability）

在無復(fù)本且不準(zhǔn)備重測情況下，通過使用兩個(gè)不同內(nèi)容但具等同效果問卷測得的信度，可查出問卷或量表所詢問問題是否針對同樣研究內(nèi)容。

將單、雙數(shù)分成兩半來計(jì)分，根據(jù)每人分別在這兩部分的總分計(jì)算所得相關(guān)系數(shù)。在較高程度結(jié)構(gòu)化和標(biāo)準(zhǔn)化測量中，被調(diào)查者、調(diào)查者、測量內(nèi)容等因素會產(chǎn)生影響，隨機(jī)誤差越小信度越高，非結(jié)構(gòu)化和非標(biāo)準(zhǔn)化測量中研究者主觀因素也會影響信度。可通過改寫問卷表述不清地方、指導(dǎo)被調(diào)查者填答、對搜集數(shù)據(jù)處理前編碼練習(xí)等方法提高信度。

（5）效度和信度的關(guān)系

信度和效度都是科學(xué)測量工具所必須滿足的條件，但二者之間存在以下幾種關(guān)系：

①信度低時(shí)，效度不可能高。因?yàn)槿绻占馁Y料或測量的數(shù)據(jù)不夠準(zhǔn)確，就不能有效地說明所研究的對象。

②信度高時(shí)，效度未必也很高。即使研究者準(zhǔn)確無誤地測出某個(gè)被試者的經(jīng)濟(jì)收入，也未必能夠說明該被試者的真實(shí)消費(fèi)水平。

③效度低時(shí)，信度可能會很高。即使某項(xiàng)研究不能有效地說明社會流動的原因，但該研究很可能精確可靠地測量出不同時(shí)期下各類人群的流動數(shù)量。

④效度高時(shí)，信度一定也很高。因?yàn)槿绻麥y量結(jié)果有效地說明了某項(xiàng)研究的問題，那么其所依據(jù)的資料和所得出的結(jié)論必然具有很高的可信度和可靠性。

新聞傳播學(xué)專業(yè)公眾號

微信號 : media-power

▇ 新傳考研智庫洞察社會脈動

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.