![]()
問責(zé)制是當(dāng)今全球教育政策的一個流行語,聯(lián)合國教科文組織2015年發(fā)布的《2030年教育行動框架》中有20多次提到問責(zé)制。對政府的教育工作進行評價是現(xiàn)代社會治理體系的重要組成部分,評價結(jié)果用于對政府問責(zé),以督促其更好履行教育職責(zé)。英國是嚴(yán)格實施教育督導(dǎo)評估制度的國家,也是少數(shù)對地方政府教育工作進行專門督導(dǎo)的國家,督導(dǎo)問責(zé)的主要內(nèi)容聚焦于地方的教育治理效能。我國是高度重視區(qū)縣政府教育工作評價的國家,有地方政府的教育工作績效評價、教育履職督導(dǎo)評估等多種類型,以期推動區(qū)縣人民政府辦好人民滿意的教育。評價指標(biāo)是引導(dǎo)、指揮和解釋政府行為的關(guān)鍵變量,評價工作已經(jīng)成為建設(shè)教育強國、推動教育治理能力現(xiàn)代化的重要手段。然而,不少地區(qū)的教育工作評價延續(xù)了以前教育規(guī)模發(fā)展階段的慣性,不論是評價功能還是評價工作自身質(zhì)量對建設(shè)教育強國的響應(yīng)均不夠充分。評價工作的高度行政導(dǎo)向和封閉性、學(xué)者難以參與評估“現(xiàn)場”等原因?qū)е孪嚓P(guān)研究數(shù)量非常少,對地方政府教育工作評價改革的研究支持嚴(yán)重不足。
《教育強國建設(shè)規(guī)劃綱要(2024—2035年)》提出“提升依法治教和管理水平”“完善督政、督學(xué)、評估監(jiān)測教育督導(dǎo)體系”。《加快建設(shè)教育強國三年行動計劃(2025—2027年)》提出“完善政府教育履職評價”。《中共中央關(guān)于進一步全面深化改革 推進中國式現(xiàn)代化的決定》明確提出處理好效率和公平的關(guān)系,因而更高效率也是高質(zhì)量發(fā)展的重要特征。質(zhì)量、公平和效率亦應(yīng)作為當(dāng)前政策對教育工作評價內(nèi)容改革和工作體系完善的價值要求。本文重點討論相對于教育規(guī)模發(fā)展階段,區(qū)縣政府教育工作評價應(yīng)如何調(diào)整評價內(nèi)容和方式,以高質(zhì)量的評價實踐適應(yīng)新時期教育強國建設(shè)的需要。
一、傳統(tǒng)評價框架面臨的挑戰(zhàn)與轉(zhuǎn)向
(一)社會需求方向的轉(zhuǎn)變
經(jīng)濟高速增長階段對社會發(fā)展水平的評價主要關(guān)注規(guī)模總量的擴張,強調(diào)工具性價值,評價對象往往表現(xiàn)為錦標(biāo)賽式的競爭狀態(tài)。社會對規(guī)模增長成就的感受具有可直接計量性和可觀察性,如校舍面積改善、學(xué)生補助人數(shù)增加等。為了推動地方政府加強教育投入,經(jīng)費、人力、物質(zhì)條件等要素的投入數(shù)量和覆蓋面是重要指標(biāo),如校舍面積、教學(xué)儀器設(shè)備值、生師比、教師學(xué)歷水平等。這種現(xiàn)狀或水平性統(tǒng)計表達方式的價值取向在于規(guī)范管理、推動地方政府落實可測性政策,但反映政府實際治理水平的能力較弱。總體上,各行業(yè)政府績效評價中均存在指標(biāo)設(shè)計重客觀輕主觀、重量化輕質(zhì)化、重排名比較輕政府治理能力提升等共性問題。已有研究證明,核心要件滿足后服務(wù)對象滿意度水平不再直線上升,可以理解為人民對美好生活的需求日益增長,但物質(zhì)水平的提高并不總能提高滿意度水平。中國民生電話調(diào)查結(jié)果顯示,2013—2017年全國教育經(jīng)費總投入約增長40個百分點,但2014—2017年的教育滿意度僅增加了0.01分,在參與測評的各行業(yè)中滿意度增長率最低。這表明以往的教育發(fā)展和投入模式進入邊際效應(yīng)降低的階段,提高教育投入效應(yīng)要轉(zhuǎn)變治理模式。有學(xué)者建議,在關(guān)注辦學(xué)條件等基礎(chǔ)性要素的同時,應(yīng)將評價重心轉(zhuǎn)向?qū)Φ胤近h委和政府治理體系與治理能力現(xiàn)代化水平的問責(zé)上。文獻研究還顯示,不論發(fā)達國家還是發(fā)展中國家,教師能力對學(xué)生成績的解釋力更強,資源的使用率比資源投入量產(chǎn)生的效應(yīng)更大。相對于基本均衡時代,縣域義務(wù)教育優(yōu)質(zhì)均衡評估對學(xué)生發(fā)展結(jié)果的強調(diào)反映了國家層面評估重點的轉(zhuǎn)向。與教育治理效能有關(guān)的指標(biāo),無論是客觀的學(xué)業(yè)成績、資源使用率、資源供給適切性,還是主觀的滿意度、權(quán)利感等,都涉及對服務(wù)對象的參與和體驗的測評,評價難度大幅增加。
(二)價值認(rèn)識的新動向
在義務(wù)教育普及階段,不少研究將教育效率限定為教育資源的投入效率,用單位投入能夠產(chǎn)出多少教育資源或者服務(wù)多少學(xué)生來衡量,將其定位于與教育公平存在沖突關(guān)系。隨著高質(zhì)量發(fā)展治理理念的提出,社會對效率的重視程度逐漸提高,學(xué)者們認(rèn)為高質(zhì)量發(fā)展的核心要義是建立在更加公平基礎(chǔ)上的更高效率。世界銀行的研究報告提出,一個模范地方政府應(yīng)在程序和結(jié)構(gòu)上符合立法,保持其財政健康,以正確的方式(最大效率)做正確的事(對民眾需求作出回應(yīng)),并對其過程和產(chǎn)出負責(zé)。國際上廣泛使用有效性、經(jīng)濟性、效率性、公平性作為公共部門績效評價的基本原則。我國對基礎(chǔ)教育發(fā)展的價值追求已從普及、基本均衡走向優(yōu)質(zhì)均衡,體現(xiàn)了對教育公平和質(zhì)量要求的提高,而減輕學(xué)業(yè)負擔(dān)、應(yīng)對人口減少的資源配置策略改進等政策體現(xiàn)了效率價值維度正逐漸受到關(guān)注。立足教育強國建設(shè),以優(yōu)質(zhì)、公平、高效為高質(zhì)量發(fā)展的內(nèi)在核心價值要求,各類教育發(fā)展指標(biāo)均可從質(zhì)量、公平、效率等價值維度進行考察,并且不再簡單分類為哪些屬于公平指標(biāo)、哪些指標(biāo)專用于評價質(zhì)量,而是每個指標(biāo)均堅持此三維價值導(dǎo)向。
(三)治理模式的完善要求
目前,履職評價中一般將投入、過程與結(jié)果作為并列關(guān)系賦權(quán)重相加,較少計算投入產(chǎn)出比較得出的效率、過程對結(jié)果的貢獻度。并且,過程性、具體措施性指標(biāo)數(shù)量占比過大,更有甚者將政策原文拆解成一條條事項性指標(biāo)考察下級政府是否遵從。與教育熱點問題有關(guān)的事項檢查更多,熱點問題事項檢查帶有較強的應(yīng)急意味,這與社會變化較快導(dǎo)致的政策制定應(yīng)急性特點有關(guān)。有時教育熱點并不是根本性的問題,如學(xué)生校服在一些地區(qū)統(tǒng)一樣式且在校外商超自主購買,并不成為一項社會問題。由于不斷有新政策產(chǎn)生,過程性指標(biāo)越來越多,地方評估負擔(dān)越來越重卻實效不高,最終導(dǎo)致一些地區(qū)履職評價的停擺。事項性指標(biāo)過多過細的原因是多方面的,首先,將指標(biāo)結(jié)構(gòu)的邏輯假定簡單化,認(rèn)為投入和過程的精細化要求與結(jié)果指標(biāo)之間存在強因果關(guān)系,現(xiàn)實中三者有可能正相關(guān),也有可能存在高投入低產(chǎn)出的不相關(guān)或者負相關(guān)情況。其次,從治理角度看,部門利益、信息不對稱、屬地管理不規(guī)范、政績觀偏差、被考核對象缺乏自身工作的話語權(quán)等是導(dǎo)致考核指標(biāo)過度細化的重要原因,考核評價重過程重痕跡,實效卻很差,多項研究建議加強結(jié)果和目標(biāo)有關(guān)評價指標(biāo)的設(shè)計。也有學(xué)者呼吁去指標(biāo)化評價,通過各評價主體的參與、體驗、溝通和對話完成評價任務(wù)。從實踐和研究趨勢看,教育工作評價應(yīng)從合規(guī)性檢查轉(zhuǎn)向效能性評價,結(jié)構(gòu)上減少事項性檢查占比,關(guān)注教育發(fā)展規(guī)律和發(fā)展目標(biāo)達成度。
二、傳統(tǒng)評價實施與管理的效度困境
(一)簡單量化的多重負效應(yīng)
有的地方政府教育工作評價幾乎全部采用量化指標(biāo),只需要填報數(shù)據(jù)就給下級政府排出名次。完全量化評價看似精確實則模糊,如音體美學(xué)科的校舍場地生均面積能夠反映硬件保障情況如何,卻難以體現(xiàn)場地實際使用情況、管理情況、是否符合師生需求等。由于高度重視指標(biāo)的數(shù)值水平,專家現(xiàn)場評價往往僅起驗證作用或僅按要求履行流程。評價指標(biāo)和標(biāo)準(zhǔn)的確定一般不會通過專家與評價對象協(xié)商產(chǎn)生,因為在評價結(jié)果的產(chǎn)生過程中,專家難以發(fā)揮對數(shù)據(jù)的經(jīng)驗解析作用,也限制了其在與評價對象交流時可發(fā)揮的指導(dǎo)作用。評價的功能和價值不僅僅是為獎懲和資源分配提供依據(jù),更在于為評價對象提供專業(yè)科學(xué)的診斷和指導(dǎo),這是評價權(quán)威性和結(jié)果信息效用價值的重要來源。
簡單量化引發(fā)的負面后果是多方面的。不僅隱藏了評價專家的作用,也容易扭曲和腐化它原本打算監(jiān)管的社會過程。對量的可觀測性與優(yōu)勢的追求會改變國家、組織和個人的行動,將質(zhì)性特征轉(zhuǎn)化為共享同一量綱的量化指標(biāo),導(dǎo)致評價去情境化、去人格化,強化數(shù)字的權(quán)威性并引導(dǎo)評價對象走向功利化。例如,某地以德育活動次數(shù)評價學(xué)校對德育工作的重視程度,導(dǎo)致學(xué)校不斷在評估管理系統(tǒng)里上報活動材料,不僅增加了評價負擔(dān),更異化了德育活動本身的價值。相反,專家去現(xiàn)場與師生直接交流、觀摩學(xué)校活動則能夠更準(zhǔn)確地判斷學(xué)校對德育工作的重視程度、工作能力和工作質(zhì)量。
(二)統(tǒng)一標(biāo)準(zhǔn)與因地制宜的艱難平衡
當(dāng)前的教育工作評價本質(zhì)是一種分類行為,即把復(fù)雜信息結(jié)構(gòu)化、條理化,同時也給評價對象在分類系統(tǒng)中分配一定的位置,會使原本可能差異不大的區(qū)縣按照分?jǐn)?shù)的細微差異排出名次。多數(shù)省份的區(qū)縣之間,發(fā)展基礎(chǔ)存在較大差異,如果評價以絕對發(fā)展水平指標(biāo)為主體且要求越來越高,發(fā)展基礎(chǔ)薄弱的地區(qū)在評價結(jié)果的排隊中會永遠處于落后位置,可能帶來數(shù)據(jù)造假或者躺平擺爛等風(fēng)險。而若降低評價標(biāo)準(zhǔn),則可能導(dǎo)致高水平區(qū)縣放松自我要求。統(tǒng)一的評估指標(biāo)和標(biāo)準(zhǔn)難以全面實現(xiàn)以評促建的目的,社會資源也將容易流向評價結(jié)果較好的區(qū)縣,最終出現(xiàn)強者恒強、弱者恒弱的趨勢。此外,人口變化對各地教育工作產(chǎn)生了巨大影響,但該影響存在地區(qū)差異,有的地方在校學(xué)生人數(shù)急劇減少,總量類指標(biāo)維持增長難度較大,生均類指標(biāo)提升未必反映真實改善。發(fā)達城區(qū)在校學(xué)生人數(shù)仍在增長,提高了教育投入的規(guī)模效益,但按照生均指標(biāo)要求則需繼續(xù)加大建設(shè)力度。當(dāng)評價指標(biāo)和標(biāo)準(zhǔn)確定的原則要求堅持因地制宜、實事求是時,評價工作就需要在個性化方面有所作為。
(三)利害性博弈對評價的扭曲
現(xiàn)實利益沖突往往導(dǎo)致評價工作背離設(shè)計初衷。評價和問責(zé)本身就是治理的工具性手段,評價結(jié)果利害性越高評價的功利性就越強,與此同時,評價從設(shè)計、過程到結(jié)果的質(zhì)量降低的可能性越大。有些地方為了盡快通過高利害性評估,犧牲其他重要的事情,發(fā)生“產(chǎn)出扭曲”問題。例如,在財政能力有限的情況下,停止其他學(xué)段的規(guī)劃項目并將經(jīng)費集中投入有評價任務(wù)的學(xué)段。此外,部門利益沖突導(dǎo)致的指標(biāo)選擇偏差、指標(biāo)政策“打架”等問題一直困擾著教育工作評價。問題產(chǎn)生的根本原因在于政府責(zé)任劃分不夠清晰,橫向責(zé)任不清導(dǎo)致不同系統(tǒng)的指標(biāo)要求沖突,縱向責(zé)任劃分不清導(dǎo)致指標(biāo)缺乏效力。例如,某地在對“十四五”規(guī)劃實施情況的中期評估中遇到了職責(zé)不清導(dǎo)致的評估困難。招生入學(xué)工作由基教部門負責(zé),推動當(dāng)?shù)赝ㄟ^均衡評估由督導(dǎo)部門負責(zé),由此出現(xiàn)城市基礎(chǔ)教育管理行政部門放寬學(xué)校規(guī)模和班額標(biāo)準(zhǔn)要求以解決入學(xué)壓力問題,督導(dǎo)部門則堅持嚴(yán)格控制學(xué)生規(guī)模的矛盾性工作方向。在教育經(jīng)費、教師編制等指標(biāo)方面,教育和財政、編制和人社等部門之間也存在著博弈和妥協(xié)。調(diào)研發(fā)現(xiàn),某經(jīng)濟強區(qū)以學(xué)生減少為由有編不補、不斷大幅削減新招教師編制,采用招聘合同教師的方式滿足崗位需求,仍舊能夠在全省區(qū)縣教育工作評價中名列前茅。各方博弈最終產(chǎn)出一個可被多方接受但不那么符合評價目的的結(jié)果,高利害性評價反而未能起到推動問責(zé)作用。
三、建設(shè)優(yōu)質(zhì)公平高效價值導(dǎo)向的新框架
傳統(tǒng)框架下,教育工作評價一般包括價值導(dǎo)向、組織領(lǐng)導(dǎo)、辦學(xué)條件、教師隊伍和學(xué)生發(fā)展等維度,內(nèi)在的程序邏輯包括投入、過程和結(jié)果三個環(huán)節(jié)。從服務(wù)高質(zhì)量發(fā)展角度看,評價框架不僅要在質(zhì)量、公平價值導(dǎo)向基礎(chǔ)上增加效率價值導(dǎo)向,還應(yīng)將各價值導(dǎo)向作為內(nèi)生性維度嵌套在投入、過程和結(jié)果等每個環(huán)節(jié)中。
(一)質(zhì)量導(dǎo)向的評價
以往對教育工作質(zhì)量的評價主要聚焦于教育教學(xué)產(chǎn)出端的學(xué)生發(fā)展結(jié)果,如學(xué)業(yè)成績、升學(xué)率等指標(biāo)。當(dāng)將質(zhì)量作為公共服務(wù)效能的重要表征時,則包括教育供給的品質(zhì)、有效、創(chuàng)新、健康等含義,以及對國家和個體需求響應(yīng)的及時性。
首先,有關(guān)教育投入的評價需超越經(jīng)費總量、生均投入水平及增長趨勢等總量型指標(biāo),在結(jié)構(gòu)和方向上深度判斷資源配置是否契合教育質(zhì)量提升目標(biāo)。尤其應(yīng)關(guān)注財政支出在關(guān)鍵教育結(jié)果質(zhì)量支撐領(lǐng)域的分配比例,如教師專業(yè)發(fā)展經(jīng)費與教研活動投入的占比,以及公用經(jīng)費在課程開發(fā)、教學(xué)材料更新、技術(shù)更新和實驗項目等內(nèi)涵提升工作中的覆蓋程度。對基建、人員以及公用支出細目進行比較并評估,有助于揭示資源分配的優(yōu)先順序是否合理。同時,教育投入的評價機制應(yīng)確立健康供給導(dǎo)向,即教育財政投入須與區(qū)域社會經(jīng)濟發(fā)展水平、人口結(jié)構(gòu)變化、財政可持續(xù)能力及教育發(fā)展階段相適配,反對以債務(wù)驅(qū)動投入或過度基建投入換取短期評價績效,避免資源錯配與結(jié)構(gòu)性浪費從而保障教育投入的長期效益。
其次,過程環(huán)節(jié)的質(zhì)量評價應(yīng)聚焦與學(xué)生全面發(fā)展穩(wěn)定相關(guān)的核心變量。其一,教師專業(yè)時間的結(jié)構(gòu)性保障,即教師用于備課、教學(xué)反思、教研活動、個性化輔導(dǎo)與課程設(shè)計的實際可支配時間是否充分;其二,學(xué)校領(lǐng)導(dǎo)力水平,包括因材施教的實際執(zhí)行能力、課程設(shè)置質(zhì)量、師生關(guān)系質(zhì)量、學(xué)校歸屬感等方面的建構(gòu)水平;其三,校外實踐與綜合活動的制度化安排,包括社會實踐、研學(xué)旅行、社區(qū)服務(wù)、職業(yè)體驗等學(xué)習(xí)方式的時長保障和質(zhì)量;其四,學(xué)校辦學(xué)自主權(quán)的保障。PISA2015調(diào)查證明,學(xué)校辦學(xué)自主權(quán)水平與學(xué)生學(xué)業(yè)表現(xiàn)呈正相關(guān),在低社會經(jīng)濟背景學(xué)校中效應(yīng)更為顯著。美國紐約市曾對城市公立學(xué)校進行了人事聘任、預(yù)算分配、課程設(shè)置及績效管理等方面的辦學(xué)自主權(quán)擴權(quán)改革,其效果評價證明,改革對提升學(xué)校數(shù)學(xué)成績、高中畢業(yè)率有積極的顯著影響。學(xué)校作為教育主體的能動性釋放是教育結(jié)果質(zhì)量提升的關(guān)鍵因素,這提示我們,評價工作應(yīng)關(guān)注學(xué)校在教師招聘、經(jīng)費使用等關(guān)鍵領(lǐng)域的自主決策空間,使其能夠及時響應(yīng)教育情境的變化。
最后,學(xué)生發(fā)展結(jié)果是衡量教育效能的核心指標(biāo),直接反映了教育過程質(zhì)量與資源轉(zhuǎn)化的效率。統(tǒng)一學(xué)業(yè)測試的嚴(yán)格政策限制導(dǎo)致了評價工作亟須構(gòu)建替代性評估路徑,以間接方式反映教育結(jié)果質(zhì)量。可聚焦對評價指揮棒的質(zhì)量控制,如可抽樣評估各校期末試卷的命題科學(xué)性、內(nèi)容代表性、能力導(dǎo)向性與難度梯度合理性,適當(dāng)延伸至對教研員與骨干教師命題素養(yǎng)的評價;教師課堂表現(xiàn)的現(xiàn)場觀察與視頻分析、學(xué)生學(xué)習(xí)品質(zhì)的行為編碼分析等,亦可作為衡量區(qū)域教研能力、教學(xué)有效性與學(xué)業(yè)發(fā)展的核心指標(biāo)。此外,教育結(jié)果質(zhì)量評價不能僅限于學(xué)業(yè)成就的評價,應(yīng)擴展至心理健康、社會適應(yīng)等非認(rèn)知領(lǐng)域。鑒于心理健康篩查的局限性,可引入外部驗證數(shù)據(jù),如青少年精神類藥品處方區(qū)域增長率、學(xué)生休學(xué)率等作為評價系統(tǒng)韌性的補充。
(二)公平導(dǎo)向的評價
瑞典學(xué)者胡森(Husén)提出的教育機會均等三維框架——起點公平、過程公平和結(jié)果公平為我國教育公平政策的制度設(shè)計與實踐評估提供了理論支撐。當(dāng)前,我國教育工作評價體系已初步覆蓋三類公平政策:一是陽光招生、均衡編班、隨遷子女入學(xué)保障,以及留守兒童關(guān)愛體系等政策確保入學(xué)機會均等;二是學(xué)校標(biāo)準(zhǔn)化建設(shè)、校際辦學(xué)條件差異監(jiān)測、教師流動機制等推動資源配置的相對均衡;三是教育質(zhì)量監(jiān)測監(jiān)控學(xué)生發(fā)展結(jié)果的校際差異。然而,上述評價對教育組織內(nèi)部運行的公平體驗關(guān)注不足,校際資源配置差異和教育質(zhì)量差異仍是導(dǎo)致社會對政府教育工作不滿意的重要因素。為促進教育公平政策從資源的均等邁向賦能的均等,教育公平評價須在關(guān)注制度合規(guī)性的基礎(chǔ)上強化體驗公正性感知評價,在關(guān)注結(jié)構(gòu)公平的基礎(chǔ)上強化組織公平評價。
首先,應(yīng)在起點環(huán)節(jié)深化差異原則實施情況的評價,如評價資源分配是否真正向弱勢群體傾斜,是否符合最少受惠者的最大利益。具體評價要點包括新設(shè)備、新興教學(xué)項目、高質(zhì)量培訓(xùn)機會等優(yōu)質(zhì)資源是否優(yōu)先供給鄉(xiāng)村學(xué)校、薄弱學(xué)校以及特殊需求學(xué)生等。在結(jié)構(gòu)維度上,須警惕學(xué)段間資源“重基礎(chǔ),輕終身”的現(xiàn)象,特別是在老齡化社會背景下,老年教育與社區(qū)教育的財政保障力度、課程供給密度、師資配備比例等指標(biāo)亟須納入公平評價體系,以實現(xiàn)教育服務(wù)全生命周期的公平正義。在過程環(huán)節(jié)考察教育管理、教育教學(xué)活動的公平狀況,如重大教育決策公眾參與率;教育政策和規(guī)則對學(xué)校、對師生是否透明無偏,有無隱性歧視或制度性排斥的潛在風(fēng)險;尤其需關(guān)注薄弱學(xué)校與小規(guī)模學(xué)校在教育治理中話語權(quán)缺失的問題,在發(fā)言機會、經(jīng)費使用權(quán)限、校本教研支持、課程供給需求滿足程度和質(zhì)量等方面與其他學(xué)校相比的系統(tǒng)性差異。結(jié)果階段的公平評價在延續(xù)前述質(zhì)量維度評價的基礎(chǔ)上應(yīng)深化群體和校際差異的評價,如比較各類區(qū)級活動學(xué)生參與率的校際差異、性別差異、戶籍差異等;將英才兒童、有心理和學(xué)習(xí)障礙等困難的學(xué)生,以及隨班就讀學(xué)生等少數(shù)群體學(xué)生的發(fā)展結(jié)果從過去的不考查或融入均數(shù)改為獨立評價,并可考查教師差異化教育教學(xué)能力、在特殊教育和心理健康教育方面接受的培訓(xùn)課時等,作為特殊需求學(xué)生發(fā)展水平的補充指標(biāo)。
(三)效率導(dǎo)向的評價
強調(diào)效率既不是推動基礎(chǔ)教育市場化,也不是強調(diào)規(guī)模效應(yīng),主要是針對資源利用率不高、教學(xué)效率不高、師生負擔(dān)居高不下等問題,改善效率從而促進教育公平和提高教育質(zhì)量。
投入環(huán)節(jié)的效率評價應(yīng)關(guān)注適應(yīng)人口變化的資源配置、校際資產(chǎn)共享率、教育資產(chǎn)閑置率、規(guī)劃落地等情況,以及教學(xué)儀器設(shè)備等資源的使用效率等。教師資源配置效率的評價不僅應(yīng)關(guān)注傳統(tǒng)的生師比,還應(yīng)考查在崗教師中編制教師的比例和教師流失率;從關(guān)注人員經(jīng)費使用效率的角度,應(yīng)考查教師崗位職數(shù)使用率,如檢查在編不在崗、在校但不授課等現(xiàn)象;從保障學(xué)生享有更優(yōu)質(zhì)的教師指導(dǎo)的角度,比較學(xué)校總課時數(shù)除以含不在崗教師的教師總數(shù)、總課時數(shù)除以在校且授課教師數(shù)等。結(jié)果環(huán)節(jié)的效率評價則需以人口數(shù)量、供養(yǎng)比、人均GDP等宏觀變量作為控制變量,分析學(xué)生成績、學(xué)生活動參與率等因變量與經(jīng)費投入、時間投入、生師比、課程豐富性等投入變量的關(guān)系。
過程環(huán)節(jié)的效率評價應(yīng)聚焦如何將投入轉(zhuǎn)化為有效結(jié)果,核心是識別阻礙效率提升的關(guān)鍵堵點,破除看不見的藩籬。可依據(jù)各地情況關(guān)注不同重點,如教師跨校輪崗或調(diào)動手續(xù)的法定環(huán)節(jié)數(shù)、材料要件數(shù)、平均辦結(jié)時長與一次辦結(jié)率;中小學(xué)校的課程安排、人事聘任、經(jīng)費使用等辦學(xué)自主權(quán)實際落實程度;學(xué)校向主管行政部門申請事項所涉審批層級、流轉(zhuǎn)節(jié)點、等待耗時等;學(xué)校日常報賬票據(jù)合規(guī)審查時長、財務(wù)系統(tǒng)響應(yīng)速度、資金到賬周期與差錯退單率等;部門協(xié)作的職能邊界清晰度、數(shù)據(jù)和信息共享充分性,以及協(xié)同響應(yīng)及時性等。
四、新框架下的評價效度提升路徑
新框架的價值導(dǎo)向同樣應(yīng)成為評價工作效度改進的導(dǎo)向,服務(wù)高質(zhì)量發(fā)展的評價工作本身也應(yīng)以質(zhì)量、公平和效率作為標(biāo)準(zhǔn),提高評價效度、降低評價負擔(dān),更好地服務(wù)評價目標(biāo)的實現(xiàn)。
(一)完善評價對人群和時態(tài)的覆蓋,減少偏差
評價內(nèi)容必須避免出現(xiàn)指標(biāo)單一問題。例如,以優(yōu)秀率、平均分為主體的評價指標(biāo)會導(dǎo)致區(qū)縣政府和學(xué)校只關(guān)注排名靠前的群體,而后20%學(xué)生及格率、進步率則更可能引導(dǎo)評價對象關(guān)注學(xué)困生的學(xué)習(xí),因此,教學(xué)質(zhì)量評價應(yīng)將各學(xué)生群體的表現(xiàn)結(jié)合起來統(tǒng)籌判斷。指標(biāo)的統(tǒng)計方法單一問題也需規(guī)避,一個指標(biāo)的不同統(tǒng)計方法能夠產(chǎn)出不同的評價結(jié)果,如較為復(fù)雜的泰爾指數(shù)、基尼系數(shù)等各種指標(biāo)反映出的公平性結(jié)果均存在差異;相對簡單的均值或中位數(shù)差、倍率、倍率差異變化、增長率差異等統(tǒng)計方法以及學(xué)生數(shù)權(quán)重使用策略所蘊含的不同群體的關(guān)注度也均有不同。即使一個指標(biāo)采用多種統(tǒng)計方法,每種方法的偏差都是難以避免的;因此,伊萬奧(Ewell)認(rèn)為目標(biāo)設(shè)定的透明度非常重要,以便在討論衡量標(biāo)準(zhǔn)時更清楚地理解偏差,并向利益相關(guān)者展示指標(biāo)中哪些群體更為重要。
靜態(tài)水平值、增減率是當(dāng)前普遍應(yīng)用的指標(biāo)統(tǒng)計方法,如學(xué)生近視率、肥胖率及其變化等。靜態(tài)水平值及增減率都是對已經(jīng)發(fā)生的情況的評價,當(dāng)指標(biāo)過于側(cè)重短期結(jié)果就會影響評價對象對長期政策的投入。麥克弗森(Macpherson)利用時間將指標(biāo)劃分為在事件發(fā)生后報告結(jié)果的滯后指標(biāo)和用于預(yù)測未來事件的領(lǐng)先指標(biāo),提示人們應(yīng)重視預(yù)期性指標(biāo)。例如,以師生對在本區(qū)縣和學(xué)校就業(yè)就學(xué)的忠誠度預(yù)測區(qū)域教育實際吸引力,以非財政性經(jīng)費的增長率或教育經(jīng)費的多元化投入來源預(yù)測未來教育系統(tǒng)的抗風(fēng)險能力,以現(xiàn)任領(lǐng)導(dǎo)決策導(dǎo)致前任政策終止或大幅調(diào)整的比例或?qū)ΜF(xiàn)任領(lǐng)導(dǎo)教育政策的長期信心等指標(biāo)預(yù)測教育工作的長期效應(yīng)。
(二)以主觀評價和質(zhì)性評價為主導(dǎo),強化人的因素
破除社會和學(xué)校唯分?jǐn)?shù)的線性評價思維,首先應(yīng)從對政府的評價開始去分?jǐn)?shù)化,才能改變對學(xué)校、教師和學(xué)生評價唯分?jǐn)?shù)的傳導(dǎo)。主觀評價可以分為兩類:一類是利益相關(guān)者的態(tài)度和看法,如滿意度調(diào)查;另一類是需要人觀察判斷的評價,如由專家實施的質(zhì)性評價。實施主觀評價和質(zhì)性評價加強評價工作中人的屬性成分,一方面有助于反映量化評價難以體現(xiàn)的內(nèi)容,另一方面有助于削減評價范圍窄化和功能扭曲的問題。
滿意度是指在體驗服務(wù)過程中,服務(wù)對象對其需求、期望和目標(biāo)得到滿足程度的一種心理體驗,比投訴率能夠更全面反映公眾態(tài)度,是各國政府績效評價普遍使用的一種方式。例如,美國佛羅里達州政府教育績效評價指標(biāo)包含了認(rèn)為當(dāng)?shù)毓W(xué)校工作表現(xiàn)良好或優(yōu)秀的本州人百分比。客觀層面的評價必須與公眾主觀感知進行對照,以免評價結(jié)果與公眾感知或者體驗不一致時引起公眾疑慮評價工作弄虛作假。滿意度調(diào)查能夠補充量化調(diào)查難以涉及的內(nèi)容,如手續(xù)復(fù)雜性、歸屬感、擇區(qū)擇校意愿等,尤其在判斷監(jiān)測和評價的價值目標(biāo)達成度方面具有獨特作用。教育投入與滿意度不是單一線性關(guān)系,當(dāng)實際需求得以滿足時,個體才會表達出積極的滿意度和獲得感。政府績效目標(biāo)中工具目標(biāo)的內(nèi)容不斷增加常會出現(xiàn)與價值目標(biāo),即群眾的實際需求脫節(jié)、錯位或偏離的問題。工具目標(biāo)與價值目標(biāo)產(chǎn)生背離時,工具目標(biāo)評價結(jié)果與滿意度調(diào)查結(jié)果易出現(xiàn)不一致現(xiàn)象,此時應(yīng)對評價對象進行深度考察再下結(jié)論。
現(xiàn)場質(zhì)性評價是發(fā)揮專家優(yōu)勢的主渠道。但高利害排名次的評價工作更追求量化,一個重要原因是擔(dān)憂專家現(xiàn)場評價的客觀性、公正性和一致性等問題。有學(xué)者建議,在合成總評估結(jié)論時,可采取由權(quán)威性權(quán)重、熟悉度權(quán)重和公正性權(quán)重三部分構(gòu)成的專家權(quán)重進行校正。此外,加強專家選拔、專家培訓(xùn)、增加評價者數(shù)量、做好時間地點訪談對象三要素的抽樣等工作,對于提高專家評價質(zhì)量也非常重要。在追求高質(zhì)量發(fā)展的時代,對區(qū)縣教育治理工作的評價應(yīng)調(diào)換量化評價和主觀評價的位置,將量化評價作為主觀評價的參考,強化實地質(zhì)性評價的指導(dǎo)和協(xié)作治理功能,從判斷怎么樣轉(zhuǎn)向發(fā)現(xiàn)為什么、指導(dǎo)如何改進上。
(三)聚焦治理目標(biāo),理解并滿足社會需求
在強化主觀評價的基礎(chǔ)上,聚焦教育治理服務(wù)對象的需求滿足,樹立符合需求滿足的評價才是有效評價的認(rèn)識。一些地方的上級政府將下級政府是否及時完成本部門的任務(wù)作為重要指標(biāo),而其中有些任務(wù)并不符合基層實際情況,這類評價指標(biāo)往往是基層負擔(dān)的主要來源。一切教育管理和評價工作應(yīng)服務(wù)于學(xué)校教育教學(xué)的開展,一些鄉(xiāng)村學(xué)校、薄弱學(xué)校對擴大教室面積并沒有很高的需求,但迫切需要更新補充信息化設(shè)施,評價工作應(yīng)反映這些實際需求,而不是奉報表上的百名學(xué)生擁有終端數(shù)或者計算機教室面積為圭臬。
田發(fā)等的研究顯示,地區(qū)經(jīng)濟發(fā)展水平、城鎮(zhèn)化率、城鎮(zhèn)人口規(guī)模以及社會治理財政支出是影響社會治理能力的主要因素。政府部門更在意同兄弟部門的錦標(biāo)競爭以借此贏得稀缺的表彰、晉升機會。為確保公平競爭,鼓勵基礎(chǔ)水平不一的地方政府均能夠努力工作,統(tǒng)一內(nèi)容和標(biāo)準(zhǔn)的排名評價應(yīng)轉(zhuǎn)向基于共同價值標(biāo)準(zhǔn)的個性化發(fā)展性評價,重點評價每個地方的教育項目和任務(wù)制定是否符合當(dāng)?shù)貙嶋H,以及基于自身背景和社會需求的發(fā)展目標(biāo)完成情況。
(四)引導(dǎo)管理變革,從事項敘事走向要素敘事
依法治教背景下,對地方政府教育工作的評價應(yīng)以教育法的落實為根本目標(biāo),而教育法概括了教育工作的基本要素和運行規(guī)律,以教育法規(guī)定的主要內(nèi)容為評價要素有助于克服當(dāng)前評價工作的事項性評價過重的缺陷。事項性評價指標(biāo)要求過于具體,導(dǎo)致指標(biāo)排斥性較高,有可能遺漏其他需要檢查評價的問題,且同一主題領(lǐng)域在不同時期、不同地域涉及的具體問題有所差異,事項性評價在細節(jié)上的統(tǒng)一要求會導(dǎo)致評價成本、評價負擔(dān)和治理成本的提高。例如,學(xué)校供餐安全檢查要求食堂必須由學(xué)校直接運營、要有餐廳等,這個指標(biāo)間接傳導(dǎo)到對教師配置數(shù)量、專業(yè)方向、校舍建設(shè)等的要求。學(xué)校教師普遍自認(rèn)為缺乏管理食堂、保證食品和財務(wù)安全的專業(yè)能力,學(xué)校場地有限的情況下建設(shè)餐廳還可能擠占功能教室的配置。獲得國際社會廣泛認(rèn)可的日本學(xué)校供餐管理并未要求學(xué)校直接運營食堂和設(shè)置獨立餐廳,其供餐衛(wèi)生和營養(yǎng)的高水平源于全社會對食品安全的高要求。各地學(xué)校歷史形成的供餐模式多樣,有的學(xué)校直接運營效果良好,也有的學(xué)校受益于企業(yè)的專業(yè)化、規(guī)模化供餐。評價工作應(yīng)以學(xué)生健康安全這一法律規(guī)定的要素為目標(biāo)進行整體性評價,在內(nèi)容上不限于供餐安全并關(guān)注一切與學(xué)生安全有關(guān)的問題從而實現(xiàn)防患于未然;減少一刀切評價對地方差異性和自主性帶來的困擾,如食品安全責(zé)任可由學(xué)校承擔(dān)也可由企業(yè)承擔(dān)。以要素為基礎(chǔ)的整體性評價不是事項細節(jié)的相加,評價要點只是要素評價的參考而不必面面俱到。整體性評價視評價對象為有機整體,通過綜合考慮要素、要素間的聯(lián)系與協(xié)同形成最終的整體性判斷。與傳統(tǒng)分析性評價相比,避免了過分分解評價對象的系統(tǒng)性偏差。薩德拉(Sadler)提出了整體性評價方法,即先形成整體印象,再逆向推導(dǎo)印象的形成過程,這種學(xué)生學(xué)業(yè)評價方法同樣適用于政府評價。要素式整體性評價遵循教育規(guī)律,要求教育治理重視常規(guī)性投入和日常精細化管理。例如,關(guān)注儀器設(shè)備指標(biāo)值合格卻難以使用、校舍面積數(shù)值合格但衛(wèi)生水平不高、生均圖書數(shù)值合格卻缺乏教師用學(xué)科專業(yè)期刊等現(xiàn)象。因此,政府教育工作評價應(yīng)從具體事項的執(zhí)行轉(zhuǎn)向重點關(guān)注依法治教下的科學(xué)管理、民主管理問題,從而引導(dǎo)地方政府在具體事項上的規(guī)范治理。
(五)改革問責(zé)定位,強化以評促改
社會認(rèn)知通常把問責(zé)狹隘地等同于經(jīng)濟、行政等手段的獎懲,認(rèn)為沒有問責(zé)壓力時評價對象就不會認(rèn)真對待評價要求。聯(lián)合國教科文組織把問責(zé)定義為,一個旨在幫助個人和機構(gòu)履行其職責(zé)并實現(xiàn)其目標(biāo)的過程,通過對政府的職責(zé)完成情況的描述與評價,為管理、決策、規(guī)劃提供依據(jù)。信息公開帶來的壓力也是問責(zé)的一種重要形式,例如,浙江省某地的區(qū)縣黨委書記對教育工作進行公開述職,山東省電視問政等措施,雖沒有分?jǐn)?shù)排名但來自社會公眾的關(guān)注帶來的問責(zé)壓力更大。近期,英國蘇格蘭教育局以督學(xué)實地協(xié)作式督導(dǎo)的方式完成了對下屬地區(qū)戰(zhàn)略領(lǐng)導(dǎo)力、法定職責(zé)履行情況、內(nèi)部運作機制的評估,考察其在提供優(yōu)質(zhì)服務(wù)并持續(xù)改進教育質(zhì)量方面的成就,并向皇家督導(dǎo)團和社會公布了督導(dǎo)報告以接受全面監(jiān)督。政府教育工作評價可以參考更為成熟的學(xué)校督導(dǎo)模式,探索周期性全員輪流評價模式,也可以探索區(qū)縣主要領(lǐng)導(dǎo)任期結(jié)束評價模式,以及風(fēng)險地區(qū)重點評價模式等,弱化統(tǒng)一排名下的各類獎懲,服務(wù)不同的問責(zé)目的,強化評價的指導(dǎo)改進功能。
來源|《中國考試》2026年03期
作者|任春榮(中國教育科學(xué)研究院教育評價與督導(dǎo)研究所研究員)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.