密歇根大學(xué)博士生阿什莉·麥克德莫特幾年前在吉爾吉斯斯坦做田野調(diào)查時,反復(fù)聽到同一個擔(dān)憂:孩子們正在失去他們的母語。這個中亞國家有700萬人口,曾在俄羅斯統(tǒng)治下度過一個世紀(jì),直到1991年才獨立。吉爾吉斯語(發(fā)音類似"kur-giz")挺過了那段時期,至今仍是成年人的常用語言。
麥克德莫特說,她還聽說在吉爾吉斯語占主導(dǎo)的偏遠(yuǎn)村莊,有些孩子居然自發(fā)學(xué)會了俄語。大人們把矛頭指向同一個"罪魁禍?zhǔn)?——YouTube。
![]()
麥克德莫特與美國及吉爾吉斯斯坦四所大學(xué)的五名研究人員組成團(tuán)隊,發(fā)布了一項新研究。他們模擬用戶行為,收集了近1.1萬條獨特的搜索結(jié)果和視頻推薦,試圖驗證這些擔(dān)憂是否成立。
算法如何"構(gòu)造"俄語兒童受眾
研究團(tuán)隊發(fā)現(xiàn),用吉爾吉斯語搜索熱門兒童內(nèi)容——卡通、童話、美人魚——往往得不到吉爾吉斯語結(jié)果。更反常的是:即便模擬用戶連續(xù)觀看10部吉爾吉斯語兒童視頻,明確表現(xiàn)出強(qiáng)烈偏好,系統(tǒng)推薦的吉爾吉斯語內(nèi)容反而比"毫無語言偏好的機(jī)器人"更少。
研究結(jié)論直指核心:YouTube的算法優(yōu)先推送俄語內(nèi)容,而非吉爾吉斯語視頻,尤其在兒童主題領(lǐng)域。
加州大學(xué)伯克利分校博士后學(xué)者、合著者內(nèi)爾·埃舍爾在學(xué)校上周的報告中表示:「吉爾吉斯兒童被算法構(gòu)造為俄語內(nèi)容的受眾。」她補(bǔ)充說:「在YouTube上,當(dāng)一個說吉爾吉斯語的孩子,沒有好辦法。」
一位母親的應(yīng)對策略
麥克德莫特記得2023年一位吉爾吉斯斯坦母親的無奈之舉:她故意每月晚一天交網(wǎng)費,只為定期制造一天"無網(wǎng)絡(luò)、無YouTube"的家庭環(huán)境。
YouTube對外宣稱"致力于放大原住民聲音",但未回應(yīng)《連線》雜志的置評請求。埃舍爾透露,研究團(tuán)隊正嘗試與YouTube的家長控制團(tuán)隊會面,討論語言過濾功能的可能性。
殖民遺產(chǎn)的算法延續(xù)
研究人員指出,這項工作揭示了在線平臺如何強(qiáng)化殖民文化并影響線下行為。蘇聯(lián)統(tǒng)治時期,吉爾吉斯斯坦人必須學(xué)俄語才能成功。如今,許多成年人俄語和吉爾吉斯語雙語流利,俄語仍是商業(yè)重要工具。孩子在學(xué)校必須學(xué)一定課時吉爾吉斯語,但許多人每天上網(wǎng)數(shù)小時,而看YouTube是首要活動。
麥克德莫特觀察到,引用俄語視頻內(nèi)容已成常態(tài)——無論是創(chuàng)作者的口頭禪"Let's do a challenge"、美式詞匯的俄語改編如"cringe"(尷尬),還是模仿俄語口音和句法。
平臺設(shè)計的結(jié)構(gòu)性張力
這項研究的尖銳之處在于:它暴露了"全球化平臺"與"本地語言生態(tài)"之間的結(jié)構(gòu)性張力。YouTube的推薦邏輯基于用戶行為數(shù)據(jù)優(yōu)化,但當(dāng)一個語言群體的內(nèi)容基數(shù)小、創(chuàng)作者少時,算法會自然"收斂"到內(nèi)容更豐富的語言——在這里是俄語。
研究團(tuán)隊模擬了近1.1萬次搜索與推薦路徑,量化了這種"隱形"的程度。數(shù)字本身不會說話,但那位每月故意晚交網(wǎng)費的母親,已經(jīng)用行動給出了評價。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.