網易首頁 > 網易號 > 正文申請入駐

耿同學，一個退學博士是怎么用AI降維打擊學術圈的？

2026-05-21 00:10:40　來源: 秦朔朋友圈

上海舉報

分享至

2026年的春夏之交，中國學術圈和文學圈接連經歷了兩場“地震”。

學術圈的震中，是一個叫“耿同學講故事”的B站up主。36天時間里，他連續實名舉報了5位985高校院長級學者的論文造假，被點名的無一例外都是手握國家杰出青年科學基金和“長江學者”等頭銜的資深學者。

文學圈的震中，是一個叫“抒情的森林”的普通網友。從2024年10月開始，他用逐字逐句的文本對比，一年多時間內點名了近40位作家涉嫌抄襲——從86歲的楊本芬，到賈平凹、賈淺淺父女，再到蔣方舟等中生代與青年作者，覆蓋文壇老中青三代。

一個是生物醫學退學博士，一個是普通讀書人；一個用的是AI圖片查重和統計學工具，一個靠的是肉眼比對和查重軟件。兩個普通人，憑著各自的“武器”，正在撼動兩個領域的權威。

這聽起來像是兩個“憤青”打假的故事。但仔細一想，這里面還有更多值得思考的地方，那就是AI時代的到來，當普通人也能使用技術工具，監督權不再是少數人的特權，正在交還給每一個會使用工具的人。

當然，更深層的問題是，當一個體系需要靠一個退學博士來糾錯時，到底該從哪些方面來改進？

打假門檻低了

這場風暴最讓人震驚的地方，不是耿同學有多厲害，而是他用的方法竟然出奇地“低門檻”。

在中國學術圈，過往的學術打假是極少數人的能耐。要么你是同領域學者，要么得像饒毅那樣有學界影響又有揭露問題的勇氣，普通人連Nature這種期刊的文章都未必能完全讀懂，更別提找出數據造假的痕跡了。造假者占盡了所有便宜，專業壁壘讓外行人無從下手，學術共同體的“熟人社會”讓內行人睜一只眼閉一只眼，期刊審稿人時間精力有限只能基于信任評審。這三個門檻對普通人來說太高了，也因此讓造假長期是一種“低成本、高回報”的選擇。

而耿同學的打法和所有人都不一樣。他不跟你討論高深的生物學機制，不需要在Nature發過論文才有資格質疑你。他的武器是AI輔助的圖片和數據查重技術。

他的操作方法被技術圈拆解過，核心流程其實只有三步：把一篇論文的PDF拆成文本、表格和圖片，再把數據交給AI做審查。

具體來說，他重點檢查三個地方：

第一，看數據末尾數字分布是否過于集中。真實的實驗數據因為測量誤差的存在，小數點后一位乃至兩位應該是隨機分布的，而造假數據則會出現大量“5”“0”或某個數字完全消失的情況。

第二，看不同量表之間的數據有沒有雷同。比如基因表達量的數據序列和腫瘤體積的數據序列，本該毫不相干的實驗卻出現了幾個數值完全相同。

第三，用視覺大模型檢查圖片有沒有被篡改或重復使用。

耿同學自己有一句話說得極妙，在揭露中山大學鄺棟明的論文造假時，他說：“這不僅是學術界的恥辱，更是造假界的恥辱。連隨機數生成器都不會用的人，也配學術造假？”

數據造假被發現，根本原因往往不是造假者技術太差，而是太敷衍。中山大學康鐵邦論文中被質疑的實驗圖片，被網友形容為“像是從不同論文里直接復制粘貼的”。上海大學蘇佳燦的論文數據中，一組數據直接呈等差數列，“人為編造痕跡明顯”。就連同濟大學王平的那篇Nature論文，196只小鼠的體重數據中也出現了一只末位為“0”的離群值，這在統計學上是極不自然的。

耿同學對此的概括非常直白：“編造者甚至沒有花心思和時間去做一組隨機數據，而是完全隨心所欲地人為亂填。如果用心去編，其實我是看不出來的。”

這恰恰說明技術逼出了造假者的真實水平。一個在造假時都不愿意花心思的人，足以說明在這個生態里，造假已經成了一種常規操作，沒有人覺得會被發現。

本質上，耿同學只不過是把學術爭議從學術辯論降維成了數據判斷題。他沒有和你去爭論學科里面的那些高深的知識，只是從大多數只需要有一定觀察與推理能力就可以發現的問題問你：

這組數據的末位分布符合統計學規律嗎？這兩張圖片相似度是多少？這組數據有沒有在其他表格中出現過？

這些都是可以用算法來回答的，而且答案只有“是”或“否”，沒有任何灰色地帶。

不得不說，耿同學這套打法已經成了可復制的、人人都能掌握的工具，只要是有心人都可以試試。

文學圈的回響

如果說耿同學的故事是“技術賦能”的第一版本，那么“抒情的森林”的故事就是第二版本——它同樣印證了技術正在把監督權從中心推向邊緣，只不過用的是另一種工具。

抒情的森林是誰？從公開信息來看，他是一位普通的讀書博主。從2024年10月開始，他陸續公開了數十位作家已出版作品中與其他作家相似的部分語句和段落，引發輿論劇震。

他在一次采訪中坦陳：“我從0人關注開始發帖，很少下判斷，只呈現文本對比。直到今天，我更多的也只是展示事實本身，將判斷交給看帖子的人。”

過去界定抄襲，需要專家意見，需要法律程序，需要大量的專業辯論。而現在，抒情的森林只用了最基礎的“文本比對”——這是任何一個識字的人、會使用搜索引擎的人都能獨立完成的。

比如，他把賈平凹的《三十未立》和美國作家華盛頓·歐文《英國的農村生活》并列排在一起，讓讀者看到兩段文字幾乎完全相同，這樣簡單的技術工具就可以讓傳統上依賴專家權威才能做的事情，變成了任何人都能參與的“判斷題”。

在這一點上，耿同學和抒情的森林是殊途同歸的，一個靠的是AI圖片比對和統計學分析，把高深的學術論文變成了數據題；另一個靠的是文本比對和互聯網搜索，把模糊的抄襲爭議變成了直觀對照。

抒情的森林面對“你是不是為了流量”的質疑時的回應同樣值得品味。他說：“我無法阻止別人的質疑，甚至歡迎別人的質疑，但大家凡事不要代入過甚，以己度人，流于誅心之論。講話盡量有理有據，至少我自己是這樣要求自己的。你質疑的，有根據嗎？”

用證據說話，君子論跡不論心，當證據足夠清晰，動機就成了無關變量。

風暴背后

技術的發展讓普通人擁有了質疑權威的能力，很多人把這稱為“技術平權”，技術賦予了普通人挑戰權威的能力，這是積極的一面。但這場風暴另一個值得深思的問題是：為什么“耿同學”和“抒情的森林”做的，本該是體制本身應該做的事？

耿同學本人對此有一個非常坦率的觀察：“這段時間做打假以來，沒有任何一篇問題論文，是官方自己去找出來的。這是迄今為止讓我感到最失望的一點。”

他公開承認，自己發布的每一篇造假論文，“都不是我自己閑著沒事去扒拉的，而是我認識的朋友或者熱心網友先發現了，再轉發給我的”。也就是說，發現問題的人，壓根不是那些本該在審核機制里把關的人。

抒情的森林也遭遇了同樣的現象——被點名的近40位作家，除了86歲的楊本芬發文致歉，絕大多數選擇沉默。學術圈也幾乎是同一個劇本：除了饒毅等極少數人發聲，那些平時活躍的院長們、杰青們集體沉默。沒人說這是污蔑，因為證據就在那兒；也沒人否認，因為承認就等于承認自己和他們是一伙的。

在一個健康的社會里，學術論文有沒有問題，理應由學術共同體的內部審核機制來保障；文學作品是否抄襲，理應由出版行業自律和作者誠信來維系。但現在，這些本該由體制完成的事情，卻要依靠兩個“志愿者”用業余時間來完成，這是遠遠不夠的。

耿同學的視頻火了后，同濟大學的王平已經被免去院長職務，降低專業技術崗位等級兩級，涉事論文第一作者被解除聘用關系。南開大學、中山大學、上海大學都已成立調查組。

5月17日，耿同學再次發布視頻，喊話四所高校的五位“杰青”，要求他們先自查整改，否則將再次舉報。據他透露，這幾篇被質疑的論文均涉及Nature正刊或子刊。他對《三聯生活周刊》透露，第一條打假視頻發出后，他已經收到超過100條打假舉報。

也就是說，我們目前看到的，可能只是冰山一角。

對于這場風暴，我們不能止步于揪出幾個造假者，它應該催生更深層的變革，比如監督機制的現代化，Nature出版社母公司在2025年就已經開始用AI做論文審查，沒錯，就是用AI來查造假。事實證明，其實基礎的審查技術方案已經很成熟了，統計學檢驗、AI圖片比對、數據查重，哪一樣是今天的技術做不到的？問題不在于“能不能做”，而在于“愿不愿意做”。

又比如，當前的科研評價體系是不是需要變革了，當論文數量、項目經費、人才“帽子”與資源分配深度綁定時，學術就容易被異化成一場“績效競賽”，很多造假也就是這樣來的，畢竟這些造假的背后都是利益。

技術賦予每一個普通人以力量，但技術永遠不能替代制度。耿同學和抒情的森林只是拋出問題的揭蓋子的人，他們扔下的雷，最后還要由體制本身來接。

但這一次，我們再也無法假裝看不見了，因為AI時代來了，你可以繼續造假，但你要面對的不再是一個博主的質疑，而是全世界無數人的AI工具；你可以繼續抄襲，但你要面對的不再是幾個專家的評判，而是全網任何人都能參與的“文本比對”。在你造假的時候，你就應該問問自己，你真的經受得了這種審視嗎？

No.6897 原創首發文章｜作者梁云風

開白名單 duanyu_H｜投稿 tougao99999

歡迎點看【秦朔朋友圈】

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.