鄧思邈 發自 凹非寺
量子位 | 公眾號 QbitAI
一個博士生連續做了6小時實驗后,凌晨3點才吃上晚飯——
他打開了一首AI生成的歌,開始單曲循環。
![]()
聽著歌詞里的“被搶一作”“延畢”“審稿不通過”“創新點都沒有”“科研理想”,他又哭又笑,眼淚止不住地往下流。
那些他在組會上咽下去、在導師面前沒敢說出口的話,無奈、恐懼、焦慮、疲憊……全在這首歌里。他突然感覺自己被看見了,被理解了。
就這么一邊聽著歌,一邊把實驗做下去。直到窗外泛白,他才記起來自己一夜沒睡覺。
他不是一個人。
就是這樣42首歌組成的“不讀博音樂節”系列,在B站上收獲超5000萬次播放,376.4萬次點贊。
![]()
△參考文獻:少女時代.《Gee》EP, 2009.
為了用AI做出這樣一首滿意的歌,作者抽卡次數多的時候可以生成100多個版本
沒人知道他的真實身份,但卻有3000多封信寫給他表達感謝:
你不是站在岸上呼喊的人,而是會跳下水,和我們一起感受在水里掙扎浮沉的感受。
接下來,你將會看到一個被迫停下來的科研人,在停下來的時候,做出了讓別人得以喘息的東西。
他創作出這些歌詞和旋律,原本是為了治愈自己,結果治愈了別人,而別人的回應又反過來治愈了他。
寫歌的人自己也在水里
寫出這些歌的人,網名叫“餛飩皮茄總”。
![]()
△圖片為AI生成
是在讀博士生?博士畢業了?博士后?還是大學青椒?
說實話,我也不知道,他也不敢告訴我。
我只知道他是一名科研工作者,他寫下的每一個字,他自己或多或少都親眼目睹過、親身經歷過。
而這些情緒和作品的集中爆發,發生在一個他不得不從現實中抽離的時間點。
去年七月,他出了一場意外事故,左臂嚴重骨折,手術之后連正常生活都難以為繼,更別提回學校做科研。
但他竟然告訴我,至今他都非常懷念胳膊不能用的那三個月,是他最幸福的時光
父母把他安置在自家開的月子中心的單間里,有人每天送飯,從睜眼到閉眼,他就坐在桌前創作,不需要操心任何家務。
唯一受傷的是左臂,右手能用來操作電腦,大段空白的時間完全由他自己支配。
在那之前,他一直處于一種快節奏持續高壓、不停工作的狀態,每天被實驗任務、研究任務和各種deadline推著往前走。
![]()
△圖片為AI生成
那種生活里,一個人很容易忽視自己內心真實的感受是什么,甚至來不及問。
直到骨折之后,他才第一次被允許停下來,嘗試用一種旁觀者的視角去客觀看待自己,去審視那些長期被壓抑、被忽視的感受
科研進度被迫停滯了,但新的東西生長了出來。
去年7月18日那天晚上,觀看《歌手》直播,他聽著那個熟悉的旋律(原曲出自某冷門女歌手),腦子里突然閃過了另一套歌詞的模樣。
歌詞里寫的不是愛情,而是一個博士生面對一次次拒稿時的心酸和疲憊,是審稿人不斷否定和打壓之后的委屈,是學術夢想一點點碎掉的失落,還有明明已經崩潰、卻還是要硬著頭皮繼續做下去的那種無奈的釋懷。
他當天晚上就開始寫,第二天中午就寫完了。
他未曾預料過這首歌會大火,當時他以為只會有幾千次觀看,幾百個點贊。結果視頻一發出去48小時,播放量當即突破了5萬。
來自聽眾的鼓勵和正反饋源源不斷,于是他開始了平均兩到三天一更的節奏,更一條火一條,每天睜開眼都是999+,那種感覺“真的像做夢一樣”。
那段時間里他每天早上5、6點起床,晚上9點多就睡覺,或許也正是因為作息健康、精力充沛,去年8月他一口氣發了12首作品
他更沒有想到的一點是,這些歌同時在治愈他自己,縫合他的傷痛。
科研完全停擺的那幾個月里,他和外面的世界幾乎完全切斷了聯系,出不了門,見不到人。
但每天打開手機,后臺都會涌進無數條私信和評論。茄總說:
我不會覺得和這個世界脫節。這個世界在用另一種方式給我反饋。
那些歌詞,是他與自我進行的對話,就像是把自己長期壓著的情緒拆開來、放大、反復表達的過程。寫完之后,他反倒覺得輕松了很多。
他會選擇用音樂來表達,很大程度上只是因為一件事:喜歡。
沒有音樂科班背景,不識譜,也不會樂器。但音樂幾乎貫穿了他所有的日常,恨不得一天24小時把耳機掛在耳朵上——
做實驗、跑代碼的時候也要放BGM,他覺得只有這樣才能撐過那些枯燥的時間。
最初他動手寫歌的想法其實很樸素,如果能把這些迷茫、困惑和不甘心做成歌,那以后一個人搞科研的時候,至少可以當作背景音樂播放給自己聽。
近五年里,他看了30多場演唱會,從陳奕迅、鄧紫棋,到Taylor Swift,再到IU、BLACKPINK,他理解那種被音樂裹住、情緒一下子打開的感覺。
音樂于他,是愛好,也是一種排解苦悶的出口。他說音樂會讓人感到生活無時無刻都充滿旋律,“它會成為你人生當中的一種伴奏。”
用搞科研的方法論去“搞抽象”
他一開始并沒有刻意去總結什么方法。
只是寫著寫著,處理音樂的方式,就不自覺帶上了科研訓練留下的痕跡。
只不過研究對象換成了音樂旋律、情緒和人。
第一步,先選歌
他有一套“選歌三要素”:我聽過他的歌,我不討厭他的歌,我身邊的人也都聽過他的歌。
在此基礎上,還有一個獨家的選題庫可供參考。
通過逐條讀取留言區或私信評論,他主動記錄下粉絲的點歌需求,進行歌曲的呼聲權重排序,目前已經統計整理了上千條數據。
在他看來,聽人勸,才能讓別人更喜歡你。
盲目蹭新歌熱度不是他想要的,因為那樣做出來的作品,往往也與他歌詞原本想要表達的主題內核不搭。
這還沒完,這段視頻所選取的畫面,必須得是現場Live,因為音樂現場比錄制的MV更沉浸,適合用來釋放情緒。
![]()
△圖片為北京鳥巢五月天演唱會現場
他選素材也有一套標準——
只選兩類現場:舞臺美學設計在線、歌手當場情緒符合他填的歌詞。同時面部特寫還不能太多,否則口型不好處理。
所以他會把這首歌市面上能找到的所有Live版本,挨個看一遍,再做決定。
他拒絕用AI生成歌手演唱畫面或對口型,哪怕技術上已經可行。
實在碰到沒辦法對口型的情況,他會選擇把那個畫面瞬間切換,對準臺下的聽眾,或者來一個遠景鏡頭。
曾經因為找不到滿足要求的視頻素材,他不得不放棄一首非常想改編的歌,因為畫質是他的底線,1080P以下的素材不能用——“這是對觀眾的不負責”。
![]()
當歌曲敲定好之后,第二步進入填詞階段,茄總把它比作寫“八股文”或命題作文。
你不是在充滿自由的情況下去創作,它有著非常明確的規則、格式和方向在引導你。
他會對著原曲,記錄下每一句歌詞的字數、斷句、重音位置,甚至連原唱在哪里停頓都要打上標記。
最關鍵的一點在于,改編后的歌詞句尾的韻腳發音嚴格與原詞對齊,這是為了確保畫面中歌手口型能夠自然“對上”,不讓觀眾感到出戲。
原曲的音樂風格,也會對他的填詞產生影響。
如果原曲是憂傷的情歌,那二創的歌詞就可以用來表達科研人的心酸疲憊、無人認可的悲傷;如果原曲節奏很歡快,他就會在歌詞中加入更多自嘲、搞笑、抽象的元素,以樂景襯哀情。
他發現觀眾特別喜歡看外語歌被改編成中文,但發音依然順滑貼切的感覺,這背后與一個叫“空耳”的小技巧分不開。
例如,文章開頭少女時代的《Gee》,大家耳熟能詳的那句“Gee Gee Gee Gee / baby baby baby”,被他改編成了“記記記記 / 背背背”和“寄寄寄寄 / 悲悲悲”;
Michael Jackson的那首《Beat It》的“Just Beat It”,被他改成了“Just 避雷”。
他還從電影里學了一個技巧:打破第四面墻
仔細看你會發現,他的歌詞里經常會突然冒出來一句直接和觀眾互動的話,就像是歌手突然抬起頭,對著屏幕前的人開口。
![]()
填詞的工作,大部分時間都是一氣呵成寫完的,AI基本幫不上什么忙,因為“寫詞需要人腦主動去思考,需要溫度,這是AI給不了的。”
第三步,才到了重頭戲,也就是用AI模型生成音樂
這項工作會占到他總工程量至少一半的時間,甚至有時候能到70%。
在他看來,AI充滿幻覺,沒有哪一個模型能做到100%穩定不翻車。
突然的升調、降調,咬字發音不清晰,甚至完全改變歌詞旋律……諸如此類的情況時有發生。
所以他的應對策略是“賽馬”,同時動用Suno、MiniMax Music這樣的商業閉源模型,也包括HeartMuLa、ACE-Step這樣的開源模型,對同一段內容進行反復“抽卡”。
然后從這些模型生成的歌曲片段里面優中選優。
他會聽每一個版本,挑出表現最好的段落,再拼接成完整作品。
抽卡次數多的情況,同一首歌他甚至會反復修改,做出100多個版本。相當于他要把這首歌重聽100多遍,可以說是近乎強迫癥般的審美堅持……
他對自己的要求只有一條:我不能糊弄粉絲,也不能糊弄我自己。
AI擅長模仿和復制,但不擅長舉一反三,它生成的歌很難擺脫原唱的影子,“尤其是當你想添加一些自己想法的時候”。
所以茄總具體改了什么地方?
配樂,請看彈幕:
![]()
咬字和發音。AI如果念不準某個中文字的發音,就把它改成英文里的同音詞,或是筆畫更少、發音相近的中文字。
調(Key)。他會為了YOASOBI《群青》里一個不那么燃的結尾升華,去某魚花錢找真人歌手錄制降調后的Demo,再用AI過一遍,只為了增添那一點點“悲情現實主義”的質感。
如此一番“折騰”下來,你最終聽到的是一個好聽耐聽的版本,這也是茄總放在第一位的衡量標準。
他從不刻意追求對原唱音色的“神還原”。
相反,他希望自己的改編版本,在好聽程度和情感表達效果上,能做到讓聽眾暫時忘記這是一首抽象的二創。
“我”的含量很高,作品本身散發出一種主體性,這是他想要的,他也做到了。
![]()
△圖片為AI生成
但有些問題,到今天他也沒有解決。
茄總在改編過程中發現,AI至今都無法處理密集、復雜的和聲疊唱。比如在多聲道音頻面前,模型會失去辨別力,把幾個人的聲音誤認為是同一個人發出的,從而失去了原本的層次感。
這是他目前唯一真正放棄的遺憾。其他的所有較勁,都指向同一件事——
他想把這些歌做得足夠好,好到對得起聽歌的人。
那群聽歌的人
截至去年年末,茄總在后臺收到了3000多封粉絲來信。
那是B站推出的年終總結功能,用戶可以給自己的“年度摯愛UP主”寫一封信。
很多人提到會在做實驗時循環播放他的歌,也有人在讀博讀不下去時反復回來聽,甚至有人打算把他寫進論文致謝。
這群人需要他的歌,不是因為這些歌能解決任何實質性問題。
事實上,也沒有人因為他的歌,真正改變了人生走向。
來這里聽歌的人,要么是看完視頻慶幸自己當初沒選擇讀博;要么就是覺得——這說的就是我現在的感受。
大家其實是在尋找一種共鳴和歸屬感
△參考文獻:YOASOBI.《群青》EP, 2020.
![]()
他們的父母、親朋好友未必能切身體會他們做科研時的感受和處境,于是需要一個互聯網嘴替幫他們發聲,從中找到一種精神解脫,然后接著繼續苦中作樂
而且這種狀態,并不只是發生在網絡世界。
茄總有一個同樣在搞科研的朋友,從小唱歌就非常好聽,自己也創作過很多歌,但從來沒敢發出來,只是私下發給他聽。
有一天他們打視頻電話,聊到這件事,朋友嘆了口氣,說已經很久很久沒有寫過新歌了,因為沒有時間
讀博最殘忍的一點,是它會把人放進一種長期不確定的封閉環境里
你不確定自己的實驗失敗多少次才能成功,不確定費盡千辛萬苦寫出的paper會不會被拒,不確定還需要多久才能達到畢業要求。
全世界和你做同一個細分方向研究的,可能不超過10個人
你的父母不理解,你的朋友不理解,尤其是當實驗失敗、論文被拒、導師也未必能給出有效的幫助的時候。
人在這種處境里,很容易開始懷疑自己,覺得自己一無是處,然后這種自我否定會慢慢積累,甚至變成長期的內耗,慢慢侵蝕進身體里。
![]()
更深的困境在于,很多人拼命內卷,最后卻發現自己追逐的那個研究方向根本沒有意義。
真正有價值的想法早就被人做過了,剩下的大多是跟風的熱點、邊角料的題材,或者為了滿足考核指標硬湊出來的偽命題。
他們不是不努力,但他們自己也搞不清楚,這些努力到底值不值得。包括茄總他自己在內,也是擰巴的曲中人之一。
純粹靠好奇心驅動的研究,是極少數人才能享受的奢侈品——它需要更高的容錯率,也需要更多的資源支持。
絕大多數普通科研工作者只能被績效和KPI牽著走,什么熱點火就做什么,被迫生產出那些可以快速發表、可以拿到經費的東西。
大多數人在踏進“圍城”之前,也沒有想清楚自己到底該不該、適不適合讀博。
![]()
很多人要么是出于科研信仰,要么是把學歷當投資。但茄總發現,這兩種理由都不牢靠。
因為科研信仰會在一篇篇灌水的paper面前慢慢磨損;投資的回報又從來不是穩定的,“絕大部分資質平庸的博士生,畢業之后還是拿不到985和211的教職,也拿不到大廠頂尖的人才計劃offer”。
作為同路人,茄總想通過這些歌,把沒有擺在明面上的代價講清楚。很多人只看到讀博的好處,但從來沒想清楚這背后隱藏著什么。
如果把個體經驗拉回到整體層面,這群聽歌的人,其實是一個正在持續擴張的群體。
根據國家統計局數據,全國在學研究生人數(含碩士和博士)從2023年的388.3萬,到2024年的409.5萬,再到2025年的430萬,三年連續攀升。
![]()
那些聽歌的人終究會離開這條路,但還會有新的人走進來,帶著同樣的疲憊,同樣找不到人說話,同樣在評論區戒讀……
沒有人會讀一輩子讀博士,但是每年都會有新人讀博士。
One more thing
今年年初,茄總重新回歸科研生活。視頻更新的頻率不得不回到一周一更,甚至是一月一更。
有人會私信關心他:是不是手頭在趕什么paper?是不是論文馬上要提交了?
他們替他想好了理由,因為他們自己也是這樣過來的。
但茄總依舊沒有斷更,當然也不會停更。
讓他真正下定決心要把這個系列做下去的那個時刻,發生在去年中秋節。
那天他上傳視頻的時間比平時晚了很多,快到深夜11點才發出去。
他以為沒什么人會看,結果不到一個小時,評論區涌進來很多人,給他點贊,留言祝他中秋快樂。
![]()
就是那一刻,他突然意識到,“我要守護這個群體。”
曾經,他在工位獨自肝到深夜。現在,因為這些歌,他和無數素未謀面的陌生人之間,建立了某種真實的連接。
他想了很久,該對這群人說些什么。
還在考慮要不要讀博的人:先想清楚你愿意為它付出什么代價,而不只是你想從中得到什么好處。
正在讀博的朋友:不要因為實驗失敗、文章被拒而否定自己,你的身心健康比任何一篇paper都更重要,都更值得被珍惜。
已經博士畢業的朋友:你能走到今天真的很不容易,接下來的人生,請不必再用同一套標準去證明自己。
他一直覺得自己歌詞里寫的那個人,是一個有血有肉的普通人。
不是只會坐在原地嘆氣,更不是什么loser,而是那種在學術生涯里遭受了很多挫折、卻還是在積極樂觀往前走的人。
你應該認識這樣的人。
或者,你就是。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.