(財見2026年4月7日訊)中國·貝賽思學(xué)子陳廣宇(Nathan C.),現(xiàn)就讀于華潤小徑灣貝賽思國際學(xué)校12年級,攜手知名人工智能企業(yè)月之暗面(Kimi)深耕核心技術(shù)研究,取得突破性成果。2026年3月16日,陳廣宇作為共同第一作者參與的技術(shù)論文《Attention Residuals》正式發(fā)表,迅速引爆全球AI界。特斯拉CEO埃隆·馬斯克公開轉(zhuǎn)發(fā)并評價這項工作“令人印象深刻”(“Impressive work from Kimi”);曾任OpenAI研究負(fù)責(zé)人的Jerry Tworek更稱這意味著“深度學(xué)習(xí)2.0”時代的到來。
![]()
2024年11月,陳廣宇在校內(nèi)為同學(xué)們做學(xué)術(shù)分享。
陳廣宇參與的研究,正在試圖改寫大模型沿用近十年的核心設(shè)計。陳廣宇和團(tuán)隊提出的新方法,讓模型學(xué)會根據(jù)當(dāng)前需要,自由選擇提取之前哪一層的信息。這套方法經(jīng)Kimi官方披露,可將模型訓(xùn)練效率提升25%。而陳廣宇和共同作者張宇在其中提出的“分塊注意力殘差”設(shè)計,正是讓這項創(chuàng)新能夠走向大規(guī)模應(yīng)用的關(guān)鍵。
陳廣宇來自深圳,出生于2009年,是華潤小徑灣貝賽思國際學(xué)校的創(chuàng)校學(xué)生。在投身前沿AI科研的同時,陳廣宇始終兼顧校內(nèi)的全部學(xué)業(yè)與各項校園活動,做到科研、學(xué)習(xí)兩不誤。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.