![]()
編輯 | 心悅
數學中有一個樸素又深刻的問題,被稱為親吻數問題(Kissing Number Problem, KNP):在一顆中心球周圍,最多能緊貼放置多少顆相同的球?
在一維和二維情況下,答案可以簡單求解是 2 和 6。但當維度增加到 3 維,問題就變得復雜起來,一度讓科學巨匠艾薩克?牛頓和蘇格蘭數學家大衛?格雷戈里為其爭論。1694 年,牛頓認為三維空間親吻數問題的答案是 12,格雷戈里認為是 13。這個謎團持續了近三百年,直到 1952 年,數學界才證明牛頓是對的。傳奇數學家保羅?埃爾德什曾言,離散幾何或許就始于這場著名的「12 對 13」之爭。
![]()
親吻數問題的意義遠不止于數學本身,在物理、信息論、材料科學等領域,它皆有深刻的應用價值。例如,在信息編碼中,用最少的比特數壓縮最多的信息,就與親吻數和球體堆積這類問題相通。2022 年,數學家馬林娜?維亞佐夫斯卡還因對球體堆積問題的貢獻,獲得了菲爾茲獎。
然而,在高維空間中堆疊球體,隨著維度增加,可能的排列方式會呈爆炸式增長。人類在這種巨大組合空間中的處理能力非常有限,幾何直覺也往往并不可靠,甚至可能完全違背實際情況。
過去近 50 年中,親吻數構造僅有 7 次實質性進展,而且每一次突破幾乎都依賴完全不同的數學技巧,難以形成可復制的研究路徑。
當傳統數學方法遭遇瓶頸,人工智能為這一世界級經典難題帶來了方法論層面的轉折。
近期,上海科學智能研究院(下稱上智院)、北京大學、復旦大學的聯合研究團隊設計出一套名為PackingStar 的強化學習系統。該系統將高維堆積問題轉化為余弦矩陣(描述球心之間幾何關系的矩陣)上的多智能體博弈學習任務,從而使人工智能得以探索遠超人類直覺的復雜空間,并在連續 7 個維度上刷新了親吻數世界紀錄。
![]()
從數學難題到多智能體游戲
一個偶然的機會,PackingStar 項目組長馬成棟關注到親吻數問題,被其簡潔的表述、明確的答案,以及數學命題獨有的客觀可驗證性所吸引。他敏銳地意識到:這一經典的高維幾何問題,或許可以通過強化學習的方法進行全新的探索與求解。
為了找到親吻數問題的通用研究路徑,PackingStar 團隊首先回到了問題本身,分析最基本的約束和前提。
親吻數問題本質上是一個「加球」問題,而問題的關鍵在于:在球盡可能多的前提下,下一個球可以放在哪個位置?
這就相當于在坐標空間中做選擇題,順著這個思路,團隊順利求解八維以下的親吻數問題,但有一些注定無法被解決的限制。比如,數值誤差會隨著球數越來越多而不斷地傳播、累積,以至于誤差本身都足以破壞整個堆積結構。
那么,有沒有可能簡化這個選擇題?
在親吻數問題中,兩個球體的原點之間可以形成連線,而兩條連線之間角度的余弦值是有規律的。團隊意識到,這些余弦值會收斂到一個有限的集合中。
![]()
這個發現至關重要,因為它讓研究團隊從「逐個求解球體坐標」這一難以并行、計算量巨大的思路中跳脫出來,將整個問題的建模從坐標空間轉向余弦空間,這是前人未曾探索過的路徑。
研究團隊引入了余弦值矩陣(Cosine Matrix),將一個非常復雜的高維幾何問題變成了余弦值矩陣填充問題。
![]()
當前人工智能擅長的就是依托大規模并行計算架構,快速處理大量數據,從中找到特定模式和規律。引入余弦值矩陣使所有計算都被重構為矩陣上的并行運算,并且幾乎不引入精度誤差,這天然適配了大規模 GPU 的計算邏輯,充分釋放了 AI 模型的潛力。
在這個矩陣填充問題中,每一步需要從待選動作集中選取一個條目來填充余弦值矩陣,直到整個矩陣無法再被填充,即在高維空間中學出一組最優的策略。這個過程是不是看起來很熟悉?沒錯,這符合強化學習的工作原理,也恰好印證了馬成棟此前的猜想。
研究團隊把余弦值矩陣填充任務設計成一個游戲,用強化學習來訓練智能體去玩這個游戲。在這個游戲中,智能體作為玩家,通過不斷選擇填充動作、接收環境反饋,逐步學會在復雜的組合空間中做出更優的決策。
![]()
然而,這個游戲并不簡單,每一步的動作空間都異常巨大并且變化不定,獎勵也非常稀疏,動作策略很難被表征和學習,研究團隊嘗試了大量方法來修減候選動作空間。此外,不同的「加球」順序可能會得到完全相同的結構,重復探索會影響學習效率,最終導致 AI 難以學出好的策略。
![]()
在維數達到 14 維時,研究團隊發現經過千百次實驗,仍然沒有復現出數學家的結果(1932)。這一度使研究陷入僵局,讓研究團隊感到非常沮喪。
突破的契機,竟源于研究人員與 AI 之間一場特殊的「較量」。
當 AI 在高維空間中探索時,團隊里的青年科學家也在并行地審視著這個難題。他們發現如果手動刪掉一些球,就可以復原 14 維的經典結果 1932,也就是說有一些球加進來之后會破壞整個結構。這意味著 AI 應該學會識別并剔除這些球。
「我們像是與 AI 展開了一場『智力拉鋸戰』。在 AI 探索這個高維難題時,我們也在搜索同一個地方的寶藏。如果我們在某一步比 AI 表現得更好,就會嘗試把這種人類獨有的直覺轉換成算法,再次注入 AI 的血液」,數學系出身的團隊核心成員陶兆巍說。
于是,團隊意識到單一智能體不足以完成這項任務,必須引入一種能夠識別并剔除「問題球」的修正機制,由此設計了另一個智能體,專門模擬人類通過直覺與經驗進行手動修正的操作。兩個智能體形成了相互協同又彼此制衡的「合作博弈」關系:
填充智能體負責探索與構建:通過快速填充余弦值矩陣,填充智能體構造出高維空間中球體堆積的初步形態,并通過強化學習不斷優化生成策略,但僅依靠填充智能體會產生大量次優填充。
修剪智能體負責評估與優化:次優填充就意味著球體堆積結構不夠合理,這時修剪智能體就負責識別并去除次優填充,再將余弦值矩陣交由填充智能體重新填充,反復迭代,最終得到最優解。
這種雙智能體協同的設計,既融合了人類的結構性直覺,又發揮了 AI 的搜索與學習能力,巧妙的幫助 AI 壓縮了探索空間,提高了樣本質量,成為 PackingStar 工作中最為精妙的方法創新。
![]()
至此,困擾數學界的高維親吻數問題,被成功轉化為一個「多智能體游戲」。
有趣的是,研究團隊驚喜地發現,在不同高維復雜結構中(例如 2000 個球和 2400 個球的結構),存在著一些完全相同的、具有良好幾何特性的核心子模塊。這一發現提示,這些低維且具有普適性的「子結構」或許可以作為破解高維問題的基石,將原本混沌無序的高維空間結構化,從而使其變得可分析、可駕馭。
正是基于這一思路,研究團隊提取了一個關鍵的子結構,并以其為基礎,實現了 25 至 31 維的突破。
工程優化加速科學發現
盡管數學難題可以被轉化為多智能體強化學習任務,但高維問題固有的復雜性并未因此消失。隨著維度的增加,搜索空間呈指數級膨脹,系統所需的計算量也隨之急劇攀升。當維度上升至 18 維、19 維時,團隊構建的 PackingStar 系統會出現學習效率的明顯下降,探索的步伐在龐大的可能性空間中逐漸放緩。
實際上,這不是親吻數問題才有的困境。很多科學智能(AI for Science)問題都需要在指數級增長的解空間中尋找最優解,因而在研究的擴展階段普遍遭遇類似的「維度瓶頸」。
為了讓 PackingStar 項目順利推進,上智院首先從整體 GPU 算力池中專項抽調出穩定可靠的算力資源供其使用。而比資源更關鍵的,是團隊的融合 —— 讓工程側的「精兵強將」與算法團隊深度合作,讓他們共同理解問題、拆解瓶頸,實現工程優化。
工程優化也是過去一年 AI 領域熱議的話題,業內開始探索在 AI Infra 層面為模型優化出「額外學習空間」:通過算子優化、調度策略升級等方式,提升 AI Infra 的整體效率。在核心算法實現突破之后,工程層面的深度優化已成為推動研究邊界繼續延伸的鍵。
在 PackingStar 項目中,工程團隊通過優化底層算子,大規模加速了搜索。原本 PackingStar 系統直接調用了一些 CUDA 原生算子,但通過性能分析,研究團隊發現其內存訪問模式會對大量中間變量進行顯存拷貝與冗余讀寫,GPU 的有效利用率較低。為此,他們重寫了定制化的 CUDA Kernel,直接在 GPU 上計算并原位寫入數據。這樣一來,核心計算鏈路的端到端吞吐效率就提升了數倍。
另一方面,計算過程中有些操作對精度要求很高,有些則不需要那么高的精度。研究團隊為此設計了混合精度機制去逼近每一個精度級別的極限,從而大幅提高了計算效率。
![]()
我們可以這么理解工程加速的意義:計算和智能密不可分。能夠在給定問題下迅速做出最優選擇,本身就是智能的重要體現;當搜索速度提升數倍,原本需要三年完成的工作,就可能在一年內完成。
除了提升計算效率,確保程序可靠穩定地運行對 PackingStar 這種長周期任務也是非常重要的。千卡集群上,一次中斷就可能讓數天的計算進度歸零。如果程序在集群上頻繁崩潰,即使單次執行速度再快也是反復運行失敗。
因此,工程團隊為 PackingStar 構建了容錯機制 —— 自動 Checkpointing 系統,使程序可以定時滾動存檔,并在出現故障后自動回溯恢復,確保數據零丟失、任務斷點可續傳。
這么一頓操作下,PackingStar 的搜索效率提升數倍,累計節省超 10 萬 GPU 卡時。相關算子與方法已在上智院牽頭建設的星河啟智科學智能開放平臺上沉淀為可復用能力,為更多科學問題提供智算基礎。
人工智能和科學行至今日,工程優化已不再是配角,而是科學突破的基礎設施 —— 以其穩定性和效率來對沖科學發現的不確定性,加速科學發現。
世界級難題的系統性突破
PackingStar 不是唯一一個嘗試用 AI 求解親吻數問題的研究。Google DeepMind 的 AlphaEvolve 曾刷新 11 維空間中的下界(從 592 提升至 593),對原有構型進行了局部調整與修補,但未能給親吻數問題提供新的求解路徑。
PackingStar 的不同之處在于:它不是基于已有幾何直覺做簡單拓展,而是選擇重新定義問題本身 —— 將高維幾何難題轉化為 AI 模型所擅長的代數計算問題。這不是工具層面的替換,而是開創了全新的方法論,帶來了 AI for Math 范式的一次前移。
![]()
今天,在維基百科上,25 至 31 維空間的親吻數下界,標注著同一個名字:PackingStar。這意味著,一套強化學習系統,一次性在連續 7 個維度上刷新了世界紀錄,還在廣義親吻數問題上完成了一系列維度的紀錄突破,取得了系統性而非單點突破。
![]()
![]()
同時,研究團隊還在一些維度獲得了更深層的發現。例如,在 12-15 維中,團隊發現多個持平紀錄的「非對稱構型」。這超越了人類的幾何直覺。傳統的高維球體堆積的構造往往高度依賴于結構的對稱性,而非對稱構型是借助 AI 探索發現的新穎排列方式。
![]()
這就像是 AI 為我們打開了一扇觀察高維空間的新窗口,也提醒我們,高維空間遠比我們想象的更為復雜多樣。
PackingStar 取得的突破很快引起了當代離散幾何與編碼理論領域的領軍人物、MIT 教授 Henry Cohn 的高度關注。在 Cohn 的建議下,PackingStar 團隊針對廣義親吻數問題展開了研究。
廣義親吻數將研究從「一個單位球面周圍能放置多少個與之相切的單位球」擴展到「多個單位球面周圍能放置多少個與之相切的單位球」。PackingStar 團隊在此方向上取得了多項突破,例如,在 14 維與 17 維情況下,打破了「兩球親吻數」的最佳構造紀錄;在 12 維、20 維與 21 維情況下,打破了「三球親吻數」的最佳構造紀錄。
值得注意的是,這些由 AI 生成的結構,數學多樣性極為豐富,包含著數學家從未想到過的構造方式:有些是低維結構的巧妙拼裝,有些是基于特殊規則的張量積,有些則對應于已知結構的新的分解方式。這不僅豐富了廣義親吻數研究,還為數學家 Cohn 提供了新的思路。
![]()
人類和機器共探科學的浪漫
PackngStar 項目的意義,遠不止于為親吻數問題找到新解,它更是一次完整的 AI for Math 路徑驗證:從問題拆解、算法設計到工程優化,證明了人工智能可以為數學注入從無到有的「規模化探索」的能力。
這個過程不是 AI 的單打獨斗,而是依托人類與 AI 互促進化的科研范式:人工智能在遠超人類直覺所及的空間中學習如何求解問題,人類隨后對其產生的結果進行解讀與抽象,從中提煉新的數學規律 —— 兩股力量循環往復、彼此反哺,最終凝結為人機協作的完整閉環。
作為「科學的語言」,數學為物理、化學等眾多學科提供了基本的描述和分析工具 —— 當人工智能能夠介入數學發現、在嚴謹的公理體系中與人類協同推理,它便會在更多科學領域發揮更大作用。
今天的科學智能,正經歷一場深層躍遷:從依賴既有數據和信息解決已定義問題,走向圍繞復雜科學問題構建探索系統。人工智能已成為與科學家并肩的探索者 —— 當科學家有了好的想法,人工智能能夠以其大規模探索能力,幫助科學家高效地探索未知宇宙。
這本身,就是一種人類和機器共同探索科學的浪漫。
當科學發現不再依賴單點英雄的橫空出世,而是成為人機協同、平臺支撐、跨界融合下的系統涌現,我們正在見證:科學發現,從天才的靈光一閃,轉變為人機共舞的必然成果。
為了回答牛頓三百年前的一個問題,一群中國青年讓 AI 學會了創造高維幾何結構。科研紀錄短片《Packing Star》,帶你回到 1694 年,也帶你遨游數學宇宙。
(PackingStar 團隊的科研青年們,從左至右為:劉明灝、李鵬宇、馬成棟、陶兆巍、陳浩鈞、毛子皓)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.