|作 者:朱駿宜? 趙文靖
(香港中文大學物理系)
本文選自《物理》2026年第4期
01
優化算法在科學中的核心地位
![]()
從物理角度來看,不同的物理問題往往可以通過一定的簡化,抽象成某一個偏微分方程。這個方程的形式可以相當復雜,但是最大的挑戰往往還是來自于復雜的邊界條件。在經典力學的時代,拉格朗日發展出了變分法,至此,邊界條件的復雜性,就可以被轉化為通過變分法來優化一個多變量的函數以對應復雜性。這樣,可以把困難的邊界條件問題轉化成一個困難多變量函數的優化問題。當然,從工程上來說,工程師們很多時候更關注一些特定多變量函數的優化問題,像如何組織復雜的電路負載來省電,如何指揮機械臂來完成某種任務,如何尋找一種優秀的材料來獲取某種最優的功能,如何通過設計一系列的化學反應,在獲得需要產物的同時節省最多的材料和能源,等等。因此,一個優秀的全局優化算法是解開大多數物理和工程問題的鑰匙,在計算物理乃至整個科學和技術發展過程來說,居于核心位置。
02
從梯度優化到演化算法的代理視角
![]()
經典的方法是通過各類梯度方法來求得局域最優,比如牛頓法[1]、最速下降法[2]、共軛梯度法[3],等等。但是局域最優不是全局最優,因為最后的優化結果取決于從哪里開始嘗試。我們通常相信人類歷史上有一些天才具有敏銳的洞察力,他們因此總能夠從一個比較重要的局域最優附近開始他們的科研,或者說優化歷程。然而,在多變量函數對應的高維空間,絕大多數的起始點都是平庸而遠離最優解的,所以突破性的發展就格外稀少。也許,這種對天才的想象,更多是表達了對從相對重要起點出發的幸運者的崇拜。
下面,讓我們跳出探索者的視角,從探索者行為的外部來觀察他們。不妨把這些幸運或者不幸的探索者看作一個個代理。無疑,代理間的關系就成為了一個有趣的組織性問題。既然我們無法預測哪個代理會成功,不妨賦予大量代理探索性的任務,來看看什么樣的組織方式是有效的。假設他們都并不相關,這就是最簡單的一類并行處理,適用于像蒙特卡羅模擬這樣的問題。事實上,費曼在洛斯阿拉莫斯實驗室的計算小組雇傭大量女秘書來從事一些繁重的計算勞動,這種行為也可以看作是并行計算的早期嘗試。在人類組織的演化過程中,這類嘗試也是大量存在的。比如在傳統上一般認為,西周的統治者會通過一種井田和逐級封建的制度,來相對均勻的分配土地、組織農業生產并協調稅收和分配[4],這種井田制也被后世的儒家學者們當作政治治理的基礎規范而不斷嘗試和改進。但是,不幸的是,我們要探索的復雜空間和耕種問題是不同的。這是因為,在絕大多數的區域很可能其函數值都是不重要且無趣的,所以簡單地把函數的變量空間劃分成均等的若干份,明顯是一個不怎么聰明的辦法。事實上,我們通常期待一些重要的局部最優點附近往往會有更加優秀的函數值。因此,需要把這些代理們有效地組織起來,讓他們交流信息。
03
粒子群優化算法的仿生啟發與局限
![]()
在20世紀90年代,粒子群優化(particle swarm optimization, PSO)算法是一個異軍突起的算法[5]。它通過向鳥群學習,去模仿鳥群的構造和信息交流方式,來達到優化一個函數的目的。這個算法通過記錄群體當前最優的位置和個體當前最優的位置,來不斷改變每一個代理的速度,也就是每一只飛鳥的速度。這個算法在今天依然有大量的應用。比如國產的尋找新材料的Calypso算法[6],就是結合了對稱性分析和粒子群優化的一個優秀算法,在材料物理領域有重要應用。在工程方面,粒子群優化也在很多的優化問題當中為我們的日常生活默默做著貢獻。然而,這類算法的原始形式依然存在很多潛在問題。盡管在早期,研究者試圖讓每一只小鳥通過觀察其周圍小鳥的飛行姿態,來調整自身飛行方式,保持鳥之間的距離。但是這類計算通常來說是比較繁重的,因為要保持鳥間距離就需要傳遞大量的飛行姿態信息,以及在算法上的各種微調和技巧。因此,在粒子群優化的正式版本中,這些措施被刪除掉了,這直接導致的問題就是粒子群優化也還是容易局限在某個局部最優的區域。盡管如此,粒子群優化具備高度的啟發性,也就是說,我們不應該執著于某個函數變量空間某個點的梯度函數,而是應該以一種模仿自然的組織原則為方法來獲得對自然的認知。
這種仿生的做法看上去頗為原始,卻具備了非常有趣和有效的內涵。事實上,在物理學的發展過程中,基于類比和模仿的新發現比比皆是,比如薛定諤方程的建立,正是基于對波動性的抽象類比。事實上,在新石器早期,古人類對星空的觀察,北天極不動性的體認,方向和歷法的建立,也都是建立在類比和模仿的基礎上,這正是古人所謂“象天法地”。既然模仿鳥群行為帶給我們粒子群優化這樣的優秀算法,是否可以進一步地模仿人類的組織行為,獲得更加靈活而優秀,并且不容易停滯的算法呢?答案顯然是肯定的。
04
歷史中的算法智慧:從中原王朝到草原帝國
![]()
我們不妨把步子先邁大一點,看看在抽象的層面,一個優秀的算法,或者組織原則,應該是什么樣的。這里面,最原始的原則就是尚書中記錄的舜向禹傳述的16字,“人心惟危,道心惟微,惟精惟一,允執厥中”[7]。這句話傳統上可以被解釋為:人心變化莫測,道心中正入微。要真誠地保持精純專一之道,使人心與道心和合,執中而行。對應到算法上,不妨把人心視作一種局域的演化選擇,也就是說,每一個搜索代理,由于其視野的有限性,其搜索和優化必然在局域中進行。這里,“危”就是高的意思[8],其含義正是可以類比俗語,“人往高處走”,也就是局部的智慧試圖進行局域優化。而“道心”指的當然就是更加全局的演化原則,也就是通過不斷運動,在漫長的時間域上覆蓋所有可能性。具體而言,在全局的演化角度上,由于足夠長時間的隨機游走必然可以訪問函數自變量空間的每一個細節,局部是不重要的。因此對于前8個字,局域優化伴隨著有意義的計算,信息熵的降低和能量的耗散,而隨機游走則是全局演化的基本原則。而在后8個字當中,“精”可以被視作局域的提煉或者萃取[9],“一”可以被理解為復雜系統里每一個基本組成單位的運動,“中”是大地和天文測量的工具。總體來說,后面8個字表達的很可能是領導藝術的基本原則,即同時體認局域的優化和基本單位的運動這兩種特性。過于局域優化,則系統容易陷入停滯,過于全局漲落,則會浪費大量算力和資源。其哲學意象,頗類似于物理理論中的漲落耗散定理。
然而這種抽象并不能直接幫助人們解決問題,因為我們的初衷是向歷史學習,真正去構造優秀的全局算法。我們不妨回到周代,看看周禮的世界。周禮的世界以一種等級制度來劃分整個疆域,其結構呈現出分形特征。也就是各個代理均下轄4到5個的代理,經過遞歸式的推行到若干個級別之后,就完成了疆域的劃分。這種等級制度的好處在于每一個領導代理只負責4、5個下屬代理,這樣其下屬代理之間的信息交流就變得相對簡單,對應于物理里的一種局域近似。另外,每一個領導代理不需要操心其下屬的下屬。根據這些原則,可以構造出一棵具備等級的樹形結構,如圖1所示。
![]()
圖1 等級樹結構的示意圖,每一個點代表著一個代理,點與點之間的連線表示代理之間的上下級關系
可以看出,無論在這棵等級樹的哪一層,這些不同層的領導代理盡管處理的疆域尺寸不同,其工作的復雜度都是相似的。對應到算法設計中,我們可以設定一個規則:當某個代理的下屬更新其最優位置時,這個代理會立即將這個新位置與其歷史最優位置相比較,如果新位置更優秀的話,這個代理就會更新自己的最優記憶位置。這樣,越靠上層的代理,其信息的更新速度就應該越慢,因為它只在下屬確實帶來了更優結果時才會行動。基于這樣的更新機制,可以只允許最底層的代理做函數的計算,從而使上層代理僅負責信息的處理和流動。此外,這種組織形式很可能類比為道德經里的所謂“無為”原則[9],也就是說,從體系外觀測,越是上層的領導,其記憶更新的頻率會越低。我們發現,在新算法等級信息樹(hierarchical information tree, HIT)中,這一原則也得到了統計上的支持,如圖2所示。
![]()
圖2 等級信息樹算法中不同層級記憶更新次數的分布圖
然而,這個類比依然過于抽象且有一些內稟的問題,這在于周禮的劃分是靜態的,而這種靜態的劃分依然是過于簡單了,不能適用于復雜的函數空間。這里,我們可以再次借鑒歷史,從中學習動態的組織原則,而動態的組織原則是產生在深遠的北方大草原上。按照著名地理學和邊疆學大家拉鐵摩爾的觀點,純游牧的生產方式和組織形式的成型晚至秦漢時代[10]。其產生,是在秦統一并修筑長城后,一批生活在農耕與草原交界地帶、從事混合經濟的先民,轉而選擇了高度流動的純游牧生活方式的結果[11],即混合生業模式轉化為相對靜止的純農業與相對高度動態的純游牧。而后一種組織形式的特點,正是其高度的流動性。草原帝國這棵算法樹在大草原上逐水草而居,經常性地劃分不同級別的牧場,而其財富正是來源于這種有組織的流動。對照于這一原則,我們不妨允許所有的代理以一種分形的信息分發方式移動。每一個代理的下一個位置,由其領導的當前位置和其自身的最優記憶的某種隨機疊加而決定。因此,這種組織方式可以避免經典的速度概念,整個系統的運動方式具有高度的漲落性,而不同層級的重要位置信息則通過算法樹,不斷疊加與重組。每一個領導代理并不去計算函數值,而只是負責信息的處理。同一個領導代理的5個下屬代理之間則保持一定的距離,如果過近就把其中一個表現略差的隨機踢到一個近鄰位置。這里選取5只是因為5是在分型系統里有著重要數學意義的費根鮑姆常數的整數近似值[12],該常數對應著在分型結構的有序與混沌的過渡中,周期倍增時的參數間距比值。在中國歷史上,契丹族建立的遼朝可以被視為一個具備高度流動性和空間分形結構的政治實踐。其五京制度[13]和四時捺缽制度[14],正可以視作這種高度有序流動性分形統治結構的體現。
05
等級信息樹算法的提出與分析
![]()
我們基于上述原則建立的嶄新算法,稱之為等級信息樹,如圖3所示。我們把這個算法和粒子群優化算法做了細致的比較,發現它可以輕松處理幾十個到上百個變量的優化問題,在晶體結構優化、表面重構搜尋和幾個數學函數上的表現都遠遠超過粒子群優化。具體細節請參照我們已經發表的文章[15]。另外,由于這個算法利用的是費根鮑姆常數構造的自相似結構,因此代理間距離的計算量正比于底層代理的數目,如圖3(b)所示。而不具備分形結構的算法則正比于這個數目的平方,因此我們的算法在處理子代理的距離運算時效率有顯著提升。然而,這個算法僅僅是一個開始,因為它模仿的對象還只是草原帝國時代。一個真正具備靈活性的算法,一定還有更多的原則等待探索。下面不妨做一番分析和臆測。
![]()
圖3 (a)等級信息樹的多層樹狀結構及代理間關系的示意圖;(b)此示意圖表示從屬于同一領導的子代理的間距,每條虛線均代表兩個同事代理之間的一次距離計算。只要使不同等級的同事代理之間保持合適的距離,就能使整個信息樹所有的代理避免過度聚集
首先,這個算法和目前流行的各類深度學習算法顯著不同。所有的深度學習算法都是基于確定數據集的擬合類算法,而等級信息樹是根據當前搜索信息的分形排列,不斷重組各級別的記憶,且主動探索更重要位置信息的算法。因此,它更像是一個活的生命。它在局域內具有高度的優化傾向,而從全局來看,則具備高度的漲落性,這種組合是符合16字原則的[7]。此外,通過分析等級信息樹算法的成功率隨優化步數變化的趨勢,并與粒子群優化算法進行了對比,我們發現等級信息樹表達的是一類高度波動的算法,如圖4所示。盡管在前面5000步,并沒有特別的表現,但是到了1萬步之后,等級信息樹產生了一個非常令人矚目的成功率躍遷,類似于相變中序參量的突變。這表明,真正意義的全局智慧正如道德經所描述,是大器晚成的[16]。只有對搜索空間產生了全局性的認識之后,這種全局智慧才會真正發揮威力。若將這種大器晚成的現象類比到教育領域,我們就會自然提出一個疑問,即是否要根據短期考試的表現來大規模的培養所謂少年天才。
![]()
圖4 等級信息樹算法(HIT,藍線)與粒子群優化算法(PSO,紅線)的優化成功率隨優化步數的變化
其次,領導代理的當前位置是個非常有趣的概念。在物理上,只有最底層的代理會去計算其位置相應的函數值。這樣,領導代理的當前位置可以被視作一個虛擬的概念。它由前一步的虛擬位置、其自身的最優位置和其領導的當前位置決定。這種虛擬的概念不妨當作一種理想或者意識。這種理想是一個復雜系統自發產生的某種幻覺,而這個幻覺是有意義的,它表達了這個代理為了滿足其算法目標而做出的一種努力,而物理層面上的底層代理則是受這些理想直接或者間接的影響,而產生了實際的努力。與此同時,底層代理獲得的新函數信息則作為重要的現實世界的反饋,來改變這些理想。而頂層代理的當前位置就是其最優位置,也就是代表了當前全局的最優信息,這是完全現實主義的。
然后,不妨再審視一下每一個非頂級領導代理的性質和功能。領導的位置會對其下屬代理的位置產生直接影響,而每個領導的最優位置則對其自身位置產生影響。也就是說,領導的位置信息會替代其最優記憶信息在整個樹型當中流動,其最優位置信息在信息流的權重就會較低。因此,就降低了當前最優信息的流動速度,從而增加了系統整體的隨機漲落。在社會科學和政治科學當中,這種處理有著巨大的現實意義。當前的最優信息并不是最終的全局最優信息,因此不宜迅速傳遍整個系統而造成顯而易見的擁堵。這很可能就是道德經中,“絕圣棄智民利百倍”這個說法的本來面目[17],也就是對于當前最優信息傳遞的減速過程。“圣”和“智”不妨視作某種當前的最優記憶。可以設想一下在蒼茫的草原上,存在某處水草豐美的當前最優牧場。然而,一旦這處牧場的信息為所有牧民知道并且競相占據,就會觸發地方生態環境和整個牧民社區的雙重崩潰。而可持續性的發展,應當是基于對搜索空間多樣性的探索。但是多樣性的探索也不宜過度強調,因為這必然會造成巨大的系統資源浪費。因此一個優秀的全局優化算法,必須在多樣性探索與重要性取樣之間取得某種良好的疊加中間態。且這種良好的中間態則需要不斷地拓展對于優化問題在各尺度的理解,以不斷提高優化效率。
06
自適應算法的未來展望與傳統智慧的跨學科啟示
![]()
最后,我們不妨列一系列展望,看看未來更優秀的優化算法應該具備什么樣的性質。第一,就是這些算法應當具備自適應性和高度自動化。因此其可以自動優化其參數,而代理對自身運行狀態的反饋和總結應當來源于下層代理帶來的實際計算信息,也就是因地制宜。只有這樣,每一個代理才有可能獲得相對客觀的自我認識。第二,應當存在更加有效的記憶調控機制來調控漲落和耗散的比例。這種調控很可能和實際問題的復雜性相關。第三,能夠在合適的實際情況中,有效利用來自距離較遠代理的搜索信息。這在軍事科學和政治科學當中有不少實際例子可以借鑒。第四,可能對代理的搜索階段進行有效分類,從而提高整體搜索效率。比如在某些階段增加漲落,而另外一些階段增加耗散。這就會讓搜索產生節律,也就是時間域上的某種有序性,這也頗可以對應遼代的四時捺缽制度[14]。這種有序性有可能對搜索效率的提高至關重要。
另外,這項工作也表明,盡管現代科學能在諸多方面促進政治學、哲學與社會學的發展,但傳統政治學、哲學與歷史智慧,也將對未來科學發展及算法進步發揮日益關鍵的作用。我們預測,對于這些傳統智慧的仿生學研究、算法設計和計算物理觀念上的類比,會是未來學術的一個重要新領域。
參考文獻
[1] Bennett A A. Proceedings of the National Academy of Sciences,1916,2(10):592
[2] Cauchy A. Comp. Rend. Sci. Paris,1847,25:536
[3] Hestenes M R,Stiefel E. Journal of Research of the National Bureau of Standards,1952,49(6):409
[4] 孟軻. 孟子·滕文公上. 北京:中華書局,2023
[5] Kennedy J,Eberhart R. Particle Swarm Optimization. In:Proceedings of ICNN’95-International Conference on Neural Networks(1995,November),Vol. 4,pp. 1942—1948. IEEE
[6] Wang Y,Lv J,Zhu L et al. Computer Physics Communications,2012,183(10):2063
[7] 尚書·虞書·大禹謨. 北京:中華書局,2016
[8] 漢語多功能字庫. 香港中文大學,https://humanum.arts.cuhk.edu.hk/Lexis/lexi-mf/search.php?word=%E5%8D%B1
[9] 《說文解字最新整理全注譯本》編委會.說文解字:最新整理全注全譯本,第5卷. 北京:中國書店,2010
[10] 李耳. 道德經·三十七. 北京:中華書局,2022
[11] 歐文·拉鐵摩爾. 中國的亞洲內陸邊疆.江蘇:江蘇人民出版社,2010
[12] Feigenbaum M J. Universal Behavior in Nonlinear Systems. In:Universality Chaos,1980. pp.49—84
[13] 遼史·地理志. 北京:中華書局,1974
[14] 遼史·卷三十二·營衛志·行營. 北京:中華書局,1974
[15] Zhao W,Kwan M W,Zhu J. Computational Materials Today,2025,7:100033
[16] 李耳. 道德經·四十一. 北京:中華書局,2022
[17] 李耳. 道德經·十九. 北京:中華書局,2022
(參考文獻可上下滑動查看)
歡迎訂閱2026年《物理》雜志
《物理》是由中國科學院物理研究所和中國物理學會主辦的權威物理類中文科普期刊,注重學科性與科普性相結合,秉承“輕松閱讀,享受物理”的辦刊理念,集學科大家之力,追蹤物理學成果,服務物理學領域,促進學科交叉,讓科學變得通俗易懂。已成為我國眾多物理專業的大學生、研究生、物理學家案頭常讀的刊物之一。
(期刊訂閱)
訂閱方式:編輯部直接訂閱優惠價240元/年,全國包郵。
方式1微信訂閱
在“物理所財務處”微信公眾號繳費,操作如下:公號下方“業務辦理”-“訂刊費”-收費部門“《物理》編輯部”,之后填寫相應信息。如有問題,可添加編輯微信咨詢:18627635857。
(注:僅針對需要對公開電子發票的讀者,且務必提供正確的單位名稱和單位稅號)
方式2銀行匯款
開戶行:中國農業銀行北京科院南路支行
戶 名:中國科學院物理研究所
帳 號:11250101040005699
(注:請注明“《物理》編輯部”,匯款成功后請及時聯系編輯部登記郵寄地址)
編輯部聯系方式:
咨詢電話:010-82649277;82649029
Email:physics@iphy.ac.cn
(贈閱活動)
為答謝廣大讀者長期以來的關愛和支持,《物理》編輯部特推出優惠訂閱活動:凡直接向編輯部連續訂閱2年《物理》雜志,將獲贈《歲月有情- <物理> 50周年紀念本》。內有自1972年至2022年《物理》發表的50篇精選文章信息,掃描對應的二維碼,可重溫經典之作,感悟物理科學的真諦,領略學科大家的風采。希望讀者們愛上《物理》!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.