公眾號記得加星標??,第一時間看推送不會錯過。
Chiplet帶來的改變遠不止架構,它們還在改變芯片的制造方式。
隨著行業從平面SoC向多芯片系統轉型,工程挑戰不再局限于單個芯片的邊緣。性能、可靠性和良率如今取決于多個芯片在先進封裝內的協同工作方式、如何利用互連技術的組合進行數據優先級排序和傳輸,以及日益開放的生態系統所帶來的影響。
Chiplet的出現正迫使人們對整個設計流程進行根本性的重新思考。當設計、驗證、封裝、測試和可靠性決策從一開始就相互影響時,線性開發方法已不再適用。專家一致認為,Chiplet時代的成功取決于結構化的工作流程,這些工作流程能夠盡早將建模、分析、驗證和制造決策聯系起來——在流片或組裝階段出現代價高昂的問題之前。為什么這些工作流程如此重要?它們必須包含哪些內容?人工智能又是如何開始提升這些工作流程的效率的?
“先進封裝、2.5D 和 3D 架構的復雜性不容忽視,企業的工作方式也正在發生轉變,”西門子 EDA部門負責熱管理和可靠性的 3D-IC 解決方案架構師 Andras Vass-Vernai指出。“幾年前,封裝對于可靠性至關重要。幾年前的一次會議上,有人吹噓說,大家之所以能用上最新的電子產品和手機,完全是因為小型化,而小型化之所以成為可能,是因為一些機械工程師解決了熱管理問題。但他們當時的做法總是非常孤立。他們從未真正與芯片設計師和封裝的電氣設計師合作。他們各自討論各種規格和設計目標,然后各自為政。先進封裝改變了這一切,因為你需要盡早了解自己做出的決策是否正確。”
Chiplet工作流程涉及諸多考量,而不同半導體生態系統參與者的視角也各不相同。“在我們傳統的單片ASIC設計視角下,我們將其視為二維結構;而Chiplet則不同,因為它是分層的,所以是2.5維甚至三維結構。”Expedera軟件工程總監Prem Theivendran指出,“大多數問題都源于互連,這對從事Chiplet設計的人來說簡直是噩夢。此外,還有機械問題、機電問題、電熱問題以及信號完整性問題。這三者的建模是一個多物理場問題。”
作為一家IP設計公司,Expedera并不創建模型,但它曾為一些Chiplet客戶研究過這個問題。“我很高興他們更加重視這些問題。這意味著我們必須正確設計NPU和接口,因為不再是標準的AXI接口,這就引出了如何降低總線延遲的問題,”Theivendran說道。“在Chiplet方面,它完全符合UCIe標準,采用類似SerDes的接口,頻率非常高等等。但不再需要傳統的AXI接口,那么我們該如何接入呢?這就是我們NPU需要改變的地方。”
在此背景下,實際問題就變成了設計團隊應該如何調整設計方案以適應這些新的限制。對許多團隊而言,這意味著用專為跨芯片設計、封裝和測試而構建的工作流程來取代零散的交接環節。
“在傳統的單芯片設計中,如果出現局部缺陷,你只會報廢一個芯片,” Silvaco旗下公司Mixel的AMS高級經理Long Thanh (Kevin) Bui表示。“但在Chiplet架構中,一個互連故障或一個I/OChiplet缺陷就可能毀掉一個極其昂貴的完整封裝。因此,工程團隊需要統一的工作流程,因為封裝本身就是一個系統。他們必須協調復雜的多芯片交互,并在實際流片之前盡可能減少故障。”
在芯片設計中,結構化工作流程至關重要,原因有以下幾點。“首先,復雜性呈爆炸式增長,”Bui說道。“多芯片系統會增加故障點,從互連和熱耦合到翹曲,不一而足。手動或脫節的流程會導致交互缺失、返工和缺陷。其次,跨領域協調至關重要,涉及架構、封裝、測試、可靠性以及多供應商供應鏈。第三,可擴展性和可重復性至關重要。芯片設計旨在實現跨產品復用,因此工作流程能夠實現模塊化、標準化的流程,而非一次性工作。第四,降低風險。早期預測建模和設計內分析可以在流片前發現問題。分層測試和知識定義設計(KGD)有助于確保只組裝已知良好的組件。第五,提高效率至關重要,因為建模、分析和驗證步驟之間的自動化轉換可以減少錯誤、加快迭代速度并促進協作。”
換句話說,關注點已從芯片內部設計轉移到跨芯片行為。“關注的邊界已從芯片內部轉移到芯片之間的接口。像UCie這樣的新標準推動工作流程從專有、封閉的系統擴展到開放的生態系統,在這個生態系統中,來自不同供應商的芯片必須可靠地協同工作。先進的封裝技術——包括2.5D/3D封裝、中介層和混合鍵合——也引入了新的物理現象,例如應力、熱梯度以及凸點間距和材料等變量,”他說道。
在芯片設計中,工作流程意味著什么?
在半導體工程中,工作流程是指從概念到芯片,再到整個產品生命周期中,可重復的、端到端的工程步驟、工具、數據和決策門序列,旨在確保可靠性。
同時,Chiplet工作流程是一個并行協同設計的循環,它持續驗證多個獨立芯片封裝成單個高性能系統時的功能、電氣和物理完整性。“對于Chiplet而言,穩健的工作流程至關重要,”Bui說道。“與傳統的單芯片SoC不同,后者可靠性主要局限于單個芯片,而Chiplet系統引入了全新的復雜性:多個芯片、高密度互連、先進封裝以及系統級行為。可靠性不再僅僅是芯片級的問題,它已成為一個真正的系統級挑戰,涉及多個領域和學科。”
其他專家也認同這一觀點。“當我們談到芯片可靠性時,我們主要關注四個核心領域——散熱、機械、電源完整性和信號完整性,” Synopsys首席產品經理Lang Lin表示。“在芯片設計能夠自信地流片之前,這四個方面都需要進行評估。實際上,這意味著要使用一個整體的EDA工作流程,將這四個方面結合起來進行分析。工程師們依靠多物理場求解器來研究散熱、機械、電源和信號影響之間的相互作用,因為這些問題都不能再被視為孤立的問題了。現代流程兼具多物理場和多尺度特性,使團隊能夠評估系統中不同的物理效應,并識別出最壞的情況。例如,一個芯片可能因為散熱不足導致溫度過高而失效,而另一個芯片則可能因為距離電源過遠而出現電源完整性問題。”
這是一個復雜的多物理場問題。“我們通常從一個初始狀態開始。芯片處于室溫,電源電壓為標稱值,信號以預期的數據速率運行,封裝沒有明顯的應力或翹曲,”林解釋說。“但一旦芯片開始工作,所有這些條件都會同時發生變化。隨著溫度升高,漏電功率增加,從而導致總功耗上升。更高的溫度還會降低芯片的運行速度,因為延遲會增加。同時,加熱還會導致一些機械問題,例如熱膨脹系數不匹配和芯片翹曲。這些影響都不是獨立發生的,它們同時相互作用,這就是為什么解決芯片可靠性問題會成為一個復雜的工程難題。”
對于芯片架構師來說,這一切都需要大量的協作,因為它涉及多個環節。“有接口人員,有標準制定者,有我們負責的IP設計,還有系統級測試,”Expedera公司的Theivendran說道。“所以,要使用合適的組件并確保端到端的正常運行,現在涉及到多個環節。此外,還有驗證環節。你必須提供一個基于UVM的基礎設施測試平臺、驅動程序、監視器等等,僅僅是為了模擬我們的環境,因為現在我們就像芯片內部的一個微型芯片。它不僅僅是一個標準的IP,它包含更多東西。它就像一個真正的芯片,有著不同的約束條件。”
這與傳統的平面SoC工作流程截然不同。“如果我們正在構建一個系統,那么工作流程將包括架構設計、測試、系統級測試、模塊級測試,然后逐步向上——最終進行網表分析、門級測試和功耗分析,”Theivendran說道。“驗證工作量大大增加,但我們無法進行系統級測試。我們只能進行模塊級和IP級測試。因此,它看起來像是傳統的工作流程,但實際上多了更多步驟和需要考慮的細節。”
Chiplet工作流程必須包含哪些內容?
根據 Mixel 公司的 Bui 的說法,由于堆疊芯片在物理和電氣方面相互依賴性很強,因此一個穩健的Chiplet工作流程必須涵蓋幾個不同的任務。Chiplet工作流程的核心組件包括:
多物理場簽核。由于芯片間距很小,工作流程必須同時分析熱應力、機械應力和電應力。邏輯芯片上的熱熱點會導致機械翹曲,從而降低相鄰芯片上敏感的模擬/混合信號電路的性能。
電源和信號完整性 (PI/SI)。芯片間高速傳輸的數據不能出現質量下降,這就需要模擬芯片間微小連接的電磁行為。
互連可靠性。工作流程必須考慮連接芯片的凸塊和中介層,包括電遷移和應力引起的空洞。
已知良好芯片和已知良好堆疊(KGD/KGS)。嚴格的測試方法應采用內置自測試和通道修復邏輯,在組裝前后繞過損壞的互連。
![]()
多物理場協同設計是不可或缺的。“Chiplet設計本質上就是多物理場問題,”是德科技EDA總經理Nilesh Kamdar表示,“垂直堆疊的芯片之間會產生熱量上升。跌落或振動造成的機械應力會影響焊點連接和電氣性能。在數據中心應用中,共封裝光學器件會將光學物理引入到已經需要處理電氣和熱交互的堆疊結構中。這些因素都無法孤立地建模。出于電氣性能考慮而選擇的材料可能會使散熱管理更加復雜。優化散熱性能可能會影響機械穩定性。必須對整個系統進行分析。想想智能手機在嘗試連接微弱信號時過熱會發生什么。過多的熱量會加速電池電量的消耗,迫使無線電模塊更加努力地工作,從而產生更多熱量。在Chiplet堆疊中,這種反饋回路會同時發生在多個芯片、材料和物理域中。”
驗證工作更增加了挑戰。“傳統的模塊級驗證方法是為單芯片系統設計的,無法考慮跨多個芯片、工藝節點和封裝層的交互作用,”Kamdar 指出。“有效的驗證需要從一開始就從系統層面進行考量,在確認整個芯片堆疊組裝完成后性能是否仍然有效之前,先對每個芯片進行單獨測試。例如,熱效應和串擾在組件層面是不可見的,只有在對整個系統進行建模時才會顯現出來。硬件輔助環境可以發現靜態分析遺漏的時序和互操作性問題,但這只有在仿真能夠與設計保持同步的情況下才能實現。”
仿真還有其他需要考慮的因素。“如果你只是想構建一個仿真模型,那就會比較復雜,”西門子EDA的Vass-Vernai說道。 “你需要對工具、網格劃分技術、物理學等方面有深入的了解,這有時需要多年的經驗積累。我們一直致力于讓這些工具普及化。例如,如果你僅僅從半導體仿真的角度來看這些工具,你會發現,其核心理念是創建一個類似電子表格或輸入框的東西。你輸入標準封裝樣式的所有細節。然后,工具會構建模型、進行網格劃分并進行配置。我們一直在努力降低仿真的門檻。在芯片堆疊方面,這一點尤為重要,因為你需要確保電氣設計師能夠快速做出決策。問題在于,這種基于電子表格的輸入模板已經不再適用,因為封裝不再標準化。這取決于你使用的技術、你的工程技能、你的想象力以及你構建的封裝架構類型。我們仍然需要降低仿真的門檻,但我們可以用我們熟悉的方式來實現。”
與此同時,這也推動了封裝數字孿生技術的開發。當架構師定義布局、芯片布局、堆疊方式、中介層材料、連接方式和網表時,他們實際上已經生成了仿真所需的大部分機械信息。與其構建單獨的仿真工具并依賴仿真工程師后續重建模型,不如將這些電氣定義轉化為多物理場模型。雖然仍需進行一些設置,例如材料屬性、功率分配和邊界條件,但目標是盡可能簡化流程。這樣,電氣封裝設計人員就可以在工作流程的早期階段,利用其初始設計生成數字孿生的熱力學或熱機械版本。
人工智能如何重塑工作流程?
將人工智能融入Chiplet工作流程也能產生顯著影響。“在預測建模和分析方面,人工智能可以改進熱力學和機械仿真、測試中的異常檢測以及良率預測,”Mixel 的 Bui 表示。“它可以處理海量的多物理場數據集,從而更早、更準確地預測熱點、翹曲和故障風險。在自動布線方面,人工智能可以幫助自動完成Chiplet之間數千個微凸點的復雜布線,同時最大限度地減少干擾。在驗證和調試方面,人工智能可以加速回歸測試、根本原因分析和分層測試。它還可以對互連行為進行建模,并幫助生成 KGD 和芯片間鏈路的測試模式。”
人工智能的發展日新月異,就連術語也在不斷演變。“我們現在不太喜歡用‘腳本’這個詞了,”Vass-Varnai 指出,“我們仍然在編寫腳本,但現在我們談論的是自動化。說到自動化,谷歌不再是創建腳本,而是在這些工具之上創建人工智能代理,并教會這些代理如何運行不同的工具以及如何創建流程。這就是我們的發展方向。我們還有另一個計劃,將自動化與生命周期管理(LLM)相結合,因為實現這一目標的最佳方式是能夠用自然語言提示工具,解釋你想要哪種類型的軟件包,包含哪些組件,并與你的助手協作,幫助你完成設計。這顯然是我們前進的方向。我知道我們所有的競爭對手都已經在做這件事了。我認為目前還沒有人真正做到,但競爭非常激烈,誰能做得最好,誰就能最終勝出。”
事實上,整個EDA行業的核心在于工作流程。“要運行EDA,你需要設計數據;有了設計數據,你就可以運行各種工具,生成更多數據,再運行更多工具處理這些數據,然后你還需要更多工具來處理這些數據,”IC Manage首席執行官Dean Drako指出。“這就是你的工作流程。現在,我們正在利用智能AI增強工作流程,也就是在工作流程中使用智能AI來進行IP生命周期管理。通過AI增強功能,新的特性使得系統組件/IP的重用更加快捷方便,因為它用打包、支持和發現等工作流程取代了大量手動操作,工程師可以快速找到所需組件/IP,判斷其是否符合要求,并在必要時進行調整,或者使用我們為他們開發的AI進行驗證。”
此外,人工智能代理可以基于大量模擬進行快速預測。“有些公司已經完全實現了這一點,”Vass-Varnai補充道。“我們內部也有一些工具,正在考慮將其添加到我們的工作流程中。如果你想訓練人工智能,你需要結構良好、干凈的數據,我們也提供數據管理服務,可以幫助你實現這一點。但即便你實現了這一點,最好還是能夠使用來自多家公司的多輪設計數據來訓練人工智能。”
Synopsys 產品管理高級總監 Matt Commens 也認為,人工智能將迅速重塑芯片可靠性工作流程。 “設計創建、設置以及運行過程中的許多環節都將通過智能代理來實現。每個人都希望工作流程自動化,因此我們參與了一些項目,與特定客戶合作,為特定活動構建高度自動化的工作流程。當然,我們也一直在改進自身的工作流程,以實現更多集成,例如多物理場工作流程。客戶希望工作流程能夠高度契合他們的應用需求。人工智能將很快接管這些工作,我們已經看到了這種趨勢。Ansys(現已更名為 Synopsys)早在四五年前就主動啟動了 API 優先戰略,當時 ChatGPT 還未問世。我們之所以率先采用 API 優先戰略,是為了構建工作流程。在我們與客戶合作的一個項目中,為了實現高度自動化,我們構建了一個名為 PyAEDT 的 API。它是開源的,托管在 GitHub 上,并且有完整的文檔。它非常活躍,所有語言模型都知道如何使用它進行編碼,因為它們都是基于 PyAEDT 進行訓練的。”
不過,科門斯并不認為會一夜之間全面轉向人工智能驅動的工作流程。“這將是一個漸進的過程,”他說道。“設計界不可能在一夜之間放棄現有的方法。團隊目前都在使用既定的工具、流程和習慣,而且還受到業務方面的限制。隨著工作流程變得更加自動化和復雜,人工智能的使用將需要更多的計算資源和能源。整個行業需要解決數據中心容量和電力是否足以滿足這種需求的問題。因此,盡管目前存在一些實際的限制,但發展方向是明確的。”
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4406內容,歡迎關注。
加星標??第一時間看推送
![]()
![]()
求推薦
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.