網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

三種硬件仿真架構(gòu)的故事

2026-05-07 09:17:00　來(lái)源: 半導(dǎo)體行業(yè)觀察

上海舉報(bào)

分享至

公眾號(hào)記得加星標(biāo)??，第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。

硬件仿真技術(shù)的應(yīng)運(yùn)而生，源于上世紀(jì)八十年代的迫切需求。到了八十年代中期，半導(dǎo)體設(shè)計(jì)的復(fù)雜程度已經(jīng)遠(yuǎn)遠(yuǎn)超出了門級(jí)仿真的實(shí)際應(yīng)用范圍。門級(jí)仿真雖然精度高，但速度極其緩慢；硅原型雖然能夠以實(shí)時(shí)速度運(yùn)行，但交付卻為時(shí)已晚。業(yè)界亟需一種新的工具——一種驗(yàn)證引擎，它能夠以合理的速度執(zhí)行真實(shí)的硬件模型，同時(shí)又能保持全面驗(yàn)證所需的可見(jiàn)性和控制力。硬件仿真技術(shù)應(yīng)運(yùn)而生，正是為了填補(bǔ)這一空白。

誰(shuí)能想到，摩爾定律所描述的復(fù)雜性增長(zhǎng)會(huì)在2020年代被人工智能模型復(fù)雜性的增長(zhǎng)速度遠(yuǎn)遠(yuǎn)超越呢？當(dāng)然，事后諸葛亮總是容易的。讓我們來(lái)看看半導(dǎo)體需求究竟發(fā)生了什么：

圖 1：半導(dǎo)體需求加速增長(zhǎng)

縱觀個(gè)人電腦、互聯(lián)網(wǎng)、移動(dòng)、物聯(lián)網(wǎng)和云計(jì)算這四代主要的電子系統(tǒng)發(fā)展歷程，我們可以說(shuō)，仿真技術(shù)的演進(jìn)是由不同的范式驅(qū)動(dòng)的，它們通過(guò)不同的技術(shù)優(yōu)勢(shì)平衡來(lái)滿足極其廣泛的市場(chǎng)需求，從而爭(zhēng)奪市場(chǎng)份額。如今，市場(chǎng)主要投資于人工智能芯片，這些芯片必須能夠執(zhí)行復(fù)雜度呈爆炸式增長(zhǎng)的人工智能模型。因此，在執(zhí)行這些長(zhǎng)時(shí)間人工智能工作負(fù)載方面具有性能優(yōu)勢(shì)的仿真架構(gòu)成為當(dāng)今市場(chǎng)的贏家也就不足為奇了。

讓我們回顧一下所有仿真技術(shù)的發(fā)展歷程，以及基于商用 FPGA 的架構(gòu)如何最終滿足當(dāng)今人工智能系統(tǒng)驗(yàn)證的需求。

第一代仿真器依賴于大量的商用FPGA陣列，這在當(dāng)時(shí)是一項(xiàng)革命性的進(jìn)步。這些系統(tǒng)使得復(fù)雜芯片的芯片驗(yàn)證能夠在芯片設(shè)計(jì)之前完成，而這在以前僅仿真就需要數(shù)年時(shí)間。近十年來(lái)，F(xiàn)PGA的發(fā)展遵循著可預(yù)見(jiàn)的軌跡：每一代新的FPGA器件都提供了更大的容量、更高的性能以及映射日益復(fù)雜的設(shè)計(jì)的能力。規(guī)模得到了顯著提升，但其基本理念卻基本保持不變。

然而，隨著這些平臺(tái)的發(fā)展，它們的局限性也變得不容忽視。邏輯容量的提升并沒(méi)有解決其底層架構(gòu)固有的制約因素。早期的基于FPGA的系統(tǒng)存在著許多工程師后來(lái)稱之為“原罪”的缺陷。

為了應(yīng)對(duì)爆炸式增長(zhǎng)的設(shè)計(jì)規(guī)模，所需的FPGA數(shù)量龐大，導(dǎo)致設(shè)置時(shí)間長(zhǎng)達(dá)數(shù)周甚至數(shù)月。編譯周期延長(zhǎng)至數(shù)天，常常使被測(cè)器件（DUT）的準(zhǔn)備工作超出項(xiàng)目進(jìn)度，并使迭代開(kāi)發(fā)變得異常緩慢。設(shè)計(jì)可見(jiàn)性同樣受到限制：內(nèi)部可觀測(cè)性依賴于將探針編譯到FPGA架構(gòu)中，這會(huì)消耗寶貴的資源，加劇布線擁塞，并將調(diào)試變成一項(xiàng)繁瑣的工作。執(zhí)行模型僵化，完全基于在線仿真（ICE），限制了交互式調(diào)試的靈活性。此外，總擁有成本——包括購(gòu)買、運(yùn)行和維護(hù)——使得這些系統(tǒng)遠(yuǎn)遠(yuǎn)超出了大多數(shù)工程團(tuán)隊(duì)的承受范圍。

因此，硬件仿真仍然局限于最關(guān)鍵的驗(yàn)證挑戰(zhàn)，通常是在設(shè)計(jì)周期的后期，而且僅限于最先進(jìn)的組織。對(duì)許多團(tuán)隊(duì)而言，它并非日常工程平臺(tái)，而是一種稀缺的高價(jià)值資源——功能強(qiáng)大、不可或缺，卻始終供不應(yīng)求。

巨大分裂的種子開(kāi)始萌芽

到了 20 世紀(jì) 90 年代中期，商業(yè)格局表面上看似穩(wěn)定，主要由兩家公司主導(dǎo)：Quickturn Design Systems 和 IKOS Systems。然而，在這種穩(wěn)定之下，該領(lǐng)域正在經(jīng)歷深刻的變革。設(shè)計(jì)規(guī)模迅速擴(kuò)大，軟件棧隨著硬件復(fù)雜性的增長(zhǎng)而增長(zhǎng)，驗(yàn)證需求也從模塊級(jí)正確性轉(zhuǎn)向全系統(tǒng)行為。問(wèn)題不再是仿真能否相應(yīng)地?cái)U(kuò)展，而是如何擴(kuò)展。

在這些壓力下，架構(gòu)思維出現(xiàn)了根本性的分歧。供應(yīng)商和工程團(tuán)隊(duì)開(kāi)始重新構(gòu)想仿真器應(yīng)有的樣子：它不再僅僅是一個(gè)更大的FPGA陣列，而是一個(gè)專為驗(yàn)證而設(shè)計(jì)的、針對(duì)可見(jiàn)性、可控性和系統(tǒng)級(jí)性能進(jìn)行優(yōu)化的工具。這種重新思考催生了三種截然不同的硬件仿真架構(gòu)——每一種都基于不同的理念，在速度、可擴(kuò)展性和易用性方面做出不同的權(quán)衡，并且每一種都將影響未來(lái)幾十年芯片前驗(yàn)證的發(fā)展軌跡。

由此衍生出的三種架構(gòu)方法分別被稱為基于處理器的仿真、基于定制FPGA的仿真和基于商用FPGA的仿真。每種方法都代表著一種不同的嘗試，旨在克服仿真日益增長(zhǎng)的局限性，同時(shí)實(shí)現(xiàn)以有意義的速度和規(guī)模驗(yàn)證硬件設(shè)計(jì)。通過(guò)考察這些技術(shù)的起源、發(fā)展歷程和實(shí)際權(quán)衡取舍，可以理解它們的基本特性。

基于處理器的仿真

一、IBM與處理器式方法的興起

20世紀(jì)80年代初，IBM開(kāi)始探索硬件加速技術(shù)，旨在通過(guò)約克鎮(zhèn)仿真引擎（YSE：Yorktown Simulation Engine）和工程驗(yàn)證引擎（EVE：Engineering Verification Engine）等項(xiàng)目來(lái)提高設(shè)計(jì)驗(yàn)證效率。這些系統(tǒng)作為仿真加速器——專用計(jì)算平臺(tái)，旨在比傳統(tǒng)仿真器更快地執(zhí)行用軟件語(yǔ)言編寫的硬件描述。雖然它們帶來(lái)了可衡量的速度提升，但仍然無(wú)法滿足將真實(shí)世界激勵(lì)應(yīng)用于被測(cè)設(shè)計(jì)（DUT）所需的性能要求。

到了 20 世紀(jì) 90 年代中期，IBM 完善了一種以簡(jiǎn)單布爾處理器陣列為核心的新架構(gòu)方向。這些處理器操作存儲(chǔ)在大型共享內(nèi)存中的設(shè)計(jì)數(shù)據(jù)結(jié)構(gòu)，并由復(fù)雜的調(diào)度機(jī)制進(jìn)行協(xié)調(diào)。這種方法被證明能夠適應(yīng)完整的仿真工作負(fù)載，為傳統(tǒng)的仿真提供了一種可擴(kuò)展的替代方案。然而，IBM 并沒(méi)有充分利用這項(xiàng)技術(shù)。

二、Quickturn 和基于處理器的仿真商業(yè)化

Quickturn 在近十年的商用 FPGA 仿真系統(tǒng)使用經(jīng)驗(yàn)之后發(fā)現(xiàn)，盡管這些仿真器取得了重要進(jìn)展，但它們也暴露出一些難以克服的結(jié)構(gòu)性缺陷。為了實(shí)現(xiàn)足夠的設(shè)計(jì)容量，需要在多個(gè)電路板上互連數(shù)百個(gè) FPGA，這帶來(lái)了巨大的物流和工程挑戰(zhàn)。在這種分布式架構(gòu)上進(jìn)行分區(qū)和布線設(shè)計(jì)通常需要數(shù)月的準(zhǔn)備時(shí)間，以避免擁塞并確保確定性行為。調(diào)試可見(jiàn)性必須顯式地編譯到設(shè)計(jì)中，這會(huì)與布線資源競(jìng)爭(zhēng)，并減慢開(kāi)發(fā)周期。此外，性能也無(wú)法隨設(shè)計(jì)規(guī)模線性擴(kuò)展，隨著工作負(fù)載變得更加復(fù)雜，執(zhí)行速度反而會(huì)下降。

為了尋找解決方案，Quickturn 評(píng)估了一家名為 Meta System 的法國(guó)初創(chuàng)公司開(kāi)發(fā)的定制 FPGA 架構(gòu)。與此同時(shí)，Mentor Graphics 在放棄了早期的仿真實(shí)驗(yàn)并將所有資產(chǎn)出售給 Quickturn 后，也走上了同樣的道路。由此產(chǎn)生的競(jìng)爭(zhēng)升級(jí)為圍繞知識(shí)產(chǎn)權(quán)的法律糾紛，最終導(dǎo)致 Mentor 收購(gòu)了 Meta System。

Quickturn公司此前已熟悉IBM基于處理器的技術(shù)，并果斷地朝著這個(gè)方向發(fā)展。IBM并沒(méi)有直接將這項(xiàng)技術(shù)商業(yè)化，而是與Quickturn公司簽訂了獨(dú)家OEM協(xié)議，使后者能夠?qū)⒃摷軜?gòu)集成到新一代仿真系統(tǒng)中。

IBM 的以處理器為中心的架構(gòu)提供了一種極具吸引力的替代方案。它解決了 FPGA 系統(tǒng)面臨的三大長(zhǎng)期難題：冗長(zhǎng)的設(shè)置和編譯周期、有限的調(diào)試可見(jiàn)性以及大規(guī)模部署時(shí)的性能下降。然而，當(dāng)時(shí)不太明顯的一個(gè)缺點(diǎn)是，與同等容量的 FPGA 解決方案相比，其功耗更高。

1997年，Quickturn收購(gòu)了IBM的技術(shù)，并很快推出了并發(fā)廣播陣列邏輯技術(shù)（CoBALT）仿真器，這是首個(gè)基于處理器架構(gòu)的主要商業(yè)平臺(tái)。該產(chǎn)品迅速獲得了市場(chǎng)的認(rèn)可。

競(jìng)爭(zhēng)格局持續(xù)變化。Mentor 和 Quickturn 之間的訴訟一直持續(xù)到 2002 年左右，當(dāng)時(shí) Cadence 收購(gòu)了 Quickturn，解決了這些糾紛，并將關(guān)鍵的仿真技術(shù)整合到其產(chǎn)品組合中。

三、Cadence與基于處理器的仿真的擴(kuò)展

收購(gòu)?fù)瓿珊螅珻adence逐步淘汰了Quickturn基于FPGA的產(chǎn)品線，并全面轉(zhuǎn)向基于處理器的架構(gòu)。這一決定為Palladium系列仿真器的長(zhǎng)期發(fā)展奠定了基礎(chǔ)，該系列仿真器后來(lái)成為公司的旗艦平臺(tái)。

從2000年代初期開(kāi)始，Palladium歷經(jīng)數(shù)代迭代，始終秉持著其核心架構(gòu)原則：大量簡(jiǎn)單處理器協(xié)同工作，大規(guī)模模擬硬件行為。每一次迭代都擴(kuò)展了設(shè)計(jì)能力，提升了執(zhí)行性能，增強(qiáng)了調(diào)試功能，并加快了編譯流程，使其更加自動(dòng)化。

該平臺(tái)的兩大特點(diǎn)始終吸引著用戶。首先，其編譯時(shí)間遠(yuǎn)短于基于FPGA的方法，從而加快了開(kāi)發(fā)周轉(zhuǎn)速度。其次，工程師無(wú)需特殊的編譯步驟即可在運(yùn)行時(shí)全面了解設(shè)計(jì)，這對(duì)于調(diào)試和迭代驗(yàn)證而言是一項(xiàng)強(qiáng)大的優(yōu)勢(shì)。

Palladium 在電路內(nèi)仿真方面也表現(xiàn)出色。其豐富的速度橋接器生態(tài)系統(tǒng)實(shí)現(xiàn)了與真實(shí)硬件接口的直接交互，從而能夠在真實(shí)的運(yùn)行條件下對(duì)軟件和硬件進(jìn)行協(xié)同驗(yàn)證。

這些優(yōu)勢(shì)也伴隨著結(jié)構(gòu)上的權(quán)衡。基于處理器的系統(tǒng)需要大量的物理基礎(chǔ)設(shè)施，并且通常比同等容量的基于FPGA的仿真器消耗更多電力。客戶必須投資昂貴的水冷基礎(chǔ)設(shè)施。擴(kuò)展到數(shù)十億門級(jí)的設(shè)計(jì)通常需要由多個(gè)機(jī)柜組成的大型安裝系統(tǒng)。在基于事務(wù)的加速場(chǎng)景中，基于處理器的平臺(tái)的執(zhí)行速度往往也低于專門針對(duì)該用例優(yōu)化的競(jìng)爭(zhēng)架構(gòu)。

盡管存在這些限制，基于處理器的仿真技術(shù)已成為硬件驗(yàn)證的基礎(chǔ)技術(shù)，它在可擴(kuò)展性、可見(jiàn)性和生產(chǎn)力方面實(shí)現(xiàn)了獨(dú)特的平衡，并持續(xù)塑造著現(xiàn)代仿真平臺(tái)。

基于定制FPGA的仿真器

一、定制FPGA：一條并行創(chuàng)新之路

當(dāng) IBM 在美國(guó)推進(jìn)基于處理器的仿真技術(shù)時(shí)，歐洲也在形成一條平行且同樣重要的創(chuàng)新路線。

在法國(guó)，Meta System公司開(kāi)始研發(fā)一種受現(xiàn)場(chǎng)可編程門陣列（FPGA）啟發(fā)，但專為仿真工作負(fù)載而設(shè)計(jì)的可編程硅芯片。這些器件——通常被稱為定制FPGA——并非用于通用邏輯原型設(shè)計(jì)或ASIC設(shè)計(jì)，而是專門作為仿真器的計(jì)算基礎(chǔ)架構(gòu)而構(gòu)建的。

與必須適應(yīng)各種應(yīng)用場(chǎng)景的商用FPGA不同，Meta Systems的可編程器件針對(duì)硬件驗(yàn)證的特定需求進(jìn)行了優(yōu)化。其架構(gòu)將可配置邏輯單元與高密度、確定性的互連矩陣相結(jié)合，以實(shí)現(xiàn)可預(yù)測(cè)的時(shí)序。嵌入式多端口存儲(chǔ)器能夠高效存儲(chǔ)設(shè)計(jì)狀態(tài)和激勵(lì)數(shù)據(jù)，而高帶寬I/O通道則支持與外部系統(tǒng)和軟件環(huán)境的連接。這些器件還集成了內(nèi)置調(diào)試引擎，包括基于存儲(chǔ)器的探測(cè)功能，以及專用時(shí)鐘生成電路，以保持大型映射設(shè)計(jì)之間的同步。

這種專業(yè)化帶來(lái)了諸多切實(shí)的好處。由于布線和配置問(wèn)題針對(duì)仿真而非通用綜合進(jìn)行了約束和優(yōu)化，編譯和設(shè)置時(shí)間顯著縮短。設(shè)計(jì)人員在執(zhí)行過(guò)程中能夠全面了解設(shè)計(jì)，通常無(wú)需耗時(shí)的重新編譯周期來(lái)插入探針。隨著設(shè)計(jì)復(fù)雜性的增加，性能的擴(kuò)展也更加可預(yù)測(cè)，因?yàn)榧軜?gòu)是圍繞被仿真硬件的結(jié)構(gòu)特性而非通用可編程性而設(shè)計(jì)的。與基于處理器的仿真器相比，定制FPGA方法在提供類似功能的同時(shí)，功耗更低，且執(zhí)行模型更以硬件為中心。

二、Mentor Graphics 與“芯片上模擬器”的商業(yè)化

基于定制FPGA的仿真技術(shù)前景廣闊，吸引了業(yè)界的廣泛關(guān)注。1996年，Mentor Graphics擊敗Quickturn后收購(gòu)了Meta Systems，并推出了SimExpress，這是首款基于定制可編程芯片的商用仿真器。

SimExpress在很多方面更像是一個(gè)概念驗(yàn)證平臺(tái)，而非一個(gè)完全具有競(jìng)爭(zhēng)力的平臺(tái)。它被封裝在一個(gè)緊湊的機(jī)箱中，大小與小型酒窖相仿，在當(dāng)時(shí)領(lǐng)先的ASIC芯片已經(jīng)突破百萬(wàn)門大關(guān)的時(shí)候，它一次只能映射不到10萬(wàn)個(gè)門的設(shè)計(jì)。然而，它的架構(gòu)方向意義重大。設(shè)置更簡(jiǎn)單，編譯時(shí)間從數(shù)小時(shí)縮短到數(shù)分鐘，運(yùn)行時(shí)對(duì)設(shè)計(jì)的可見(jiàn)性也遠(yuǎn)勝于許多基于FPGA的系統(tǒng)。該平臺(tái)展示了如何將仿真優(yōu)化的芯片與先進(jìn)的驗(yàn)證軟件相結(jié)合，從而為芯片設(shè)計(jì)前的驗(yàn)證構(gòu)建一個(gè)平衡的環(huán)境。

Mentor公司在1999年推出了Celaro，進(jìn)一步拓展了這一概念。Celaro是一款規(guī)模更大的仿真器，標(biāo)稱容量約為500萬(wàn)門。通過(guò)集群多個(gè)系統(tǒng)，工程師可以將總?cè)萘繑U(kuò)展到2000萬(wàn)門以上——這在片上系統(tǒng)（SoC）設(shè)計(jì)規(guī)模和復(fù)雜性迅速增長(zhǎng)的今天，是一個(gè)重要的里程碑。

然而，定制FPGA方案也存在一些權(quán)衡取舍。由于這些器件的原始邏輯密度無(wú)法與最大的商用FPGA相媲美，因此實(shí)現(xiàn)大型設(shè)計(jì)需要更多的芯片。更大的陣列意味著更長(zhǎng)的互連路徑和更大的信號(hào)傳播延遲。結(jié)果，大型配置的執(zhí)行速度通常低于1兆赫茲——雖然足以滿足驗(yàn)證工作流程的需求，但比一些同等容量的基于FPGA的競(jìng)爭(zhēng)仿真器要慢。

三、IKOS、虛擬線路和基于交易的驗(yàn)證

2002年，Mentor Graphics收購(gòu)IKOS Systems，這成為一次關(guān)鍵性的轉(zhuǎn)變。此次收購(gòu)帶來(lái)了兩項(xiàng)互補(bǔ)技術(shù)，將塑造下一代仿真技術(shù)。

第一種方法是虛擬線纜互連技術(shù)，最初由虛擬計(jì)算機(jī)公司 (VCC：Virtual Computer Corporation) 開(kāi)發(fā)，后來(lái)被集成到 IKOS 平臺(tái)中。虛擬線纜通過(guò)將物理連接抽象為軟件控制的互連層，簡(jiǎn)化了在眾多可編程器件上進(jìn)行大型設(shè)計(jì)布線的繁瑣任務(wù)。工程師無(wú)需重新布線即可重新分配信號(hào)路徑，從而顯著加快了啟動(dòng)和迭代速度。

第二項(xiàng)成果是IKOS在基于事務(wù)的驗(yàn)證方面的工作。該方法不再像以往那樣在測(cè)試平臺(tái)和硬件模型之間交換底層信號(hào)切換，而是將通信提升到更高層次的事務(wù)層面——數(shù)據(jù)包、協(xié)議事件和軟件交互。這種方法顯著提高了驗(yàn)證效率，并實(shí)現(xiàn)了硬件和軟件驗(yàn)證之間更緊密的耦合。

Mentor公司將這些創(chuàng)新技術(shù)集成到Veloce仿真系列產(chǎn)品中，該系列產(chǎn)品于2007年首次推出，定位為新一代片上仿真器系統(tǒng)。其架構(gòu)將定制可編程芯片、可擴(kuò)展互連和先進(jìn)的驗(yàn)證軟件整合到一個(gè)統(tǒng)一的硬件輔助驗(yàn)證平臺(tái)中。

四、通過(guò)驗(yàn)證方法實(shí)現(xiàn)差異化

Mentor最終脫穎而出的原因不僅在于硬件，更在于其方法論。該公司在IKOS的基礎(chǔ)上，推出了TestBench Xpress (TBX)，TBX被廣泛認(rèn)為是事務(wù)級(jí)加速最有效的實(shí)現(xiàn)之一。TBX通過(guò)將事務(wù)處理卸載到主機(jī)環(huán)境，使軟件測(cè)試平臺(tái)（通常用SystemVerilog、C或SystemC編寫）能夠與模擬硬件高效協(xié)同運(yùn)行。

Mentor公司進(jìn)一步拓展了這一方法，推出了VirtuaLAB，這是一套針對(duì)特定應(yīng)用場(chǎng)景的驗(yàn)證環(huán)境，專為USB、以太網(wǎng)和存儲(chǔ)接口等行業(yè)協(xié)議量身定制。這些環(huán)境使團(tuán)隊(duì)能夠在設(shè)計(jì)周期的早期階段驗(yàn)證實(shí)際工作負(fù)載和軟件棧，從而彌合了芯片前硬件驗(yàn)證和系統(tǒng)級(jí)驗(yàn)證之間的差距。

五、Veloce系列的演化

在隨后的幾年里，Veloce平臺(tái)經(jīng)歷了數(shù)代迭代。每一次迭代都提升了設(shè)計(jì)容量、提高了執(zhí)行性能并增強(qiáng)了分析能力。新增功能支持低功耗驗(yàn)證、功耗估算、基于虛擬平臺(tái)的混合仿真以及功能覆蓋率分析。該系統(tǒng)從最初的小眾驗(yàn)證引擎發(fā)展成為大型SoC硬件輔助驗(yàn)證策略的核心支柱。

2018年，西門子數(shù)字化工業(yè)軟件收購(gòu)了Mentor Graphics，并將Veloce產(chǎn)品線整合到其更廣泛的電子設(shè)計(jì)自動(dòng)化產(chǎn)品組合中。該平臺(tái)持續(xù)開(kāi)發(fā)，以適應(yīng)數(shù)十億門級(jí)設(shè)計(jì)、復(fù)雜軟件棧和異構(gòu)計(jì)算架構(gòu)的需求。

如今，該系列的最新一代產(chǎn)品是 Veloce Strato CS，它是 Veloce CS 硬件輔助驗(yàn)證平臺(tái)的一部分。它代表了數(shù)十年架構(gòu)演進(jìn)的巔峰之作——從定制可編程硅和虛擬線互連到基于事務(wù)的加速和企業(yè)級(jí)仿真基礎(chǔ)設(shè)施——旨在支持對(duì)現(xiàn)代 AI 驅(qū)動(dòng)的軟件定義片上系統(tǒng)的驗(yàn)證。

FPGA的復(fù)興

當(dāng)基于處理器和定制 FPGA 的仿真器在市場(chǎng)上站穩(wěn)腳跟的同時(shí)，可編程邏輯領(lǐng)域也在發(fā)生著一場(chǎng)并行的變革。

到了 20 世紀(jì) 90 年代末，Xilinx 和 Altera 的新一代 FPGA 開(kāi)始縮小在密度、速度和布線靈活性方面長(zhǎng)期存在的差距。這些器件現(xiàn)在可以容納當(dāng)時(shí)流行的片上系統(tǒng) (SoC) 設(shè)計(jì)中更大比例的組件，而改進(jìn)的布局布線工具縮短了迭代周期——這對(duì)于在持續(xù)的流片壓力下工作的驗(yàn)證團(tuán)隊(duì)來(lái)說(shuō)至關(guān)重要。

千禧年之交，賽靈思推出了 Virtex 系列，標(biāo)志著一個(gè)關(guān)鍵的轉(zhuǎn)折點(diǎn)。這些器件結(jié)合了更高的邏輯容量、更快的互連速度，以及至關(guān)重要的回讀功能。工程師無(wú)需重新編譯設(shè)計(jì)，即可在運(yùn)行時(shí)檢查內(nèi)部寄存器和存儲(chǔ)器的內(nèi)容。雖然回讀操作會(huì)降低執(zhí)行速度，但其帶來(lái)的可視性對(duì)于調(diào)試復(fù)雜系統(tǒng)而言至關(guān)重要。對(duì)于驗(yàn)證工程師而言，這代表了可觀測(cè)性和速度之間的一種新平衡，并將影響未來(lái)數(shù)年基于 FPGA 的仿真策略。

商用FPGA的快速發(fā)展重新燃起了人們對(duì)直接使用現(xiàn)成可編程器件構(gòu)建仿真器的興趣。與定制芯片方案相比，基于FPGA的系統(tǒng)有望實(shí)現(xiàn)更快的創(chuàng)新周期和更低的開(kāi)發(fā)成本，同時(shí)還能受益于FPGA供應(yīng)商不斷帶來(lái)的性能提升。這種環(huán)境為新一輪的創(chuàng)業(yè)活動(dòng)奠定了基礎(chǔ)。

兩家分別位于大西洋兩岸的初創(chuàng)公司抓住了這個(gè)機(jī)會(huì)，各自追求著不同的建筑理念。

1999 年，硅谷的 Axis 公司推出了一款基于其專利可重構(gòu)計(jì)算 (RCC) 架構(gòu)的仿真加速器。該系統(tǒng)以 FPGA 陣列的形式實(shí)現(xiàn)，并以 Excite 為名進(jìn)行市場(chǎng)推廣，最初的目標(biāo)是加速仿真工作負(fù)載，而非實(shí)現(xiàn)完整的仿真。幾年后，Excite 演變?yōu)?Extreme，一個(gè)更為傳統(tǒng)的仿真平臺(tái)。Extreme 的一項(xiàng)標(biāo)志性創(chuàng)新是其“熱插拔”功能，該功能允許工程師在仿真器和專有仿真器之間無(wú)縫地遷移設(shè)計(jì)。這種方法既利用了軟件仿真的交互式調(diào)試優(yōu)勢(shì)，又保留了硬件執(zhí)行的速度優(yōu)勢(shì)，從而彌合了兩個(gè)此前截然不同的驗(yàn)證領(lǐng)域。

幾乎在同一時(shí)期，歐洲一項(xiàng)更具顛覆性的計(jì)劃正在醞釀。由四位前Mentor Graphics工程師于2000年創(chuàng)立的Emulation Verification Engineering (EVE)公司，致力于從根本上重新定義基于FPGA的仿真技術(shù)。2003年，該公司推出了ZeBu（Zero-Bugs），這是一款實(shí)現(xiàn)于緊湊型PC卡上的仿真器。首個(gè)版本ZeBu-ZV集成了兩顆Xilinx Virtex-II器件：一顆用于映射被測(cè)設(shè)計(jì)（DUT），另一顆則通過(guò)一種新開(kāi)發(fā)的可重構(gòu)測(cè)試平臺(tái)（RTB）技術(shù)來(lái)加速事務(wù)級(jí)執(zhí)行。

事實(shí)證明，這一架構(gòu)決策至關(guān)重要。通過(guò)將測(cè)試平臺(tái)提升到硬件層面并啟用基于事務(wù)的驗(yàn)證，ZeBu 顯著提高了吞吐量，并減少了被測(cè)設(shè)備 (DUT) 與驗(yàn)證環(huán)境之間的通信瓶頸。同時(shí)，該系統(tǒng)利用 Virtex 的回讀功能，無(wú)需重新編譯即可提供運(yùn)行時(shí)內(nèi)部狀態(tài)的可見(jiàn)性——再次以執(zhí)行速度為代價(jià)，換取了強(qiáng)大的調(diào)試能力。

該概念展現(xiàn)了技術(shù)可行性和商業(yè)潛力。不到一年，EVE 便將該架構(gòu)擴(kuò)展到更大的機(jī)箱中，并可配置 Virtex FPGA 陣列。由此誕生的 ZeBu-XL 系統(tǒng)標(biāo)志著從緊湊型/個(gè)人仿真器向可擴(kuò)展/企業(yè)級(jí)仿真平臺(tái)的轉(zhuǎn)變。隨著時(shí)間的推移，該產(chǎn)品線歷經(jīng)數(shù)代迭代，每一代都受益于 FPGA 密度、時(shí)鐘技術(shù)和工具自動(dòng)化方面的進(jìn)步。

2009 年，DAC 迎來(lái)了一個(gè)重要的里程碑——ZeBu Server 的發(fā)布，它開(kāi)啟了一個(gè)長(zhǎng)盛不衰的產(chǎn)品系列。ZeBu Server 的設(shè)計(jì)可擴(kuò)展性強(qiáng)，從單機(jī)箱到多機(jī)架配置均可勝任，標(biāo)稱處理能力可達(dá)十億門。它引入了更高水平的自動(dòng)化功能，包括增量編譯、更快的布局布線周期以及多用戶功能——這些特性反映了驗(yàn)證工作流程日益工業(yè)化的趨勢(shì)。

同樣重要的是其經(jīng)濟(jì)性和運(yùn)營(yíng)特性。ZeBu Server 的執(zhí)行速度遠(yuǎn)超所有競(jìng)爭(zhēng)對(duì)手的模擬器，而計(jì)算能力消耗卻僅為它們的幾分之一。據(jù)報(bào)道，其定價(jià)——在大規(guī)模配置下甚至低于每門一美分——重新定義了硬件仿真的成本效益。該平臺(tái)憑借業(yè)內(nèi)最低的總體擁有成本之一迅速獲得認(rèn)可，使 EVE 成為驗(yàn)證市場(chǎng)上的強(qiáng)大力量。

在架構(gòu)上，ZeBu 也突破了當(dāng)時(shí)盛行的 ICE（在線仿真）優(yōu)先理念。早期系統(tǒng)強(qiáng)調(diào)通過(guò) RTB（后更名為靈活測(cè)試平臺(tái)，F(xiàn)TB）進(jìn)行基于事務(wù)的驗(yàn)證，RTB 的運(yùn)行時(shí)鐘頻率高于被測(cè)設(shè)備 (DUT)，以最大限度地提高帶寬和響應(yīng)速度。ICE 功能在后續(xù)版本中引入，但事務(wù)級(jí)加速仍然是其核心優(yōu)勢(shì)，這與嵌入式軟件和系統(tǒng)級(jí)驗(yàn)證日益重要的作用相契合。

一、Synopsys進(jìn)軍仿真領(lǐng)域

硬件仿真技術(shù)日益增長(zhǎng)的重要性引起了各大EDA廠商的關(guān)注。早在20世紀(jì)90年代中期，Synopsys就意識(shí)到這項(xiàng)技術(shù)的戰(zhàn)略意義，并試圖通過(guò)收購(gòu)一家名為Arkos的初創(chuàng)公司進(jìn)入市場(chǎng)。Arkos開(kāi)發(fā)了一種處理器式的仿真方法。然而，此次收購(gòu)最終以失敗告終。幾個(gè)月后，Synopsys剝離了Arkos及其資產(chǎn)，這些資產(chǎn)隨后被Quickturn收購(gòu)。

早期的挫折使 Synopsys 直接涉足仿真領(lǐng)域的時(shí)間推遲了十多年。在此期間，市場(chǎng)日趨成熟，基于 FPGA 的解決方案獲得了認(rèn)可，而隨著復(fù)雜 SoC 和嵌入式軟件棧的興起，系統(tǒng)級(jí)驗(yàn)證要求也日益提高。

轉(zhuǎn)折點(diǎn)出現(xiàn)在2012年，當(dāng)時(shí)Synopsys收購(gòu)了EVE。那時(shí)，EVE已經(jīng)推出了第三代ZeBu服務(wù)器平臺(tái)，并在性能、可擴(kuò)展性和成本效益方面建立了良好的聲譽(yù)。

收購(gòu)?fù)瓿珊螅琒ynopsys 對(duì) ZeBu 的發(fā)展路線圖進(jìn)行了大量投資。通過(guò)增強(qiáng)自動(dòng)化和工具集成，容量持續(xù)擴(kuò)展，性能不斷提升，編譯時(shí)間也得以縮短。此外，還引入了新的分析和使用模式，支持從軟件啟動(dòng)到系統(tǒng)驗(yàn)證和混合原型設(shè)計(jì)等各種應(yīng)用場(chǎng)景。

這些發(fā)展鞏固了基于 FPGA 的商業(yè)仿真作為驗(yàn)證領(lǐng)域長(zhǎng)期支柱的地位。

總結(jié)

20 世紀(jì) 80 年代中期，可編程邏輯技術(shù)作為快速發(fā)展的實(shí)用技術(shù)而興起，如今已發(fā)展成為現(xiàn)代半導(dǎo)體發(fā)展的基石——可擴(kuò)展到數(shù)十億門的設(shè)計(jì)，實(shí)現(xiàn)軟件定義的系統(tǒng)，并支持日益以系統(tǒng)為中心的驗(yàn)證。

從本質(zhì)上講，硬件仿真的發(fā)展歷程就是一個(gè)架構(gòu)分化的故事。三種截然不同的方法應(yīng)運(yùn)而生，每一種都受到當(dāng)時(shí)的技術(shù)限制和驗(yàn)證要求的影響，并且每一種都重新定義了仿真平臺(tái)能夠提供的功能。

早期對(duì)商用FPGA的依賴暴露了現(xiàn)有技術(shù)與深度系統(tǒng)驗(yàn)證需求之間的根本性不匹配。這一認(rèn)識(shí)標(biāo)志著一個(gè)轉(zhuǎn)折點(diǎn)，催生了基于處理器和基于定制FPGA的架構(gòu)——兩條強(qiáng)大但本質(zhì)上不同的路徑，在半導(dǎo)體行業(yè)爆炸式增長(zhǎng)的十年間支撐著仿真技術(shù)的發(fā)展。盡管新一代FPGA驅(qū)動(dòng)系統(tǒng)后來(lái)顛覆了它們，但早期的方法并未過(guò)時(shí)；相反，它拓寬了架構(gòu)的格局，凸顯了一個(gè)關(guān)鍵事實(shí)：沒(méi)有一種單一的仿真架構(gòu)能夠完美應(yīng)對(duì)所有驗(yàn)證挑戰(zhàn)。

隨著時(shí)間的推移，在用戶需求不斷變化和技術(shù)進(jìn)步的共同推動(dòng)下，仿真技術(shù)的作用顯著擴(kuò)展。在人工智能時(shí)代，驗(yàn)證已完全以系統(tǒng)為中心，需要在下一代架構(gòu)上執(zhí)行大規(guī)模軟件工作負(fù)載，例如大型語(yǔ)言模型。這種轉(zhuǎn)變使得仿真有效性的關(guān)鍵在于三個(gè)因素：系統(tǒng)容量、執(zhí)行性能和接口連接性。只有這三者達(dá)到最佳平衡，才能實(shí)現(xiàn)大規(guī)模的有效芯片前驗(yàn)證。

在當(dāng)今各種競(jìng)爭(zhēng)方法中，基于商用 FPGA 的平臺(tái)在所有三個(gè)維度上都處于最佳位置——在可擴(kuò)展性、速度和實(shí)際接口方面實(shí)現(xiàn)了引人注目的平衡，符合現(xiàn)代人工智能系統(tǒng)開(kāi)發(fā)的需求。

（來(lái)源：semiwiki ）

*免責(zé)聲明：本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn)，半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn)，不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持，如果有任何異議，歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4399內(nèi)容，歡迎關(guān)注。

加星標(biāo)??第一時(shí)間看推送

求推薦

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.