![]()
距離DeepSeek祭出久違的V4、V4Pro“雙響炮”才過去15天,中國AI界又迎來一個明星大模型的“王炸級”更新!
01,無懼DeepSeek V4Pro?
5月9日上午,百度毫無征兆官宣新一代基礎(chǔ)大模型文心大模型5.1正式發(fā)布,引發(fā)行業(yè)高度關(guān)注,據(jù)悉,文心5.1通過“多維彈性預(yù)訓(xùn)練”技術(shù),僅以業(yè)界同規(guī)模模型約6%的預(yù)訓(xùn)練成本,就達(dá)到了基礎(chǔ)效果的領(lǐng)先水平。
![]()
實(shí)際上,對于正式版取得的驚艷表現(xiàn),李彥宏等百度高層應(yīng)是一早就“心里有底”了。
4月30日,文心5.1的先行預(yù)覽版(Preview)便以1476的高分登上LMArena文本榜國內(nèi)第一,并且是該權(quán)威榜單中,TOP 15里唯一的中國自主研發(fā)大模型!
LMArena大模型競技場最新排名顯示,文心 5.1以1223分登上LMArena搜索榜國內(nèi)第一、全球第四,仍然是唯一上榜的國產(chǎn)大模型。
![]()
搜索能力強(qiáng)大的模型能在復(fù)雜的業(yè)務(wù)場景中更具優(yōu)勢,因?yàn)閷π畔⒄吓c處理的效率更高,在內(nèi)容生成、智能助手、企業(yè)知識管理以及Agent應(yīng)用等方面潛力也更大。
并且,在業(yè)界公認(rèn)權(quán)威的多項(xiàng)基準(zhǔn)測試中,文心 5.1在智能體、知識、推理和深度搜索等方面皆表現(xiàn)優(yōu)異。
值得一提的是,其Agent能力已經(jīng)超越DeepSeek目前最強(qiáng)的V4-Pro,其創(chuàng)意寫作能力與頂尖模型Gemini 3.1 Pro相當(dāng),推理能力也接近業(yè)界領(lǐng)先的閉源模型。
為什么文心5.1如此“夯”?
核心原因還是“多維彈性訓(xùn)練”這一重磅黑科技的迭代進(jìn)化帶來的威力,除了多項(xiàng)核心能力的全面升維之外,還直觀降低了企業(yè)預(yù)訓(xùn)練的成本!
據(jù)了解,這是百度自研的?大模型分布式訓(xùn)練范式?,其核心目標(biāo)是:?一次訓(xùn)練,生成多規(guī)模模型家族,實(shí)現(xiàn)訓(xùn)練成本降低94%的同時保持效果領(lǐng)先?。
本質(zhì)上,這是一種基于超稀疏混合專家架構(gòu)的彈性訓(xùn)練范式,在單一訓(xùn)練過程中動態(tài)生成不同參數(shù)規(guī)模、計(jì)算密度與推理效率的子模型。打破了傳統(tǒng)“一訓(xùn)練一模型”的固化模式,實(shí)現(xiàn)?訓(xùn)練資源復(fù)用最大化?,不犧牲性能的前提下,顯著降低千億級大模型的訓(xùn)練成本與部署門檻。
在文心5.0時期,“多維彈性訓(xùn)練”就已經(jīng)小試牛刀,實(shí)現(xiàn)了一次訓(xùn)練生成多種規(guī)模模型的目標(biāo);
到了文心5.1階段,“多維彈性訓(xùn)練”已然大施拳腳,實(shí)現(xiàn)了將總參數(shù)壓縮至約 1/3、激活參數(shù)壓縮至約 1/2、單次響應(yīng)延遲降低35%、僅使用業(yè)界同規(guī)模模型約6%的預(yù)訓(xùn)練成本,基礎(chǔ)效果全面領(lǐng)先的成就。
可以說文心5.1在繼承文心5.0知識基礎(chǔ)上,實(shí)現(xiàn)輕量化與高性能并存,并且,除了為企業(yè)減負(fù),直觀創(chuàng)造經(jīng)濟(jì)價(jià)值(比如將大模型訓(xùn)練成本從動輒“億元級”降至“千萬級”,推動AI普惠化),該項(xiàng)技術(shù)還有重大的社會意義!
以GPT-4級別的大模型訓(xùn)練耗電量為參照,前者完成訓(xùn)練約2.4億度電,而文心5.1等效電力消耗僅約633.6萬度,能夠大幅降低能能源消耗,利好碳達(dá)峰、碳中和。
憑借“彈性+高效”的差異化亮點(diǎn),百度也在一步一步筑深自研大模型的護(hù)城河,目前的文心5.0、文心5.1系列大模型,已經(jīng)穩(wěn)居國產(chǎn)大模型第一梯隊(duì)。
正所謂春江水暖鴨先知,基礎(chǔ)大模型取得了突破性成績,其實(shí)壓根都不怎么需要詳細(xì)的科普,資本市場已早早用肯定的態(tài)度來“投票”了。
![]()
截至5月8日收盤,百度仍大漲近6個百分點(diǎn),此外,最新消息顯示,5月13日至14日在北京國家會議中心二期舉辦Create2026AI開發(fā)者大會,展示文心大模型在產(chǎn)業(yè)應(yīng)用的最新進(jìn)展。
種種跡象表明,那個昔年總被調(diào)侃“起大早、改晚集”的百度,或許正有條不紊地迎來了一輪疊加商業(yè)兌現(xiàn)的技術(shù)紅利井噴期?
02,百度“AI版圖”再擴(kuò)容!
對百度而言,近期的重磅利好,絕不僅僅是AI基礎(chǔ)大模型上取得的突破,在最底層的 AI芯片賽道,百度亦大動作頻頻,就在昨天 ,百度旗下昆侖芯被曝出“A+H”雙線并行IPO的消息。
![]()
5月8日,據(jù)中國證監(jiān)會官網(wǎng),百度(Nasdaq:BIDU,09888.HK)旗下昆侖芯(北京)科技股份有限公司(簡稱:昆侖芯)擬首次公開發(fā)行股票并在科創(chuàng)板上市,中國國際金融股份有限公司擔(dān)任輔導(dǎo)機(jī)構(gòu)。
2026年1月2日,百度發(fā)布公告稱,1月1日,昆侖芯已透過其聯(lián)席保薦人以保密形式向香港聯(lián)交所提交上市申請表格(A1表格),以申請批準(zhǔn)昆侖芯股份于香港聯(lián)交所主板上市及買賣。
在業(yè)內(nèi)分析人士看來,百度雙線推進(jìn)港股、科創(chuàng)板的IPO,既可保留未來境內(nèi)融資的靈活性,也體現(xiàn)了對國內(nèi)資本市場的長期信心。
當(dāng)然,打鐵還需自身硬 ,昆侖芯作為投資標(biāo)的,能吸引各路資本的關(guān)注,其硬核底色或許才是的核心原因。
據(jù)《互聯(lián)網(wǎng)那些事》此前文章報(bào)道:昆侖芯投資陣容中不乏 CPE源峰、IDG資本、比亞迪、國新高層次人才基金等知名機(jī)構(gòu);
另據(jù)中銀國際研報(bào),昆侖芯的理想估值或直逼1000億港元,這一估值規(guī)模,較昆侖芯去年末的投后估值,近乎翻了4~5倍 。
![]()
圖:昆侖芯營收與出貨測算,源:國信證券
據(jù)國信證券測算,其對昆侖芯的展望,比高盛、摩根大通等國際投行還要樂觀,其稱,國產(chǎn)AI芯片需求呈現(xiàn)快速增長,昆侖芯2025年?duì)I收有望達(dá)到50億元級、26年?duì)I收或達(dá)百億元級。
截至目前,百度昆侖芯已經(jīng)擁有包括吉利汽車、vivo、南方電網(wǎng)、招商銀行、中國移動等知名大型企業(yè)集團(tuán)在內(nèi)的上百家大客戶,交付規(guī)模幾十卡到萬卡以上不等。
從自研算力底座(芯片)到大模型突破、從AI應(yīng)用到生態(tài)閉環(huán),深耕26載的百度,趟出了一條民族科技自立自強(qiáng)的硬核之路!
參考資料:
封面圖源文心大模型生成
百度文心大模型 5.1發(fā)布:登上LMArena搜索榜國內(nèi)第一-DoNews
訓(xùn)練一次GPT-4耗電2.4億度,中國電力儲備真能撐起AI大爆發(fā)嗎?-BigNews
昆侖芯啟動科創(chuàng)板IPO輔導(dǎo):仍在正常推動港股上市進(jìn)程,百度持股57%-澎湃新聞
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.