文心5.1重磅發(fā)布！DeepSeek迎“最強(qiáng)對手”？

2026-05-09 17:58:16　來源: 互聯(lián)網(wǎng)那些事

江蘇舉報(bào)

分享至

距離DeepSeek祭出久違的V4、V4Pro“雙響炮”才過去15天，中國AI界又迎來一個明星大模型的“王炸級”更新！

01，無懼DeepSeek V4Pro？

5月9日上午，百度毫無征兆官宣新一代基礎(chǔ)大模型文心大模型5.1正式發(fā)布，引發(fā)行業(yè)高度關(guān)注，據(jù)悉，文心5.1通過“多維彈性預(yù)訓(xùn)練”技術(shù)，僅以業(yè)界同規(guī)模模型約6%的預(yù)訓(xùn)練成本，就達(dá)到了基礎(chǔ)效果的領(lǐng)先水平。

實(shí)際上，對于正式版取得的驚艷表現(xiàn)，李彥宏等百度高層應(yīng)是一早就“心里有底”了。

4月30日，文心5.1的先行預(yù)覽版（Preview）便以1476的高分登上LMArena文本榜國內(nèi)第一，并且是該權(quán)威榜單中，TOP 15里唯一的中國自主研發(fā)大模型！

LMArena大模型競技場最新排名顯示，文心 5.1以1223分登上LMArena搜索榜國內(nèi)第一、全球第四，仍然是唯一上榜的國產(chǎn)大模型。

搜索能力強(qiáng)大的模型能在復(fù)雜的業(yè)務(wù)場景中更具優(yōu)勢，因?yàn)閷π畔⒄吓c處理的效率更高，在內(nèi)容生成、智能助手、企業(yè)知識管理以及Agent應(yīng)用等方面潛力也更大。

并且，在業(yè)界公認(rèn)權(quán)威的多項(xiàng)基準(zhǔn)測試中，文心 5.1在智能體、知識、推理和深度搜索等方面皆表現(xiàn)優(yōu)異。

值得一提的是，其Agent能力已經(jīng)超越DeepSeek目前最強(qiáng)的V4-Pro，其創(chuàng)意寫作能力與頂尖模型Gemini 3.1 Pro相當(dāng)，推理能力也接近業(yè)界領(lǐng)先的閉源模型。

為什么文心5.1如此“夯”？

核心原因還是“多維彈性訓(xùn)練”這一重磅黑科技的迭代進(jìn)化帶來的威力，除了多項(xiàng)核心能力的全面升維之外，還直觀降低了企業(yè)預(yù)訓(xùn)練的成本！

據(jù)了解，這是百度自研的?大模型分布式訓(xùn)練范式?，其核心目標(biāo)是：?一次訓(xùn)練，生成多規(guī)模模型家族，實(shí)現(xiàn)訓(xùn)練成本降低94%的同時保持效果領(lǐng)先?。

本質(zhì)上，這是一種基于超稀疏混合專家架構(gòu)的彈性訓(xùn)練范式，在單一訓(xùn)練過程中動態(tài)生成不同參數(shù)規(guī)模、計(jì)算密度與推理效率的子模型。打破了傳統(tǒng)“一訓(xùn)練一模型”的固化模式，實(shí)現(xiàn)?訓(xùn)練資源復(fù)用最大化?，不犧牲性能的前提下，顯著降低千億級大模型的訓(xùn)練成本與部署門檻。

在文心5.0時期，“多維彈性訓(xùn)練”就已經(jīng)小試牛刀，實(shí)現(xiàn)了一次訓(xùn)練生成多種規(guī)模模型的目標(biāo)；

到了文心5.1階段，“多維彈性訓(xùn)練”已然大施拳腳，實(shí)現(xiàn)了將總參數(shù)壓縮至約 1/3、激活參數(shù)壓縮至約 1/2、單次響應(yīng)延遲降低35%、僅使用業(yè)界同規(guī)模模型約6%的預(yù)訓(xùn)練成本，基礎(chǔ)效果全面領(lǐng)先的成就。

可以說文心5.1在繼承文心5.0知識基礎(chǔ)上，實(shí)現(xiàn)輕量化與高性能并存，并且，除了為企業(yè)減負(fù)，直觀創(chuàng)造經(jīng)濟(jì)價(jià)值（比如將大模型訓(xùn)練成本從動輒“億元級”降至“千萬級”，推動AI普惠化），該項(xiàng)技術(shù)還有重大的社會意義！

以GPT-4級別的大模型訓(xùn)練耗電量為參照，前者完成訓(xùn)練約2.4億度電，而文心5.1等效電力消耗僅約633.6萬度，能夠大幅降低能能源消耗，利好碳達(dá)峰、碳中和。

憑借“彈性+高效”的差異化亮點(diǎn)，百度也在一步一步筑深自研大模型的護(hù)城河，目前的文心5.0、文心5.1系列大模型，已經(jīng)穩(wěn)居國產(chǎn)大模型第一梯隊(duì)。

正所謂春江水暖鴨先知，基礎(chǔ)大模型取得了突破性成績，其實(shí)壓根都不怎么需要詳細(xì)的科普，資本市場已早早用肯定的態(tài)度來“投票”了。

截至5月8日收盤，百度仍大漲近6個百分點(diǎn)，此外，最新消息顯示，5月13日至14日在北京國家會議中心二期舉辦Create2026AI開發(fā)者大會，展示文心大模型在產(chǎn)業(yè)應(yīng)用的最新進(jìn)展。

種種跡象表明，那個昔年總被調(diào)侃“起大早、改晚集”的百度，或許正有條不紊地迎來了一輪疊加商業(yè)兌現(xiàn)的技術(shù)紅利井噴期？

02，百度“AI版圖”再擴(kuò)容！

對百度而言，近期的重磅利好，絕不僅僅是AI基礎(chǔ)大模型上取得的突破，在最底層的 AI芯片賽道，百度亦大動作頻頻，就在昨天，百度旗下昆侖芯被曝出“A+H”雙線并行IPO的消息。

5月8日，據(jù)中國證監(jiān)會官網(wǎng)，百度（Nasdaq：BIDU，09888.HK）旗下昆侖芯（北京）科技股份有限公司（簡稱：昆侖芯）擬首次公開發(fā)行股票并在科創(chuàng)板上市，中國國際金融股份有限公司擔(dān)任輔導(dǎo)機(jī)構(gòu)。

2026年1月2日，百度發(fā)布公告稱，1月1日，昆侖芯已透過其聯(lián)席保薦人以保密形式向香港聯(lián)交所提交上市申請表格（A1表格），以申請批準(zhǔn)昆侖芯股份于香港聯(lián)交所主板上市及買賣。

在業(yè)內(nèi)分析人士看來，百度雙線推進(jìn)港股、科創(chuàng)板的IPO，既可保留未來境內(nèi)融資的靈活性，也體現(xiàn)了對國內(nèi)資本市場的長期信心。

當(dāng)然，打鐵還需自身硬，昆侖芯作為投資標(biāo)的，能吸引各路資本的關(guān)注，其硬核底色或許才是的核心原因。

據(jù)《互聯(lián)網(wǎng)那些事》此前文章報(bào)道：昆侖芯投資陣容中不乏 CPE源峰、IDG資本、比亞迪、國新高層次人才基金等知名機(jī)構(gòu)；

另據(jù)中銀國際研報(bào)，昆侖芯的理想估值或直逼1000億港元，這一估值規(guī)模，較昆侖芯去年末的投后估值，近乎翻了4~5倍。

圖：昆侖芯營收與出貨測算，源：國信證券

據(jù)國信證券測算，其對昆侖芯的展望，比高盛、摩根大通等國際投行還要樂觀，其稱，國產(chǎn)AI芯片需求呈現(xiàn)快速增長，昆侖芯2025年?duì)I收有望達(dá)到50億元級、26年?duì)I收或達(dá)百億元級。

截至目前，百度昆侖芯已經(jīng)擁有包括吉利汽車、vivo、南方電網(wǎng)、招商銀行、中國移動等知名大型企業(yè)集團(tuán)在內(nèi)的上百家大客戶，交付規(guī)模幾十卡到萬卡以上不等。

從自研算力底座（芯片）到大模型突破、從AI應(yīng)用到生態(tài)閉環(huán)，深耕26載的百度，趟出了一條民族科技自立自強(qiáng)的硬核之路！

參考資料：

封面圖源文心大模型生成

百度文心大模型 5.1發(fā)布：登上LMArena搜索榜國內(nèi)第一-DoNews

訓(xùn)練一次GPT-4耗電2.4億度，中國電力儲備真能撐起AI大爆發(fā)嗎？-BigNews

昆侖芯啟動科創(chuàng)板IPO輔導(dǎo)：仍在正常推動港股上市進(jìn)程，百度持股57%-澎湃新聞

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.