![]()
Sora 下線的同時,國內一家做多模態視頻生成的公司卻在兩個月內連續拿了兩筆共 26 億人民幣的融資。
今天就分享這家公司:生數科技。
生數科技成立于 2023 年 3 月,核心方向是多模態大模型,當前最核心的產品是視頻生成平臺Vidu。
![]()
從融資看,這家公司已經進入重投入、重擴張階段。今年 2 月,生數完成超過 6 億元人民幣 A+ 輪融資;4 月,又完成20 億元人民幣左右的 B 輪融資,由阿里云領投。
生數最核心的技術人物是朱軍,是公司的創始人兼首席科學家。
朱軍本身是清華大學計算機系教授、清華大學人工智能研究院副院長,長期做機器學習、生成模型和擴散模型方向。
![]()
公司早期創始班底還有唐家渝和鮑凡:唐家渝本碩都在清華計算機系,做過騰訊優圖、瑞萊智慧;鮑凡是清華計算機系博士,長期跟著朱軍做擴散模型和多模態生成。
2025 年 3 月,原火山引擎 AI 業務負責人駱怡航加入生數出任 CEO,負責研發、產品、商業化和團隊管理。
這個團隊組合很有代表性。
換句話說,生數不是“高校老師帶學生創業”的輕團隊,它已經把科研、產品化和商業化三層都拼好了。
尤其是 CEO 駱怡航加入后,外界對它的判斷也明顯從“技術明星項目”轉向“準備大規模商業化的視頻模型公司”。
生數不是靠套開源模型起來的。它反復強調的技術底座叫U-ViT。
這個架構最早在 2022 年 9 月由朱軍團隊提出,是擴散模型和 Transformer 融合的一套自研路線。
2023 年,團隊又基于這個架構做了 UniDiffuser。2024 年核心產品 Vidu發布時,外界都把它看作這條技術路線在視頻生成上的一次產業化落地。
![]()
它在技術上的打法是:先有模型,再有產品。所以你會看到它既在推 Vidu,也在往“世界模型”方向延展。
生數把自己的技術架構講成三層:底層是基礎世界模型,上面分成數字世界的生成模型和物理世界的行動模型。
這個方向還比較早,但至少說明它的自我定位,不只是做一個創意工具,而是想把視頻模型繼續往更通用的建模能力上推。
也就是說,它不是單一的視頻生成工具,而是一整套內容生產入口。
![]()
再往下拆,Vidu 現在至少有三層產品形態。
第二層是面向開發者和企業的 MaaS / API。
Vidu 的開放平臺是給企業和開發者“無縫創建并規模化擴展視頻驅動產品”的平臺。
它支持視頻生成、圖像生成、音頻生成和其他工作流組件,已經是一套企業可接入的能力層。
第三層是行業合作與解決方案。
官網的合作頁列了很多生態伙伴:百度智能云、AWS、華為云、視覺中國等。
其中參考生視頻被官網直接稱為全球首個參考生視頻功能,主打角色、物體、場景的一致性。
先來看參考生視頻。
參考生視頻是先給模型一張或幾張參考圖,再讓它按這些圖里的角色、物體、場景去生成視頻。核心價值就是保持一致性和內容創作的連續性。
模型層面,不同版本的產品能力區分得也很清楚:Q2 動態更強、細節更豐富;Q1 畫面更清晰、過渡更平滑、運鏡更穩定;2.0 的特點是速度快。
接下來是圖生視頻。
圖生視頻的邏輯更直接,就是把靜態圖變成動態視頻。
它比較強調鏡頭運動設計、語義理解和電影感輸出。2024 年 Vidu 剛發布時,公開資料就提到它支持一鍵生成最長 16 秒、1080p 的高清內容,并在多鏡頭語言、時空一致性、動態表現上去對標 Sora。
Vidu 支持音頻和畫面同步輸出,而且不是只加一個背景音軌,而是對話、旁白、音效、音樂四類音軌可以一次生成;單次最長支持16 秒。
適用場景寫得也很清楚:漫劇、漫畫風劇情、電影感鏡頭、短劇、敘事廣告。
最后,速度是生數一直在打的點。
官方報道,Vidu 2.0 在圖生視頻和首尾幀生視頻上,生成 4 秒 512P 單片段視頻都已做到10 秒以內;單片段視頻實測推理速度已經壓到30 秒以內。
生數的商業模式其實前面已經說的比較清楚,主要分三塊。
Vidu 官網有訂閱頁和免費積分機制,所有用戶可以先拿免費積分體驗,再根據需要訂閱。
第二塊是API 調用收費。
這一塊是它最標準的 MaaS 模式。開發者或企業通過開放平臺,按模型、分辨率、時長來計費。不同模型和分辨率的價格不同。
第三塊是企業項目與行業合作。
生數并不是單純賣標準 API,它還在做聯合解決方案、生態接入和行業項目。
視覺中國和它一起做視覺產業大模型平臺,AMD幫它往端側和 AI PC 部署擴展,百度千帆幫它擴大企業調用場景。
這類合作通常意味著更高客單價和更深綁定。
第一組是早期爆發力。
官網報告,Vidu 從 2024 年 7 月底全球上線后,20 天用戶數破百萬,100 天破千萬,累計生成視頻過億條。
參考生視頻這個功能上線 3 個月后,用戶用它生成的視頻也已經到千萬條級別。
第二組是2025 年全年增長。
Vidu 在 2025 年實現了用戶和收入都超過 10 倍增長。行業客戶包括索尼電影、騰訊動漫、字節跳動等。
第三組是全球覆蓋和行業滲透。
生數現在的競爭力,主要有三個。
第一,它的技術棧是自己的。U-ViT 這條路線、UniDiffuser 這類研究積累,讓它不是靠套殼起家。這會直接影響模型迭代速度和長期天花板。
同時,這家公司也面對無法回避的現實壓力。
一是視頻模型賽道迭代太快,阿里、字節、快手、可靈、Runway、Google、xAI 都在卷,模型領先窗口往往很短。
二是它現在很多案例仍然是“官方案例”或“匿名客戶案例”,這說明公司已經有商業化,但對外能驗證的客戶細節還不算特別多。判斷它未來的穩固程度,還要繼續看更多長期付費客戶、續費率和大客戶占比。
三是它往世界模型走,想象空間更大,研發和算力投入也會更重。今年以來的連續大額融資本身既說明市場看好,也說明這門生意依然非常燒錢。
以上,祝你今天開心。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.