![]()
DeepSeek擬募資最高500億,梁文鋒自掏200億
市場消息顯示,DeepSeek正進行其首輪大規模融資,目標金額高達500億元人民幣(約合73.5億美元)。若融資順利完成,將創下國內人工智能領域單輪融資的最高紀錄。
值得關注的是,本輪融資中最大的一筆出資來自創始人梁文鋒本人。據悉,其個人出資額達到200億元人民幣,占本輪融資總額的40%,以真金白銀彰顯了對公司前景的堅定信心。
百度文心大模型5.1發布:登頂多個榜單,預訓練成本僅為業界 6%
百度文心大模型5.1 正式發布,其繼承文心5.0 知識,顯著降低預訓練成本,將總參數壓縮至約1/3、激活參數壓縮至約1/2,僅使用業界同規模模型約6% 的預訓練成本,實現同級別模型基礎效果領先。
登錄文心一言官網即可與文心5.1模型對話體驗最新能力。開發者可以通過千帆大模型平臺修改model_name為ernie-5.1即可調用API服務。
從今天起,文心大模型 5.1 將陸續在超過十個創意生產智能體平臺上線,包括 ISEKAI ZERO(全球領先的 AI 角色扮演互動平臺)、Mulan AI(創意智能體平臺)、諦聽幻流(AI 原生創意畫布)和 Storymaster(AI 短劇生成平臺)等。
接入超300款AI大模型 國內最大大模型服務平臺正式上線
國內最大的大模型服務平臺近日正式上線,由中國移動開發的這個平臺已接入并提供300余款國內主流AI大模型的服務與能力,是國內匯聚大模型數量最多的平臺。
據了解,該平臺首創詞元(Token)集約化運營模式,記者在現場看到,平臺能夠自動分析用戶需求,智能為任務匹配最優模型。通過“成本優先”“效果優先”“均衡優先”三種模式,為用戶動態篩選適配方案,以更低的詞元消耗、更高的執行效率完成工作。
當模型出現超時、限流或故障時,平臺能自動實現秒級切換,確保業務連續不中斷。目前,該平臺實現單位詞元成本降低30%左右,資源占用率減少50%以上,日均調用量超過千億級。
MiniMax深度復盤“馬嘉祺消失”,揭秘Token退化真相與修復策略
近日,開發者社區發現MiniMax M2系列模型輸出“馬嘉祺”異常。官方排查后揭示,后訓練階段低頻Token退化是主因,分詞器切分“馬嘉祺”后,“嘉祺”因樣本不足致向量空間未優化。約4.9%的Token顯著退化,引發日語對話等異常。MiniMax提出三項修復策略,日語混淆率降至1%,未來將兼顧多層面保障表達力。
Lanmeih/今日話題
你在用DeepSeek嗎?
咱們評論區聊聊~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.