快科技5月27日消息,今日,小米宣布,旗下MiMo-V2.5系列大模型API迎來永久降價。
據介紹,相比原始API定價,MiMo-V2.5系列新價格最高降幅可達99%,并且不再區分上下文窗口長度。
本次調價已于北京時間5月27日0:00正式生效,全球同步調整。
具體來看,此次降價覆蓋MiMo-V2.5和MiMo-V2.5 Pro兩個版本。
![]()
其中,MiMo-V2.5 Pro輸入緩存命中價格降至0.025元/百萬tokens,最高降幅達99%;MiMo-V2.5輸入緩存命中價格降至0.02元/百萬tokens,最高降幅達98%。
輸出價格方面,MiMo-V2.5 Pro降至6元/百萬tokens,最高降幅86%;MiMo-V2.5降至2元/百萬tokens,最高降幅93%。
除了API價格下調外,MiMo的Token Plan計費體系也同步迎來重大優化。
優化后的Token Plan在加量不加價的基礎上,用量提升至原來的5至8倍,同時引入Credits概念,讓計費規則更清晰、更易理解。
![]()
小米稱,本次價格調整背后,離不開技術團隊在推理系統上的持續優化。
據了解,小米基于SGLang HiCache完整支持SWA(Sliding Window Attention),將KV Cache在GPU顯存、CPU內存、SSD等多級存儲之間的數據搬運量降低至優化前的近1/7,并將可緩存token數量提升至優化前的近5倍,從而顯著提升緩存命中率和推理效率。
同時,小米還通過優化專家并行方案、輸入長度分桶策略等方式,進一步提升集群輸入吞吐能力,在保障服務質量的前提下,持續降低單位token服務成本。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.