品玩4月28日訊,階躍星辰近日宣布,正式發(fā)布新一代自動語音識別模型StepAudio 2.5 ASR。該模型創(chuàng)新性地將大語言模型推理加速技術引入語音識別領域,基于ASR與MTP-5深度融合架構,實現(xiàn)了推理速度提升400%、時延降低60%的突破。
在性能方面,模型在主流評測基準上超越同類產品,綜合字錯誤率與詞錯誤率均表現(xiàn)優(yōu)異。其復用LLM原生32K上下文窗口,支持單次完整轉寫長達30分鐘的音頻,有效解決了傳統(tǒng)切片轉寫導致的上下文斷裂問題。
商業(yè)化落地層面,StepAudio 2.5 ASR通過極致的吞吐優(yōu)化,將推理成本直降80%,API定價低至0.15元/小時。目前,該模型已全量上線階躍星辰開放平臺及Step Plan,面向開發(fā)者與企業(yè)用戶提供服務。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.