![]()
![]()
![]()
RAGFlow v0.25.2 已于 2026 年 5 月 10 日發布。這一版本的關鍵詞非常明確:API 繼續統一、數據源刪除同步能力增強、權限控制更嚴格、性能瓶頸被修復、兼容性持續維護。如果你正在關注 RAGFlow 的升級節奏,v0.25.2 是一次覆蓋面非常廣的版本更新,既有架構層面的持續演進,也有大量面向生產可用性的修補與增強。
一、v0.25.2 版本總覽
本次版本主要分為三大方向:
1)API 繼續重構與統一
RAGFlow 持續推進 Web API 向 RESTful 規范遷移,同時強調保持舊接口兼容。這意味著新舊客戶端在遷移過程中不會被強制打斷,整體升級更平滑。
2)數據源刪除文件同步能力增強
本次新增了一個輕量級 snapshot 機制,用于同步多個數據源中的已刪除文件,并盡可能真實反映遠端數據源狀態。該能力覆蓋多個數據源,說明 RAGFlow 在“同步一致性”方面進一步強化。
3)大量 bug 修復與安全/性能提升
從元數據可見性問題、重復 chat 輸出、過濾性能瓶頸,到權限檢查、兼容性路由、導出下載、數據集訪問控制等,本次版本對生產環境中的關鍵問題做了系統性修正。
二、核心改進:API 統一繼續推進,舊接口保持兼容
v0.25.2 延續了前幾個版本的方向:Web API 向 RESTful 風格持續重構和統一。這類改動通常意味著:
? 路由命名更統一
? 資源表達方式更清晰
? 接口層次更適合長期維護
? 客戶端調用體驗更一致
更重要的是,本次更新特別強調了一個原則:所有 legacy 端點都保持向后兼容。也就是說,雖然內部接口正在逐步規范化,但舊版本的調用方式仍然可用。這對于正在使用 RAGFlow 的團隊非常關鍵,因為它降低了升級風險,也減少了遷移成本。
這次還出現了多個與 RESTful 重構相關的更新點,例如:
? 文檔預覽/下載遷移到 RESTful API
? 文檔下載增加兼容路由
? 完整的舊文檔 API 向后兼容維護
? 路由名稱調整
? legacy 系統健康檢查路由保留
這說明 RAGFlow 并不是簡單地“換接口”,而是在做一套漸進式 API 重構:新規范逐步落地,老調用繼續可用,保證系統演進不中斷。
三、數據源同步重大升級:刪除文件同步機制上線
本次最值得關注的功能之一,是輕量級 snapshot 機制的引入。它的目的很明確:用于同步遠端數據源中被刪除的文件,從而讓本地狀態更忠實地反映遠端真實變化。
這項能力覆蓋了多個數據源,包括:
? Moodle
? DingTalk AI Table
? RSS
? WebDAV
? Asana
? Zendesk
? IMAP
? Seafile
以及本次還擴展到:
? dingtalk-ai-table
? moodle
? rss
? webdav
? asana
? zendesk
? seafile
? rdbms
從更新描述看,這不是單點修補,而是一次跨數據源的能力擴展。它解決的是同步系統中非常現實的問題:遠端數據源刪了文件,本地如果不知道,就會產生臟數據、誤檢索、誤展示、甚至誤引用。
這個機制帶來的直接價值
? 刪除內容能夠被更及時識別
? 數據源狀態更一致
? 檢索結果更可靠
? 數據同步更貼近真實遠端狀態
? 后續文檔管理與權限控制更容易保持正確性
此外,這次更新中還包含了多個與同步相關的修復:
? 數據源空列表同步修復
? 文件批量刪除優化
? 文檔刪除權限檢查補充
? 刪除文檔 UUID 校驗移除
? 連接器服務時間設置與日志間隔修正
? 同步文檔 ID 按連接器作用域隔離,避免跨知識庫沖突
可以看出,v0.25.2 不只是“支持刪除同步”,而是順手把整條同步鏈路的穩定性、隔離性、正確性都加強了一遍。
四、性能優化:元數據過濾從內存處理下沉到 Elasticsearch
這次版本里有一個非常明確的性能改進點:元數據過濾不再在內存中處理,而是下推到 Elasticsearch。
這項優化非常重要,因為內存過濾通常會帶來以下問題:
? 數據量大時性能明顯下降
? 過濾邏輯難以擴展
? 會產生額外的內存開銷
? 檢索鏈路容易出現瓶頸
本次改動后,過濾邏輯交給 Elasticsearch 執行,說明系統更合理地利用了檢索引擎能力。對于大規模數據集場景,這種優化往往能帶來非常明顯的收益。
除此之外,性能類修復還包括:
? 避免 embedding 累積中的 O(n2) 數組增長
? RocksDB 元數據并發 CREATE/DROP 沖突重試
? 圖譜構建中的合并并發和 checkpoint 恢復
? 文件批量刪除優化
? 任務日志數量上限放寬
? 繼續優化數據過濾與檢索鏈路
這些變化表明,v0.25.2 不只是修小 bug,而是在處理大數據量、大并發環境下的真實使用問題。
五、聊天與多模態能力增強
本次在 chat 體驗方面也有較多更新:
? 簡化 chat,并支持多模態 chat
? 支持多模態 chat 流式輸出
? 修復聊天頁面 LaTeX 公式無法顯示
? 修復雙重轉義的 LaTeX 反斜杠和 HTML 實體
? 修復重復 chat 輸出
? 修復非流式工具調用追加到 chat history 的異常
? 修復對話中的思考顯示折疊與深度研究檢索標簽分離
? 修復聊天頁中書寫公式顯示問題
? 修復部分輸出與消息展示錯誤
這些修復說明 RAGFlow 在對話層的目標并不是只做“能聊”,而是進一步讓復雜能力在前端表現上保持穩定。例如:
? 公式內容能正確渲染
? 多模態請求可流式返回
? 工具調用歷史更穩定
? deep research 的展示標簽更清晰
? 聊天輸出重復問題被處理
這類體驗修復對最終用戶感知非常明顯,尤其是在知識問答、文檔分析、多模態輔助場景里。
六、權限控制全面收緊:多處接口補上授權檢查
v0.25.2 在安全性方面非常明顯的一點,就是權限檢查更嚴格了。多個接口都補上了 tenant 級別的授權控制或 IDOR 防護,避免越權訪問和跨租戶泄露。
本次涉及的安全與權限修復包括:
? 文檔刪除權限檢查
? beta 文檔下載授權檢查
? 文檔下載 endpoint 加強租戶授權
? chatbot SDK endpoint 強制 tenant 級授權
? memory 與 message endpoint 強制 tenant 權限
? 文件 ancestry 接口補權限檢查
? /files/link-to-datasets 授權缺失修復
? 私有數據集訪問檢查中的越權修復
? agent 權限問題修復及回滾
? team member 無法編輯 agent 的修復
? hybrid 模式下認證問題修復
? CLI 登錄、注冊、注銷相關修復
? document download 兼容路由同時保留授權邏輯
這些修復共同指向一個目標:多租戶環境下的數據隔離必須嚴格。這對于企業部署尤其重要,因為一旦權限邊界不清晰,就可能造成數據泄露或者誤操作。
七、模型與推理能力持續擴展:更多 provider 接入
v0.25.2 中,模型接入能力繼續擴展,新增或完善了多個 provider 支持,包括:
? FuturMix
? Vllm
? Ollama
? xAI
? lm-studio
? OpenAI
? Nvidia
? OpenRouter
? HuggingFace
? 阿里云相關能力
? ZhipuAI 的 Rerank
? Gitee AI 的 Rerank
? SiliconFlow 的 Balance
? DeepSeek 的 Balance
? Aliyun 的 Encode(embeddings)
? Bedrock 相關修正
? MiniMax GroupId header 支持
? 繼續優化 model service 的統一調用邏輯
同時還有以下相關改進:
? 使用統一的 GetChatModel,減少重復函數
? 修正 IMAGE2TEXT 到 CHAT 的 fallback 與 model_type 歸一化
? 修復本地模型連接檢查的全局狀態污染
? 修復不同 provider 的 ListModels 和 CheckConnection 接口對接
? 修復 agent completion 的兼容性
? 支持 non-stream runtime agent completion
這意味著 RAGFlow 的模型生態繼續變寬,同時內部調用鏈也在變得更統一、更可維護。
八、數據集、文檔、檢索與 RAG 相關修復
圍繞數據集與文檔的修復非常多,覆蓋面很廣:
? 允許搜索多個數據集
? 修復數據集文件頁面路由錯誤
? 修復數據集文件過濾 API
? 修復 document api 的向后兼容
? 修復知識庫 prompt 中 document_metadata 為空導致的 citation 崩潰
? 修復 tag parser id
? 修復 handle id as keyword
? 修復 kb_ids 在 SQL 拼接前的 UUID 校驗
? 修復文檔導出元數據丟失
? 修復文檔生成器輸出補充 base64
? 修復文檔轉換的向后兼容
? 修復過濾條件下 rerank 不應繞過閾值
? 修復嵌入模型切換后已有 chunks 的恢復問題
? 修復 shared dataset 訪問時的私有數據集授權繞過
? 修復 file ancestry 相關越權
? 修復 dataset search 多數據集 UI
? 修復刪除 last file 的問題
? 修復 sync 中 document IDs 按 connector 作用域隔離
? 修復 filter api 在 dataset document 中的行為
這些更新集中體現了 RAGFlow 的核心定位:文檔檢索、數據集管理、RAG 召回、rerank、導出、轉換、權限控制必須形成閉環。任何一個環節不穩定,最終都會影響問答、引用和業務結果。
九、開發者與 CLI 能力增強
本次版本也強化了 Go 相關能力與 CLI 工具鏈,包括:
? CLI 支持 text、image、video 聊天
? CLI 登錄修復
? CLI 注冊修復
? CLI 注銷修復
? Go CLI 支持數據集搜索
? Go CLI 支持 embed 和 rerank
? Go 管理 ingestion tasks
? Go 側日志模塊遷移到 common
? Go 側 auth 修復
? Go 側 provider 實現持續擴展
這些內容說明 RAGFlow 不只是 Web 產品,也在持續建設命令行和程序化使用能力,方便自動化、調試和運維集成。
十、其他值得關注的細節修復
除了上面的大方向,這次版本還有不少細節修復,同樣影響生產穩定性:
? 版本信息修復
? 任務日志更多展示
? 路由名稱調整
? 樹形圖/畫布運行路徑感知修復
? 文檔預覽下載元數據保留
? 兼容歷史健康檢查路由
? 支持 local provider 的代碼執行組件
? 去除部分過時模型
? Turkish 本地化字符串更新
? SSL 證書配置指南補充
? README 與版本引用更新
? release notes 和發布時間同步修正
? docs 全面更新到 v0.25.2
這些內容雖然看起來零散,但它們是成熟產品持續迭代中非常重要的一部分:讓系統更穩定、文檔更準確、升級更順暢、運維更友好。
十一、v0.25.2 的整體意義
如果把這次更新濃縮成一句話,那就是:
RAGFlow v0.25.2 是一次以兼容性為前提、以穩定性和安全性為重點、以同步與檢索性能優化為亮點的綜合升級。
它沒有只做單一功能,而是同時推進了:
? REST API 統一
? 刪除文件同步
? 多數據源一致性
? 權限與安全
? 檢索性能
? 多模態聊天
? 模型 provider 擴展
? CLI 與 Go 側增強
? 向后兼容維護
這類版本通常最適合生產環境關注,因為它解決的不是表面功能,而是實際落地中的關鍵痛點。
十二、總結
代碼地址:github.com/infiniflow/ragflow
RAGFlow v0.25.2 這次更新內容非常密集,覆蓋范圍也非常廣。從 API 重構到數據源刪除同步,從元數據過濾性能到聊天展示修復,從租戶權限到多 provider 支持,再到 CLI 與 Go 側完善,幾乎可以說是一次“全棧型”的版本升級。
我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.