網易首頁 > 網易號 > 正文申請入駐

拉脫維亞這家小貸公司，用AI把審核從20小時壓到5秒

2026-05-01 01:09:50　來源: Ping值焦慮

北京舉報

分享至

一個貸款申請從提交到放款，傳統流程要卡20小時。Sun Finance的工程師在2025年8月26日那天啟動了一個項目，107天后，這個數字變成了5秒。

舊系統的天花板：60%申請卡在人手里

Sun Finance不是新手。這家2017年成立的拉脫維亞金融科技公司，2019年就用亞馬遜的人臉識別和文檔識別服務搭過第一版自動化系統。但業務擴張到發展中地區后，老辦法開始失靈。

具體卡在哪？當地語言。英語加本地雙語文檔，傳統光學字符識別（OCR）訓練數據覆蓋不足，錯漏頻發。7種不同版式的身份證件，每種布局都不一樣。結果是：8萬筆月申請里，60%要人工復核——而這60%里，80%純粹是因為OCR提取錯了。

這不是風控嚴格，是系統拖后腿。

新架構的解法：讓專用工具和大模型分工

Sun Finance找到AWS生成式AI創新中心，重新設計管道。核心思路不復雜：OCR負責"看見"，大語言模型（LLM）負責"理解"。

具體實現分三層。第一層，亞馬遜的文檔識別服務（Textract）做人臉檢測和原始文本提取，這是它的強項。第二層，提取的文本送進亞馬遜的模型托管平臺（Bedrock），用Claude模型做結構化——把混亂的OCR輸出整理成標準字段。第三層，向量數據庫做欺詐檢測，把歷史欺詐文檔的特征向量化，新申請來了直接比對相似度。

這個組合的關鍵在于：不迷信單一工具。純OCR搞不定復雜版式，純大模型成本高且對文檔細節不敏感。兩者接力，各干各擅長的。

35天上線的真相：預訓練模型+明確邊界

項目時間線值得細看。AWS側32天完成方案設計和原型，26天技術交接，Sun Finance自己35天推上線——中間還夾了14天假期凍結。總共107個營業日，從kickoff到生產環境。

能這么快，因為沒走"從零訓練模型"的彎路。Bedrock上的Claude是現成的，Textract和Rekognition也是托管服務。Sun Finance做的主要是流程編排、提示詞工程和向量檢索邏輯。生成式AI的價值在這里體現得很務實：不是替代現有工具，是把原本卡住的環節打通。

數據驗證了這點。文檔提取準確率從79.7%拉到90.8%，單份文檔成本砍了91%，處理時效從最高20小時壓到5秒內。

給同類業務的三個硬啟示

第一，別急著扔掉OCR。大模型不是萬能掃描儀，它的優勢在語義理解和結構化，像素級文字識別仍是傳統工具的領地。Sun Finance的方案證明，拼接比替換更靠譜。

第二，向量搜索做欺詐檢測是性價比之選。不需要標注海量欺詐樣本，把歷史問題文檔向量化，新申請實時比對相似度，架構輕量且可解釋。

第三，上線速度取決于邊界清晰度。35天能投產，前提是需求定義清楚：7種證件類型、雙語場景、明確的準確率閾值。生成式AI項目拖期的，往往不是技術，是需求蔓延。

為什么這件事值得關注

小額貸款是金融科技的毛細血管，單筆金額小、量大、時效敏感，傳統銀行看不上，自動化難度又高。Sun Finance的案例說明，這個環節的ID驗證和反欺詐，已經可以被AI管道標準化處理。

更深層的影響在成本結構。91%的單文檔成本降幅，意味著高頻、小額、跨國的信貸業務，邊際審核成本可以趨近于零。這對任何想打入新興市場的放貸機構，都是基礎設施級的變量。

如果你也在處理規模化身份文檔，現在該做的不是評估"要不要用大模型"，而是盤點你現有的OCR pipeline里，有多少比例的錯誤屬于"提取對了但理解錯了"——那部分，就是大模型能接手的空間。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.