一個貸款申請從提交到放款,傳統流程要卡20小時。Sun Finance的工程師在2025年8月26日那天啟動了一個項目,107天后,這個數字變成了5秒。
舊系統的天花板:60%申請卡在人手里
![]()
Sun Finance不是新手。這家2017年成立的拉脫維亞金融科技公司,2019年就用亞馬遜的人臉識別和文檔識別服務搭過第一版自動化系統。但業務擴張到發展中地區后,老辦法開始失靈。
具體卡在哪?當地語言。英語加本地雙語文檔,傳統光學字符識別(OCR)訓練數據覆蓋不足,錯漏頻發。7種不同版式的身份證件,每種布局都不一樣。結果是:8萬筆月申請里,60%要人工復核——而這60%里,80%純粹是因為OCR提取錯了。
這不是風控嚴格,是系統拖后腿。
新架構的解法:讓專用工具和大模型分工
Sun Finance找到AWS生成式AI創新中心,重新設計管道。核心思路不復雜:OCR負責"看見",大語言模型(LLM)負責"理解"。
具體實現分三層。第一層,亞馬遜的文檔識別服務(Textract)做人臉檢測和原始文本提取,這是它的強項。第二層,提取的文本送進亞馬遜的模型托管平臺(Bedrock),用Claude模型做結構化——把混亂的OCR輸出整理成標準字段。第三層,向量數據庫做欺詐檢測,把歷史欺詐文檔的特征向量化,新申請來了直接比對相似度。
這個組合的關鍵在于:不迷信單一工具。純OCR搞不定復雜版式,純大模型成本高且對文檔細節不敏感。兩者接力,各干各擅長的。
35天上線的真相:預訓練模型+明確邊界
項目時間線值得細看。AWS側32天完成方案設計和原型,26天技術交接,Sun Finance自己35天推上線——中間還夾了14天假期凍結。總共107個營業日,從kickoff到生產環境。
能這么快,因為沒走"從零訓練模型"的彎路。Bedrock上的Claude是現成的,Textract和Rekognition也是托管服務。Sun Finance做的主要是流程編排、提示詞工程和向量檢索邏輯。生成式AI的價值在這里體現得很務實:不是替代現有工具,是把原本卡住的環節打通。
數據驗證了這點。文檔提取準確率從79.7%拉到90.8%,單份文檔成本砍了91%,處理時效從最高20小時壓到5秒內。
給同類業務的三個硬啟示
第一,別急著扔掉OCR。大模型不是萬能掃描儀,它的優勢在語義理解和結構化,像素級文字識別仍是傳統工具的領地。Sun Finance的方案證明,拼接比替換更靠譜。
第二,向量搜索做欺詐檢測是性價比之選。不需要標注海量欺詐樣本,把歷史問題文檔向量化,新申請實時比對相似度,架構輕量且可解釋。
第三,上線速度取決于邊界清晰度。35天能投產,前提是需求定義清楚:7種證件類型、雙語場景、明確的準確率閾值。生成式AI項目拖期的,往往不是技術,是需求蔓延。
為什么這件事值得關注
小額貸款是金融科技的毛細血管,單筆金額小、量大、時效敏感,傳統銀行看不上,自動化難度又高。Sun Finance的案例說明,這個環節的ID驗證和反欺詐,已經可以被AI管道標準化處理。
更深層的影響在成本結構。91%的單文檔成本降幅,意味著高頻、小額、跨國的信貸業務,邊際審核成本可以趨近于零。這對任何想打入新興市場的放貸機構,都是基礎設施級的變量。
如果你也在處理規模化身份文檔,現在該做的不是評估"要不要用大模型",而是盤點你現有的OCR pipeline里,有多少比例的錯誤屬于"提取對了但理解錯了"——那部分,就是大模型能接手的空間。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.