該模型周三正式發(fā)布,可識別姓名、日期、賬戶號碼、信用卡號及電子郵件地址等敏感信息,用戶還可根據(jù)自身需求和隱私政策對其進(jìn)行微調(diào)。
Privacy Filter最關(guān)鍵的特性在于支持本地運行。待處理的敏感數(shù)據(jù)無需上傳至服務(wù)器,可直接在設(shè)備端完成脫敏,從而降低數(shù)據(jù)在傳輸過程中的暴露風(fēng)險。
此次發(fā)布被OpenAI定位為"構(gòu)建更具韌性的軟件生態(tài)系統(tǒng)"的一部分,其戰(zhàn)略意圖指向AI開發(fā)工具鏈的底層基礎(chǔ)設(shè)施。該模型現(xiàn)已在Hugging Face和GitHub上以Apache 2.0許可證開源發(fā)布,支持商業(yè)部署與二次微調(diào)。
![]()
在檢測類別上,Privacy Filter覆蓋八類標(biāo)簽:私人姓名、私人地址、私人郵箱、私人電話、私人URL、私人日期、賬號信息以及密鑰/密碼。
Privacy Filter依托預(yù)訓(xùn)練語言模型的語言先驗,能夠區(qū)分屬于公眾信息的實體與涉及私人個體的信息,從而在"該屏蔽什么"的判斷上更為精細(xì)。
同時OpenAI GTM 團隊成員特別提到該模型支持本地運行,待處理的敏感數(shù)據(jù)無需上傳至服務(wù)器,可直接在設(shè)備端完成脫敏,從而降低數(shù)據(jù)在傳輸過程中的暴露風(fēng)險。
![]()
不過,OpenAI在模型說明中明確指出了若干重要局限。Privacy Filter并非匿名化工具,也不等同于合規(guī)認(rèn)證,無法替代高風(fēng)險場景下的人工政策審核。在法律、醫(yī)療、金融等高敏感領(lǐng)域,仍需人工復(fù)核與領(lǐng)域?qū)僭u估。
此次發(fā)布與OpenAI過去數(shù)月持續(xù)加大開源力度的路徑一致,反映出其在商業(yè)模式上的多維布局。一方面通過API和ChatGPT等產(chǎn)品直接變現(xiàn),另一方面通過開放模型和工具鞏固開發(fā)者生態(tài)。
Privacy Filter以Apache 2.0許可證發(fā)布,允許免費商業(yè)使用和修改,許可條款相對寬松。
OpenAI表示,此次發(fā)布為預(yù)覽版,目的是收集研究社區(qū)和隱私領(lǐng)域從業(yè)者的反饋,并在此基礎(chǔ)上進(jìn)一步迭代模型性能。
其長期愿景是使隱私保護(hù)基礎(chǔ)設(shè)施"更易于檢查、運行、適配和改進(jìn)",并將Privacy Filter定位為"AI系統(tǒng)應(yīng)學(xué)習(xí)世界知識,而非學(xué)習(xí)私人個體信息"這一原則的技術(shù)實踐。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.