<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      OpenAI 開源新模型「隱私過濾器」

      0
      分享至

      OpenAI

      凌晨,OpenAI 開源了「Privacy Filter」,隱私過濾器

      這是一個(gè)小模型,能跑在瀏覽器上,幫助快速識(shí)別并遮蔽個(gè)人信息


      https://github.com/openai/privacy-filter

      在此之前,這件事主要是靠正則,而這次的隱私過濾器換了思路,結(jié)合上下文進(jìn)行判斷,然后決定是否過濾。借由這個(gè)小模型,原始數(shù)據(jù)可以在本地先進(jìn)行一遍過濾,在遮蔽敏感信息后,再發(fā)給云端


      郵件里敏感信息被直接移除

      有關(guān)「隱私過濾器」

      這是是一個(gè)雙向 token 分類模型,非常小:1.5B 總參數(shù),50M 激活參數(shù),MoE 架構(gòu)

      這個(gè)模型,會(huì)給文本中的每個(gè) token 打標(biāo)簽,告訴你這個(gè) token 是不是某一類敏感信息的一部分,進(jìn)而對(duì)敏感信息進(jìn)行對(duì)比

      然后這個(gè)模型是 Apache 2.0 許可證,可以商用、可以改、可以拿去 fine-tune,然后 OpenAI 內(nèi)部在用一個(gè) fine-tuned 版本做自己的隱私工作流

      對(duì)于模型的訓(xùn)練,是分兩段的

      第一段:按自回歸方式預(yù)訓(xùn)練,得到一個(gè)和 gpt-oss 架構(gòu)同源、尺寸更小的基座模型

      第二段:把語言模型的輸出頭換成分類頭,放開原來的因果注意力,改成雙向帶狀注意力(帶寬 128),然后用監(jiān)督分類損失做 post-train

      八個(gè)識(shí)別類別

      Privacy Filter 出廠帶的標(biāo)簽體系,覆蓋八類

      private_person私人姓名,包括能指向具體個(gè)人的用戶名、賬號(hào) handle

      private_address和具體私人相關(guān)聯(lián)的地址、位置

      private_email用于個(gè)人通信、指向具體個(gè)人的郵箱

      private_phone關(guān)聯(lián)具體私人的電話號(hào)碼

      private_url指向私人的 URL 或 IP 地址

      private_date生日、出生年份、能指向個(gè)人身份的日期

      account_number銀行賬號(hào)、信用卡號(hào)、加密貨幣地址、身份證號(hào)等賬號(hào)類 ID

      secretAPI key、密碼、OTP 等憑證

      注意,這個(gè)標(biāo)簽體系只認(rèn)「指向具體私人」的信息。公共實(shí)體的地址、組織郵箱、官方日期,按設(shè)計(jì)不會(huì)被遮蔽

      標(biāo)簽不能在運(yùn)行時(shí)動(dòng)態(tài)配置,想換一套體系要再去 fine-tune 一次。OpenAI 內(nèi)部版本就在基礎(chǔ)類別上又拆了一層,比如把 private_addresspublic_address(官方駐地)分開

      怎么用

      官方給了一個(gè)叫 opf 的命令行

      一鍵遮蔽

      $ opf "Ben Morgan lives at 12 3rd St. Call him at 123 456 7890." lives at . Call him at .

      按文件處理

      $ opf -f text_file

      走管道

      cat /path/to/file | grep -e 'some_pattern' | opf

      要結(jié)構(gòu)化輸出就加 --format json,每個(gè) span 會(huì)帶上類別、起止位置、原文、占位符,另外附一個(gè)帶顏色高亮的終端預(yù)覽

      跑在 CPU 還是 GPU 都行,--device cpu 就切到 CPU。模型默認(rèn)從 ~/.opf/privacy_filter 找權(quán)重,沒有就自動(dòng)下載

      也能通過 Transformers pipeline 直接跑

      from transformers import pipeline classifier = pipeline(task="token-classification", model="openai/privacy-filter") classifier("My name is Alice Smith")

      要做微調(diào)就用 opf train --output-dir finetuned/ dataset.jsonl

      已知短板

      官方也對(duì)短板部分進(jìn)行了梳理

      一跳推理(one-hop reasoning)差。比如「記住,當(dāng)我后面說『萬壽菊』,我指的是我家電費(fèi)賬號(hào)」,隔了一長(zhǎng)段文字之后再出現(xiàn)「『萬壽菊』是 7281-0543-98217」。模型不太能把定義和后續(xù)的值對(duì)上,距離越遠(yuǎn)越差


      定義和值隔得越遠(yuǎn),召回率越低

      對(duì)抗格式會(huì)被打穿。官方自己測(cè)了幾種:數(shù)字寫成單詞(two six eight)、chunk 之間塞額外空格、字符被視覺相似的 emoji 替換、郵箱用 [dot] 混淆、字母用 phonetic alphabet 拼讀(charlie、oscar、lima)等

      非拉丁文字指標(biāo)下降。中文表現(xiàn)好只是相對(duì),和英語的 F1 0.934 仍有差距。字符稀有、naming convention 非主流的語言,很可能被漏標(biāo)或邊界拖錯(cuò)

      secret 類會(huì)誤報(bào)高熵字符串。placeholder、hash、sample credential 這些長(zhǎng)得像密鑰但不是密鑰的字符串,會(huì)被誤遮蔽

      高敏感場(chǎng)景不適用。醫(yī)療、法律、金融、HR、教育、政務(wù)這些高敏感場(chǎng)景,都需要人工復(fù)核和 domain 微調(diào)

      參考材料

      → 官方博客:openai.com/index/introducing-openai-privacy-filter

      → 模型權(quán)重:huggingface.co/openai/privacy-filter

      → GitHub 倉(cāng)庫(kù):github.com/openai/privacy-filter

      → 在線 Demo:huggingface.co/spaces/openai/privacy-filter

      → Model Card:cdn.openai.com/pdf/...OpenAI-Privacy-Filter-Model-Card.pdf

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      美國(guó)眾議院議員強(qiáng)行將援助烏克蘭的法案賦予投票

      美國(guó)眾議院議員強(qiáng)行將援助烏克蘭的法案賦予投票

      山河路口
      2026-05-14 12:33:23
      格列茲曼:C羅值得贏一次世界杯;最喜歡帕瓦爾對(duì)阿根廷時(shí)的世界波

      格列茲曼:C羅值得贏一次世界杯;最喜歡帕瓦爾對(duì)阿根廷時(shí)的世界波

      懂球帝
      2026-05-14 10:51:37
      遼籃青年隊(duì)從3分惜敗到兩連勝場(chǎng)均贏36分!大哥執(zhí)教有方,未來可期

      遼籃青年隊(duì)從3分惜敗到兩連勝場(chǎng)均贏36分!大哥執(zhí)教有方,未來可期

      君馬體育
      2026-05-15 00:57:18
      又一“水果騙局”被曝光!背后全是科技與狠活,網(wǎng)友:智商稅

      又一“水果騙局”被曝光!背后全是科技與狠活,網(wǎng)友:智商稅

      品牌觀察官
      2026-05-14 17:17:47
      瞞不下去了,真的需要徹查了!

      瞞不下去了,真的需要徹查了!

      胖胖說他不胖
      2026-04-25 14:12:40
      面對(duì)中國(guó)時(shí),特朗普像換了個(gè)人,落地北京后,對(duì)華提了一個(gè)請(qǐng)求

      面對(duì)中國(guó)時(shí),特朗普像換了個(gè)人,落地北京后,對(duì)華提了一個(gè)請(qǐng)求

      云崖聽松
      2026-05-15 02:51:29
      故事:白宮幕僚位置到手,特朗普御用風(fēng)水師,卻在關(guān)鍵時(shí)刻放棄了

      故事:白宮幕僚位置到手,特朗普御用風(fēng)水師,卻在關(guān)鍵時(shí)刻放棄了

      宅家伍菇?jīng)?/span>
      2024-11-07 17:35:34
      越扒越有!閆學(xué)晶風(fēng)波僅3月,難堪的一幕發(fā)生,王紅梅成眾矢之的

      越扒越有!閆學(xué)晶風(fēng)波僅3月,難堪的一幕發(fā)生,王紅梅成眾矢之的

      星娛叨叨社
      2026-05-14 15:30:00
      太聰明了!安徽一招根治漫天楊絮,值得全國(guó)效仿

      太聰明了!安徽一招根治漫天楊絮,值得全國(guó)效仿

      一口娛樂
      2026-05-14 12:01:40
      臺(tái)灣統(tǒng)一猜想升溫,候選人名單浮出水面,誰最能穩(wěn)住民心?

      臺(tái)灣統(tǒng)一猜想升溫,候選人名單浮出水面,誰最能穩(wěn)住民心?

      川川八卦說
      2026-05-14 08:15:13
      “香港演員幾乎全軍覆沒! 無戲可拍”引發(fā)網(wǎng)友熱議

      “香港演員幾乎全軍覆沒! 無戲可拍”引發(fā)網(wǎng)友熱議

      許三歲
      2026-03-26 11:35:13
      50歲后還能輕松做到這兩件事,恭喜你,大概率會(huì)長(zhǎng)壽

      50歲后還能輕松做到這兩件事,恭喜你,大概率會(huì)長(zhǎng)壽

      方舟健客科普
      2026-05-14 18:13:44
      馬塞洛兒子放棄巴西選西班牙?父親吐露心聲:西足協(xié)誠(chéng)意太足了!

      馬塞洛兒子放棄巴西選西班牙?父親吐露心聲:西足協(xié)誠(chéng)意太足了!

      仰臥撐FTUer
      2026-05-14 20:35:04
      全職爸爸靠帥臉火了,全網(wǎng)卻為他的“豪門婚姻”吵翻了

      全職爸爸靠帥臉火了,全網(wǎng)卻為他的“豪門婚姻”吵翻了

      媽咪OK
      2026-05-08 19:54:01
      法新社鏡頭下的中國(guó)軍人,不動(dòng)如山

      法新社鏡頭下的中國(guó)軍人,不動(dòng)如山

      三叔的裝備空間
      2026-05-14 21:50:39
      小米SU7全車攝像頭突然集體失靈!4S店:外力滲液,不保修!車主蒙了:我沒撞沒泡水啊

      小米SU7全車攝像頭突然集體失靈!4S店:外力滲液,不保修!車主蒙了:我沒撞沒泡水啊

      魯中晨報(bào)
      2026-05-14 17:14:03
      盤點(diǎn)NBA5大“打劫式”交易:?jiǎn)讨纬扇做?成就公牛王朝

      盤點(diǎn)NBA5大“打劫式”交易:?jiǎn)讨纬扇做?成就公牛王朝

      兵哥籃球故事
      2026-05-14 19:10:39
      俄軍打1500天沒動(dòng),美軍中校放話:換中國(guó)軍隊(duì),3天就夠了?

      俄軍打1500天沒動(dòng),美軍中校放話:換中國(guó)軍隊(duì),3天就夠了?

      老謝談史
      2026-05-14 11:15:26
      89年前那場(chǎng)災(zāi)難,照片為何至今仍讓人窒息

      89年前那場(chǎng)災(zāi)難,照片為何至今仍讓人窒息

      時(shí)光慢郵啊
      2026-05-13 07:19:13
      43歲未婚官宣二胎,網(wǎng)友傻眼了:姐你糊涂啊……

      43歲未婚官宣二胎,網(wǎng)友傻眼了:姐你糊涂啊……

      FUFASHION
      2026-05-14 21:06:25
      2026-05-15 04:00:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      439文章數(shù) 53關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克說會(huì)談很順利 黃仁勛點(diǎn)贊 庫(kù)克比耶

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國(guó)造

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國(guó)造

      體育要聞

      爭(zhēng)議抽象天王山,和季后賽最穩(wěn)定中鋒

      娛樂要聞

      何九華官宣當(dāng)爸!全程不提孩子?jì)?/h3>

      財(cái)經(jīng)要聞

      李強(qiáng)會(huì)見美國(guó)工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

      態(tài)度原創(chuàng)

      時(shí)尚
      手機(jī)
      藝術(shù)
      公開課
      軍事航空

      白色上衣+彩色下裝:今年夏天最火搭配,時(shí)髦又減齡!

      手機(jī)要聞

      榮耀600系列國(guó)行版終來到,跟海外版完全兩個(gè)樣!

      藝術(shù)要聞

      帕特里克鏡頭下的戴安娜:光影與情感的極致呈現(xiàn)

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美以伊戰(zhàn)爭(zhēng)期間以總理密訪阿聯(lián)酋

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产熟女在线| 人妻无码久久中文字幕专区 | 翘臀后进少妇大白嫩屁股| 亚洲精品V天堂中文字幕| 漂亮人妻被中出中文字幕色| 精品无人码麻豆乱码1区2区| 亚洲日本韩国欧美云霸高清| 久久婷婷综合缴情亚洲狠狠_| 欧美日视频| 亚洲精品理论电影在线观看| 国产精品林美惠子在线观看| 宜兰县| 色男人的天堂久久综合| 神马久久亚洲一区 二区| 日韩a级?a级| 色吊丝av中文字幕亚洲?熟女| 亚洲国产精品va在线播放| 中文字幕成人电影| 国产精品免费久久久久影院无码| 亚洲av本道一区二区| 爱3P| 大香伊蕉在人线国产免费| 五月天婷婷在在线视频| 无码毛片一区二区本码视频| 荃湾区| 99国产精品国产高清一区二区| 久久香蕉国产亚洲av麻豆| 岛国免费成人电影| 精品在免费线中文字幕久久| 综合色一色综合久久网| 717午夜伦伦电影理论片| 四虎在线播放亚洲成人| 色久综合在线| 99久久久无码国产精品试看 | 有码中文字幕一区三区| 日韩欧国产精品一区综合无码 | 国产做a爱视频免费无遮挡| 一区二区中文| 人妻有码中文字幕| 国产超碰无码最新上传| 亚洲精品国产一区二区在线观看 |