<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AI模型是個黑箱,這家公司造了一把能打開它的鑰匙

      0
      分享至


      (來源:麻省理工科技評論)

      舊金山初創公司 Goodfire 剛剛發布了一款叫 Silico 的新工具,它能讓研究人員和工程師在訓練 AI 模型的過程中,觀察模型的內部結構并調整參數——也就是那些決定模型行為的設置。這可能讓開發者對 AI 的構建方式擁有前所未有的精細控制力。

      Goodfire 稱 Silico 是同類產品中第一款開箱即用的工具,覆蓋從構建數據集到訓練模型的整個流程。這家公司的使命說起來很簡單:讓構建 AI 模型從“煉金術”變成“科學”。ChatGPT 和 Gemini 這樣的大語言模型確實能做出很厲害的事情,但沒有人確切知道它們為什么能做到,這讓修復缺陷或阻止不良行為變得很困難。

      “我們看到一個越來越大的鴻溝:一邊是人們對模型的理解程度,另一邊是模型被部署的廣度,”Goodfire 的 CEO 埃里克·何(Eric Ho)在 Silico 發布前獨家告訴《麻省理工科技評論》。“我覺得現在頭部實驗室的主流想法就是:規模更大、算力更多、數據更多,然后就能實現 AGI,別的都不重要。我們想說的是:有更好的路。”

      Goodfire 做的事情屬于一個叫“機制可解釋性”(mechanistic interpretability)的技術方向,同行包括 Anthropic、OpenAI 和 Google DeepMind。簡單說就是給 AI 模型做“腦部掃描”:映射出神經元以及神經元之間的通路,搞清楚模型做決定時內部到底發生了什么。《麻省理工科技評論》將機械可解釋性評為 2026 年十大突破技術之一。

      Goodfire 想用這種方法做的,不只是事后審計已經訓練好的模型,而是從訓練階段就介入。

      “我們想去掉反復試錯,把訓練模型變成精密工程,”何說,“把旋鈕和刻度盤暴露出來,讓開發者在訓練過程中就能用上。”

      Goodfire 此前已經用自研技術調整過大語言模型的行為,比如減少幻覺,而 Silico 是把這些內部積累的技術打包成產品對外發布。工具內置了智能體來自動化大量復雜操作。“智能體現在已經強到可以完成很多以前需要人工做的可解釋性工作,”何說,“這塊缺口補上之后,客戶才真正能自己上手。”

      阿姆斯特丹大學研究機制可解釋性的學者萊昂納德·貝雷斯卡(Leonard Bereska)認為 Silico 是一個有用的工具,但對 Goodfire 更宏大的說法有所保留。“實際上,他們是在給煉金術增加精確度,”他說,“叫它‘工程’讓它聽起來比實際情況更有章法。”

      Silico 可以讓你深入到模型的特定區域,觀察單個神經元或一組神經元,測試它們在干什么。你可以檢查什么輸入會激活哪些神經元,也可以沿上下游通路追蹤一個神經元跟其他神經元之間的關系。(前提是你能訪問模型的內部結構。大多數人沒法拿 Silico 去翻 ChatGPT 或 Gemini 的底,但可以用它查看許多開源模型。)

      比如 Goodfire 在開源模型 Qwen 3 內部找到了一個跟“電車難題”關聯的神經元。激活之后,不管你問什么,模型都會把回答包裝成道德兩難的形式。“這個神經元一旦激活,各種奇怪的事就會發生,”何說。

      定位這類異常行為的來源,如今已經算比較常規的操作。Goodfire 想更進一步:讓調整這些行為變得同樣容易。通過 Silico,開發者可以直接調整與特定神經元關聯的參數,增強或抑制某些行為。

      舉個更有意思的例子。研究人員問一個模型:一家公司的 AI 產品在 0.3% 的情況下會欺騙用戶,影響 2 億人,該不該公開披露?模型的回答是“不該”,理由是會損害公司利益。

      研究人員打開模型內部,找到了跟“透明度”和“信息披露”關聯的神經元,把它們的權重調高。同一個問題再問一遍,十次里有九次模型改口說“該公開”。“模型內部其實已經有了倫理推理的線路,只是被商業風險評估的線路壓過去了,”何說。

      微調價值觀只是 Silico 的用法之一。它還可以在訓練階段過濾特定的數據,從源頭上避免某些參數被設成不理想的值。

      比如很多模型會告訴你 9.11 大于 9.9。但 AI 為什么會犯這種錯?用 Silico 打開模型內部就能找到原因:模型在訓練時讀了大量《圣經》文本和軟件代碼倉庫,在這兩類文本里,9.9 確實排在 9.11 前面(《圣經》按章節編號,代碼按版本號遞增),模型內部因此形成了一組“9.9 在 9.11 前面”的神經元。做數學題時這組神經元被誤激活了,就導致了錯誤答案。找到了病因,開發者就可以重新訓練模型,讓它做數學時繞開這些神經元。

      Goodfire 發布 Silico 的目的,是把以前只有少數頂級實驗室才掌握的能力交給更多人。想自建模型或改造開源模型的小公司和研究團隊都是目標用戶。工具將收費使用,價格根據客戶需求逐案確定(Goodfire 拒絕透露具體定價)。

      “如果訓練模型能變得更像開發軟件,就沒有理由不讓更多公司來設計符合自己需求的模型,”何說。

      貝雷斯卡同意這類工具可以幫助企業構建更值得信賴的模型,尤其在醫療和金融等安全要求極高的領域。“頭部前沿實驗室內部已經有了自己的可解釋性團隊,”他說,“Silico 武裝的是下一梯隊的公司——它們不用再自己去招一批可解釋性研究員了。”

      https://www.technologyreview.com/2024/10/28/1106251/this-ai-system-makes-human-tutors-better-at-teaching-children-math/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      這不是我們的戰爭——法國船只在霍爾木茲海峽遭襲,數名船員受傷

      這不是我們的戰爭——法國船只在霍爾木茲海峽遭襲,數名船員受傷

      老王說正義
      2026-05-07 00:06:55
      舉報一個查一個!耿同學舉報3位大學院長和教授,同濟院長被免職還差南開和中山

      舉報一個查一個!耿同學舉報3位大學院長和教授,同濟院長被免職還差南開和中山

      可達鴨面面觀
      2026-05-07 13:03:19
      700米的“中國第一高樓”沒了,華潤70億抄底接盤!

      700米的“中國第一高樓”沒了,華潤70億抄底接盤!

      GA環球建筑
      2026-05-06 23:50:22
      不再掛小米車標!小米首款增程SUV將定名尋天:下半年發布

      不再掛小米車標!小米首款增程SUV將定名尋天:下半年發布

      快科技
      2026-05-07 11:48:06
      福建母子武漢旅游期間撿到價值十余萬元的勞力士?蝦店老板發視頻稱已歸還失主,網友態度不一

      福建母子武漢旅游期間撿到價值十余萬元的勞力士?蝦店老板發視頻稱已歸還失主,網友態度不一

      極目新聞
      2026-05-07 10:23:48
      院長和女研究員在國際頂刊大肆造假,同濟大學通報:院長免職降級,第一作者被解聘

      院長和女研究員在國際頂刊大肆造假,同濟大學通報:院長免職降級,第一作者被解聘

      高分子科學前沿
      2026-05-06 21:26:12
      1800萬存銀行被員工“轉走炒股”,最新進展:吉林農商銀行全額支付儲戶1000萬元存款本金和利息,另一儲戶800萬元仍無明確進展

      1800萬存銀行被員工“轉走炒股”,最新進展:吉林農商銀行全額支付儲戶1000萬元存款本金和利息,另一儲戶800萬元仍無明確進展

      洪觀新聞
      2026-05-07 14:33:26
      離岸人民幣兌美元升破6.8

      離岸人民幣兌美元升破6.8

      界面新聞
      2026-05-07 15:14:06
      人心是怎么壞的?女子被救后,反手一巴掌給施救者,后續來了!

      人心是怎么壞的?女子被救后,反手一巴掌給施救者,后續來了!

      眼光很亮
      2026-05-07 07:35:40
      48小時連收兩大利好,日本舉國狂歡,中國聯合國當眾炸鍋

      48小時連收兩大利好,日本舉國狂歡,中國聯合國當眾炸鍋

      近史博覽
      2026-05-06 14:42:13
      國乒男團VS韓國隊,比賽時間公布,王皓是否換人,央視解說引爭議

      國乒男團VS韓國隊,比賽時間公布,王皓是否換人,央視解說引爭議

      體育大學僧
      2026-05-07 10:52:38
      前體操冠軍吳柳芳再回應擦邊風波:“把債還完了,我才能把體面重新撿起來”;談及與管晨辰的爭執,吳柳芳表示:“我不會去恨一個人”

      前體操冠軍吳柳芳再回應擦邊風波:“把債還完了,我才能把體面重新撿起來”;談及與管晨辰的爭執,吳柳芳表示:“我不會去恨一個人”

      揚子晚報
      2026-05-07 07:43:31
      世乒賽震撼一幕:王曼昱狂掃11-0,劉詩雯馬龍驚嘆!8強對決即將揭曉

      世乒賽震撼一幕:王曼昱狂掃11-0,劉詩雯馬龍驚嘆!8強對決即將揭曉

      海闊山遙YAO
      2026-05-07 00:52:32
      大巴黎再進歐冠決賽,主席暗諷姆巴佩:這波 “殺人誅心” 太狠了

      大巴黎再進歐冠決賽,主席暗諷姆巴佩:這波 “殺人誅心” 太狠了

      姜大叔侃球
      2026-05-07 10:50:05
      京圈大佬飯局爆猛料:陳冠希現在,根本瞧不上內娛這三瓜倆棗

      京圈大佬飯局爆猛料:陳冠希現在,根本瞧不上內娛這三瓜倆棗

      西樓知趣雜談
      2026-05-07 12:40:04
      五一各地旅游收入排名,河南381億第二,北京沒進前五,第一是誰

      五一各地旅游收入排名,河南381億第二,北京沒進前五,第一是誰

      丁丁鯉史紀
      2026-05-07 14:04:42
      新加坡總理哭了,無人同情!當初對中國有多狂妄,現在就多狼狽!

      新加坡總理哭了,無人同情!當初對中國有多狂妄,現在就多狼狽!

      混沌錄
      2026-05-06 23:33:12
      中足聯官宣重磅罰單!45歲鄭智因辱罵裁判,被禁賽6場+罰款6萬元

      中足聯官宣重磅罰單!45歲鄭智因辱罵裁判,被禁賽6場+罰款6萬元

      我愛英超
      2026-05-07 11:49:35
      俄羅斯副部長被查前成功出逃美國,跨三國離境

      俄羅斯副部長被查前成功出逃美國,跨三國離境

      桂系007
      2026-05-01 23:48:19
      三星宣布停止在中國市場銷售所有家電產品

      三星宣布停止在中國市場銷售所有家電產品

      財聯社
      2026-05-06 19:32:22
      2026-05-07 16:28:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16672文章數 514924關注度
      往期回顧 全部

      科技要聞

      月之暗面完成20億美元融資,估值突破200億

      頭條要聞

      記者詢問"是否敦促美方從霍爾木茲撤出軍艦" 中方回應

      頭條要聞

      記者詢問"是否敦促美方從霍爾木茲撤出軍艦" 中方回應

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業照

      財經要聞

      特朗普:美伊“很有可能”達成協議

      汽車要聞

      理想為什么不做轎車,有了解釋……

      態度原創

      健康
      本地
      親子
      公開課
      軍事航空

      干細胞治燒燙傷面臨這些“瓶頸”

      本地新聞

      用青花瓷的方式,打開西溪濕地

      親子要聞

      2026年上海幼兒入園報名驗證、小學報名今起開始

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:美伊"很可能"達成協議

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲中文字幕无码久久2017| 色偷偷av亚洲男人的天堂| 亚洲丰满熟女一区二区蜜桃| 日本精品久久中文字幕| avav免费入口| 永久黄网站色视频免费| 国产精品久久中文字幕| 欧美日韩a视频| 精品无码人妻一区二区三区| 亚洲国产一区二区三区| 国产欧美日韩久久久久| 成人免费ā片在线观看| 国产美女在线精品观看| 成人精品视频99在线观看免费| 狠狠躁夜夜躁人人躁婷婷视频| 国产免费视频一区二区| 国产久久天堂| 亚洲国产成av人天堂无码| 亚洲中文字幕日产乱码高清| 波多野结衣乳巨码无在线观看 | av无码精品一区二区三区四区 | 久久亚洲精品中文字幕一区| 国产白丝护士AV在线网站| 国产精品一区二区久久国产| 超碰人人艹| 精品人妻码一区二区三区| 国产1区2区| 黄色小网站在线观看| 亚洲v天堂v手机在线| 狠狠躁日日躁夜夜躁欧美老妇| 亚洲国产精品无码专区| jizzjizzjizzjizzjizzjizzjizzjizzjizz| 人人草人人做人人爱| 夜夜高潮夜夜爽高清视频| 国产成视频在线观看| 欧美性猛交aaaa片黑人| 欧美专区在线观看| 国产无遮挡又黄又大又爽| 老司机夜间福利| 亚洲一区二区三区av链接| 日韩欧美亚洲综合久久|