<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek連夜刪新論文,梁文鋒到底怕什么|深度

      0
      分享至



      5月1日消息,今天AI領域的最大事件,無疑是DeepSeek刪論文的消息。

      昨天,DeepSeek多模態團隊負責人陳小康宣布灰度基于多模態模型技術的“識圖模式”,以及在GitHub平臺上傳了一篇長達25頁的多模態研究論文:

      《Thinking with Visual Primitives》(用視覺基元思考)。

      然而,到了今晨,陳小康的推文刪了,這篇多模態研究論文也撤了、GitHub庫也404了。



      在未刪除之前,我把這篇論文下載并且讀完了。

      我靜下心把整篇內容捋完之后,反倒有了不一樣的感受。

      你以為,這是簡單DeepSeek的識圖模式論文,但其實,這篇論文映射出DeepSeek揭露了行業的發展趨勢:

      多模態AI模型的下一階段競爭重點,可能從單純的“看得更清”轉向“思考時能精確指向”。通過將坐標嵌入思維鏈,多模態模型模仿了人類“邊指邊想”的協同機制,為解決復雜空間結構化推理提供了一條新穎路徑——最終其實也要走向世界模型。

      值得一提的是,就在8小時前,DeepSeek正式公布了Agent接入指南,親手教大家接入OpenClaw、Hermes等方式,深入到Agent技術層面。



      所以,在我看來,DeepSeek連夜刪論文,刪除的原因不是“論文有問題”,實際可能是灰度下重新修正“識圖模式”的能力,以及這篇論文可能太超前,透露太多了。很多數據需要重新進行查驗和修正,并且有望重新上傳到arxiv上。

      越往后深入了解,越能體會到這次DeepSeek V4以及多模態新模型的含金量,也真切感覺到AI行業的技術迭代。

      實際上,梁文鋒一直都在悄悄提速,AI技術的真正核心突破往往都藏在這種技術論文里。



      DeepSeek新論文到底講了什么?

      先做總結。

      這篇DeepSeek已撤回的多模態研究論文《Thinking with Visual Primitives》,核心在于探討自然語言模型到視覺等多模態模型的瓶頸和變化,從而揭示DeepSeek多模態領域的新研究方向:

      從單純的“看得更清”,轉向“推理思考時能精確指向”。

      換句話說,未來模型既有AI聊天和深度研究,而且還能用AI大模型技術(非OCR)識別圖像視頻中的核心信息。

      而通過將坐標嵌入思維鏈,DeepSeek的多模態模型模仿了人類“邊指邊想”的協同機制,這將解決世界模型、3D空間的結構化推理等方向。提供了一條新穎而有效的路徑。

      下面再基于這篇已刪新技術報告,具體看看DeepSeek、北京大學、清華大學又創造了怎樣的奇跡。

      首先,大型語言模型(LLMs)與計算機視覺的融合,開啟了多模態大型語言模型時代,使其具備了復雜的場景理解能力。然而,當我們推動這些模型進行復雜的推理,當前范式的一個根本性局限便顯現出來。

      盡管這些模型的內部推理(通常以思維鏈的形式呈現)在語言領域已變得越來越穩健,但它與視覺領域在很大程度上仍然是割裂的。而當前多模態模型主要解決的是感知差距。

      然而,“看見”不等于“推理”。

      即使擁有完美的感知能力,多模態大模型在處理涉及復雜空間布局或密集物體交互的任務時,仍常常遭遇邏輯崩潰。在密集計數或多步驟空間推理等場景中,模型的“語言”思維會失去對其試圖指代的視覺實體的追蹤,從而導致連鎖幻覺。

      因此,DeepSeek聯合北京大學和清華大學,提出一種范式轉變:基于視覺基元進行思考。

      團隊超越將視覺定位視為次要任務或最終輸出的傳統做法,將空間標記——點和邊界框——提升為“思維的最小單元”,直接交錯嵌入模型的推理軌跡中。

      這一機制從人類的認知過程中汲取靈感。當人類在復雜迷宮中導航或清點密集物體時,會自然地運用指示性指針(例如手勢)來降低認知負荷并保持邏輯一致性。

      這項工作以DeepSeek剛發布的V4-Flash為語言主干。該模型混合專家模型(MoE)擁有284B 總參數、推理時激活 13B 參數,視覺編碼部分則使用DeepSeek自研的視覺Transformer ViT,支持任意分辨率輸入。

      通過將視覺基元交錯融入思考過程,這個模型模仿了這種“指向?推理”的協同作用,有效地將抽象的語言思維錨定到具體的空間坐標上。此外,該模型框架建立在架構高效的基礎之上,專為高吞吐、長上下文的多模態交互而設計。與依賴海量視覺標記序列來彌補視覺缺陷的傳統方法不同,我們的模型利用壓縮稀疏注意力技術,它將每個視覺標記的鍵值緩存壓縮為單一條目。

      總結這個研究報告的三個創新點:

      第一大核心創新,是重構視覺推理邏輯,把坐標與邊界框做成可實時參與思考的思維單元。

      傳統模型先推理、后補坐標,屬于事后標注;但該模型全程在思維鏈中同步框選、打點定位,用空間錨點鎖定邏輯路徑,避免推理跑偏,同時配套點、框兩類標準視覺原語,適配各類復雜視覺場景定位需求。

      第二項硬核創新為超高倍率視覺輕量化壓縮,通過圖像分塊編碼、多層空間降采樣與壓縮稀疏注意力聯動優化,整體達成7056倍視覺信息壓縮。大幅削減KV緩存占用,顯存開銷遠低于同類旗艦模型,做到看得準、開銷低,高效平衡視覺表征精度與推理落地算力成本。

      第三項關鍵創新,是全流程的高校數據定制化搭建,搭配專屬進階訓練體系。團隊嚴控數據源篩選雙重審核標準,首先爬取了近 10 萬個與目標檢測相關的數據集,經過兩輪嚴格篩選(語義審核和幾何質量審核),最終保留約 3.17 萬個高質量數據源,生成超過 4000 萬條訓練樣本。

      在針對性設計的計數、多跳空間問答、迷宮導航、曲線路徑追蹤四個任務中,該模型專門補齊拓撲空間推理短板。而且,團隊采用先分訓專家模型、再統一強化微調的分體融合訓練策略,搭配多維精細化獎勵機制與在線策略蒸餾優化,穩步提升模型視覺理解穩定性,強化復雜場景下的綜合推理適配能力。



      測試成果層面,DeepSeek團隊在11個基準測試上進行了評測,與谷歌Gemini-3-Flash、GPT-5.4、Claude Sonnet 4.6、谷歌Gemma4-31B、阿里Qwen3-VL-235B等主流模型對比,DeepSeek新的視覺模型,與其他海外模型差距懸殊,并且超越了阿里Qwen3-VL-235B。









      DeepSeek多模態識別的圖片顯示,DeepSeek視覺模型在Pixmo-Count(精確匹配)上得分89.2%,超過Gemini-3-Flash的88.2%、GPT-5.4的76.6%和Claude Sonnet 4.6的68.7%。

      在空間推理的多個基準上,整體表現與頭部模型持平或略有超越,在 MIHBench(85.3%)和 SpatialMQA(69.4%)上均排名第一。

      在拓撲推理的迷宮導航(DS_Maze_Navigation)任務上,該模型得分66.9%,而GPT-5.4為50.6%、Gemini-3-Flash為49.4%、Claude Sonnet 4.6 為 48.9%,新模型提升了約17個百分點。



      不過目前,DeepSeek灰度“識圖模式”功能的用戶太少,包括我在內都沒辦法使用,只能說用普通模式、專家模型識別一些簡單圖片。

      猜測五一假期之后,DeepSeek可能還會上很多新功能。



      梁文鋒想的AGI到底是什么:物理世界AI

      總結來說,這篇論文完全體現出DeepSeek未來發展節奏,絕對不是單純的多模態視覺識別,而是瞄準了更大的發展前奏——物理世界AI。

      最近,世界模型和物理AI是模型層新的發展趨勢。

      我也是總結了最近幾天發布的模型,發現大家10天發布了10款AI基礎模型,其中80%來自中國企業。

      • 20日:Kimi K2.6發布;Qwen3.6 27B系列模型測試結果陸續出來。
      • 21日:螞蟻Ling 2.6 Flash模型發布;Qwen3.6 35B A3B推理和非推理模型開始在各大算力平臺測試;
      • 23日:OpenAl GPT-5.5模型公布,小米Xiaomi MiMo-V2.5系列大模型正式開啟公測;騰訊混元Hy3-preview 推理模型發布;
      • 24日:DeepSeek V4 Pro和DeepSeek V4 Flash系列模型發布;
      • 28日:IBM Granite 4.1模型基準測試公布;小米Mimo-V2.5 Pro正式發布。
      • 30日:Ling 2.6 -1T基礎模型正式開源;DeepSeek上線識圖模式開啟灰測。

      目前來看,無論是Kimi K2.6,還是DeepSeek V4系列,顯示出今年基礎模型層最大的三個方向:Agent智能體、Coding編程能力、多模態和世界模型技術。

      一個例子就是Kimi。

      近期,月之暗面Kimi發布并開源的Kimi K2.6模型,在通用Agent、代碼、視覺理解等綜合能力全面提升,在多個基準測試優于或持平GPT-5.4、Claude Opus 4.6和Gemini 3.1 Pro等閉源模型。

      而Kimi K2.6長程編碼能力得到顯著提升,在測試中可不間斷編碼13小時,編寫或修改超過4000行代碼。同時大幅增強了Agent自主化執行能力,由 K2.6 模型驅動的Agent集群架構,支持300個子Agent并行完成4000個協作步驟,實現更大規模的并行化。

      針對高負載工作流與OpenClaw、Hermes Agent等主動式Agent框架,K2.6具備自動化任務處理能力,支持長達5天的持續自主運行。

      簡單來說,現在很多模型,增加了Agent和世界物理AI的功能和適配。

      但DeepSeek這套視覺多模態模型其實還比較落后,原因在于DeepSeek之前沒往多模態層面考量,更多還是在語言模型層面實現AGI。

      值得一提的是,論文也提出了一些局限性:

      1、受限于圖片輸入分辨率,模型在超高精細視覺場景中表現不佳,容易出現坐標、點位等視覺思維單元標注不準的問題,后續可結合感知缺口優化算法聯動優化補足短板。

      2、核心視覺思維推理能力依賴專屬觸發詞才能啟用,無法自主讀懂場景需求、主動調用坐標框選推理機制,智能自適應適配性有待提升。

      3、用單點坐標處理高難度復雜拓撲推理難題時能力偏弱,跨場景泛化穩定性不足,同類能力很難靈活適配多樣化復雜空間任務,也是后續技術迭代重點攻堅方向。

      因此,新的研究成果并非真正意義的物理AI、世界模型,也不是完全的多模態識別,其頂多是DeepSeek OCR 2和V4的結合體。

      這或許是DeepSeek提前撤下論文的原因之一。

      2500年前,古希臘哲學家普羅泰戈拉提出:“人是萬物的尺度。”

      這句話的真正含義是,世界本身沒有固有價值,所有意義與判斷,都由人的感知與思考來定義。

      而DeepSeek這篇論文想要揭示的核心趨勢,正是 AI 視覺能力的一次本質躍遷:從只會 “看清畫面”,升級為思考時精準定位、理解空間、判斷價值

      未來十年,AI一定會深度重塑工作方式、改變產業格局、重構生活節奏。

      但無論技術如何進化,人類獨有的情感、經驗創造力與同理心,永遠無法被算法替代。

      人的價值,來自真實的生活閱歷;人與人之間的情感連接,才是我們愿意彼此關心、持續前行的根本理由。

      因此,無論 AI 如何飛速發展,有一件事永遠不會改變:

      我們依然需要珍惜身邊真實的關系,保有真實的內心感受,理性適應技術變化,不斷去探索人類最本質的力量 ——創造價值、感知意義、彼此相連

      五一節快樂。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      科爾左膀右臂全部離開!兩大首席助教告別勇士

      科爾左膀右臂全部離開!兩大首席助教告別勇士

      體壇周報
      2026-05-15 10:45:15
      因FIFA每人每天1.1萬美元補貼,加納將帶3名本土聯賽國腳參賽

      因FIFA每人每天1.1萬美元補貼,加納將帶3名本土聯賽國腳參賽

      懂球帝
      2026-05-14 18:17:06
      同樣是國乒男隊功臣,王皓梁靖崑是兒子接機,他卻很低調是女兒接

      同樣是國乒男隊功臣,王皓梁靖崑是兒子接機,他卻很低調是女兒接

      攬星河的筆記
      2026-05-14 15:11:17
      90歲鐘南山公開6個長壽秘訣:第一條就很多人做不到,看完就明白

      90歲鐘南山公開6個長壽秘訣:第一條就很多人做不到,看完就明白

      醫學科普匯
      2026-05-14 17:41:18
      善惡有報,移居英國僅2年,57歲吳秀波再迎噩耗,步入李易峰后塵

      善惡有報,移居英國僅2年,57歲吳秀波再迎噩耗,步入李易峰后塵

      有范又有料
      2025-12-17 14:54:06
      血虧7.5億,萬博的地下,是如何爛尾的

      血虧7.5億,萬博的地下,是如何爛尾的

      拆神
      2026-05-15 09:43:21
      楊洋《雨霖鈴》收視破1,觀眾棄劇一片,理由一致:表情呆演技爛

      楊洋《雨霖鈴》收視破1,觀眾棄劇一片,理由一致:表情呆演技爛

      往史過眼云煙
      2026-05-15 14:25:16
      35歲女子去做私處緊縮,縫針斷在肉里,醫生徒手掏了半小時沒找著

      35歲女子去做私處緊縮,縫針斷在肉里,醫生徒手掏了半小時沒找著

      離離言幾許
      2026-04-21 19:53:18
      1500萬潮汕人移民東南亞,當年究竟有多慘烈?| 地球知識局

      1500萬潮汕人移民東南亞,當年究竟有多慘烈?| 地球知識局

      地球知識局
      2026-05-13 07:30:17
      王中軍落魄償債盡顯狼狽,網友:賈玲拉低電影質量,行業瀕臨崩盤

      王中軍落魄償債盡顯狼狽,網友:賈玲拉低電影質量,行業瀕臨崩盤

      夢仙境aa
      2026-05-12 19:06:35
      北京四季酒店連續三天滿房,特朗普要住這了,為何選這個地方?

      北京四季酒店連續三天滿房,特朗普要住這了,為何選這個地方?

      李昕言溫度空間
      2026-05-13 06:00:20
      博士肄業生把985院長拉下馬:同濟剛免職,又有三所高校被爆造假

      博士肄業生把985院長拉下馬:同濟剛免職,又有三所高校被爆造假

      妍妍教育日記
      2026-05-13 09:55:04
      北京隊客戰上海G1裁判出爐,2外籍名哨+1本土老熟人,有好戲看了

      北京隊客戰上海G1裁判出爐,2外籍名哨+1本土老熟人,有好戲看了

      萌蘭聊個球
      2026-05-15 11:07:44
      湖人內部矛盾加劇,傳詹東互相厭惡,詹姆斯立雕像基本無望

      湖人內部矛盾加劇,傳詹東互相厭惡,詹姆斯立雕像基本無望

      藝兔體壇
      2026-05-14 16:25:13
      這菜不起眼,卻是“補鉀高手”!夏天一周吃2次,強骨骼、解疲勞

      這菜不起眼,卻是“補鉀高手”!夏天一周吃2次,強骨骼、解疲勞

      阿龍美食記
      2026-05-12 15:57:38
      用了13年,說停就停?中國銀行宣布,這個App“6月30日24時起徹底停止服務”

      用了13年,說停就停?中國銀行宣布,這個App“6月30日24時起徹底停止服務”

      都市快報橙柿互動
      2026-05-15 14:56:45
      巔峰時期的QQ有多“狂”?2008年,騰訊竟打算用Q幣給員工發工資

      巔峰時期的QQ有多“狂”?2008年,騰訊竟打算用Q幣給員工發工資

      荊楚寰宇文樞
      2026-05-14 23:20:07
      女兒對快百歲父親說:爸,你活的日子太長了,我媽應該來把你帶走

      女兒對快百歲父親說:爸,你活的日子太長了,我媽應該來把你帶走

      烙任情感
      2026-05-14 14:29:49
      俄宣發布虛假消息,稱蘇-57戰機在烏克蘭上空擊落薩博-340預警機

      俄宣發布虛假消息,稱蘇-57戰機在烏克蘭上空擊落薩博-340預警機

      走進烏克蘭2022
      2026-05-14 19:48:01
      亮劍后續:李云龍升軍長首查趙剛,絕密檔案簽字人令他驚呆

      亮劍后續:李云龍升軍長首查趙剛,絕密檔案簽字人令他驚呆

      動物奇奇怪怪
      2026-05-15 10:42:20
      2026-05-15 15:35:00
      智能紀元AGI
      智能紀元AGI
      專注科技、科學、商業產業報道
      2317文章數 10609關注度
      往期回顧 全部

      科技要聞

      兩年聯姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      牛彈琴:中美元首歷史性會晤 向世界釋放五個信號

      頭條要聞

      牛彈琴:中美元首歷史性會晤 向世界釋放五個信號

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經要聞

      特朗普的北京時刻

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      教育
      時尚
      數碼
      藝術
      房產

      教育要聞

      剛剛,南外發布2026小升初招生簡章,擴招40人,招生范圍變大!

      冰涼一夏 | 比沒穿還舒服,這些貼身衣物我囤了5件

      數碼要聞

      經典風格重現:華碩ROG CROSSHAIR 2026復刻版主板實物現身

      藝術要聞

      一個北大 “反卷教授” 的意外走紅

      房產要聞

      海南樓市新政要出!擬調公積金貸款額度,最高可貸168萬!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲综合色婷婷久久| 午夜天堂av| 人妻精品丝袜一区二区无码AV| 久久99国产精品久久99| 久久不见久久见免费影院国语| 一本一本久久a久久精品综合不卡| 日韩亚洲国产精品一区| 国产成人毛片在线视频| 日本一区二区三区视频一| 日本成人有码在线视频| 777精品| 久久无码喷吹高潮播放不卡| 午夜高清福利在线观看| 国产成人一区二区三区小说| 两个人的视频高清在线观看| 国产精品VA在线观看老妇女| 成人免费午夜视频| 国产精品综合av一区二区国产馆 | 99视频精品国产免费观看| 欧美激情乱人伦| 极品人妻少妇一区二区三区| 亚洲第一综合网址网址| 国产内射合集颜射| 国产线播放免费人成视频播放| 日韩无码一区二区AV| 成人午夜亚洲影视在线观看| 中文字幕在线视频不卡| 免费毛片在线视频| 中文字幕av免费看| 最新高清无码专区| 亚洲精品国产成人7777| 欧洲精品色在线观看| 成人性生交大片免费看vr | 久久精品国产亚洲婷婷| 国产成人高清精品免费软件 | 正在播放的国产a一片| 久久毛片少妇高潮| v中文在线| 越南女子杂交内射bbwxz| 国产成人在线小视频| 欧美视频二区欧美影视|