<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      大模型上下文窗口長度為何很“卷”?一文看懂

      0
      分享至



      最近很多人發現:隨著LLM越來越熱,大模型的上下文窗口的長度也越來越長了。

      以openAI為例,僅在今年GPT-4就從一開始的4K、8K拓展到了128k(此為GPT-4-turbo支持的上下文窗口長度)。國內大模型賽道玩家比如百川智能,10月底發布的Baichuan2大模型,上下文窗口長度已突破至192K。

      就在上個月,另一家AI公司Anthropic推出Claude2.1,其LLM模型的上下文窗口長度更是達到了200K(其實國內AI服務商如零一萬物、月之暗面等也稱已達到同一長度)。


      數據參考自網絡,排名不分先后

      眼看大模型可支持的上下文窗口長度越來越長,很多人表示:未來沒有更長,只有更卷。

      但上下文窗口長度的突破真這么容易嗎?為什么這么多頭部人工智能企業都在上下文窗口長度這點上“卷”得不亦樂乎?上下文窗口長度技術上的突破能帶來哪些價值?

      如果你也好奇,下面我們一起來看看。

      大模型上下文窗口長度突破難嗎?

      根據對主流LLM廠商采訪的整理,延長大模型上下文窗口長度涉及算力、算法、工程能力等方面,其實整體的實現難度并不低。

      比如超長上下文窗口會有更高的算力需求,僅Transformer模型中自注意力機制的計算量,就會隨著上下文長度的增加呈現平方級增長。

      眾所周知,算力就意味著高投入,尤其是存儲和訓練這塊。據媒體報道:目前很多的顯存容量和帶寬就還跟不上超長上下文的使用需求。此外,顯存壓力也是實現超長上下文窗口無法忽視的點。

      兼顧文本長度和推理速度,對于訓練算法和工程能力是另一大考驗。因為一般情況下,隨著計算量暴漲,會導致用戶等待時間變長,而且反饋速度和效度也會受影響。

      為了不影響推理速度,可能嘗試模型降級(如變大模型為小模型),或者功能降維(例如減少計算量、犧牲即時存儲等基礎功能)等方法,但這樣很容易導致模型性能和應用價值大打折扣。

      在這樣的情況下,要想保障實現較長的上下文窗口長度,同時保持應有的性能,意味著:硬件配置、算法優化、工程代碼性能等方面,都需要同步強化,這也讓文本長度的升級面臨著較高門檻。

      上下文窗口長度為何越來越卷?

      雖然有難度,但面對提升對話框容量所能帶來的價值,“卷”依然成了自然而然的選擇。

      比如隨著上下文窗口長度的增加,可以提供更豐富的語義信息,有助于減少LLM的出錯率和「幻覺」發生的可能性,用戶使用時,體驗能提升不少。

      同時,它能解決很多人在長對話或長文檔推理這類業務上的痛點,也能很好地應用于智庫、調研、科研、教育等這類此前涉足不深的業務場景。

      另外,作為大模型的核心技術之一,很多LLM服務商也將「長文本輸入」視為自身底座大模型的差異化競爭力,從而熱心于上下文窗口長度的拓展。

      文本長度技術突破能帶來哪些價值?

      對于普通人來說,隨著上下文窗口長度的發展,進行長時間對話或處理長文檔資料時,不會因為聊得久而失去上下文記憶,也不會因為“超出文本限制”的提示語而被輕易打斷。

      畢竟200K的超長上下文窗口足以滿足普通人甚至海量級別的文本輸入需求(比如200K的超長上下文窗口版本,可以處理約40萬漢字規模)。

      處理文本密集型文檔或進行長篇創作時,也能從容地應對,不擔心容量限制而輸入不了,或者出現信息丟失或模型「幻覺」等情況,能進一步提升生成精度和效度。

      對于企業來說,搭建內部信息知識庫時,需要處理海量數據集。隨著上下文窗口長度延長,搭配大語言模型單次能完成的容量也能大幅提升。

      鑒于這一技術在處理長對話和長文檔中的應用,目前,還有一些AI廠商針對已有大模型推出了超長文本擴展技術,以拓展現有的模型文本長度。

      值得注意的是:增加上下文長度并不是提升語言模型性能的唯一條件,就像上面提到的,拓寬容量限制的同時,其實算力、算法、工程實現、模型構架等方面會面臨更多的挑戰。要想確保容量拓展后,依然保持較高的性能和生成質量,配套的軟硬件條件其實都能跟上。

      備注:本文原創,首發司普科技,參考澎湃新聞、機器之心等,僅做分享。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      三分命中率19%!防守慘不忍睹,進攻狂打鐵!他真能爭歷史老三?

      三分命中率19%!防守慘不忍睹,進攻狂打鐵!他真能爭歷史老三?

      阿浪的籃球故事
      2026-05-22 16:03:43
      美在國際事務中如幾何攪局者般肆意

      美在國際事務中如幾何攪局者般肆意

      烽火瞭望者
      2026-05-22 06:12:51
      35歲女子覺得不夠緊做陰道緊縮手術,縫合針突然斷體內,瞬間崩潰

      35歲女子覺得不夠緊做陰道緊縮手術,縫合針突然斷體內,瞬間崩潰

      丫頭舫
      2026-03-03 21:33:10
      聯想集團港股漲超20%

      聯想集團港股漲超20%

      每日經濟新聞
      2026-05-22 15:27:21
      湖北63歲環衛阿姨冒雨背50名學生蹚水過馬路,當事人被通報表揚并收到500元獎勵:既開心又慚愧

      湖北63歲環衛阿姨冒雨背50名學生蹚水過馬路,當事人被通報表揚并收到500元獎勵:既開心又慚愧

      河南交通廣播1041
      2026-05-21 16:27:29
      別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

      別不信!央國企裁員,最先安全的不是95后,是45歲這批“老油條”

      職場資深秘書
      2026-04-28 22:32:48
      劉恒率六人入長安奪周勃兵權,傀儡藩王一夜逆轉登基局勢

      劉恒率六人入長安奪周勃兵權,傀儡藩王一夜逆轉登基局勢

      嘮叨說歷史
      2026-03-24 17:26:56
      強降雨區域轉移,湖北安徽河南將成暴雨大暴雨集中地,局地累計雨量或具有一定極端性

      強降雨區域轉移,湖北安徽河南將成暴雨大暴雨集中地,局地累計雨量或具有一定極端性

      極目新聞
      2026-05-22 18:30:33
      *ST聞泰索賠80億 ,已獲法院受理

      *ST聞泰索賠80億 ,已獲法院受理

      每日經濟新聞
      2026-05-22 22:15:42
      投500萬只剩30萬,全國5萬個家庭,陷入千億騙局

      投500萬只剩30萬,全國5萬個家庭,陷入千億騙局

      鑒史錄
      2026-05-21 15:13:52
      劉亦菲與父母同框,媽媽美貌驚人,爸爸帥氣逼人!

      劉亦菲與父母同框,媽媽美貌驚人,爸爸帥氣逼人!

      小椰的奶奶
      2026-05-22 20:25:32
      新款紅旗H5:配15.6寸2.5K屏+8155P芯片,升級靈犀智能座艙

      新款紅旗H5:配15.6寸2.5K屏+8155P芯片,升級靈犀智能座艙

      念寒車評
      2026-05-21 18:45:16
      廣東一所民辦高校宣布!研究生免住宿費還發補貼,公辦高校沉默了

      廣東一所民辦高校宣布!研究生免住宿費還發補貼,公辦高校沉默了

      Delete丨CC
      2026-05-22 21:25:34
      象棋的馬很沒用,為什么和炮等價?網友回答讓人恍然大悟!

      象棋的馬很沒用,為什么和炮等價?網友回答讓人恍然大悟!

      夜深愛雜談
      2026-05-22 07:59:23
      澳洲這個職業需求猛增, 年薪$14萬都招不到人! 福利豐厚

      澳洲這個職業需求猛增, 年薪$14萬都招不到人! 福利豐厚

      澳微Daily
      2026-05-22 15:57:08
      泰國王認命了!帕公主第七份病情公告發布,最后用詞流露悲觀姿態

      泰國王認命了!帕公主第七份病情公告發布,最后用詞流露悲觀姿態

      看盡落塵花q
      2026-05-22 08:08:53
      女子向智能回收箱投遞近40斤舊衣物 提現時卻因“舊衣服不回收”遭拒

      女子向智能回收箱投遞近40斤舊衣物 提現時卻因“舊衣服不回收”遭拒

      閃電新聞
      2026-05-22 08:55:44
      A股仍具備可觀上行空間!摩根大通最新發聲,錨定三大成長主線

      A股仍具備可觀上行空間!摩根大通最新發聲,錨定三大成長主線

      21世紀經濟報道
      2026-05-22 20:55:22
      老婆和別人牽手逛商場,我拍下發給了她爸媽,隔天她哭著讓我原諒

      老婆和別人牽手逛商場,我拍下發給了她爸媽,隔天她哭著讓我原諒

      千秋文化
      2026-05-03 20:23:25
      U17國足2-3負日本收獲亞軍!評價一下主要球員在本屆亞洲杯的表現

      U17國足2-3負日本收獲亞軍!評價一下主要球員在本屆亞洲杯的表現

      越嶺尋蹤
      2026-05-23 03:26:58
      2026-05-23 04:28:49
      有聊有理
      有聊有理
      忙里偷閑,一起聊聊2B和人生
      336文章數 175關注度
      往期回顧 全部

      科技要聞

      雷軍:輸給特斯拉不丟人

      頭條要聞

      伊朗前總統內賈德被指是"最大內鬼" 其目前下落不明

      頭條要聞

      伊朗前總統內賈德被指是"最大內鬼" 其目前下落不明

      體育要聞

      最糟糕裁判?他想要退役當市長

      娛樂要聞

      周也戀情曝光!對象身份不簡單

      財經要聞

      富途擬被罰18.5億元 老虎 長橋也回應了

      汽車要聞

      11萬級直接上四驅 銀河星耀7限時權益價9.88萬起

      態度原創

      家居
      手機
      本地
      公開課
      軍事航空

      家居要聞

      低調傳承 溫潤沉靜

      手機要聞

      性能王炸!iQOO 16蓄勢待發:首批搭載2nm芯片驍龍8E6 Pro

      本地新聞

      用云錦的方式,打開江蘇南京

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄羅斯試射具備核打擊能力的高超音速導彈

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧日韩无套内射变态| 精品国产精品中文字幕| 青草娱乐极品免费视频| 久久水蜜桃亚洲av无码精品麻豆| 日韩午夜| 国产麻豆精品久久一二三| 亚洲另类激情专区小说| 日韩av无码社区一区二区三区| 国产真实乱对白精彩久久老熟妇女 | 欧美成人高清在线播放| 亚洲精品久久麻豆蜜桃| 国产精品国产三级国产专区5o| 久久av青久久久av三区三区| 国产精品大片中文字幕| 国产AV日韩AV| 亚洲成女人综合图区| 97碰碰碰人妻视频无码| 未满十八勿入av网免费| 国产真实乱对白精彩久久老熟妇女 | 亚洲 日韩 欧美 成人 在线| 91久久国产自产拍夜夜嗨| 亚洲国产都市一区二区| 亚洲人视频在线观看| 奇米影视7777久久精品人人爽| 亚洲熟女无码在线| 99er热精品视频| 色婷婷av一区二区三区之红樱桃| 西乌| 国产在线自揄拍揄视频网站| 亚洲精品国产av成拍色拍个| 放荡的少妇2欧美版| 草草影院ccyy| 福利社试看一分钟| 色综合久久中文字幕有码| 久久精品国产久精国产| 国产免费内射又粗又爽密桃视频| 午夜黄色福利| 97国产精东麻豆人妻电影| 性AV十丰满AV十无码AV| 爱爱综合网| 大学生久久香蕉国产线看观看|