<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      1/10Token 消耗干同樣的活!Ling-2.6-flash 想幫開發(fā)者把 AI 成本打下來

      0
      分享至


      更少的 Token,更好的結(jié)果。

      作者丨吳海明

      編輯丨梁丙鑒 馬曉寧

      用戶苦 Token 成本久矣。

      “燒了幾千塊錢的 Token,Agent 還是沒把活干完”,這或許是第一批嘗鮮“養(yǎng)蝦”的弄潮兒們最不想面對、卻又最常遭遇的尷尬時刻。

      當 Agent 越發(fā)全面地接管工作流,人們在交付效果的權(quán)衡中,開始更多地看到效率問題。有時候它們能自主完成需求分析、多輪修改,直接交付可用的文案或代碼,有時候卻在復雜任務的拆解中,迷失工具調(diào)用的方向。端到端的任務場景,往往會讓成本失控的問題更加凸顯。一覺醒來,Token賬單幾百美元,正事卻沒干多少。

      不少開發(fā)者會將之歸咎于 Agent 的架構(gòu)設(shè)計、工具鏈的完善程度,或是 Prompt 工程的深淺。但更根本的矛盾是,大模型本身的執(zhí)行力,即高效完成任務的能力,可能遠未達到工業(yè)級可用標準。

      這不僅指推理質(zhì)量本身,一個常被忽視的維度是詞元效率(Token Efficiency)。

      當傳統(tǒng)模型在多輪對話中不斷膨脹上下文窗口、消耗驚人 Token 時,螞蟻百靈最新發(fā)布的Ling-2.6-flash,卻在用一個簡單的主張撬動開發(fā)者的注意:更少Token,更快響應、更強執(zhí)行。

      一周前,代號為 Elephant Alpha 的匿名模型登陸 OpenRouter,這正是百靈模型 Ling-2.6-flash 的匿名測試版本。上線首日,Elephant Alpha 在沒有高調(diào)預熱的情況下,就迅速沖上 OpenRouter Trending 榜單第 2 位,日榜第 13 名,Token 使用量日增高達377%,prompt tokens 突破 6.11B。

      開發(fā)者社區(qū)對這一路線的反應,已經(jīng)很說明問題。


      01


      Token效率成新賽點

      官方技術(shù)文檔介紹,Ling-2.6-flsah 是一款總參數(shù)量 104B、激活參數(shù) 7.4B 的 Instruct 模型,此前通過 Elephant Alpha 展示出的核心能力,主要來自三方面革新:

      ? 混合線性架構(gòu),釋放推理效率:通過引入混合線性架構(gòu),模型從底層優(yōu)化計算效率,在 4 卡 H20 條件下推理速度最快可達到 340 tokens/s,Prefill 吞吐達到 Nemotron-3-Super 的 2.2 倍,以更高的“費效比”完成任務。

      ? Token 效率優(yōu)化,提升智效比:在訓練過程中,研究團隊對Ling-2.6-flsah 的 Token 效率進行了針對性校準,力求以更精簡的輸出完成既定目標。在 Artificial Analysis 的完整評測中,Ling-2.6-flash僅消耗15M tokens,約為Nemotron-3-Super 等模型的1/10,以更高的“智效比”完成任務。

      ? 面向 Agent 場景進行定向增強:針對當前需求最旺盛的 Agent 應用,Ling-2.6-flash 在工具調(diào)用、多步規(guī)劃與任務執(zhí)行能力上持續(xù)優(yōu)化,在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等評測中,即使面對激活參數(shù)更大的模型,依然能夠取得相近甚至 SOTA 級別的表現(xiàn)。


      API 定價方面,Ling-2.6-flash 輸入每百萬 tokens 定價 0.1 美元,輸出 0.3 美元,屬實屬于“白菜價”了。目前其 API 服務已正式向用戶開放,并提供了為期一周的免費試用。

      單點極限能力的榜首,早已是你方唱罷我登場,Ling-2.6-flash 更值得關(guān)注之處在于,它在控制 Token 消耗的前提下,仍然維持住了自身在 Agent 性能之爭中的強大競爭力。多位海外評測者也指出,其輸出風格與產(chǎn)品體驗更接近“實用型而非單純強大”的定位,這與其宣稱的“追求極致智效比”形成了某種呼應。

      作為第一款主打 Token 效率的模型,“高智效比”究竟是營銷話術(shù),還是實打?qū)嵉哪芰Γ课覀兊谝粫r間上手了 Elephant Alpha,不追峰值能力,不刷榜單分數(shù),而是將它放進真實任務場景中,實測結(jié)果說話。

      02


      實測:少即是多,Elephant Alpha實力幾何?

      ? 測試一:基準測試——詞元效率(Token Efficiency)基準

      為確保客觀性,我們以 Qwen3.5-122B-A10B (Qwen3.5) 和 Nemotron-3-Super-120B-A12B (Nemotron-3-Super)作為基準參照,在同等測試條件下進行對比測試。

      我們設(shè)計了三組測試任務:Token 效率基準、上下文窗口驗證和 Function Calling 與結(jié)構(gòu)化輸出。

      其中,Token 效率基準涵蓋代碼生成(4 道題)、Bug修復(4 道題)、文檔摘要(3 道題)、邏輯推理(5 道題)和結(jié)構(gòu)化輸出(5 道題)五大場景,統(tǒng)計各模型的信息留存率與 Token 消耗。256K 的上下文窗口是 Elephant Alpha 的核心賣點之一。我們分別在 64K、128K、200K 三個長度下測試模型的信息召回能力。

      Elephant Alpha 的表現(xiàn)如何呢?先看測試結(jié)果:


      可以看到,Elephant Alpha 在評測人員收集的 4 個 Bug 修復任務上展現(xiàn)出顯著優(yōu)勢,相對于 Qwen3.5 和 Nemotron-3-Super 成功修改通過 3 道的通過率,Elephant Alpha 修改后的代碼全部通過測試。

      更高的信息留存率之下,輸出 Token 反而更少。Elephant Alpha 以 1,017 個 Token 完成了 Qwen3.5 和 Nemotron-3-Super 分別需要 1,539 和 1464 個 Token 才能達成的同等信息量任務,節(jié)省約 50%。在 AI 落地日益講究 ROI 的當下,這個數(shù)字頗有分量。

      上下文窗口驗證方面,三者均實現(xiàn)了 100% 召回率。受限于測試環(huán)境,我們未能觸及 256K 上限,但 200K 級別的穩(wěn)定表現(xiàn)已經(jīng)證明了基礎(chǔ)能力的可靠性,足以勝任大部分任務場景。

      最后,三者在 Function Calling 測試(純python環(huán)境)中均觸發(fā)工具調(diào)用,但都只完成了單步操作(搜索文件),未完成"讀文件→分析→寫入"的三步連貫操作。這一結(jié)果提示我們,當前的 Agent 能力邊界仍需在具體環(huán)境中進一步探索。

      ?測試二:Coding測試——工程能力的真實考驗

      太多模型在基礎(chǔ)測試中表現(xiàn)亮眼,但一進入真實工程場景,立刻拉胯。因此我們決定給 Elephant Alpha 再上點強度。

      我們使用開源的opencode工具,將 Elephant Alpha 放進了一個完整的項目開發(fā)流程中:創(chuàng)建一個具備 CRUD 能力的 RESTful API 服務,包含數(shù)據(jù)庫模型設(shè)計、路由配置、錯誤處理和單元測試。

      這項測試考察的是模型的 Coding 工程能力,不僅僅是寫出片段式的代碼,更在于是能否理解需求、設(shè)計架構(gòu)、處理邊界條件,并在出現(xiàn)問題時回溯修改。

      Markdown
      請實現(xiàn)一個可運行、可測試的 `Task` RESTful API 服務,要求包含:

      - CRUD 接口:`POST /tasks`、`GET /tasks`、`GET /tasks/:id`、`PUT /tasks/:id`、`DELETE /tasks/:id`
      - 數(shù)據(jù)模型字段:`id`、`title`、`description`、`status`、`priority`、`due_date`、`created_at`、`updated_at`
      - 校驗與錯誤處理
      - 單元測試
      - 項目結(jié)構(gòu)說明與運行說明

      約束:

      - `title` 必填且不能為空
      - `status` 僅允許 `pending` / `in_progress` / `done`
      - `priority` 僅允許 `low` / `medium` / `high`
      - 不存在資源返回 `404`
      - 非法輸入返回結(jié)構(gòu)化 JSON 錯誤
      - 必須先做需求分析和架構(gòu)規(guī)劃,再編碼
      - 如果測試失敗或?qū)崿F(xiàn)有問題,必須自行修復并說明原因

      請輸出完整項目,而不是零散代碼片段。
      先規(guī)劃模塊,然后逐步開發(fā),最后測試。
      展示你的工程化開發(fā)、測試與回溯修復能力。

      先規(guī)劃,再各個擊破Elephant Alpha 理解了“先規(guī)劃后編碼”的要求,在正式實現(xiàn)前先進行了需求拆解和模塊設(shè)計,從數(shù)據(jù)模型、路由配置、校驗器、控制器到測試框架,形成了清晰的MVC 架構(gòu)。這說明它不是一上來就堆代碼,這種工程化思維,已經(jīng)成為了模型能在生產(chǎn)級任務中真正落地的門票。


      遇到bug,堅決改正。模塊測試過程中遇到了一些“插曲”,代碼出現(xiàn)了 Python 版本兼容性問題(async 語法、PEP 604 聯(lián)合類型寫法等),而 Elephant Alpha 從報錯信息中快速定位問題根源,并自主完成了代碼修正,無需人工介入。

      這種“遇到問題→自我修正”的閉環(huán),在傳統(tǒng)開發(fā)中往往意味著額外的 Token 消耗,Elephant Alpha 也不能免俗。但它的革新之處在于,更高的 Token 效率意味著它能在更緊湊的上下文中完成修正。對每一個環(huán)節(jié)的成本都如此砍下一刀,日積月累,不可小覷。


      測試結(jié)束,不忘收個尾。Elephant Alpha 最終交付了一個包含11 個測試用例的完整項目,全部通過。它甚至還生成了清晰的項目結(jié)構(gòu)說明和運行指南——從requirements.txt依賴管理到uvicorn啟動命令,從安裝到測試運行,一條龍完整交付。

      對于工程師來說,這種“有始有終”的完成度已經(jīng)達到了拿來即用的標準。


      Elephant Alpha 在 Coding 場景下展現(xiàn)了三大優(yōu)勢:先規(guī)劃后編碼的工程思維、自主修正的回溯能力,以及最重要的,用更少Token完成同等任務的效率優(yōu)勢。對于需要將 AI 融入開發(fā)流程的團隊而言,這三個特質(zhì)缺一不可。

      03


      Token效率重塑AI評價坐標系

      如果說過去的大模型競爭,是一場“誰的參數(shù)量更大、誰的 Benchmark 分數(shù)更高”的軍備競賽,那么 Elephant Alpha 的出現(xiàn),則是為這場競賽開辟了一個新的維度,“同樣強悍的智能,但我比你更省”。

      無法忽視的事實是,在 Agent 逐步靠近真實場景的今天,用戶的 Token 賬單也越發(fā)承壓。保守估計,一次代碼補全任務可能消耗幾十 Token,一次多輪對話會燒掉數(shù)百,一個 Agent 任務跑下來,這個數(shù)字可能就飆升到了數(shù)千。Token成為硬通貨,高效就不再是錦上添花,而是核心競爭力。

      值得一提的是,在英偉達 Nemotron 3 Super 的一份報告中,還特意強調(diào)了以螞蟻此前開源的 Ling-flash-Base-2.0 和智譜的 GLM-4.5-Air-Base 做基準。

      由此可見,“智效比”正在成為模型 Agent 場景的通用語言。此后人們不再問“一次生成質(zhì)量有多高”,而是“每 Token 消耗能換來多少有效產(chǎn)出”。在這個坐標系下,能用 600 Token 說清楚的事,就不該浪費 800。


      這場效率革命的影響,很快就會在產(chǎn)業(yè)鏈上下游爆發(fā)。

      對開發(fā)者而言,更高的 Token 效率意味著更普惠的智能,它包括更低的調(diào)用成本、更快的響應速度、以及在生產(chǎn)環(huán)境中真正可接受的 ROI。當 AI 落地不再需要“燒錢換體驗”,應用的滲透速度將以指數(shù)級增長。

      而在用戶側(cè),這場效率革命也指向了一種更可靠的 Agent。更少的 Token 消耗,將直接轉(zhuǎn)化為更緊湊的上下文窗口、更低的幻覺風險、以及更穩(wěn)定的多輪執(zhí)行能力。只有當模型能在有限上下文中完成更多任務,“上下文膨脹”這個 Agent 落地最大的痛點,才真正有解。

      在規(guī)模之外,當效率同樣成為了模型價值的衡量維度,發(fā)生在模型層的爭奪將真正邁上下一個臺階。

      未經(jīng)「AI科技評論」授權(quán),嚴禁以任何方式在網(wǎng)頁、論壇、社區(qū)進行轉(zhuǎn)載!

      公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標注來源并插入本公眾號名片。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      倒查10年!國家出手,全面整治醫(yī)院這類問題

      倒查10年!國家出手,全面整治醫(yī)院這類問題

      醫(yī)脈圈
      2026-05-15 20:39:55
      俄羅斯超大艦隊進入東海

      俄羅斯超大艦隊進入東海

      烽火觀天下
      2026-05-14 10:58:42
      盧秀燕急了,鄭麗文未赴美,選舉已徹底輸

      盧秀燕急了,鄭麗文未赴美,選舉已徹底輸

      徐云流浪中國
      2026-05-15 14:25:34
      特朗普幫了中國大忙,中國首次成為全球第一,日本完全被踩在腳下

      特朗普幫了中國大忙,中國首次成為全球第一,日本完全被踩在腳下

      小小科普員
      2026-03-26 00:27:10
      特朗普訪華享最高禮遇,日本首相登門卻遭冷遇,區(qū)別對待藏大智慧

      特朗普訪華享最高禮遇,日本首相登門卻遭冷遇,區(qū)別對待藏大智慧

      舟望停云
      2026-05-15 21:59:28
      擊敗世界第10!中國女網(wǎng)15歲超新星崛起:3大10后小花看齊鄭欽文

      擊敗世界第10!中國女網(wǎng)15歲超新星崛起:3大10后小花看齊鄭欽文

      李喜林籃球絕殺
      2026-05-15 12:06:56
      半島聚焦丨中成藥迎“最嚴清退”!7月起超4萬種中成藥可能停產(chǎn),健胃消食片等明星產(chǎn)品將淘汰?

      半島聚焦丨中成藥迎“最嚴清退”!7月起超4萬種中成藥可能停產(chǎn),健胃消食片等明星產(chǎn)品將淘汰?

      半島官網(wǎng)
      2026-05-14 16:52:07
      中藥又立功!蒲公英能在48小時內(nèi)殺死98%的癌細胞?醫(yī)生說出實情

      中藥又立功!蒲公英能在48小時內(nèi)殺死98%的癌細胞?醫(yī)生說出實情

      垚垚分享健康
      2026-05-15 08:52:25
      獨家專訪|蔡斌:排球人生路,問心無愧

      獨家專訪|蔡斌:排球人生路,問心無愧

      澎湃新聞
      2026-05-14 18:20:28
      又贏了,4-2!北京隊爆發(fā)4球,橫掃4連勝黑馬,27歲新星冉冉升起

      又贏了,4-2!北京隊爆發(fā)4球,橫掃4連勝黑馬,27歲新星冉冉升起

      北門兒
      2026-05-15 22:00:15
      小米手機官宣降價,門店員工:15Ultra直降1500元,17Ultra也有優(yōu)惠

      小米手機官宣降價,門店員工:15Ultra直降1500元,17Ultra也有優(yōu)惠

      極目新聞
      2026-05-15 19:08:44
      絕色美人艾梅柏:曾經(jīng)迷倒德普和馬斯克,如今帶著3個娃“隱居”

      絕色美人艾梅柏:曾經(jīng)迷倒德普和馬斯克,如今帶著3個娃“隱居”

      小書生吃瓜
      2026-05-02 22:22:47
      天津津門虎1-2成都蓉城,賽后評分出爐:成都蓉城7號排第一

      天津津門虎1-2成都蓉城,賽后評分出爐:成都蓉城7號排第一

      側(cè)身凌空斬
      2026-05-15 21:33:24
      天王嫂濾鏡徹底碎!方媛?lián)寙稳碎g引眾怒,極致利己嘴臉藏不住了

      天王嫂濾鏡徹底碎!方媛?lián)寙稳碎g引眾怒,極致利己嘴臉藏不住了

      千言娛樂記
      2026-05-14 23:30:52
      印度自取其辱,專挑中美的大日子舉辦金磚會議,王毅外長直接不去

      印度自取其辱,專挑中美的大日子舉辦金磚會議,王毅外長直接不去

      生活魔術(shù)專家
      2026-05-15 16:18:18
      2026公安嚴打!這8件事別碰,碰了連累全家

      2026公安嚴打!這8件事別碰,碰了連累全家

      原廣工業(yè)
      2026-05-15 18:11:31
      怎么拒絕親戚要長期住到家里的請求?網(wǎng)友:看好了,我只教一遍!

      怎么拒絕親戚要長期住到家里的請求?網(wǎng)友:看好了,我只教一遍!

      夜深愛雜談
      2026-05-15 07:17:28
      特斯拉中國官宣全新優(yōu)惠,5.59 萬即可提 Model 3 了!

      特斯拉中國官宣全新優(yōu)惠,5.59 萬即可提 Model 3 了!

      XCiOS俱樂部
      2026-05-13 14:22:27
      韋世豪連場破門!301天首次,3戰(zhàn)津門虎均破門,閆炳良巨大失誤

      韋世豪連場破門!301天首次,3戰(zhàn)津門虎均破門,閆炳良巨大失誤

      奧拜爾
      2026-05-15 19:56:03
      不瞞了!馬斯克罕見承認:美國是第一,但第二到第十全都來自中國

      不瞞了!馬斯克罕見承認:美國是第一,但第二到第十全都來自中國

      瀲滟晴方DAY
      2026-04-25 23:29:34
      2026-05-15 22:27:00
      AI科技評論 incentive-icons
      AI科技評論
      點評學術(shù),服務AI
      7280文章數(shù) 20751關(guān)注度
      往期回顧 全部

      科技要聞

      直降千元起步!蘋果華為率先開啟618讓利

      頭條要聞

      生產(chǎn)成本疑不足40元 "童鞋界愛馬仕"泰蘭尼斯廣告翻車

      頭條要聞

      生產(chǎn)成本疑不足40元 "童鞋界愛馬仕"泰蘭尼斯廣告翻車

      體育要聞

      德約科維奇買的球隊,從第6級聯(lián)賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經(jīng)要聞

      騰訊掉隊,馬化騰戳破真相

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態(tài)度原創(chuàng)

      親子
      旅游
      游戲
      數(shù)碼
      公開課

      親子要聞

      深圳萌娃化身“護鳥衛(wèi)士” 為紅耳鵯蛋寶寶搭圍欄立守則

      旅游要聞

      瓣瓣一線|門票優(yōu)惠、公益講解!河南三門峽送出“5·19”游玩大禮包 ?

      PS5獨占神作銷量太慘了!首周僅4614份 第二周消失

      數(shù)碼要聞

      艾為電子連啟三場 mini研討會 | 攜手合作伙伴全域賦能生態(tài)

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产精品久久久久久久久 | 赣榆县| 欧美福利电影A在线播放| 日本亚洲国产| 国产综合色产在线视频欧美| 亚洲成av人片一区二区蜜柚| 夜夜春久久天堂亚洲精品| 91精品人妻一区二区三区蜜桃 | 国产精品久久久久久久久久免费| 插b内射18免费视频| 日本视频网址一区二区三区| 亚洲第一狼人成人综合网| 男人天堂久久| 亚洲AV片揉捏奶头| 欧美性猛交xxx嘿人猛交| 极品粉嫩小泬无遮挡20p| 亚洲第49页| 欧美自拍嘿咻内射在线观看| AV怡红院一区二区三区| 又长又粗又爽又高潮的视频| 老头老太性髙潮| 久久久久青草线综合超碰| 国精品午夜福利视频不卡| 中文字幕人成无码免费视频| 欧美www在线观看| 久久国产高潮流白浆免费观看| 麻豆丰满少妇chinese| www熟女com| 成人免费电影亚洲| 亚洲视频导航| 国色天香成人一区二区| 欧美丝袜你懂的| 国产精品资源管理站在线直播| 日本亚洲精品色婷婷在线影院| 九九热精品视频在线| 国产午夜福利精品一区二区三区 | 深爱色情网| 秋霞无码久久一区二区| 午夜福利视频网站| 全南县| 伊人久久福利中文字幕|