<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      神秘模型「大象」:僅100B拿下SOTA,Token效率超高!

      0
      分享至

      金磊 發自 凹非寺
      量子位 | 公眾號 QbitAI

      神秘模型Elephant的面紗,終于被揭開了。

      事情是這樣的。

      前一陣子OpenRouters在自家官方上提到了一個神秘模型Elephant Alpha,并且給到的評價是這樣的:

      100B大小,在同規模模型里是SOTA,還巨省Token



      話題一出,立即引來不少網友們的圍觀,他們紛紛開始猜測這又是哪家的模型。

      不過非常微妙的一點是,這次網友們猜測的對象,統一地指向了中國大模型:

      是MiniMax、Kimi、DeepSeek,還是什么新黑馬?



      量子位獨家獲悉了答案,只能說網友們猜對了一半——

      確實是來自中國的模型;但玩家并未在他們給的選項里。

      因為這頭「大象」,出自螞蟻Inclusion AI 團隊之手。

      很反差的一點是,「大象」不大,自帶的只是100B大小、256K上下文窗口、32K輸出的敏捷屬性。

      并且在整體體驗下來之后,很直觀的感受,就是它有點國產版Grok 4 Fast的味道,天生干活圣體。

      來,咱們這就展開一波深度實測~



      干活圣體,很省Token

      針對「大象」的實測,我們是在OpenRouters上的網頁端來展開。

      并且會取日常工作較高頻的工作內容來進行測試,只為證明一件事:「大象」干活,到底行不行。



      實測1:修Bug沒有多余廢話

      對于程序員群里來說,AI寫代碼已經不是什么新鮮事了。

      但現在比較頭疼的,就是怕AI唰唰唰地寫了幾百行代碼,一跑全報錯,再讓它改,它又給你唰唰唰地重新生成幾百行……

      不僅效率低,還很費Token。

      為此,我們在這個實測環節中給「大象」先安排了一個接地氣的任務:

      用HTML和原生JS寫一個帶表單校驗的活動報名頁,要求包含姓名、手機號、郵箱,并且手機號必須符合中國大陸格式。



      △原速度展示

      可以看到,「大象」在思考片刻后,以極快的速度將代碼給生成了出來。

      把整段代碼保存為.html文件后,也是可以成功運行。



      但這并不是重點,重點在于「大象」是否做到修復。

      于是乎,我們接下來給剛才生成好的代碼來一波投毒的操作:

      把JS邏輯里定義提交按鈕的變量 const submitBtn = document.getElementById(‘submitBtn’) 直接刪掉。



      如此投毒之后,控制臺必定會爆出 Uncaught ReferenceError: submitBtn is not defined 的錯誤。

      然后我們把這份代碼再喂給「大象」,并簡單地附上一句:

      運行報錯了,找不到變量。



      不同于其它大模型,「大象」特別精準地找到了問題所在,然后用極簡的方式給出了解法。

      也正因為這種沒有多余廢話的回答,直接省去了Token的無用消耗。

      實測2:雜亂文檔,會抓重點

      代碼生成和修復還只能說是程序員工作圈子里的任務,但像會議內容整理,幾乎是所有職場人都需要經歷的事兒。

      在這項測試中,我們特意準備了一份大約3000字的會議紀要,里面充滿了口語化的表述,毫無意義的重復強調、部門之間關于排期的互相扯皮,甚至還有中途某人跑題聊起中午吃什么的外賣討論:



      然后我們把文件丟給「大象」并附上一句Prompt:

      忽略所有寒暄和跑題內容。請基于這3000字,嚴格按照以下JSON 格式(包含:結論摘要、待辦清單及責任人、一封用于抄送全員的跟進郵件草稿)輸出結果。



      「大象」給出的整理結果可以說是一目了然。

      在剔除了無用信息之后,嚴格按照Prompt要求的那樣,把會議內容給呈現了出來。

      或許單看「大象」的結果不夠明顯,我們為此特意拿了Gemini-2.5-Flash-Lite做了下對比:



      正所謂沒有對比就沒有傷害。

      Gemini-2.5-Flash-Lite雖然也是實現了Prompt里的結構,但很明顯一點就是,太長,也就意味著更多Token的消耗。

      所以「大象」在會議整理任務上,Win Again。

      實測3:Agent任務,也是夠快

      最后的實測,我們來上一道硬菜——大火的Agent。

      我們用「大象」來模擬一個輕量級的Agent Loop:

      讀取一份包含四個月度數據的CSV銷售報表 → 計算季度同比(需要調用數學邏輯) → 寫一段簡練的分析結論 → 自檢數字是否準確。



      從內容上來看,「大象」先是對數據做了快速分析和推理,并給出了初步結論;而后又完成了自檢的工作,最終輸出最終結論。

      但更重要的還是速度:只思考了10秒鐘、輸出2秒鐘

      由此可見,這個只有100B大小的「大象」,是真的做到了快、準、省

      而這一點,同樣體現在權威榜單的評測中。

      作為開發者圈層公認的模型測謊儀,AI BENCHY不看廠商宣傳跑分,只聚焦指令遵循、響應速度、Token效率三大實戰指標。



      從AI BENCHY給出的結果來看,「大象」輸出Token維持在了2500左右,說明每一分錢的API算力,都用在了刀刃上。

      平均響應時間方面,「大象」平均時延被壓制在了1秒左右,而其它選手則均是10-30秒的水平。

      并且在最重要的輸出質量上,它的一致性分數達到了9.6分(滿分10分)!

      因此,不論是從實測的體驗,亦或是權威榜單的評測來看,「大象」已然是可以勝任日常絕大多數的工作了。

      但也有不擅長的事

      正所謂人無完人、模無完模。

      「大象」畢竟走的是一條快、準、省的路線,所以它定然是在某些領域里有所妥協。

      在我們的實測中,也發現了「大象」一些不太擅長的工作。

      例如復雜長鏈規劃,就是其中之一:

      幫我主導一個出海東南亞市場的戰略項目。請從市場調研開始,接著做競品分析,然后給出渠道策略建議,最后幫我排一個半年的執行甘特圖。



      對于這個任務,「大象」直言無法執行。

      因為它沒有數據采集工具、沒有分析工具、沒有策略生成工具,也沒有項目管理工具。

      所以對于這類任務,我們不妨用大模型規劃 + 「大象」執行的方式來操作。

      再如,對于非常非常新的知識,「大象」也可能會心有余而力不足。



      以及要求生成React 18新特性或剛更新的SDK代碼時,「大象」可能會基于舊知識產生API幻覺。

      所以如果你有這方面的需求,可以在Prompt中注入最新文檔來解決。

      最后,Prompt過于模糊,也會影響輸出的質量。

      例如跟「大象」說:

      幫我寫個好看的網頁。



      因此,在用「大象」的時候,我們還需切記,Prompt一定要細致、要有足夠的約束力。

      Agent 時代,“快、好、省”的小模型同樣重要

      其實,在這個時間節點發布這樣一款主打智效比的模型,本身就是一種信號。

      過去幾年時間里,AI圈似乎都在比拼誰的模型更大、誰的訓練成本更貴、誰在榜單上刷的分更高。

      但行業走到今天,做加法的人太多了,需要有人站出來做減法。

      因為Token浪費,已然成了行業高度重視的關鍵內容之一。

      《財經》報道,全球企業級AI應用中,約有50%的Token正在被浪費。AI應用從對話轉向執行后,Agent在復雜多輪任務中會不斷累積歷史文件、對話記錄,大量冗余信息導致Token消耗指數級增長。

      每一塊錢都要花出響動,這是工程落地的鐵律。而踐行這條路線的,遠不止百靈。

      就在前不久,OpenAI連續發布了GPT-5.4 mini和GPT-5.4 nano兩款小型模型,專為高頻且對延遲敏感的任務設計。它們在保持了GPT-5系列優秀推理基因的前提下,實現了極高的吞吐量、極低的延遲和極具競爭力的性價比。

      谷歌則通過開源小模型Gemma 4,以低成本、高推理力打入低端AI市場。Gemma 4的參數規模僅為同智力水平大模型的約二十分之一,過去需要花費上千萬GPU成本才能跑動的模型,現在大概一張高階顯卡就能跑得動,成本差距將近十倍。

      尤其是對于預算有限、算力資源匱乏、追求極致投入產出比的中小企業而言,無需為冗余Token支付高額算力成本,無需采購昂貴硬件部署大模型,輕量化的「大象」就能無縫承接代碼開發、文檔處理、數據復盤、輕量Agent執行等高頻剛需工作。

      在動輒消耗幾十萬Token的長文本辦公場景中,響應壓制在1秒內、少說廢話的高效模型,正在成為AI從玩具跨越到生產力工具的堅實底座。

      快、準、省,這三個看似接地氣的字眼,正在成為AI高效上崗的標準。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      0-1!2-1!瘋狂一夜,維拉爆冷落敗,布拉加補時絕殺,水晶宮獲勝

      0-1!2-1!瘋狂一夜,維拉爆冷落敗,布拉加補時絕殺,水晶宮獲勝

      足球狗說
      2026-05-01 05:14:38
      4月新勢力銷量出爐:零跑7萬臺斷層領先,深藍、極氪等5家破3萬臺,新能源滲透率超60%

      4月新勢力銷量出爐:零跑7萬臺斷層領先,深藍、極氪等5家破3萬臺,新能源滲透率超60%

      紅星資本局
      2026-05-01 18:40:10
      孫楊他媽是嫌孫楊“涼”得還不夠徹底嗎?

      孫楊他媽是嫌孫楊“涼”得還不夠徹底嗎?

      蔥哥說
      2026-04-30 21:24:28
      中方表示遺憾,不得不投棄權票

      中方表示遺憾,不得不投棄權票

      極目新聞
      2026-05-01 13:03:40
      山西農婦慘死田間,鄰居不吃不喝躲藏6天,被抓后笑談行兇過程

      山西農婦慘死田間,鄰居不吃不喝躲藏6天,被抓后笑談行兇過程

      莫地方
      2026-04-28 01:10:03
      太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

      太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

      橙星文娛
      2026-04-17 13:19:56
      143頁!人大知名教授被舉報:名人之后、9個愛人,聊天內容流出

      143頁!人大知名教授被舉報:名人之后、9個愛人,聊天內容流出

      溫柔看世界
      2026-04-30 11:32:33
      中國花2000萬買個航母空殼?烏專家曾言:光4個發動機就超2000萬

      中國花2000萬買個航母空殼?烏專家曾言:光4個發動機就超2000萬

      素衣讀史
      2026-04-29 21:55:54
      暴雨大暴雨,要來了!

      暴雨大暴雨,要來了!

      中國日報
      2026-05-01 14:11:05
      轉走儲戶千萬的銀行員工已被采取措施,銀行不愿兜底想等司法結論

      轉走儲戶千萬的銀行員工已被采取措施,銀行不愿兜底想等司法結論

      映射生活的身影
      2026-05-01 15:23:04
      施瓦辛格私生子首奪健美冠軍!保姆所生,長得像爹,肌肉更是復刻

      施瓦辛格私生子首奪健美冠軍!保姆所生,長得像爹,肌肉更是復刻

      照見古今
      2026-04-12 19:26:48
      放大招?!長沙地鐵計劃近期新建280公里!

      放大招?!長沙地鐵計劃近期新建280公里!

      星耀長沙
      2026-05-01 13:58:00
      冠軍相!成都蓉城新賽季中超已領先7分:有望創中國足球新紀錄

      冠軍相!成都蓉城新賽季中超已領先7分:有望創中國足球新紀錄

      邱澤云
      2026-05-01 23:44:50
      他是水貨探花?季后賽得分全隊第1,籃板第1,比錫安莫蘭特強多了

      他是水貨探花?季后賽得分全隊第1,籃板第1,比錫安莫蘭特強多了

      球毛鬼胎
      2026-05-01 21:10:06
      她和孩子沒有遇害,活得很好!

      她和孩子沒有遇害,活得很好!

      劉娜
      2026-04-29 20:49:02
      零跑7.1萬臺,理想3.4萬臺,小米超3萬臺!多家車企公布4月銷量!

      零跑7.1萬臺,理想3.4萬臺,小米超3萬臺!多家車企公布4月銷量!

      小南看車
      2026-05-01 15:12:55
      一場0-1!利好熱刺保級:維拉歐聯杯爆冷聯賽或留力,西漢姆難了

      一場0-1!利好熱刺保級:維拉歐聯杯爆冷聯賽或留力,西漢姆難了

      體育知多少
      2026-05-01 07:04:03
      目前的中國股市,如果想賺錢,就買這兩種股票,賺到盆滿缽滿!

      目前的中國股市,如果想賺錢,就買這兩種股票,賺到盆滿缽滿!

      股經縱橫談
      2026-05-01 20:39:27
      鐵路員工站臺抽煙,真實原因曝光,難怪舉報女子遭網暴

      鐵路員工站臺抽煙,真實原因曝光,難怪舉報女子遭網暴

      奇思妙想草葉君
      2026-04-30 17:36:43
      英超專家小組認定加布頂牛哈蘭德屬于暴力行為,本應吃到紅牌

      英超專家小組認定加布頂牛哈蘭德屬于暴力行為,本應吃到紅牌

      懂球帝
      2026-05-01 21:10:11
      2026-05-02 00:16:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12567文章數 176458關注度
      往期回顧 全部

      科技要聞

      DeepSeek發布多模態論文又連夜刪除

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      財經要聞

      GPU神話松動,AI真正的戰場變了

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      旅游
      健康
      教育
      時尚
      軍事航空

      旅游要聞

      玩法升級!鞏義雙槐樹遺址假期首日激發體驗熱潮

      干細胞治燒燙傷面臨這些“瓶頸”

      教育要聞

      五一首日熱度爆棚!秦淮區中招會傳來最新消息!

      這個夏天,彩色褲子又火了!

      軍事要聞

      伊朗:持續推進海上封鎖的行為不可容忍

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲AV日韩AV永久无码网站| 激情综合色区网激情五月| 人妻制服OL熟女の美脚| 两当县| 成年无码av片在线狼人| 亚洲国产日韩欧美一区二区三区| 宁远县| 亚洲综合网中文字幕在线| www.99热| 国产一级特黄aa大片在线观看| 精品毛片乱码1区2区3区| 男人吃奶摸下挵进去啪啪软件 | 成人无码小视频在线观看| 男人天堂中文字幕| 国产免费午夜福利片在线| av激情亚洲男人的天堂| 囯产精品无码va一区二区| 不卡的无码AV| 亚洲AV成人无码久久精品色欲| 永久免费AV无码网站YY| 亚洲国产精品成人久久综合影院| 精品午夜福利短视频一区| 狼色精品人妻在线视频免费 | 51社区精品视频| 熟女人妻视频| 亚洲成a∨人片在线观看无码| 99热热久久这里只有精品68| 玩弄放荡人妻一区二区三区| 色综合天天综合网国产| 日本免费精品一区二区三区| 97精品尹人久久大香线蕉| 国产免费久久精品99久久| 亚洲av产在线精品亚洲第一站| 97se亚洲综合在线| 中文字幕日韩精品一区二区三区| 亚洲熟妇av综合一区二区| 色天使av| 国产av仑乱内谢| 国产一区二区视频在线播放| 国产盗摄xxxx视频xxxx| 亚洲AV永久无码嘿嘿嘿嘿|