![]()
從“手動(dòng)擋”到“智能駕駛”:數(shù)據(jù)分析的范式革新
想象一下,你正駕駛一輛高性能跑車,卻不得不頻繁停車,手動(dòng)調(diào)整引擎參數(shù)、更換輪胎,甚至在每次轉(zhuǎn)彎前下車勘測(cè)路況。這聽(tīng)起來(lái)荒謬,卻正是當(dāng)前許多 AI 在復(fù)雜數(shù)據(jù)分析任務(wù)中的真實(shí)寫照:盡管擁有強(qiáng)大的計(jì)算能力,卻依然被繁瑣的人工干預(yù)所束縛。
KDD Cup 2026 正式發(fā)布全新賽道:Data Agents for Complex Data Analysis。本次大賽由香港科技大學(xué)(廣州)數(shù)據(jù)智能與分析實(shí)驗(yàn)室 聯(lián)合 清華大學(xué)數(shù)據(jù)庫(kù)組 共同承辦,并由 ACM/IEEE Fellow 清華李國(guó)良教授和港科廣駱昱宇教授領(lǐng)銜。這不僅是一場(chǎng)全球頂尖的數(shù)據(jù)挖掘賽事,更是一次面向未來(lái)的技術(shù)挑戰(zhàn):我們能否構(gòu)建出真正意義上的“智能駕駛”AI,徹底告別人工干預(yù),自主定義數(shù)據(jù)分析的能力邊界?
![]()
01
任務(wù)驅(qū)動(dòng):當(dāng) AI 必須“學(xué)會(huì)思考”
傳統(tǒng)的數(shù)據(jù)分析自動(dòng)化,更多是“腳本化”的:預(yù)設(shè)流程、固定工具、單一數(shù)據(jù)源。一旦任務(wù)超出預(yù)設(shè)范圍,或數(shù)據(jù)環(huán)境發(fā)生變化,人工干預(yù)便不可避免。Data Agents 的核心價(jià)值,在于讓 AI 從“執(zhí)行者”升級(jí)為“思考者”:
場(chǎng)景模擬:假設(shè)你是一名數(shù)據(jù)科學(xué)家,需要評(píng)估一家跨國(guó)公司在全球各區(qū)域的季度銷售表現(xiàn),并找出異常波動(dòng)的原因。這需要你:
1.理解問(wèn)題:從一份高層報(bào)告中提煉出“評(píng)估銷售表現(xiàn)”和“找出異常原因”這兩個(gè)核心目標(biāo)。
2.數(shù)據(jù)尋源:在全球多個(gè)數(shù)據(jù)庫(kù)(SQL)、本地文件(CSV、JSON)、甚至郵件附件(PDF 報(bào)告)中尋找相關(guān)銷售數(shù)據(jù)、市場(chǎng)報(bào)告、匯率信息等。
3.工具選擇:根據(jù)數(shù)據(jù)類型和分析需求,選擇合適的工具:SQL 查詢數(shù)據(jù)庫(kù)、Python 腳本處理 CSV、PDF 解析器提取報(bào)告內(nèi)容。
4.邏輯推理:將不同來(lái)源的數(shù)據(jù)整合,進(jìn)行復(fù)雜的計(jì)算(如匯率轉(zhuǎn)換、同比環(huán)比),識(shí)別異常模式,并結(jié)合市場(chǎng)報(bào)告進(jìn)行歸因分析。
5.結(jié)果呈現(xiàn):將分析結(jié)果以清晰的圖表和文字形式呈現(xiàn)。
目前,這一系列步驟仍需大量人工協(xié)調(diào)。而 Data Agent 的目標(biāo),正是要自主完成這一切。
02
Data Agents:
突破“人工天花板”的核心能力
![]()
KDD Cup 2026 Data Agents 賽道,旨在推動(dòng) AI 具備以下“告別人工干預(yù)”的關(guān)鍵能力:
1.自主任務(wù)分解與策略生成:不再依賴人類指令,Agent 能夠?qū)?fù)雜的高層級(jí)目標(biāo),自主拆解為一系列可執(zhí)行的子任務(wù),并動(dòng)態(tài)規(guī)劃最優(yōu)的執(zhí)行路徑。
2.跨模態(tài)工具鏈編排:Agent 能夠智能識(shí)別并調(diào)用多樣化的工具(數(shù)據(jù)庫(kù)操作、編程語(yǔ)言執(zhí)行、外部 API 交互),并將其靈活編排,形成高效的工作流。
3.異構(gòu)信息融合與推理:Agent 能夠無(wú)縫處理來(lái)自結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化甚至多模態(tài)數(shù)據(jù)源的信息,進(jìn)行深度關(guān)聯(lián)與邏輯推理,構(gòu)建全面的數(shù)據(jù)視圖。
4.自適應(yīng)決策與結(jié)果驗(yàn)證:在執(zhí)行過(guò)程中,Agent 能夠根據(jù)中間結(jié)果進(jìn)行自適應(yīng)調(diào)整,并對(duì)最終分析結(jié)果進(jìn)行自我驗(yàn)證,確保準(zhǔn)確性和可靠性。
03
DataAgent-Bench:
丈量 AI 自主分析的“能力邊界”
![]()
為了精確丈量 AI 在自主數(shù)據(jù)分析方面的“能力邊界”,本次大賽推出了核心基準(zhǔn)測(cè)試平臺(tái)DataAgent-Bench。它通過(guò)構(gòu)建一系列精心設(shè)計(jì)的任務(wù),挑戰(zhàn) Agent 的極限:
?真實(shí)場(chǎng)景模擬:任務(wù)設(shè)計(jì)深度還原企業(yè)級(jí)數(shù)據(jù)分析場(chǎng)景,數(shù)據(jù)源涵蓋數(shù)據(jù)庫(kù)、文檔、圖表等異構(gòu)模態(tài)。
?非線性推理挑戰(zhàn):任務(wù)包含順序鏈、分支與合并、迭代循環(huán)等多種推理模式,要求 Agent 具備高級(jí)的邏輯判斷和策略調(diào)整能力。
?難度梯度分級(jí):從 Easy 到 Extreme 四個(gè)難度級(jí)別,通過(guò)控制“模態(tài)數(shù)量”與“干擾項(xiàng)規(guī)模”,系統(tǒng)性地評(píng)估 Agent 在不同復(fù)雜程度下的表現(xiàn)。
一個(gè) Phase 1 任務(wù)示例:
任務(wù):分析公司 2025 年 Q3 季度銷售數(shù)據(jù),識(shí)別出實(shí)際銷售額超出預(yù)算目標(biāo) 20% 的地區(qū),并歸因其驅(qū)動(dòng)因素。
Agent 需處理的數(shù)據(jù):
?sales_transactions.sqlite:交易數(shù)據(jù)庫(kù)。
?region_mapping.json:地區(qū)映射文件。
?Company_Ops_Manual.md:預(yù)算計(jì)算規(guī)則。
?Market_Report_Q3.md:市場(chǎng)分析報(bào)告。
Agent 需完成的推理:
1.從手冊(cè)中提取預(yù)算公式,結(jié)合映射文件,解析數(shù)據(jù)庫(kù)中的地區(qū)信息。
2.對(duì)交易數(shù)據(jù)進(jìn)行復(fù)雜查詢和計(jì)算,篩選出高增長(zhǎng)地區(qū)。
3.結(jié)合市場(chǎng)報(bào)告,對(duì)增長(zhǎng)原因進(jìn)行自動(dòng)化歸因。
重要信息:Phase 1 Demo 數(shù)據(jù)集及官方 Starter Kit 已發(fā)布!包含 Easy、Medium、Hard 和 Extreme 四個(gè)難度級(jí)別,并配套 GitHub 基準(zhǔn)代碼與工具鏈。立即前往官網(wǎng) https://dataagent.top/ 下載,挑戰(zhàn) AI 自主分析的極限!
04
賽制與獎(jiǎng)勵(lì):
激發(fā)創(chuàng)新,共塑未來(lái)
KDD Cup 2026 采用兩階段賽制,旨在全面激發(fā)參賽者的創(chuàng)新潛力:
?Phase 1(單一主賽道):所有隊(duì)伍在公共排行榜上競(jìng)技,通過(guò)自動(dòng)化評(píng)估,考驗(yàn)基礎(chǔ)能力與算法效率。
? Phase 2(雙子賽道):晉級(jí)隊(duì)伍可選擇:
Leaderboard Subtrack(排行榜賽道):追求極致準(zhǔn)確率,挑戰(zhàn)包含數(shù)據(jù)圖像、數(shù)據(jù)視頻等更具挑戰(zhàn)性的新模態(tài)數(shù)據(jù),推動(dòng)性能極限。
Creative Subtrack(創(chuàng)意賽道):更注重系統(tǒng)設(shè)計(jì)與用戶體驗(yàn),鼓勵(lì)構(gòu)建成熟、交互友好且決策透明的 Data Agent 系統(tǒng),探索應(yīng)用邊界。
本次大賽設(shè)立總額120,000 元人民幣的豐厚獎(jiǎng)金池,并提供:
?大廠 Offer 直通車:助力職業(yè)發(fā)展,連接頂尖人才與產(chǎn)業(yè)需求。
? KDD Cup Workshop 專屬演講機(jī)會(huì):在國(guó)際學(xué)術(shù)舞臺(tái)展示成果,提升個(gè)人與團(tuán)隊(duì)影響力。
官方獲獎(jiǎng)證書:為學(xué)術(shù)履歷增添價(jià)值,彰顯技術(shù)實(shí)力。
![]()
05
權(quán)威陣容:頂尖學(xué)者,引領(lǐng)前沿
本次大賽由香港科技大學(xué)(廣州)和清華大學(xué)聯(lián)合組織,匯聚了數(shù)據(jù)智能領(lǐng)域的學(xué)者。組織委員會(huì)成員包括:
General Chairs 陣容:
![]()
?李國(guó)良,ACM Fellow,IEEE Fellow,清華大學(xué)計(jì)算機(jī)系教授、副主任,國(guó)家杰出青年科學(xué)基金獲得者(并延續(xù)資助),國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目首席科學(xué)家,數(shù)據(jù)智能北京市重點(diǎn)實(shí)驗(yàn)室主任,計(jì)算機(jī)學(xué)會(huì)數(shù)據(jù)庫(kù)專委會(huì)副主任。
?駱昱宇,香港科技大學(xué)(廣州)助理教授,研究興趣為Data Agents、LLM Agents。在 SIGMOD、VLDB、KDD、ICML 等頂會(huì)發(fā)表論文40 余篇。曾獲世界人工智能大會(huì)云帆獎(jiǎng)、福布斯中國(guó)U30、華為火花獎(jiǎng)。領(lǐng)導(dǎo) OpenManus 和 DeepEye 開(kāi)源智能體項(xiàng)目(GitHub 5.5萬(wàn)+ Stars),獲日內(nèi)瓦發(fā)明展銀獎(jiǎng)。
?湯南,香港科技大學(xué)(廣州)副教授,ACM Distinguished Member,國(guó)家高層次人才計(jì)劃入選者。研究聚焦 AI4DB 與數(shù)據(jù)中心化 AI,曾獲 VLDB 最佳論文獎(jiǎng)及 SIGMOD 2024 Research Highlight Award。
?李伯巖,香港科技大學(xué)(廣州)博士生。研究方向聚焦于Text-to-SQL 和 Data Agents,在SIGMOD、KDD、VLDB、ICML等CCF-A類會(huì)議發(fā)表論文10余篇,領(lǐng)導(dǎo)DeepEye數(shù)據(jù)智能體開(kāi)源項(xiàng)目,獲日內(nèi)瓦發(fā)明展銀獎(jiǎng)。
Committee Chairs 陣容:
![]()
除上述專家外,大賽還匯聚了一批活躍在數(shù)據(jù)智能體、文檔智能、信息提取、數(shù)據(jù)可視化、數(shù)據(jù)庫(kù)系統(tǒng)及以數(shù)據(jù)為中心的 AI等前沿領(lǐng)域的青年學(xué)者。他們將出任本次大賽的 Committee Chairs,深度參與并統(tǒng)籌賽事的注冊(cè)流程、全球宣傳、數(shù)據(jù)構(gòu)建及評(píng)估標(biāo)準(zhǔn)制定,從多維度為大賽的公平性、權(quán)威性與技術(shù)專業(yè)度保駕護(hù)航。
06
關(guān)鍵時(shí)間節(jié)點(diǎn):
把握機(jī)遇,共赴前沿 (AoE 時(shí)區(qū))
? 3月22日 - 4月23日:全球隊(duì)伍注冊(cè)階段(機(jī)會(huì)稍縱即逝,立即組隊(duì),搶占先機(jī)!)
? 4月24日 - 5月23日:Phase 1 激烈角逐
? 5月28日 - 6月30日:Phase 2 激烈角逐
? 8月9日:KDD 2026 現(xiàn)場(chǎng)公布最終獲獎(jiǎng)名單
![]()
07
立即行動(dòng),告別干預(yù),定義未來(lái)!
Data Agents 的時(shí)代已然來(lái)臨,KDD Cup 2026 正是你告別人工干預(yù)、定義數(shù)據(jù)智能未來(lái)的最佳舞臺(tái)!
▎大賽官網(wǎng)(數(shù)據(jù)集下載 & 賽事詳情):復(fù)制鏈接 https://dataagent.top/ 到瀏覽器訪問(wèn),或點(diǎn)擊文末左下角“閱讀原文”直達(dá)。
▎加入官方交流社區(qū),與全球精英同行:為方便參賽者交流、獲取最新動(dòng)態(tài)及組隊(duì)信息,我們開(kāi)通了官方交流渠道。關(guān)注“數(shù)據(jù)智能與分析實(shí)驗(yàn)室 DIAL”微信公眾號(hào),回復(fù)關(guān)鍵詞即可獲取:
?回復(fù)KDD大賽:獲取官方 Discord 交流社區(qū)(KDD Cup 2026 | DataAgents)、X (Twitter) 賬號(hào)鏈接及賽事 FAQ 快速入口。
您也可以直接復(fù)制鏈接 https://discord.gg/7eFwJQN3Fx 加入我們的 Discord 社區(qū),與全球開(kāi)發(fā)者共同探討 Data Agents 的前沿技術(shù)!
讓我們相約 KDD 2026,共同告別人工干預(yù),塑造數(shù)據(jù)分析的未來(lái)!
![]()
未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.