<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      不只是調用API,Spatial-Agent讓大模型生成可執行地理分析工作流

      0
      分享至



      作者:Riyang Bao, Cheng Yang, Dazhou Yu, Zhexiang Tang, Gengchen Mai, Liang Zhao

      單位:Emory University;Rutgers University;University of Texas at Austin

      大語言模型在地圖、城市、交通等空間領域的應用越來越廣泛。對于這些場景來說,問題往往不只是 “查一個地點” 或 “調用一次路線 API” 就能解決的,而是需要把用戶的自然語言問題組織成一段可執行、可驗證的地理分析流程。

      比如,用戶問的可能已不再是 “附近有什么餐廳”,而是 “在某個區域內,哪些餐廳同時滿足距離、評分、營業時間和路線約束”;也不再只是 “從 A 到 B 怎么走”,還可能包括多站點行程、時間窗口和交通方式限制。這類問題通常沒有現成答案,需要先確定空間范圍,再組織對象、關系、度量和工具調用。

      Spatial-Agent 討論的正是這一類地理空間分析任務。它希望 LLM agent 在調用地圖、搜索和路線工具之前,先形成一套可以檢查的分析工作流:問題中有哪些空間對象?哪些是條件?哪些是最終要計算的指標?這些步驟應該按什么順序組織起來?



      • 論文標題:Spatial-Agent: Agentic Geo-spatial Reasoning with Scientific Core Concepts
      • 論文鏈接:https://arxiv.org/abs/2601.16965
      • 代碼:https://github.com/ecerybao/Spatial-Agent

      1. 為什么地圖問答不等于地理空間分析?

      單步地圖 API 通常適合回答事實型問題。例如輸入一個地點名,返回地址、評分、經緯度等信息;或者輸入起終點,返回兩點之間路線。這些能力有用,也是大多數地圖應用的基礎。

      但如果遇到稍微復雜一點的地理空間分析問題:以 “某個區域內某類設施的比例是多少” 為例,如果先對全城數據做聚合,再把結果拿去套一個空間范圍,和先篩出目標區域、再在這個范圍內計算比例,得到的結果完全不同。LLM 可能給出兩種看似合理的分析流程,但從地理分析角度看,只有其中一種計算得到的答案和用戶問題匹配。



      LLM 直覺流程與正確空間流程對比

      這也是通用 Agent 在這類任務上容易出錯的原因。它可以生成一串 thought-action-observation,也可以順利調用 geocoding、place search、routing 等工具;但問題在于,工具調用本身不出錯并不能保證分析順序正確。對于復雜 POI 檢索、空間過濾、多點路線規劃和時間約束任務,組織順序一旦出錯,后面的結果再完整也會偏離原問題。

      2. Spatial-Agent:

      把自然語言問題轉成 GeoFlow Graph

      Spatial-Agent 的做法,是在自然語言問題和工具調用之間加入一個中間層:GeoFlow Graph。這個圖不是普通的思維鏈文本。圖中的節點對應空間概念,邊表示概念之間的轉換關系;Agent 隨后按圖上的依賴關系去調用對應工具。這樣一來,Agent 不會直接從一句話跳到答案,而是會先把問題拆成一組有地理含義的分析步驟。

      可以把它理解為一種 “先搭分析骨架,再執行工具” 的方式。地圖 API 仍然很重要,但它只負責完成工作流中的某些操作;決定答案是否正確的,是這些操作是否圍繞這個空間問題被有序的組織起來。

      3. 理論根基:來自 GIScience 的

      core concepts 與 functional roles

      這篇工作借用了 GIScience 里兩類長期積累下來的東西:一類用來描述空間信息本身是什么,另一類用來描述這些信息在分析過程中起什么作用。

      第一類對應 core concepts of spatial information。Goodchild 在 1992 年提出 Geographical Information Science 時,已經把 GIS 從單純軟件系統問題推進到科學問題層面。Kuhn 在 2012 年進一步整理出 location、field、object、network、event 等空間信息核心概念,用來描述地理現象的基本組成。

      第二類更接近 “分析流程里的角色”。Scheider 等人的 core concept data types 工作,把這些空間概念和有效的數據轉換聯系起來;后續 geo-analytical question-answering 研究則強調,很多地理問題的答案要通過 GIS workflow 計算出來。Xu、Scheider 等人進一步把地理分析問題解釋為 concept transformations,并用 functional roles 描述一個概念是在限定范圍、充當條件、提供支撐對象,還是作為最終度量。

      Spatial-Agent 沿用了這條線索。它會識別問題中的 Location、Object、Field、Event、Network、Amount、Proportion 等概念,也會標出 Extent、Temporal Extent、Sub-condition、Condition、Support、Measure 等角色。前者回答 “問題里有什么”,后者回答 “它們在這次分析里負責什么”。

      4. 方法:從概念抽取到工具執行

      GeoFlow Graph 之所以必要,是因為很多地理問題的難點不在某一個工具的執行,而在工具及其執行結果之間的依賴關系。系統需要知道先找地點還是先篩范圍,先構建路線還是先判斷候選 POI,最后的 measure 又依賴哪些中間結果才能得到。

      在 Spatial-Agent 中,處理流程大致有四個環節。首先,系統會從自然語言中找出地點、對象、事件、網絡和度量目標,并為它們分配功能角色。這樣,問題不再只是若干文本片段,而被整理成可以進入地理分析的單元;然后,系統會參考一組預先驗證過的 macro-templates。這些模板對應地理任務中頻繁出現的模式,例如 “篩選 - 聚合 - 度量”“對象到距離場”“路線優化”“位置到方位分類”。模板不替模型寫答案,主要作用是幫助它避開明顯不合理的轉換順序;有了概念、角色和候選模板后,系統構建 GeoFlow Graph。這個圖需要滿足操作順序、類型兼容性、數據可用性和連通性等約束。圖必須既符合語言問題,也能落到后續工具執行;最后,圖上的轉換關系會被映射到 geocoding、place search、routing、distance matrix、spatial filtering、trip optimization 等操作。系統會記錄中間狀態,并基于工具返回的結果生成最終回答。



      Spatial-Agent 框架

      這種設計能夠支持執行后的檢查:系統到底識別了哪些空間概念,哪些條件先被處理,最終答案依賴了哪些中間結果。對于地圖類 agent,這比只看一段自然語言推理更容易定位問題。

      5. 實驗:工作流約束帶來

      更穩定的 agent 表現

      論文在 MapEval-API 和 MapQA 兩個 benchmark 上評估了 Spatial-Agent。前者覆蓋 Place Info、Nearby、Routing 和 Trip 四類 API-based 地圖任務,涉及 54 個國家的 180 個城市;后者來自 OpenStreetMap,包含開放域地理空間問答。實驗結果可總結為以下三點:

      實驗結果速覽:



      第一,MapEval-API 上的提升很明顯。Spatial-Agent + GPT-4o-mini 的總體準確率達到 45.15%,相比 MapEval API baseline 的 23.00% 有 96.30% 的相對提升。換成 GPT-5 模型后,整體準確率進一步達到 71.88%。這說明在需要多步規劃的地圖任務里,給 agent 一個地理分析工作流的范式,比直接讓模型邊想邊調工具更可靠。

      第二,MapQA 上的結果說明方法不只依賴某一個閉源模型。Spatial-Agent + GPT-4o-mini 取得 61.45% 的總體準確率;開源模型設置下,LLaMA-70B 版本達到 62.45%,Qwen2.5-72B-Instruct 版本達到 61.45%。這組結果說明系統的設計可以遷移到不同模型家族。

      第三,GeoFlow template 不是可有可無的工程細節。消融實驗中,去掉模板組合后,Spatial-Agent + GPT-4o-mini 在 MapEval-API 上的準確率從 45.15% 降到 39.32%。也就是說,預先驗證過的地理分析模式確實在幫助模型少走彎路,生成更多正確的 GeoFlow Graph。



      圖:不同方法在 MapEval-API 各類任務上的平均查詢延遲,所有方法均使用 GPT-4o-mini。Direct LLM 延遲最低,但缺少工具 grounding;在 agentic 方法中,Spatial-Agent 在 Routing 上最快,在 Nearby 和 Trip 上與 ReAct 接近。

      錯誤分析指出:系統的失敗更多集中在執行層,例如同名地點誤匹配、POI 信息缺失、營業時間或路線數據不完整。這個結果說明,當空間分析流程被正確構建之后,外部地理數據和 API 質量會成為新的瓶頸。



      圖:論文人工分析了 68 個 MapEval-API 錯誤樣例。Data Quality Issues(45.6%)和 Search Result Mismatch(33.8%)占主要比例,均發生在執行階段;Concept & Role Assignment 和 Response Generation 各占 10.3%。

      6. 結語:不要把它理解成

      泛化的 “空間推理” 口號

      Spatial-Agent 的重點不是宣稱大模型突然學會了所有意義上的空間推理。視覺、機器人、3D 理解等領域早已有各自的空間問題和技術路線;這篇工作處理的是更具體的一類任務:地理空間問答和 GIS-style analysis workflow。

      它的研究價值在于,把 GIScience 中關于 core concepts、functional roles 和 workflow composition 的理論,接到了 LLM agent 的中間表示與執行過程中。這樣,agent 在回答復雜地圖問題時,不會停留在把若干 API 串起來這一步,而會先形成一張能被驗證和執行的 GeoFlow Graph。

      當然,這項工作仍然有局限性。外部地理空間 API 的數據質量會影響系統表現,模板庫也不可能覆蓋所有地理分析模式;細粒度概念和圖結構標注仍需要人工成本。后續值得繼續推進的方向包括:更多語言環境、更專業的地理任務,以及和復雜空間分析工具鏈的結合。

      總的來說,Spatial-Agent 給出的啟發是:當 agent 進入一個有成熟理論和工具體系的領域時,單靠通用規劃能力往往不夠。真正需要處理的是,如何把這個領域里已有的理論和分析方法,變成模型可以理解和使用的中間表示。

      相關參考文獻:

      • Goodchild, M. F. (1992). Geographical information science. International Journal of Geographical Information Systems, 6 (1), 31-45.
      • Kuhn, W. (2012). Core concepts of spatial information for transdisciplinary research. International Journal of Geographical Information Science, 26 (12), 2267-2276.
      • Scheider, S., Meerlo, R., Kasalica, V., & Lamprecht, A. L. (2020). Ontology of core concept data types for answering geo-analytical questions. Journal of Spatial Information Science, 2020 (20), 167-201.
      • Scheider, S., Nyamsuren, E., Kruiger, H., & Xu, H. (2021). Geo-analytical question-answering with GIS. International Journal of Digital Earth, 14 (1), 1-14.
      • Xu, H., Nyamsuren, E., Scheider, S., & Top, E. (2023). A grammar for interpreting geo-analytical questions as concept transformations. International Journal of Geographical Information Science, 37 (2), 276-306.

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      女商人花570萬“競拍”后房錢兩空,糾紛還是詐騙?|紅星調查

      女商人花570萬“競拍”后房錢兩空,糾紛還是詐騙?|紅星調查

      紅星新聞
      2026-05-26 16:39:17
      凌晨2點打電話叫醒村民的“謝會計”遇難,妻子弟弟仍失聯

      凌晨2點打電話叫醒村民的“謝會計”遇難,妻子弟弟仍失聯

      紅星新聞
      2026-05-26 17:26:13
      突發!上海DPOY懷特塞德缺席總決賽G1 馬典成臨時頂替進名單

      突發!上海DPOY懷特塞德缺席總決賽G1 馬典成臨時頂替進名單

      醉臥浮生
      2026-05-26 18:43:49
      央視三胎宣傳片翻車惹爭議:看似溫情勸生,為何嚇退無數年輕人?

      央視三胎宣傳片翻車惹爭議:看似溫情勸生,為何嚇退無數年輕人?

      大稻網絡科技
      2026-05-25 15:23:25
      2026一季度財政自給率:浙江96%領跑,10多個省不足50%

      2026一季度財政自給率:浙江96%領跑,10多個省不足50%

      風向觀察
      2026-05-26 11:27:00
      武契奇前腳離開,后面塞爾維亞就亂了

      武契奇前腳離開,后面塞爾維亞就亂了

      鳳眼論
      2026-05-26 14:16:31
      “只要大陸敢打,我就敢送”,他公開宣稱

      “只要大陸敢打,我就敢送”,他公開宣稱

      安安說
      2026-05-24 15:20:17
      第三輪第六批中央生態環境保護督察公布廣東廣西兩省區典型案例

      第三輪第六批中央生態環境保護督察公布廣東廣西兩省區典型案例

      新京報
      2026-05-26 10:14:20
      15分鐘滅國警告!俄羅斯攤牌:若敢碰加里寧格勒,就讓立陶宛消失

      15分鐘滅國警告!俄羅斯攤牌:若敢碰加里寧格勒,就讓立陶宛消失

      觀史搜尋著
      2026-05-25 10:50:13
      紅軍村的鋼鐵洪流:西方裝甲撕開俄軍十年防線

      紅軍村的鋼鐵洪流:西方裝甲撕開俄軍十年防線

      律法刑道
      2026-05-25 17:49:18
      割四賠五上熱搜,當地書記都無可奈何,只能自掏腰包進行補償

      割四賠五上熱搜,當地書記都無可奈何,只能自掏腰包進行補償

      映射生活的身影
      2026-05-26 15:56:12
      泡藥楊梅后遺癥:你一樣一樣地爛了,我一樣一樣地戒了!

      泡藥楊梅后遺癥:你一樣一樣地爛了,我一樣一樣地戒了!

      行者殷濤
      2026-05-26 12:35:34
      教育是不是生大病了?網傳現在的中學生都過得很壓抑…

      教育是不是生大病了?網傳現在的中學生都過得很壓抑…

      慧翔百科
      2026-05-26 11:29:48
      曝央視分銷世界杯版權進賬30億元 博主:你還信FIFA只收央視4億?

      曝央視分銷世界杯版權進賬30億元 博主:你還信FIFA只收央視4億?

      風過鄉
      2026-05-26 13:01:16
      官方通報“維也納酒店牙刷刷馬桶”“全季酒店用客人牙刷洗杯子后放回”:約談涉事酒店負責人,責令立即整改,將根據調查核實情況嚴肅處理

      官方通報“維也納酒店牙刷刷馬桶”“全季酒店用客人牙刷洗杯子后放回”:約談涉事酒店負責人,責令立即整改,將根據調查核實情況嚴肅處理

      大風新聞
      2026-05-26 11:12:07
      曝蘇超球員與未成年發生關系!未滿14歲最高死刑 不滿18可算強奸

      曝蘇超球員與未成年發生關系!未滿14歲最高死刑 不滿18可算強奸

      念洲
      2026-05-26 16:59:59
      伊朗總統下令恢復國際互聯網接入

      伊朗總統下令恢復國際互聯網接入

      澎湃新聞
      2026-05-26 03:34:09
      國宴上桌,高層調研:一家民企密集被“看見”,什么信號?

      國宴上桌,高層調研:一家民企密集被“看見”,什么信號?

      智谷趨勢
      2026-05-20 17:04:05
      韜定律掀的是臺積電們的桌子

      韜定律掀的是臺積電們的桌子

      智遠同學
      2026-05-25 21:23:45
      尼克斯重返總決賽!布倫森1999年總決賽萌照曝光,冥冥自有天意

      尼克斯重返總決賽!布倫森1999年總決賽萌照曝光,冥冥自有天意

      仰臥撐FTUer
      2026-05-26 14:34:08
      2026-05-26 18:55:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13087文章數 142653關注度
      往期回顧 全部

      科技要聞

      中國AI要向外卷,而不只是做第二個OpenAI

      頭條要聞

      25歲海歸男戀上32歲離異女 因88.8萬彩禮鬧掰追討12萬

      頭條要聞

      25歲海歸男戀上32歲離異女 因88.8萬彩禮鬧掰追討12萬

      體育要聞

      上賽季差點降入英甲,下賽季要踢英超了

      娛樂要聞

      臺媒貼臉!S媽被問大S嗑藥當場沉默

      財經要聞

      中國鋁行業爆單 下一個“煤炭”大周期?

      汽車要聞

      涉水加強 福特烈馬亞馬遜限量版上市 售價39.98萬

      態度原創

      房產
      旅游
      游戲
      藝術
      公開課

      房產要聞

      招商地產接盤碧桂園!海口這個爛尾豪宅,要徹底改命?

      旅游要聞

      漫步虎山公園 邂逅泰安初夏的溫柔

      5月版號來了!PS5霓虹深淵2、恐龍快打起源等

      藝術要聞

      中國之美,美到極致!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久精品国产99久久久古代| 亚洲中文字幕日产无码成人片| 亚洲国产精品高清在线第1页| 最新精品国偷自产在线 | 久久亚洲精品11p| 国产萌白酱喷水视频在线观看| 粉嫩av国产一区二区三区 | 无码精品黑人一区二区三区| 国产人妻人伦精品1国产| 2021亚洲国产精品无码| 午夜免费无码福利视频麻豆| 天海翼一区| 亚洲图片另类图片激情动图| 扒开末成年粉嫩的小缝视频| 国产一区二区亚洲三区| 日韩欧美中文亚洲高清在线| 日本黄色一区二区三区四区| 91精品国产综合久久久蜜臀678| 中文字字幕人妻中文| 日本护士一区二区三区| 人妖网址| 久久久久人妻精品一区二区三区| 久久亚洲国产成人亚| 成人国产一区二区三区| 久久福利| 天天躁日日躁狠狠躁av麻豆男男| 久久精品无码视频一二三专区免费| 强乱中文字幕在线播放不卡| 波多野结衣在线精品视频| 国产欧美日韩一区二区三区| 亚洲第一页综合图片自拍| 最近中文字幕av在线| 西西午夜无码大胆啪啪国模| 亚洲日韩操| 亚洲男人在线无码视频| 成人污视频| 中文字幕久久久久久精| 欧美性猛交xxxx免费看蜜桃| 中文字字幕在线中文| 中文字幕亚洲天堂 | 99热这里只有免费国产精品|