<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      別死磕百萬上下文了!Neo4j CEO 詳解知識圖譜:如何把大公司的“隱性知識”塞進(jìn) AI 的腦子?

      0
      分享至


      “專用向量數(shù)據(jù)庫的生存空間已經(jīng)快沒了!”

      編譯 | 王啟隆

      出品丨AI 科技大本營(ID:rgznai100)

      這兩年,AI 圈里有一個越來越明顯的錯位。

      一邊,大家還在為上下文窗口越做越大興奮,100 萬、200 萬,仿佛只要能往模型里塞進(jìn)更多東西,問題就會自動消失。另一邊,真正開始把 AI 系統(tǒng)往生產(chǎn)環(huán)境里推的人,越來越容易撞上一堵墻,問題從來不只是信息夠不夠多,而是這些信息彼此到底是什么關(guān)系。

      • 一個 chunk 為什么會被撈出來?

      • 每一段話是誰寫的?

      • 一條權(quán)限對誰生效?

      • 這份文檔為什么重要?

      • 這個答案到底是沿著什么路徑長出來的?

      如果這些東西始終只是散落的文本,那么上下文再長,很多時候也只是更大的噪音池。可一旦信息開始帶著實(shí)體、關(guān)系、權(quán)限、作者、來源和歷史進(jìn)入系統(tǒng),問題就完全變了。AI 要的也許不是更多文本,而是一層能把文本重新組織起來的結(jié)構(gòu)。

      這也是為什么,圖(Graph)在這個時間點(diǎn)重新變得重要。


      最近一期 Latent Space 播客請來了 Neo4j 首席執(zhí)行官Emil Eifrem。Neo4j 是圖數(shù)據(jù)庫領(lǐng)域最有代表性的公司之一,Emil 則是過去很多年里持續(xù)推動這套技術(shù)路線的人。放在今天的語境里,這已經(jīng)不只是數(shù)據(jù)庫圈子的舊話題了,因?yàn)?strong>圖數(shù)據(jù)庫正重新卷進(jìn) GraphRAG、知識圖譜、智能體記憶、上下文圖譜這些 AI 系統(tǒng)里越來越核心的問題。

      這場對話最有意思的地方在于,它沒有把圖說成一種神秘的新答案,反而把一件事講得越來越具體,AI 系統(tǒng)需要的,不只是 top-K chunks,而是帶結(jié)構(gòu)的上下文。GraphRAG 也不是把向量檢索替換成另一個流行詞,而是讓系統(tǒng)先從語義相近處起步,再沿著真正有意義的關(guān)系繼續(xù)展開。這樣得到的東西,不只是更準(zhǔn),也更容易追問,更容易調(diào)試,更容易解釋。

      Emil 在這場對話里一路講到 Neo4j 的來路,講到圖數(shù)據(jù)庫和向量數(shù)據(jù)庫的關(guān)系,講到知識圖譜、Agent memory、context graph,也講到一個越來越清楚的判斷,未來很多 AI 應(yīng)用,也許都需要一層圖狀的上下文底座。名字可以很多,但背后的方向其實(shí)正在變得越來越一致。

      要點(diǎn)速覽

      • AI 缺的未必是更多上下文,很多時候缺的是上下文之間的關(guān)系。

      • top-K chunks 可以把文檔撈出來,但解釋不了它們?yōu)槭裁粗匾?、彼此為什么相連。

      • 向量搜索解決的是“像不像”,圖更擅長回答“為什么是它”。

      • GraphRAG 不是替代向量檢索,而是讓檢索命中之后還能順著關(guān)系繼續(xù)往下走。

      • 當(dāng) AI 開始進(jìn)入權(quán)限、歷史、作者、決策軌跡這些復(fù)雜地帶,純文本上下文很快就會不夠用。

      • 圖數(shù)據(jù)庫重新變重要,不是數(shù)據(jù)庫品類回潮,而是 AI 系統(tǒng)開始需要一層更像知識結(jié)構(gòu)的上下文底座。


      為什么“圖”在當(dāng)下至關(guān)重要

      主持人:大家好,我們今天在遠(yuǎn)程演播室連線了 Neo4j 的首席執(zhí)行官 Emil Eifrem。歡迎你的到來。

      Emil:很高興來到這里。

      主持人:這一刻我期待已久。你是第一屆世界博覽會(World's Fair)上最受歡迎的演講嘉賓之一。去年我們又和你的團(tuán)隊(duì)一起辦了完整的 GraphRAG 專場,今年我們再次聚焦這個話題。如今,你會如何向大家介紹 Neo4j?

      Emil:這取決于聽眾是誰。我想我們最廣為人知的身份是一個數(shù)據(jù)庫,確切地說,是圖數(shù)據(jù)庫。但時至今日,它已經(jīng)演變成一個遠(yuǎn)超數(shù)據(jù)庫范疇的廣闊平臺。

      我通常會這樣開場:我們將數(shù)據(jù)煉成知識。這是一個實(shí)現(xiàn)該愿景的平臺。

      當(dāng)然,這自然會引出一個問題:你說的“知識”到底指什么?畢竟這是一個定義模糊的詞。

      我會解釋說,知識的本質(zhì)是從噪音中提取信號,并以一種“知識高密度”的方式呈現(xiàn)出來,而“圖”正是其中一種絕佳形式。毋庸置疑,其核心依然是數(shù)據(jù)庫,但如今這個平臺已經(jīng)包羅萬象了。

      主持人:你們已經(jīng)深耕這個領(lǐng)域有一陣子了?,F(xiàn)在幾乎所有人都在用你們的產(chǎn)品,甚至包括倫敦交通局。這挺有意思的,因?yàn)檫@本身就非?!皥D”——等你親自去那里就會發(fā)現(xiàn),倫敦的地鐵網(wǎng)絡(luò)就是一個天然的圖結(jié)構(gòu)。

      Emil:哈哈,那當(dāng)然。不過話說回來,這取決于你的“圖式思維”有多深——在圖的視角下,萬物皆是圖。

      主持人:確實(shí)如此,我自己也曾在這個“兔子洞”里沉迷過。十年前我剛開始學(xué)編程時,參加了一個編程訓(xùn)練營。后來在某個大會的工作坊上,我第一次接觸到了 Cypher 查詢語言和 Neo4j。我想很多人的 Neo4j 啟蒙也是如此。今天我們想聊聊,自那以后發(fā)生了什么?廣義上的“圖智能”究竟是什么?你們后來又構(gòu)建了怎樣的一套生態(tài)系統(tǒng)?

      Emil:我們先來談?wù)劚澈蟮摹盀槭裁础薄H绻麖?AI 工程師的視角來看,你剛才提到了 GraphRAG 這個詞,現(xiàn)在人們很喜歡用它來描述檢索過程——也就是在 R(檢索)這個環(huán)節(jié)中引入知識圖譜。這樣做有很多理由。我從用戶那里聽到最多的呼聲是:它能帶來更高的準(zhǔn)確率,因?yàn)槟銚碛辛藰O其豐富的數(shù)據(jù)表征。其次,出乎很多人意料的是,它還能顯著提升開發(fā)者的生產(chǎn)力。

      這里有一個潛在的前提,那就是你得先有一個“圖”,我們待會兒可以細(xì)聊這個。但當(dāng)你擁有了圖,并把它與向量空間進(jìn)行對比時,你會發(fā)現(xiàn)向量空間非常像一個黑盒。如果你搜索并找到了排名前 K 的文檔,你根本不知道為什么是它們。系統(tǒng)只會告訴你,在某個余弦或歐幾里得空間里,它們的相似度是 0.7。相比之下,圖結(jié)構(gòu)是極其明晰的,你甚至可以直觀地審視它。比如,我有一個蘋果和一個橘子,它們之所以關(guān)聯(lián),是因?yàn)樗鼈兌紝儆凇八薄5跉W幾里得空間里,一個蘋果和一個網(wǎng)球的相似度可能也是 0.7,僅僅因?yàn)樗鼈兌际菆A的,或者都是綠色的。你無從知曉原因。這就是第二個優(yōu)勢。

      然后,我們聽到的第三個強(qiáng)烈訴求是關(guān)于可解釋性。人們非??粗匾稽c(diǎn):與不透明的向量空間相比,他們現(xiàn)在可以真正去審查,系統(tǒng)究竟為什么選出了這 K 篇文檔。

      主持人:我好像沒聽到你提查詢速度,我猜這應(yīng)該也是優(yōu)勢之一吧。但我思考圖數(shù)據(jù)庫時總覺得,人們之所以想用它,是因?yàn)槟憧梢皂樦鴪D去游走、去遍歷,這大概比做一堆傳統(tǒng)查詢和表連接(Joins)要高效得多。這是不是一種比較老派的理解方式?還是說,這其實(shí)就是把你剛才的話換了種說法?

      Emil:我認(rèn)為速度的優(yōu)勢其實(shí)已經(jīng)內(nèi)化到“準(zhǔn)確率”里了。因?yàn)楹芏鄷r候,正是得益于極快的處理速度,你才能在極短的時間內(nèi)覆蓋廣闊的范圍,遍歷并觸及海量的文檔或節(jié)點(diǎn)。你這個觀察很有意思,雖然我們現(xiàn)在確實(shí)很少聽到客戶把它拿出來單說。從 AI 工程師的角度,或者在 AI 相關(guān)的應(yīng)用場景中,大家可能已經(jīng)習(xí)慣了大模型本身就會吃掉大量的延遲時間,所以“查詢速度快”反而很少成為首要關(guān)注點(diǎn)。但正是因?yàn)樗俣瓤?,我們才有可能?shí)現(xiàn)更高的準(zhǔn)確率。所以我認(rèn)為它們是息息相關(guān)的。

      主持人:也就是說,只要你有速度優(yōu)勢,你完全可以多花一點(diǎn)時間去換取更高的準(zhǔn)確率。

      Emil:沒錯。


      Neo4j 的破局與向量數(shù)據(jù)庫的余輝

      主持人:酷。那么接下來,我覺得大家經(jīng)常會問的一個問題是:作為一位保持中立的數(shù)據(jù)庫 CEO,你認(rèn)為向量數(shù)據(jù)庫怎么了?為什么它沒能成為一個……我該怎么形容呢,持久的、或者說獨(dú)立的品類?現(xiàn)在每家數(shù)據(jù)庫都有向量索引功能了,我想說“作為獨(dú)立品類的向量數(shù)據(jù)庫已經(jīng)終結(jié)”應(yīng)該不算過分吧?

      Emil:我不知道,這說法可能有點(diǎn)夸張了。幾年前我就公開表示過,我不認(rèn)為它會是一個長青的數(shù)據(jù)庫品類。至少不能作為一個純粹的“數(shù)據(jù)庫”品類存在,它給人的感覺更像是“搜索”。這是我?guī)啄昵暗恼摂唷?/p>

      不過讓我驚訝的是,目前似乎還存在某種長尾效應(yīng)——我們依然看到很多早期的實(shí)驗(yàn)項(xiàng)目在嘗試使用向量數(shù)據(jù)庫。而且在極其高端的需求場景下,某些專用向量數(shù)據(jù)庫的表現(xiàn),依然優(yōu)于其他數(shù)據(jù)庫自帶的向量搜索功能。

      你剛才說我是中立方,其實(shí)我在這件事上并不中立,因?yàn)?Neo4j 也內(nèi)置了向量搜索功能。坦白說,它目前還比不上那些專用的向量數(shù)據(jù)庫。但隨著每個季度、每一年的迭代,這條及格線在不斷提高。因此,留給專用向量數(shù)據(jù)庫的生存空間越來越少了。幾周前你們采訪了 Turbopuffer 公司,我記得他把自己的產(chǎn)品描述為一個搜索平臺,或者說搜索工具。我認(rèn)為這正是那些曾經(jīng)自稱為向量數(shù)據(jù)庫的公司目前的轉(zhuǎn)型方向。

      隨著所有人都把向量搜索作為標(biāo)配功能加入自己的產(chǎn)品,“夠用就好”的水平已經(jīng)足以應(yīng)對絕大多數(shù)場景了,這進(jìn)一步擠壓了它們的生存空間。

      主持人:我也覺得是這樣。我認(rèn)為大家在做宣傳時,都應(yīng)該誠實(shí)地說明:到底在多大的數(shù)據(jù)規(guī)模、多高的數(shù)據(jù)復(fù)雜度和基數(shù)下,你們的產(chǎn)品才是真正卓越的?在哪些場景下,由于你們特殊的架構(gòu)設(shè)計(jì),你們的解決方案能把競爭對手遠(yuǎn)遠(yuǎn)甩在身后?如果在小規(guī)模數(shù)據(jù)下,誰會在乎呢?隨便用什么工具都能跑通。但一旦達(dá)到規(guī)?;?,這些差異就變得至關(guān)重要了。

      Emil:我同意。對我們來說,向量搜索是這樣融入體系的:你有一個 RAG 語料庫,并且有一套數(shù)據(jù)管道,將這些數(shù)據(jù)處理成可查詢的狀態(tài),最終喂給大模型。我們會利用這套攝取管道和向量搜索索引中的嵌入(embeddings),來填充我們的圖數(shù)據(jù)庫。然后在查詢時,我們通常會用向量搜索來找到圖中的“起始節(jié)點(diǎn)”,接著從那里開始進(jìn)行圖遍歷。

      舉個經(jīng)典的客服場景:Swyx 剛買了一臺新筆記本,發(fā)現(xiàn)權(quán)限設(shè)置有問題,于是你去蘋果的售后網(wǎng)站輸入了你的疑問。面對這段自然語言,系統(tǒng)通常會先跑一次向量搜索,往往還會結(jié)合類似 BM25 的關(guān)鍵詞搜索。這步操作可能會撈出,比如說 100 篇文檔。

      接著,你從這些文檔節(jié)點(diǎn)出發(fā)進(jìn)行圖遍歷,去獲取完整的上下文。

      最后系統(tǒng)會進(jìn)行綜合判斷:它不僅僅看這些文檔是否被向量搜索命中,還會發(fā)現(xiàn)“原來這些文檔是某位高權(quán)重作者寫的”——這個權(quán)重可能是通過 PageRank 算法算出來的,也可能只是簡單的星級評分或類似信號,綜合這些因素,你最終得到了最精準(zhǔn)的前 K 篇文檔。所以,這從來不是“圖搜索”與“向量搜索”的二選一,而是向量搜索與圖遍歷的珠聯(lián)璧合。這是我們目前看到的最典型的模式。

      主持人:而且這里的工程實(shí)現(xiàn)其實(shí)極其困難,因?yàn)槟惚仨氃跓o數(shù)的利弊中做權(quán)衡、權(quán)衡、再權(quán)衡。如果你有無限的預(yù)算,當(dāng)然無所不能,但現(xiàn)實(shí)并非如此。所以拋開 Neo4j 不談,我認(rèn)為業(yè)界有一個大趨勢:大家都在試圖從數(shù)據(jù)攝取管道中榨取更多的信號,以優(yōu)化后續(xù)的查詢……你可以稱之為預(yù)處理,總而言之,就是在把數(shù)據(jù)丟進(jìn)向量搜索之前,盡可能多地提取出有價(jià)值的信號。

      Emil:在向量數(shù)據(jù)庫的語境里,你們通常把這叫作“元數(shù)據(jù)”,但它的本質(zhì)其實(shí)就是結(jié)構(gòu)化數(shù)據(jù)。我們也是這股大趨勢的一部分。你可以把“圖”視為一種極其豐富的結(jié)構(gòu)化數(shù)據(jù)。我認(rèn)為這才是正確的認(rèn)知方式。你在上游下的功夫越深,在運(yùn)行時或查詢時的負(fù)擔(dān)就越輕。


      欺詐、身份與實(shí)時上下文

      主持人:讓我們聊聊應(yīng)用場景吧。我覺得去年最讓人驚喜的案例之一就是輝瑞(Pfizer)的演講,那真的很酷。你們有如此龐大的客戶群,在那些走在 AI 前沿的客戶中,有哪些是大家萬萬想不到會使用圖數(shù)據(jù)庫,或者用 Neo4j 來做某些事情的?

      Emil:這里面可聊的太多了。

      其中一個巨大的跨越是,人們現(xiàn)在已經(jīng)真正將它投入生產(chǎn)環(huán)境了。兩年前一切還處于非常早期的階段。你提到了輝瑞。我們看到圖數(shù)據(jù)庫在生命科學(xué)領(lǐng)域得到了廣泛應(yīng)用。廣義上講,這就是這些大型生命科學(xué)公司的研究員們每天都在使用的“科學(xué)智能”。它不僅能接入內(nèi)部的同行研究,還能檢索專利、外部發(fā)表的學(xué)術(shù)論文等等。這是我們公開的案例之一:超過 6000 萬份文檔,數(shù)十億個節(jié)點(diǎn)和關(guān)系。他們使用了大量精巧的命名實(shí)體識別(NER)和實(shí)體解析技術(shù)。順便說一句,實(shí)體解析在目前的 AI 工程界嚴(yán)重被低估和忽視了,我完全不理解為什么會這樣,但這正是他們從海量數(shù)據(jù)中理出頭緒的關(guān)鍵。你想想,一家生命科學(xué)公司可是博士扎堆的地方。這套系統(tǒng)絕對是他們提升生產(chǎn)力和科研產(chǎn)出的核心命脈。這就是一個典型例子。

      就在 2026 年,我們在銀行業(yè)迎來了爆發(fā)式的增長。舉個例子,今年到目前為止,我們關(guān)于 AI 的業(yè)務(wù)洽談中,有 30% 都是和全球性銀行進(jìn)行的,這非常驚人。其中一個案例(我不知道我們官網(wǎng)上有沒有放),是一家巨型抵押貸款公司。他們雇傭了大量的銀行業(yè)務(wù)員,他們管這些人叫“Agent”,這在現(xiàn)在的語境下很容易讓人誤解,但他們確實(shí)是活生生的人類。這些人類業(yè)務(wù)員大多是二十出頭的年輕人,人員流失率極高,平均任期不到一年。

      因此,這場游戲的核心挑戰(zhàn)就是如何讓他們快速上手。當(dāng)他們向客戶推銷時,你如何能讓業(yè)績墊底的四分之一員工迅速提升水平?于是,他們構(gòu)建了一個龐大的系統(tǒng),審視了過往所有成功的銷售路徑,分析了過去真正促成轉(zhuǎn)化的因素,并將這些經(jīng)驗(yàn)匯總起來。他們其實(shí)在公開場合分享過這個案例,雖然沒提 Neo4j 的名字,但他們明確表示這套系統(tǒng)讓轉(zhuǎn)化率提升了 20%。這些都是最近發(fā)生的事。

      主持人:如果把這 20% 換算成真金白銀,那是多大一筆錢?。?/p>

      Emil:我不知道具體數(shù)字,但肯定比他們付給我們的軟件費(fèi)多得多!不過真正酷的是,今年他們開始將這個流程自動化了。以前,系統(tǒng)只是給業(yè)務(wù)員提供話術(shù)草稿,再由人工發(fā)送短信或郵件?,F(xiàn)在,他們自然而然地把“人”從這個閉環(huán)中移除了,系統(tǒng)直接自動發(fā)送??吹饺藗?nèi)绱搜杆俚貙⑦@些技術(shù)投入到直面客戶的生產(chǎn)環(huán)境中,真的非常震撼。去年夏天我們盤點(diǎn)客戶案例時,幾乎還沒有人敢把這些技術(shù)用在直面客戶的生產(chǎn)線上。但在過去的三個月里,風(fēng)向發(fā)生了極其劇烈的轉(zhuǎn)變。

      主持人:你提到“過去的三個月”,這剛好印證了我一直在研究的一個猜想。2025 年 12 月肯定發(fā)生了一些事,當(dāng)時隨著 Claude Opus 4.5 等模型的發(fā)布,許多數(shù)據(jù)曲線都出現(xiàn)了拐點(diǎn)。你們也觀察到這個現(xiàn)象了嗎?

      Emil:我們確實(shí)看到了。不過我不太相信這僅僅是因?yàn)?Opus 4.5 的發(fā)布,感覺這背后還有別的推手。

      主持人:當(dāng)然還有 GPT。但無論是在哪種數(shù)據(jù)庫里,每一張圖表的走勢都驚人的一致……顯然,我能看到很多全行業(yè)的數(shù)據(jù)和統(tǒng)計(jì)。作為大約 30 家公司的天使投資人,加上我通過 Cognition(AI 編程公司)看到的內(nèi)部數(shù)據(jù),每一張算力消耗圖表都在飆升,每一張數(shù)據(jù)庫使用圖表都在飆升,所有 AI 編程代理的圖表也都在飆升。絕對有大事在發(fā)生。

      Emil:確實(shí)有大事發(fā)生。對我們而言,我不確定這是否純粹是模型質(zhì)量提升帶來的,但我們確實(shí)感受到了這股浪潮。一個重大的轉(zhuǎn)變就像我剛才說的:過去人們的訴求是“幫我起草信息”,現(xiàn)在變成了“替我發(fā)送信息”。這種直面客戶的完全自動化,顯然在“信任度”上達(dá)到了某種臨界點(diǎn),所以企業(yè)才敢放手去做。

      還有一個例子,如果說剛才聊的是企業(yè)宏觀層面的動向,那我們現(xiàn)在把視角切到微觀層面,看看單個開發(fā)者、單個應(yīng)用是怎么做的——這也是我兩年前那場 GraphRAG 演講所探討的邊界。

      你可以想想人們現(xiàn)在是如何編寫基于圖的 Agent 應(yīng)用的。圖數(shù)據(jù)庫是一個工具,向量數(shù)據(jù)庫可能也是一個工具。然后系統(tǒng)接收到一段英文,或者說一段自然語言。過去業(yè)界的最佳實(shí)踐是:把你最常收到的高頻問題提取出來。再拿客服系統(tǒng)舉例(這是最直觀的,當(dāng)然還有很多其他場景),比如 Swyx 去蘋果官網(wǎng)提問。開發(fā)者會把這些高頻問題直接封裝成 Cypher 查詢語言的函數(shù)或工具。只有當(dāng)這些預(yù)設(shè)工具失效時,才會把通用的“自然語言轉(zhuǎn) Cypher”作為兜底方案。

      客戶以前通常是怎么干的呢?他們會坐下來,死死盯著那些觸發(fā)了兜底方案的日志。找出那些沒能成功解析的查詢,然后把它們單獨(dú)抽離出來,寫成一個新的函數(shù)或工具調(diào)用。這曾經(jīng)是大家的常規(guī)操作。大約一年前,你在其他數(shù)據(jù)庫和 Agent 應(yīng)用里也能看到類似的打法。但在過去的三個到六個月里,游戲規(guī)則被顛覆了。過去是“優(yōu)先使用專用函數(shù),通用大模型兜底”,現(xiàn)在完全反過來了?,F(xiàn)在的做法是:直接用通用的自然語言轉(zhuǎn) Cypher 開局,只有當(dāng)它搞不定時,你才把那些邊緣場景提取出來寫成專用函數(shù)。我認(rèn)為在整個技術(shù)棧上下,發(fā)生了一系列質(zhì)變,促成了這三到六個月以來的大反轉(zhuǎn)。

      主持人:因?yàn)楝F(xiàn)在大模型基本上可以一次性(single-shot)搞定大部分查詢了。

      Emil:沒錯。

      主持人:這讓我想起了我經(jīng)常聊的一個關(guān)于“大模型編程”的話題。當(dāng)年我參加完那個 Cypher 工作坊后,就再也沒怎么用過它,最大的原因在于它是一門領(lǐng)域特定語言(DSL)。

      我當(dāng)時就想:我真的有必要再去學(xué)一門 DSL 嗎?但現(xiàn)在看來,DSL 的存在是有充分理由的:它們?yōu)樘囟▓鼍白龅搅藰O致優(yōu)化,語法極其精煉,而且能精準(zhǔn)地處理各種復(fù)雜邏輯。唯一的缺點(diǎn)就是學(xué)習(xí)成本高。但現(xiàn)在,你根本不需要親自去學(xué)了。你們的 Cypher 恰好是一門擁有海量訓(xùn)練數(shù)據(jù)的 DSL。所以你們成功跨過了那道門檻——你們在這個行業(yè)扎根足夠久,熬過了周期的起伏,積累了足夠的數(shù)據(jù),現(xiàn)在人們完全可以零門檻地自由使用你們的產(chǎn)品。當(dāng)然,如果需要的話,他們依然可以手動優(yōu)化。但除此之外,大部分時候你只需要丟給大模型一次提示詞就能搞定,這體驗(yàn)簡直太棒了。

      Emil:我完全同意。我再補(bǔ)充幾點(diǎn)想法。首先,我們得益于成為了一個真正的 ISO 國際標(biāo)準(zhǔn)。它在 2015 年最初名為 openCypher,在經(jīng)歷了無數(shù)次的拉鋸和繁瑣的標(biāo)準(zhǔn)制定流程后,最終演變成了 GQL,這也是 SQL 誕生以來的第一門“兄弟語言”。我認(rèn)為這為 LLM 的訓(xùn)練數(shù)據(jù)提供了一個非常強(qiáng)烈的質(zhì)量信號。這是一方面。

      話雖如此,在我們內(nèi)部的產(chǎn)品矩陣中,依然運(yùn)行著許多自研的自然語言轉(zhuǎn) Cypher 工具,就像那種老派的 Copilot 輔助工具。如果你打開 Neo4j 的瀏覽器控制臺,準(zhǔn)備手敲 Cypher 查詢時,你當(dāng)然可以呼出 Copilot 幫你翻譯自然語言。你也可以在我們的架構(gòu)上運(yùn)行各種 Agent,所以我們必須把這種能力作為平臺的底層原語。實(shí)際上,我們至今仍在對這些內(nèi)部模型進(jìn)行微調(diào),即使我們在默認(rèn)情況下調(diào)用了 Gemini 模型,我們依然會做一些針對性的微調(diào),甚至加入一些后處理步驟。

      主持人:你說的“微調(diào)”,是指你們微調(diào)了一個專門生成自然語言轉(zhuǎn) Cypher 的自定義模型,還是說你們只是在輸出端的游樂場(playground)做一些提示詞層面的調(diào)整?

      Emil:不,我們是在微調(diào)一個真正的底層模型。

      主持人:據(jù)我所知,外部用戶應(yīng)該是沒法直接微調(diào) Gemini 模型的吧?

      Emil:這方面我們內(nèi)部可能使用的是某個開源的衍生模型。具體是哪個我也不太清楚。但隨后我們甚至?xí)右徊胶筇幚?,寫一些真正的指令式代碼,比如用正則表達(dá)式去糾正代碼里的箭頭方向。你知道的,在 Cypher 語法里,你得用不同的箭頭方向來描述關(guān)系的走向?,F(xiàn)實(shí)情況其實(shí)比想象的要雜亂一些……目前的開箱即用模型,還不足以完美應(yīng)對所有情況。我當(dāng)然希望——哪怕這像是一劑苦藥——隨著時間的推移,大模型最終能搞定 99% 的場景,但目前我們還沒到那一步。


      GraphRAG 與智能體記憶

      主持人:我覺得這正是專家發(fā)揮價(jià)值的地方,也是擁有一個成熟生態(tài)系統(tǒng)的意義所在。至少在當(dāng)下,這依然是人類專家的領(lǐng)地。我想把話題拉回到應(yīng)用場景,聊聊大家正在做的那些酷事。顯然,在傳統(tǒng)的推薦系統(tǒng)、欺詐檢測等領(lǐng)域,圖數(shù)據(jù)庫已經(jīng)大展拳腳了。

      去年我開了一個關(guān)于“大模型推薦系統(tǒng)”的專欄,看起來大模型正在吞噬傳統(tǒng)的推薦系統(tǒng),而且我認(rèn)為圖數(shù)據(jù)庫在其中也有非常巧妙的用武之地。據(jù)說現(xiàn)在整個 YouTube 的推薦系統(tǒng)都是基于大模型驅(qū)動的。他們把每一個視頻都轉(zhuǎn)化為 token 存進(jìn)密碼本里,然后用它來訓(xùn)練一個大模型。就像使用普通大模型一樣,系統(tǒng)會把你的歷史上下文喂進(jìn)去,讓它預(yù)測你接下來該看哪些“視頻 token”。這簡直太瘋狂了。

      Emil:這確實(shí)相當(dāng)酷。我之前都不知道。

      主持人:我認(rèn)識的推薦系統(tǒng)專家,比如業(yè)內(nèi)大牛 Eugene Yan,極其看好這個方向。顯然,X(推特)的新算法,以及 Pinterest 的推薦引擎,背后也是這套邏輯在驅(qū)動。這在他們的圈子里已經(jīng)火得一塌糊涂了,確實(shí)很酷。不過這種體驗(yàn)有時也挺讓人不適的。我的推薦流里確實(shí)出現(xiàn)過一些極其詭異的內(nèi)容,那是傳統(tǒng)系統(tǒng)絕對不會推給我的。但無所謂了,這是一個全新的世界,所有人都在拼命挖掘數(shù)據(jù)信號。而且我敢肯定,如果這世上有一家公司把 A/B 測試做到了極致,那絕對是 YouTube。

      所以說回正題,你目前觀察到了哪些新的工作負(fù)載或應(yīng)用場景,是你特別想推薦大家去嘗試的?

      Emil:現(xiàn)在行業(yè)里有大量的新奇嘗試,我非常喜歡這種氛圍。在過去的十年里,我們一直將火力集中在“全球 2000 強(qiáng)”企業(yè)上。我剛才也舉了幾個例子,比如生命科學(xué)、金融服務(wù),這類案例我能給你講上一整天。但在過去的一兩年里,我們也開始有些“回歸初心”了。我們現(xiàn)在推出了一個初創(chuàng)企業(yè)扶持計(jì)劃。我們的云服務(wù) Aura,無論是在產(chǎn)品形態(tài)還是價(jià)格門檻上,都非常適合創(chuàng)業(yè)公司。這是個極好的轉(zhuǎn)變。

      當(dāng)然,現(xiàn)在最火爆的一個場景就是“智能體記憶(Agentic Memory)”。很多人都想在圖結(jié)構(gòu)上構(gòu)建記憶系統(tǒng)。很少有人注意到一點(diǎn):最初發(fā)布的 MCP(模型上下文協(xié)議)里,其實(shí)內(nèi)置了一個微型的內(nèi)存圖數(shù)據(jù)庫。

      主持人:才 200 行代碼。我印象中也就 300 行左右的 Python 代碼吧。

      Emil:是的,差不多就是那樣。所以它只是個玩具,非常簡陋,而且是純內(nèi)存實(shí)現(xiàn)的。但它的底層邏輯是圖結(jié)構(gòu)的,這就很酷了。我當(dāng)然喜聞樂見?,F(xiàn)在有很多人自然而然地開始往這個方向探索。然后當(dāng)然就是過去三個月里,圈內(nèi)熱議的“上下文圖譜(Context Graphs)”。我們看到很多人正在嘗試構(gòu)建這類系統(tǒng),我認(rèn)為這也是圖數(shù)據(jù)庫的一個絕佳應(yīng)用場景。

      主持人:好的,“記憶”完全可以單開一個大話題了。我不知道今天有沒有時間深入聊。簡單說說我的淺見:理論上,圖數(shù)據(jù)庫簡直是構(gòu)建記憶的完美載體。但在實(shí)踐中,這可能有點(diǎn)殺雞用牛刀了。大多數(shù)人的記憶根本追溯不到那么遠(yuǎn),而且我認(rèn)為我們至今還沒摸透,那種能跨越超長時間維度的“記憶”到底該是什么結(jié)構(gòu)。弄不好一個單文件就裝得下!畢竟我個人也產(chǎn)出不了那么多 token。

      但說到“上下文圖譜”,那是另一碼事。我常說:我根本不在乎你的大模型上下文窗口有多長。我們花了三年時間,才讓所有前沿模型的上下文從 10 萬突破到 100 萬。但我們不可能做到十億、萬億級的硬塞,你必須依靠上下文圖譜和上下文鏈接。你是怎么看待最近關(guān)于上下文圖譜的討論的?這個話題真的徹底出圈了。我們之前和論文作者錄過一期簡短的播客。我覺得他們其實(shí)是在“留白”,任由大家去解讀。我想接下來會有很多人去構(gòu)建上下文圖譜系統(tǒng),我們在摸著石頭過河中自然會定義它。但作為早期觀察者,你有什么見解?

      Emil:我的看法是,它補(bǔ)全了我腦海中“數(shù)據(jù)源四象限”的最后一塊拼圖。我一直強(qiáng)調(diào),Agent 要想在生產(chǎn)環(huán)境中達(dá)到“逃逸速度”(真正爆發(fā)),必須依賴這四個象限的數(shù)據(jù)源。我認(rèn)為所需的數(shù)據(jù)源不多不少剛好四種,如果你能想出第五種或第六種,我洗耳恭聽。但我堅(jiān)信核心就是這四種。倒不是說你非得集齊四顆龍珠才能召喚神龍,但在某種程度上,自然是多多益善。

      我認(rèn)為 Agent 的第一種數(shù)據(jù)源是業(yè)務(wù)數(shù)據(jù)庫。這是記錄系統(tǒng)的基石。我把它們視為“記錄當(dāng)下的系統(tǒng)”。比如:我現(xiàn)在有多少客戶?某個特定客戶當(dāng)下的價(jià)值是多少?在平時的討論中,我們有時會把架在業(yè)務(wù)數(shù)據(jù)庫之上的應(yīng)用層叫做記錄系統(tǒng)——比如我們會說 Salesforce 是記錄系統(tǒng);有時又會把底層數(shù)據(jù)庫本身稱為記錄系統(tǒng)。但無論怎么稱呼,業(yè)務(wù)數(shù)據(jù)庫絕對占據(jù)了第一象限。

      第二象限,我認(rèn)為是云數(shù)據(jù)倉庫。有人說數(shù)倉算不上記錄系統(tǒng),我倒覺得它們也是。它們是“記錄過去的系統(tǒng)”。如果說業(yè)務(wù)數(shù)據(jù)庫記錄的是當(dāng)下,那數(shù)倉記錄的就是歷史。比如:我們在第三季度從拉美地區(qū)獲得了多少營收?諸如此類。然后,第三象限在我看來就是“記憶”。

      主持人:就是 OLAP(聯(lián)機(jī)分析處理)對吧?所以前兩個是 OLTP(聯(lián)機(jī)事務(wù)處理)和 OLAP。你剛才提到了 DSL,這也是個數(shù)據(jù)領(lǐng)域的術(shù)語,領(lǐng)域特定語言。不過對,它主要是個編程術(shù)語。

      Emil:然后第三象限就是智能體記憶。或者叫智能體狀態(tài),你可以把它理解為記錄智能體狀態(tài)(比如短期狀態(tài)、長期狀態(tài))的系統(tǒng)。

      最后,第四象限就是上下文圖譜。那它到底是什么呢?它其實(shí)是在回答第一和第二象限里那些冷冰冰的數(shù)據(jù)背后的“為什么”。舉個經(jīng)典例子:我以某個價(jià)格把產(chǎn)品賣給了客戶,這個價(jià)格是在目錄價(jià)基礎(chǔ)上打了八折,但公司的紅線是最多打九折。那么“為什么”能破例呢?原因可能是:我想借此打入這個垂直行業(yè),或者這片地域市場,而且我得到了銷售副總裁的特批——這個批準(zhǔn)可能是在電話里、Slack 上,或者是郵件里發(fā)生的。它并沒有被正式記錄在任何系統(tǒng)里。這些所謂的“決策軌跡”,最終交織成了一張網(wǎng)絡(luò),這就是他們所說的上下文圖譜。

      如果我們目前的大方向,是努力將決策權(quán)從人類的大腦轉(zhuǎn)移到 Agent 的大腦中——過去我們說這是從“濕件(人腦)”向軟件的轉(zhuǎn)移,現(xiàn)在我甚至不知道該怎么稱呼大模型了,也許是從“濕件”向“隱空間”的轉(zhuǎn)移——那么,能夠獲取這些機(jī)構(gòu)內(nèi)部的隱性知識,了解大企業(yè)里事情到底是怎么運(yùn)轉(zhuǎn)的、決策究竟是怎么做出的,就顯得極其寶貴了。這就是我說的四個象限。關(guān)于上下文圖譜我還能聊很多,但首先,你認(rèn)同這四個象限的劃分嗎?你能想到第五或者第六個嗎?

      主持人:這四個里有三個我是舉雙手贊成的。但說實(shí)話,智能體記憶——我覺得它稍微有點(diǎn)站不住腳,或者說還不夠成熟,體量也偏小。

      第一、第二和第四象限(業(yè)務(wù)庫、數(shù)倉、上下文圖譜)都是極其強(qiáng)大、極其龐大的品類,我閉著眼睛都知道該怎么去架構(gòu)它們。但第三個象限,感覺就只是一句含糊其辭的“某種記憶”。我覺得這背后應(yīng)該還有更深的東西。

      當(dāng)我們在構(gòu)建二維四象限矩陣時,OLAP 和 OLTP 是一組完美的對立面,它們代表了查詢廣度和事務(wù)吞吐量的維度。那么另一個坐標(biāo)軸應(yīng)該與它是正交的,但我目前還看不透那個軸到底是什么。所以它并不完全契合傳統(tǒng)的四象限模型,這通常意味著,這里面可能還混入了一個我們沒有察覺的第三維度。因?yàn)樗^的智能體記憶,很可能更多是偏向個人的,最多帶點(diǎn)組織屬性;而上下文圖譜則是徹頭徹尾的組織級資產(chǎn)。這是我的直覺反應(yīng),不過除非你還有別的想補(bǔ)充,我們大可以只聊上下文圖譜。

      Emil:聽到你這么說很有意思。我認(rèn)為智能體記憶的本質(zhì)是:“我想弄清楚過去在這個特定個體身上到底發(fā)生了什么。”我相信在許多應(yīng)用場景中,它會成為一個極其重要的檢索源,盡管可能不是全部。

      主持人:那讓我用自己的話來總結(jié)一下:智能體記憶,記錄的是你和 Agent 之間發(fā)生的交互;而上下文圖譜,記錄的是你和其他所有人之間發(fā)生的故事。因?yàn)槲铱吹?,現(xiàn)在所有的 Agent 公司都在拼命研究如何查詢模型自身的歷史軌跡、如何記憶知識,并以此來實(shí)現(xiàn)自我進(jìn)化,這其實(shí)跟上下文圖譜八竿子打不著。它的核心訴求純粹就是:這個 Agent 應(yīng)該越用越順手。

      Emil:確實(shí),我覺得你說的完全正確?,F(xiàn)在我們專門聊聊上下文圖譜。我認(rèn)為將企業(yè)的隱性知識以某種數(shù)字化的形式進(jìn)行編碼,是非常有戰(zhàn)略意義的。

      這又回到了我們常說的那個比喻:你招了一個擁有博士智商的實(shí)習(xí)生(大模型),但他每天醒來都會失憶,對公司的過去一無所知。所以這套系統(tǒng)很有必要。

      但真正的難點(diǎn)在于:你如何通過技術(shù)手段去“埋點(diǎn)”你的組織,從而獲取這些數(shù)據(jù)?我想大家都能預(yù)見到那個美好的未來:我的 Agent 已經(jīng)在生產(chǎn)線上跑起來了,就像我剛才舉的例子,我有一套智能化的流程,能自動聯(lián)系客戶并給他們提供房貸折扣。當(dāng)系統(tǒng)在做這些事時,它理應(yīng)被全程監(jiān)控記錄,將整個決策鏈路保存下來,作為未來自我進(jìn)化的養(yǎng)料。你能清晰地感覺到這種復(fù)利效應(yīng),或者說飛輪效應(yīng)。

      理想很豐滿,但我們現(xiàn)在還沒到那一步。目前,我們根本沒有這些數(shù)據(jù)的數(shù)字化載體。最典型的現(xiàn)實(shí)場景是:一個銷售員坐在車?yán)锝o老板打電話申請折扣,老板隨口答應(yīng)了,單子簽了,最后頂多在 Salesforce 里留個底。這就是當(dāng)下的常態(tài)。

      那么問題來了:我們該如何冷啟動這個上下文圖譜呢?這幾乎是我近期與所有大型企業(yè)客戶和初創(chuàng)公司交流時,繞不開的核心話題。對于初創(chuàng)公司來說,上下文圖譜的冷啟動依賴于用戶對他們產(chǎn)品的使用。所以對他們而言,圖譜不是問題,問題是如何讓用戶用起來。但在大型企業(yè)的語境下——一語雙關(guān)哈——問題最終變成了:我到底該如何開始這套“埋點(diǎn)”工作,才能積攢足夠的決策軌跡,從而冷啟動整個流程?這才是真正耐人尋味的博弈。


      建模、工具鏈與開發(fā)者體驗(yàn)

      主持人:初創(chuàng)公司對你們來說到底有多大價(jià)值?你們手里握著財(cái)富 100 強(qiáng)里的 80 家,你們的靶心一直是全球 2000 強(qiáng)企業(yè)。至于初創(chuàng)公司,哪怕有免費(fèi)檔之類的,他們也提供不了多少真金白銀吧。

      Emil:也許我可以從創(chuàng)始人兼 CEO 的雙重身份來回答這個問題。十年前,我們審視公司的營收結(jié)構(gòu),發(fā)現(xiàn)它是三分天下的:估值十億美元以上的大客戶占三分之一,中端市場占三分之一,初創(chuàng)公司占三分之一。但我們敏銳地發(fā)現(xiàn),那“十億美元以上”客戶群體的所有底層商業(yè)指標(biāo),都碾壓其他兩塊。接著我們又研究了所有形成規(guī)模的數(shù)據(jù)庫巨頭——主要就是甲骨文,當(dāng)然還有 DB2——他們 80% 以上的營收都來自全球 2000 強(qiáng)。很顯然,這才是數(shù)據(jù)庫公司真正的變現(xiàn)池。我們綜合了這些信息,最后拍板決定:必須 100% 全力進(jìn)軍企業(yè)級市場。

      事后證明,這是一個極其正確的商業(yè)決策。

      作為 CEO 來說,我愛死這個決定了,它獲得了空前的成功,這也是我今天能坐在這里侃侃而談的原因。一切都很完美。

      但作為創(chuàng)始人,我又有些失落,因?yàn)閯?chuàng)業(yè)者才是我的同路人,他們代表著未來。所以,當(dāng)新一代 AI 原生初創(chuàng)公司如雨后春筍般涌現(xiàn)時,我們意識到:將 Neo4j 嵌入他們的底層架構(gòu),對我們來說至關(guān)重要。

      這倒不是指望他們能立刻貢獻(xiàn)海量的年度經(jīng)常性收入。我從美國銀行身上賺到的錢永遠(yuǎn)會更多——這只是個泛泛的例子,沒泄露什么機(jī)密,我只能透露北美最大的 20 家銀行全都是我們的客戶,剩下的你們自己品。

      總之,我永遠(yuǎn)會從企業(yè)級市場賺到大頭。但我認(rèn)為,融入這個時代的精神浪潮是極其重要的。從這個角度來看,讓下一代初創(chuàng)公司在 Neo4j 上生根發(fā)芽,具有不可估量的戰(zhàn)略意義。

      主持人:按理說,初創(chuàng)公司的歷史包袱比大企業(yè)輕得多,所以應(yīng)該更容易上手。那么到目前為止,你們總結(jié)出了哪些最佳實(shí)踐?你可以挑任何一個客群來聊,說實(shí)話我對兩者都很感興趣。他們到底該如何邁出第一步?

      Emil:這取決于你所處的飛行高度。如果是一家初創(chuàng)公司,那就不單單是做一個產(chǎn)品的問題了,產(chǎn)品就是公司的全部。那就是孤注一擲。

      但這在大型企業(yè)的語境下是截然不同的,在企業(yè)里我們通常在兩個層面上展開合作。一個是聚焦于單一應(yīng)用、單一項(xiàng)目的微觀層面;另一個則是橫跨整個企業(yè)的宏觀層面。

      我先著重聊聊后者吧,因?yàn)檫@也是自兩年前那場 GraphRAG 演講以來發(fā)生的一個巨變。我們觀察到一個非常清晰的趨勢,我們通常將其稱為“知識層”。我們接觸了許多企業(yè),發(fā)現(xiàn)大家面臨著一個共同的痛點(diǎn):他們內(nèi)部的每一個數(shù)據(jù)源,未來都會暴露出某種 MCP 接口。企業(yè)希望讓他們的 Agent 能夠接入這些數(shù)據(jù)。那該怎么做呢?一種簡單粗暴的做法是,直接把所有 MCP 接口的權(quán)限都扔給 Agent,讓它自己去摸索。但這會帶來一個致命問題:系統(tǒng)確實(shí)能跑通,但不同數(shù)據(jù)源里的數(shù)據(jù)是會打架的。

      我們剛才提到過我們的云服務(wù)。哪怕是我自己,當(dāng)我想弄清楚我們的云服務(wù)到底有多少客戶時,我去問底層的云平臺,它告訴我,比方說有 3000 個客戶。這里的口徑是“有多少個活躍的、正在運(yùn)行數(shù)據(jù)庫的賬戶”。然后我轉(zhuǎn)頭去問財(cái)務(wù)系統(tǒng),它卻告訴我只有 2800 個客戶,因?yàn)樗目趶绞恰敖壎诵庞每ǖ馁~戶”。你該如何理清這其中的邏輯?我們正在吸取一個教訓(xùn):大模型永遠(yuǎn)會信誓旦旦地給你一個答案,但你根本不知道它是對是錯,而且查證起來極為困難。

      所以,我們現(xiàn)在和很多大企業(yè)探討的方案是:他們需要自己掌控一個中間層,在這個層面上,將企業(yè)內(nèi)部所有數(shù)據(jù)的元數(shù)據(jù)整合起來。這才能為你提供一致性、信任度以及可解釋性。那么,他們究竟想掌控哪些元數(shù)據(jù)呢?本質(zhì)上就是整個企業(yè)的數(shù)據(jù)資產(chǎn)全景圖。你的關(guān)系型數(shù)據(jù)庫里有哪些表結(jié)構(gòu)?你的 S3 里有哪些存儲桶?等等。將這些信息以圖的形式表達(dá)出來,并與面向業(yè)務(wù)的本體論相結(jié)合。比如:什么是“客戶”?“客戶”與“供應(yīng)商”之間是什么關(guān)系?我的業(yè)務(wù)線里到底有哪些核心概念?

      主持人:這太難了。你問五個人,能得出六種答案。

      Emil:一針見血。這正是過去一直阻礙這項(xiàng)工程推進(jìn)的死穴。但現(xiàn)在情況變了:為了讓 Agent 在特定場景下成功落地,企業(yè)被逼著必須解決這個問題。這種倒逼機(jī)制,迫使他們在內(nèi)部達(dá)成某種“只要夠 Agent 用就行”的共識。然后第三塊拼圖就是這兩者之間的映射關(guān)系。有人管這叫語義層,有人叫上下文層。我個人偏愛“知識層”這個詞。它們指代的意思大同小異但又略有區(qū)別,這絕對是我們當(dāng)下最火爆的應(yīng)用場景。

      如果你去我們官網(wǎng),或者直接谷歌搜索“l(fā)eading media company”加上 Neo4j,你會看到一個案例。頁面往下拉,有一張漂亮的綠色架構(gòu)圖。最底層是各自為戰(zhàn)的數(shù)據(jù)孤島,中間是他們所說的“語義層”,最頂層則是運(yùn)行其上的 Agent 群。這里有幾種不同的玩法,比如你可以做零拷貝。在這種模式下,知識層只負(fù)責(zé)提供一張“尋寶圖”,告訴 Agent 到底該去哪里查數(shù)據(jù);或者在某些情況下,我們會將部分高頻數(shù)據(jù)直接內(nèi)聯(lián)到知識層里,這樣 Agent 就能在這一層直接完成查詢。

      主持人:“零拷貝”具體是指什么來著?我記得是 Salesforce 發(fā)明,或者至少是帶火了這個詞。意思是不是說,你不再需要把數(shù)據(jù)在 Snowflake 和各種系統(tǒng)之間搬來搬去,而是建立一個虛擬化層,直接把指針打到原始數(shù)據(jù)源上?

      Emil:也就是外部數(shù)據(jù)封裝器(Foreign Data Wrapper)。完全正確。

      主持人:你聽得出來我是個重度 Postgres 玩家。

      Emil:哈哈,聽出來了。所以順著查詢鏈路,你最終會到達(dá)這個中間層,由它來弄清數(shù)據(jù)到底藏在哪里。有時候數(shù)據(jù)也會被物化到這一層,這樣你就能直接查詢了。所以,這是目前企業(yè)級市場里極其搶手的一個場景。

      不過,我想你的原問題是:新手入坑的最佳實(shí)踐是什么?我們剛才聊了上下文圖譜。最近出了一個非常精妙的 Python 封裝工具,叫UVX create-context-graph,它開箱即用地為你提供了,我沒記錯的話,22 個不同行業(yè)的上下文圖譜模板。這玩意兒幾天前剛發(fā)布,它能一鍵拉起一個帶有前端界面的完整 Neo4j 實(shí)例。而且它的設(shè)計(jì)靈感——你肯定會愛死這個——毫無疑問是借鑒了create-react-app。所以你能獲得一種極其絲滑的交互體驗(yàn)……它不僅能幫你處理你自己的數(shù)據(jù),你還可以直接從預(yù)設(shè)的行業(yè)模板里挑。

      主持人:哇哦。

      Emil:沒錯。而且它已經(jīng)無縫集成了八九個不同的 Agent 平臺。

      主持人:唯一遺憾的是,我最想要的那一個,偏偏不在里面。

      Emil:哪個?

      主持人:社交媒體。

      Emil:有意思,行,我們可以把它加上。


      未來的“圖狀”互聯(lián)網(wǎng)

      主持人:我的觀點(diǎn)是,每一個 SaaS 軟件,最終都會在其賬號認(rèn)證體系內(nèi)孕育出一個社交圖譜。你需要團(tuán)隊(duì)協(xié)作,你需要用戶互發(fā)消息,你需要推送通知。社交媒體的元素會滲透進(jìn)每一個細(xì)分領(lǐng)域。它甚至都不算是一個垂直領(lǐng)域,它就是一套基礎(chǔ)特性。

      我以前其實(shí)研究過把這個做成一門生意,后來發(fā)現(xiàn)別人試過但沒跑通。但其核心訴求就是:把“社交網(wǎng)絡(luò)”作為一個插件,直接空投到我的用戶庫里。因?yàn)槲业拿恳粋€用戶,都在團(tuán)隊(duì)中工作,他們有關(guān)注關(guān)系,他們想要信息流,想要通知,想要私信,甚至想寫博客。這些全都是社交功能,他們自己絕對懶得從頭開發(fā),但他們又實(shí)打?qū)嵉匦枰2还茉趺凑f,這個工具真的很酷。

      Emil:所以這個工具的作用就是幫你掃平起步的障礙,它還能自動生成一些合成數(shù)據(jù)。它同樣集成了許多 SaaS 工具。我看到你最近對 Claude Code 的命令行工具極其興奮是吧?

      主持人:誰看了不興奮啊。我之所以對 Claude Code 如此上頭,是因?yàn)槲医K于可以用它來替我操縱谷歌云(GCP)的控制臺了。我當(dāng)時的反應(yīng)是:我再也不想親手點(diǎn)那個控制臺了,那體驗(yàn)簡直反人類!

      Emil:對,所以它可以幫你抓取真實(shí)數(shù)據(jù),也能生成合成數(shù)據(jù)。它內(nèi)置了一套 Agent 記憶工具包,既包含短期記憶——也就是對話狀態(tài)之類的東西;也包含長期記憶——涵蓋了該領(lǐng)域內(nèi)的所有實(shí)體和核心概念。同時它還記錄了決策軌跡,也就是上下文圖譜。它把這些全打包在一起,還附帶了一個小巧的圖譜可視化界面。所以,這絕對是新手上路的絕佳途徑。

      主持人:這個點(diǎn)子絕了。我真不敢相信之前居然沒人做過。更不敢相信這玩意兒才發(fā)布了六天。你們絕對應(yīng)該狠狠地推廣它。

      Emil:你大概能猜到背后的老套劇情:那是我們辦一場關(guān)于上下文圖譜的線下聚會之前,他在某個周日下午隨手敲出來的,結(jié)果大家愛死它了。

      主持人:如果看了這個項(xiàng)目我非要提一個建議的話,那就是它似乎做得“太多”了。它的邊界在哪?我的應(yīng)用的邊界又在哪?這里面塞了太多東西。光看這個 Readme 文檔,我已經(jīng)開始覺得有些信息過載了。

      有時候,保持克制是非常可貴的。就像 OpenCode 的 CEO Dax 說過的那樣:看吧,在這個任何功能你都能在幾天內(nèi)憑感覺“搓”出來的時代,克制、專注和恰如其分,反而成了一種稀缺品質(zhì)。因?yàn)?,是的,你什么都能往里塞,但它真的?chuàng)造了增量價(jià)值嗎?還是僅僅在白白消耗我的注意力帶寬?我只想知道:你到底要幫我解決什么核心痛點(diǎn)?然后把那一點(diǎn)做到極致就行了。

      我覺得這又回到了喬布斯的那句名言:“我是產(chǎn)品的總編輯”。而作為一名編輯,最重要的工作就是說“不”,就是大刀闊斧地做減法。

      這真是一次干貨滿滿的快速巡游。顯然,在你們的圖譜世界里,還有很多值得我們?nèi)ネ诰虻膶毑?。在?jié)目的最后,拋開你官方的 CEO 身份,作為一個骨子里的黑客,你還有什么想分享的嗎?最近還有什么讓你心潮澎湃、極其興奮的事物?

      Emil:怎么說呢,我們所處的這個時代,既是最讓人熱血沸騰的時代,也是最令人膽戰(zhàn)心驚的時代。我們今天完全沒聊所謂的“SaaS 末日”之類的話題,但戴上 CEO 這頂帽子,我必須對這些暗流保持警覺。

      毫無疑問,我們正身處前線,目睹著企業(yè)在“買(采購 SaaS)”與“造(自己用 AI 寫)”之間的重心偏移。Klarna 就是最早的案例之一,他們嘗試了用 AI 替代外購軟件,后來又部分回調(diào)了——至少外界看到的是這樣。我不代表 Klarna 發(fā)言,但我認(rèn)為輿論對“買”和“造”兩邊的說法可能都有些夸大了。不過,這種范式的轉(zhuǎn)移是確鑿無疑的。但就我個人而言,我每年要花 20 萬美元,去買一款我恨得牙癢癢的會議管理軟件。

      主持人:也許花個兩千塊錢自己搓一個喜歡的會更好。真不敢相信你們這么牛的人居然還沒把這個痛點(diǎn)解決掉。我現(xiàn)在正忙著東奔西跑、打印胸牌、算計(jì)請魔術(shù)師的預(yù)算。自己開發(fā)軟件根本排不進(jìn)我的優(yōu)先級列表。而且,我的團(tuán)隊(duì)并不像我這樣是“Agent 原生”的。作為一個 CEO,我不能一拍腦袋就決定:“好,我們?nèi)粳F(xiàn)在都要改用 AI 自己寫軟件了”,然后指望每個員工都能無縫銜接。不可能的,他們需要培訓(xùn)。

      事實(shí)上,有時候那些我們用慣了的、充滿 Bug、運(yùn)行緩慢的破系統(tǒng),反而更靠譜。這就又回到了那個問題:這些工具的真正價(jià)值是什么?很大一部分價(jià)值,在于它們固化了某些業(yè)務(wù)流程,并對這些流程給出了規(guī)范性的指導(dǎo)。要讓 AI 迭代到那一步,我們還需要時間。如果你傾注全部精力,你確實(shí)能自己用 AI 搓出來,但在那之前,你還是得乖乖給那些破工具掏錢。所以我完全理解你的處境。

      Emil:所以,這是讓人感到恐懼或震驚的一面。但硬幣的另一面是,老天,現(xiàn)在我們擁有的創(chuàng)造能力太驚人了。要知道,我已經(jīng)算是“半退役”的技術(shù)人員了。我腦子里還懂那些比較并交換(CAS)的底層邏輯,但我已經(jīng)有整整十年沒當(dāng)過正兒八經(jīng)的現(xiàn)代程序員了。但現(xiàn)在,我又行了。軟件再一次變得如黏土般柔軟可塑,這簡直讓人興奮到極點(diǎn)。

      主持人:但我認(rèn)為,像你我這種“半退役”的技術(shù)管理者,很容易陷入一種失敗模式:你以為 AI 無所不能,于是你憑感覺“搓”出了一坨代碼,直接甩給你的員工,指望他們能完美接盤。絕對不可能。所以,我真的想提醒一下在座的各位領(lǐng)導(dǎo)者:請尊重現(xiàn)實(shí),不是所有東西都能靠 AI 隨便“搓”出來的。如果你非要這么干,你的員工很多時候還得跟在屁股后面給你擦屁股。

      Emil:舉雙手贊成。尤其我們還是一家數(shù)據(jù)庫公司,那里面可是需要真正的工匠精神的。

      主持人:但你們的測試體系做得太扎實(shí)了。數(shù)據(jù)庫的測試絕對是頂配級別的。絕大多數(shù)軟件根本享受不到這種待遇。所以其實(shí)我知道,正是因?yàn)槟銈冇腥绱藝?yán)密的測試網(wǎng),你才敢更放肆地去用 AI “搓”代碼,因?yàn)橐磺卸加袦y試在兜底。不管怎樣,非常感謝你,Emil。這真是一場酣暢淋漓的對話。

      (投稿或?qū)で髨?bào)道:zhanghy@csdn.net)


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      中央督察組通報(bào)后,遼寧省委書記許昆林赴現(xiàn)場督導(dǎo)整改

      中央督察組通報(bào)后,遼寧省委書記許昆林赴現(xiàn)場督導(dǎo)整改

      新京報(bào)
      2026-05-19 18:41:29
      楊議收徒太尷尬!女徒弟穿黑絲,佟有為收徒滿是名家,楊威現(xiàn)身

      楊議收徒太尷尬!女徒弟穿黑絲,佟有為收徒滿是名家,楊威現(xiàn)身

      裕豐娛間說
      2026-05-19 11:27:45
      上海已婚男子突然消失,妻子走投無路對外稱“丈夫死了”,戶口注銷,結(jié)果尷尬

      上海已婚男子突然消失,妻子走投無路對外稱“丈夫死了”,戶口注銷,結(jié)果尷尬

      上觀新聞
      2026-05-19 11:51:26
      現(xiàn)場畫面來了!普京走下舷梯

      現(xiàn)場畫面來了!普京走下舷梯

      第一財(cái)經(jīng)資訊
      2026-05-20 00:03:52
      外交部:中方對阿聯(lián)酋核電站相關(guān)設(shè)施遭受襲擊深表關(guān)切,反對武裝攻擊和平核設(shè)施

      外交部:中方對阿聯(lián)酋核電站相關(guān)設(shè)施遭受襲擊深表關(guān)切,反對武裝攻擊和平核設(shè)施

      環(huán)球網(wǎng)資訊
      2026-05-19 15:51:06
      黃仁勛貼身女助理身份曝光!哈佛畢業(yè)年薪125萬美金,亞裔學(xué)霸

      黃仁勛貼身女助理身份曝光!哈佛畢業(yè)年薪125萬美金,亞裔學(xué)霸

      魔都姐姐雜談
      2026-05-18 19:18:22
      馬斯克、黃仁勛接連發(fā)出警告!原來,中國機(jī)器人已讓美國感到焦慮

      馬斯克、黃仁勛接連發(fā)出警告!原來,中國機(jī)器人已讓美國感到焦慮

      陳腕特色體育解說
      2026-05-19 21:46:31
      主角:胡三元出獄!原來,這才是花彩香至死不和張光榮離婚的真相

      主角:胡三元出獄!原來,這才是花彩香至死不和張光榮離婚的真相

      慢半拍sir
      2026-05-19 21:06:01
      訪華結(jié)束才3天,美方代表槍口就對準(zhǔn)中國,沒有了在北京時的態(tài)度

      訪華結(jié)束才3天,美方代表槍口就對準(zhǔn)中國,沒有了在北京時的態(tài)度

      嫹筆牂牂
      2026-05-19 14:32:58
      菜鳥在美國、德國上線“晚必賠”,跨境包裹超時主動賠付

      菜鳥在美國、德國上線“晚必賠”,跨境包裹超時主動賠付

      IT之家
      2026-05-19 15:29:22
      廣東暴雨再升級!好消息:周末雨停了;壞消息:34℃悶熱要來了

      廣東暴雨再升級!好消息:周末雨停了;壞消息:34℃悶熱要來了

      城事特搜
      2026-05-19 19:17:21
      郭昊文4年頂薪加盟遼籃?雖然小劉總手握3頂薪,但不太可能引進(jìn)他

      郭昊文4年頂薪加盟遼籃?雖然小劉總手握3頂薪,但不太可能引進(jìn)他

      君馬體育
      2026-05-20 00:02:33
      一家三口長期吃自制餛飩,全都確診胰腺癌,妻子痛哭:是我錯了!

      一家三口長期吃自制餛飩,全都確診胰腺癌,妻子痛哭:是我錯了!

      橘子約定
      2026-05-19 22:17:53
      內(nèi)蒙古巴彥淖爾臨河區(qū)警方通報(bào)“學(xué)生課間操后暈倒離世”:排除刑事案件

      內(nèi)蒙古巴彥淖爾臨河區(qū)警方通報(bào)“學(xué)生課間操后暈倒離世”:排除刑事案件

      界面新聞
      2026-05-19 19:42:57
      普京20多年25次訪問中國,唯獨(dú)這一次出發(fā)前打破了慣例

      普京20多年25次訪問中國,唯獨(dú)這一次出發(fā)前打破了慣例

      冷眼看盡世間繁華
      2026-05-19 22:05:05
      國企央企加速清退勞務(wù)派遣!2026年底前必須整改完,千萬打工人面臨大變動

      國企央企加速清退勞務(wù)派遣!2026年底前必須整改完,千萬打工人面臨大變動

      一口娛樂
      2026-05-17 05:59:22
      體制內(nèi)的酒局快要消失了

      體制內(nèi)的酒局快要消失了

      微微熱評
      2026-05-19 12:18:03
      美國計(jì)劃對電動汽車征收道路養(yǎng)護(hù)費(fèi) 每年130美元

      美國計(jì)劃對電動汽車征收道路養(yǎng)護(hù)費(fèi) 每年130美元

      CNMO科技
      2026-05-19 14:58:12
      千年前一群伊朗人遷徙中國,更改姓氏定居甘肅,如今已有170萬人

      千年前一群伊朗人遷徙中國,更改姓氏定居甘肅,如今已有170萬人

      顧史
      2026-05-17 10:47:12
      伯恩茅斯英超連續(xù)17輪不敗,確保獨(dú)享本賽季英超聯(lián)賽不敗紀(jì)錄

      伯恩茅斯英超連續(xù)17輪不敗,確保獨(dú)享本賽季英超聯(lián)賽不敗紀(jì)錄

      懂球帝
      2026-05-20 04:39:14
      2026-05-20 06:16:49
      AI科技大本營 incentive-icons
      AI科技大本營
      連接AI技術(shù)的創(chuàng)造者和使用者
      2695文章數(shù) 7686關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      媒體:特朗普為何拋涉臺"四不"說法 魯比奧解釋清楚了

      頭條要聞

      媒體:特朗普為何拋涉臺"四不"說法 魯比奧解釋清楚了

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財(cái)經(jīng)要聞

      潔麗雅硬剛豪門內(nèi)斗傳言

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態(tài)度原創(chuàng)

      時尚
      游戲
      健康
      家居
      手機(jī)

      57歲惡女出手整治浪姐,全網(wǎng)拍手叫好

      PS嚴(yán)重安全漏洞!大量賬號被盜 索尼官方依舊沉默

      專家揭秘干細(xì)胞回輸?shù)陌踩L(fēng)險(xiǎn)

      家居要聞

      觀山隱秀 心靈沉淀

      手機(jī)要聞

      5月最后十天,5款新機(jī)連番轟炸!從電競旗艦到中端影像都齊了

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久 国产 尿 小便 嘘嘘| 日本99视频| 国产在线国偷精品产拍| 中文字幕在线影视| 国产a在视频线精品视频下载 | 亚洲精品无码日韩国产不卡av| 亚洲中文字幕高清| 曰本无码人妻丰满熟妇啪啪| 麻豆成人综合网| 久久久www成人免费毛片| 国产av一区二区三区综合| 亚洲成人自拍| 成色7777精品在线| 国产高清在线精品一区APP| 998av资源影音先锋| 内射极品人妻| 无码中文字幕加勒比一本二本 | 丰满少妇棚拍无码视频| 波多野结衣的av一区二区三区| 亲近乱子伦免费视频无码| 亚洲av电影天堂网| 日日噜噜噜噜人人爽亚洲精品 | 久久中文字幕av第二页| 天天摸夜夜添久久精品| 国产精品小一区二区三区| 全部孕妇毛片| 亚洲国产亚洲综合在线尤物| 又大又爽又黄无码a片| 九九热这里只有精品在线| 精品香蕉在线视频| 伊人久久大香线焦av综合影院| 欧美日韩国产在线观看免费| 亚洲色精品88色婷婷七月丁香| 久久婷婷色香五月综合缴缴情| 朝鲜美女黑毛bbw| 艳妇乳肉豪妇荡乳AV无码福州市| 亚洲成人中出| 一级一级特黄女人精品毛片视频 | 久久久无码精品国产一区| 午夜激情网站| 韩国19禁无遮挡啪啪无码网站 |