<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      演講實(shí)錄 | 楊傳輝:AI 時(shí)代,OceanBase 帶來(lái)了哪些產(chǎn)品革新?

      0
      分享至

      編者按

      11 月 18 日,2025 OceanBase 年度發(fā)布會(huì)在北京舉行?,F(xiàn)場(chǎng)發(fā)布并開(kāi)源了 OceanBase 首款 AI 原生混合搜索數(shù)據(jù)庫(kù) seekdb(簡(jiǎn)稱(chēng) seekdb )。作為 OceanBase “Data x AI”戰(zhàn)略的關(guān)鍵一環(huán),OceanBase 4.4 一體化融合版本也正式發(fā)布。

      在之后的分享中,OceanBase CTO 楊傳輝以“OceanBase:打造 AI 時(shí)代的一體化數(shù)據(jù)庫(kù)”為題,介紹了 OceanBase 在 AI 時(shí)代的產(chǎn)品革新和演進(jìn)。他表示,在 AI 時(shí)代,一體化架構(gòu)所承載的核心技術(shù)能力,只會(huì)愈發(fā)重要。在他看來(lái),向量搜索是 AI 數(shù)據(jù)庫(kù)的初級(jí)階段,而最終,所有向量搜索都會(huì)逐步演進(jìn)為混合搜索 —— 能否支持混合搜索,正是衡量 AI 數(shù)據(jù)庫(kù)核心實(shí)力的關(guān)鍵分水嶺。

      以下為演講實(shí)錄:



      各位來(lái)賓、數(shù)據(jù)庫(kù)領(lǐng)域的新老朋友,大家上午好。剛剛我們正式發(fā)布并開(kāi)源了 OceanBase 首款 AI 原生混合搜索數(shù)據(jù)庫(kù) seekdb,也提到了混合搜索這一核心方向。今天我的分享,同樣圍繞 AI 展開(kāi),主題是 “打造 AI 時(shí)代的一體化數(shù)據(jù)庫(kù)”。

      相信不少嘉賓在展區(qū)已經(jīng)感受到,這次發(fā)布會(huì)和以往有明顯不同 —— 我們帶來(lái)了大量 AI 相關(guān)的新產(chǎn)品。所以今天的分享,我不會(huì)聚焦 TP 或分析 AP,核心想和大家聊聊我們對(duì) AI 時(shí)代、混合搜索與 seekdb 的思考,以及近期的開(kāi)發(fā)進(jìn)展。



      AI時(shí)代一體化數(shù)據(jù)庫(kù)的變與不變

      首先,我們不妨回顧一下數(shù)據(jù)庫(kù)技術(shù)范式的演進(jìn)。數(shù)據(jù)庫(kù)技術(shù)奠基人之一 E.F.Codd 于 1970 年提出關(guān)系模型,當(dāng)時(shí)這一模型主要面向交易場(chǎng)景;1993 年,他又提出了面向分析的 OLAP。而最近幾年,業(yè)界涌現(xiàn)的所有新數(shù)據(jù)庫(kù)產(chǎn)品,本質(zhì)上都是面向 AI 的 —— 既包括大家熟悉的各類(lèi)向量數(shù)據(jù)庫(kù),也涵蓋 Supabase等 熱門(mén)產(chǎn)品。不難發(fā)現(xiàn),整個(gè)數(shù)據(jù)庫(kù)領(lǐng)域的技術(shù)范式,正從原本的支撐應(yīng)用服務(wù),逐步延伸到智能服務(wù)的全新階段。

      我們注意到,Oracle、MongoDB 等業(yè)界主流數(shù)據(jù)庫(kù),也正紛紛在自身引擎中新增搜索能力,以此適配 AI 原生場(chǎng)景的需求。在 AI 領(lǐng)域有個(gè)常見(jiàn)概念叫 AI Ready,而我們認(rèn)為,AI Ready 必然會(huì)向 AI Native 逐步演進(jìn)。所謂 AI Native,絕非僅做好數(shù)據(jù)準(zhǔn)備那么簡(jiǎn)單,核心是將模型能力深度集成到數(shù)據(jù)庫(kù)中,最終實(shí)現(xiàn)數(shù)據(jù)與模型在數(shù)據(jù)庫(kù)內(nèi)的原生融合。近期行業(yè)內(nèi)的多起收購(gòu)事件也印證了這一趨勢(shì) ——MongoDB 收購(gòu) Voyage AI、Elastic 收購(gòu) Jina AI,核心訴求都是推動(dòng)數(shù)據(jù)與模型的融合,我們高度認(rèn)同這一行業(yè)趨勢(shì)。

      AI 時(shí)代的到來(lái),既給數(shù)據(jù)庫(kù)領(lǐng)域帶來(lái)了巨大挑戰(zhàn),更孕育著前所未有的發(fā)展機(jī)遇。

      首先,AI 時(shí)代的數(shù)據(jù)庫(kù),數(shù)據(jù)處理量會(huì)持續(xù)激增,用戶(hù)與租戶(hù)規(guī)模也將迎來(lái)量級(jí)式增長(zhǎng)。與此同時(shí),AI 還會(huì)給數(shù)據(jù)庫(kù)帶來(lái)全新的工作負(fù)載 —— 我們將其定義為“面向 Agent 的多路混合搜索”。

      在 AI 時(shí)代,數(shù)據(jù)庫(kù)的處理范疇不再局限于結(jié)構(gòu)化數(shù)據(jù)與少量半結(jié)構(gòu)化數(shù)據(jù),還需要承載更多半結(jié)構(gòu)化乃至無(wú)結(jié)構(gòu)化數(shù)據(jù)。這意味著,除了傳統(tǒng)關(guān)系模型,數(shù)據(jù)庫(kù)還需支持 JSON 處理半結(jié)構(gòu)化數(shù)據(jù),并為無(wú)結(jié)構(gòu)化數(shù)據(jù)構(gòu)建各類(lèi)語(yǔ)義索引,比如大家熟知的向量索引、圖索引、全文索引等。在此基礎(chǔ)上,我們更需要一套能覆蓋結(jié)構(gòu)化、半結(jié)構(gòu)化、無(wú)結(jié)構(gòu)化數(shù)據(jù)的混合搜索能力。

      AI 還帶來(lái)了顯著的技術(shù)平權(quán)效應(yīng)。過(guò)去,數(shù)據(jù)庫(kù)主要由專(zhuān)業(yè)人士通過(guò)開(kāi)發(fā)應(yīng)用程序來(lái)使用,而在今天的 AI 時(shí)代,即便沒(méi)有計(jì)算機(jī)相關(guān)背景,普通人也能借助大模型輕松開(kāi)發(fā)自己的 Agent。這也意味著,未來(lái)數(shù)據(jù)庫(kù)的用戶(hù)量與租戶(hù)數(shù)量,必將實(shí)現(xiàn)倍數(shù)級(jí)的爆發(fā)式增長(zhǎng)。

      聊完了 AI 時(shí)代數(shù)據(jù)庫(kù)的變化,我們更要明確數(shù)據(jù)庫(kù)的變與不變。其中一點(diǎn)我堅(jiān)信不疑:數(shù)據(jù)庫(kù)領(lǐng)域不僅不會(huì)被取代,在 AI 時(shí)代還會(huì)變得愈發(fā)重要。

      無(wú)論 AI 如何迭代演進(jìn),數(shù)據(jù)庫(kù)的核心基礎(chǔ)能力始終不可或缺:我們?nèi)孕枰煽康臄?shù)據(jù)庫(kù)引擎,解決單機(jī)、分布式及多云平臺(tái)的各類(lèi)問(wèn)題;仍需要行存數(shù)據(jù)庫(kù)支撐交易場(chǎng)景,列存數(shù)據(jù)庫(kù)處理分析需求,更需要強(qiáng)大的 SQL 優(yōu)化器應(yīng)對(duì) HTAP 混合負(fù)載。同時(shí),數(shù)據(jù)庫(kù)還需提供豐富的 SQL 功能,助力大家平滑完成從 MySQL、Oracle 等系統(tǒng)的升級(jí)。



      混合搜索是 AI 數(shù)據(jù)庫(kù)的關(guān)鍵分水嶺

      在 AI 時(shí)代,一體化架構(gòu)所承載的核心技術(shù)能力,只會(huì)愈發(fā)重要。一提到 AI 數(shù)據(jù)庫(kù),很多人首先想到的是向量搜索,但在我看來(lái),向量搜索只是 AI 數(shù)據(jù)庫(kù)的初級(jí)階段。最終,所有向量搜索都會(huì)逐步演進(jìn)為混合搜索 —— 能否支持混合搜索,正是衡量 AI 數(shù)據(jù)庫(kù)核心實(shí)力的關(guān)鍵分水嶺。

      大家都知道,大模型具備強(qiáng)大的計(jì)算能力,但缺乏長(zhǎng)期記憶。這就需要數(shù)據(jù)庫(kù)為大模型提供支撐:存儲(chǔ)并管理其上下文信息,同時(shí)精準(zhǔn)輸出大模型所需的上下文。這個(gè)過(guò)程,也被稱(chēng)為 “上下文工程”。要做好“上下文工程”,首先需要通過(guò)向量搜索、向量嵌入解決 “找相似” 的問(wèn)題。但 “找相似” 只是上下文工程的一部分,除此之外,還可能需要通過(guò)全文搜索實(shí)現(xiàn) “找相同”,或借助知識(shí)圖譜與圖索引,挖掘全局相關(guān)的信息。

      “上下文工程”往往還涉及大量元數(shù)據(jù)管理,這就需要依托關(guān)系型數(shù)據(jù)庫(kù)的能力 —— 通過(guò)關(guān)系過(guò)濾、關(guān)系查找縮小檢索范圍。每一路檢索都會(huì)產(chǎn)出部分結(jié)果,最終要將各路結(jié)果融合,并經(jīng)過(guò)全局重排序(rerank),才能為大模型輸出其真正需要的精準(zhǔn)結(jié)果。這正是混合檢索的核心邏輯。

      首先,高性能且功能完備的向量搜索,是多路混合搜索的核心基礎(chǔ)。目前,OceanBase 向量搜索性能已達(dá)到業(yè)界開(kāi)源向量數(shù)據(jù)庫(kù)的最優(yōu)水平—— 無(wú)論是稠密向量還是稀疏向量,在向量數(shù)據(jù)庫(kù)領(lǐng)域主流 benchmark 測(cè)試中均表現(xiàn)突出。同時(shí),我們的磁盤(pán)向量索引,在構(gòu)建時(shí)間與存儲(chǔ)占用兩方面,也實(shí)現(xiàn)了業(yè)界領(lǐng)先。

      具備強(qiáng)大的向量搜索能力后,我們進(jìn)一步實(shí)現(xiàn)了向量搜索與全文搜索的深度融合,通過(guò)多路搜索顯著提升召回效果。



      左側(cè)圖示清晰呈現(xiàn)了不同搜索方式的召回表現(xiàn):僅采用單一搜索路徑(無(wú)論全文搜索、稠密向量還是稀疏向量),都難以達(dá)到最優(yōu)召回效果;唯有將稀疏向量、稠密向量與全文搜索相結(jié)合,才能實(shí)現(xiàn)更優(yōu)的召回表現(xiàn),達(dá)成 1+1 大于 2 的協(xié)同效應(yīng)。

      值得一提的是,OceanBase 不僅擁有上述高性能向量搜索能力,還已落地生產(chǎn)級(jí)全文搜索功能。更重要的是,這兩大能力均構(gòu)建于 OceanBase 數(shù)據(jù)庫(kù)原生架構(gòu)之上,天然繼承了分布式架構(gòu)的彈性擴(kuò)展特性與對(duì)象存儲(chǔ)的高效適配能力。

      在 AI 場(chǎng)景中,除了要開(kāi)展多路搜索,還需妥善管理 AI 場(chǎng)景下的元數(shù)據(jù)。要做好 AI 數(shù)據(jù)庫(kù)的元數(shù)據(jù)管理,不僅需要支持元數(shù)據(jù)的實(shí)時(shí)寫(xiě)入與事務(wù)一致性,還需實(shí)現(xiàn)元數(shù)據(jù)檢索結(jié)果與多路搜索結(jié)果的 SQL 級(jí)聯(lián)動(dòng)。毫無(wú)疑問(wèn),支持 HTAP 的關(guān)系型數(shù)據(jù)庫(kù)是更優(yōu)選擇。通過(guò)將關(guān)系模型與向量、全文、JSON 能力深度融合,OceanBase 最終形成了全面的混合搜索能力。

      下面我簡(jiǎn)單分享幾個(gè) OceanBase 混合檢索的客戶(hù)實(shí)踐案例:

      貨拉拉基于 OceanBase 混合檢索,搭建了一站式企業(yè) AI 數(shù)據(jù)底座。貨拉拉的 AI 應(yīng)用場(chǎng)景十分豐富,涵蓋知識(shí)庫(kù)、AI Coding、Agent 平臺(tái)、ChatBI 等。此前,他們?cè)褂枚嗫畈煌a(chǎn)品,包括搜索產(chǎn)品 V search 及兩款不同的向量數(shù)據(jù)庫(kù);升級(jí)至 OceanBase 后,實(shí)現(xiàn)了多產(chǎn)品合一,不僅解決了原有開(kāi)源組件的穩(wěn)定性問(wèn)題,還直接復(fù)用 OceanBase 的高可用能力,達(dá)成 RPO=0、RTO<8 秒的高標(biāo)準(zhǔn)。

      聯(lián)通也是借助 OceanBase 的混合搜索能力,構(gòu)建了公司級(jí)統(tǒng)一知識(shí)庫(kù)平臺(tái),該場(chǎng)景此前采用 “關(guān)系數(shù)據(jù)庫(kù) + 全文向量搜索數(shù)據(jù)庫(kù)” 的架構(gòu)。將兩者融合至 OceanBase 后,在 10 億級(jí)向量規(guī)模下,OceanBase 的處理效率達(dá)到原全文向量搜索數(shù)據(jù)庫(kù)的兩倍以上;同時(shí)通過(guò)融合關(guān)系查找與多路搜索,成功解決了知識(shí)庫(kù)的元數(shù)據(jù)管理難題,包括精細(xì)化權(quán)限管控及靈活的用戶(hù)間權(quán)限共享需求。

      螞蟻百寶箱基于混合搜索實(shí)現(xiàn)了智能體在線(xiàn)搜索。此前他們?cè)褂孟蛄繑?shù)據(jù)庫(kù)、搜索產(chǎn)品及 OceanBase 本身分別管理不同數(shù)據(jù),最終全部融合至一套 OceanBase 后,不僅幫助客戶(hù)統(tǒng)一了技術(shù)棧,還將業(yè)務(wù)層的多產(chǎn)品融合搜索能力下沉至數(shù)據(jù)庫(kù)層,極大簡(jiǎn)化了數(shù)據(jù)架構(gòu)。



      AI 時(shí)代需要怎樣的數(shù)據(jù)架構(gòu)?

      實(shí)現(xiàn) AI 場(chǎng)景下的混合搜索,主要有兩種路徑:

      第一種實(shí)現(xiàn)方式是從頭開(kāi)始搭建一個(gè)混合搜索的數(shù)據(jù)庫(kù);第二種方式是直接基于關(guān)系數(shù)據(jù)庫(kù)增加混合搜索的功能。

      在我看來(lái),第二種路徑更具優(yōu)勢(shì),核心原因有兩點(diǎn):1.關(guān)系型數(shù)據(jù)庫(kù)不管是在功能完備性、易用性還是生態(tài)成熟度上,均遠(yuǎn)超其他非關(guān)系型數(shù)據(jù)庫(kù);2.支撐 AI 場(chǎng)景,除了要有混合搜索能力,底層還需一套現(xiàn)代數(shù)據(jù)架構(gòu)。

      以 OceanBase 為代表的關(guān)系型數(shù)據(jù)庫(kù),已具備成熟的現(xiàn)代數(shù)據(jù)架構(gòu) —— 這種架構(gòu)技術(shù)壁壘高,也是 AI 時(shí)代數(shù)據(jù)庫(kù)的 Foundation。

      那么什么是現(xiàn)代數(shù)據(jù)架構(gòu)?我認(rèn)為核心包含三個(gè)點(diǎn):

      第一個(gè)點(diǎn):現(xiàn)代數(shù)據(jù)架構(gòu)一定是非常好用的;

      第二個(gè)點(diǎn):現(xiàn)代數(shù)據(jù)架構(gòu)一定是非常靈活的;

      第三個(gè)點(diǎn):一定是面向未來(lái)能夠支撐 AI 的。

      現(xiàn)代數(shù)據(jù)架構(gòu)的底層核心是一體化架構(gòu),用戶(hù)想要什么功能,數(shù)據(jù)庫(kù)就提供相應(yīng)的功能,無(wú)需根據(jù)功能的不同而選擇不同的存儲(chǔ)產(chǎn)品、學(xué)習(xí)不同的技術(shù)?!,F(xiàn)在的數(shù)據(jù)庫(kù)架構(gòu)非常靈活,在部署模式上,用戶(hù)可自由選擇上云、不上云或特定云平臺(tái)。

      同時(shí),現(xiàn)代數(shù)據(jù)架構(gòu)也需要能夠支持按需使用。數(shù)據(jù)量小時(shí)用小規(guī)格部署,數(shù)據(jù)量增長(zhǎng)后無(wú)縫擴(kuò)容,完美適配從初創(chuàng)到規(guī)?;娜A段需求。

      更關(guān)鍵的是,現(xiàn)代數(shù)據(jù)架構(gòu)需原生支持 AI 場(chǎng)景。除了前文提到的混合搜索能力,原生多租戶(hù)能力也至關(guān)重要 —— 因?yàn)?AI 時(shí)代,數(shù)據(jù)庫(kù)的使用者早已不局限于 DBA 或計(jì)算機(jī)專(zhuān)業(yè)開(kāi)發(fā)人員,每一個(gè)普通人都能通過(guò)大模型輕松構(gòu)建自己的 AI Agent。

      一體化架構(gòu)的核心,我將其總結(jié)為 “三多”:多負(fù)載、多模態(tài)、混合多云。

      1. 多負(fù)載:一套數(shù)據(jù)庫(kù)引擎即可全面支持交易、分析、AI 等各類(lèi)工作負(fù)載;
      2. 多模態(tài):兼容多樣化數(shù)據(jù)類(lèi)型與索引 —— 既涵蓋結(jié)構(gòu)化數(shù)據(jù)的關(guān)系模型、半結(jié)構(gòu)化數(shù)據(jù)的 JSON 格式,也支持無(wú)結(jié)構(gòu)化數(shù)據(jù)的各類(lèi)語(yǔ)義索引,比如向量、全文、圖索引等;
      3. 混合多云:賦予用戶(hù)完全的部署自由,可自主選擇上云、不上云或特定云平臺(tái)。更關(guān)鍵的是,用戶(hù)只需使用一套產(chǎn)品,就能實(shí)現(xiàn)跨所有公有云、混合云平臺(tái)的自動(dòng)升級(jí),無(wú)需額外適配。

      目前,OB Cloud 已成為業(yè)界支持公有云平臺(tái)最多的云數(shù)據(jù)庫(kù)產(chǎn)品,已兼容 7 朵主流云:國(guó)內(nèi)涵蓋阿里云、華為云、騰訊云、百度云四大平臺(tái),海外覆蓋 AWS、Azure、GCP 三大平臺(tái)。我們的 OB Cloud 已落地 16 個(gè)國(guó)家和地區(qū),覆蓋超 60 個(gè)地域、240 多個(gè)可用區(qū),無(wú)論你身處全球哪個(gè)角落、哪個(gè)時(shí)區(qū),都能便捷獲取 OB Cloud 一體化云數(shù)據(jù)庫(kù)。

      同時(shí),依托一體化架構(gòu),我們實(shí)現(xiàn)了多云及混合云環(huán)境下的用戶(hù)體驗(yàn)一致性,更支持跨云高可用能力。當(dāng)用戶(hù)需要跨云升級(jí)時(shí),OceanBase 可全程保障業(yè)務(wù)連續(xù)性,確保升級(jí)過(guò)程中業(yè)務(wù)不中斷。

      AI 場(chǎng)景的工作負(fù)載具有極強(qiáng)的不確定性。AI Agent 這個(gè)生態(tài)雖然數(shù)量眾多,但多數(shù)都默默無(wú)聞,僅有少數(shù)會(huì)迎來(lái)爆發(fā)式流量,且這類(lèi)流量往往具備突發(fā)特性。因此,我們必須提供支持彈性伸縮架構(gòu)的 Serverless 方案,以靈活應(yīng)對(duì)流量波動(dòng)。

      此外,AI 場(chǎng)景需要管理海量數(shù)據(jù) —— 包含大量長(zhǎng)上下文數(shù)據(jù),既有文本類(lèi)型,也有多模態(tài)類(lèi)型。這些數(shù)據(jù)中,大部分屬于冷數(shù)據(jù),僅近期高頻訪(fǎng)問(wèn)、用戶(hù)重點(diǎn)關(guān)注的數(shù)據(jù)為熱數(shù)據(jù)?;诖?,我們通過(guò)支持對(duì)象存儲(chǔ)的冷熱分離方案,高效解決海量數(shù)據(jù)的存儲(chǔ)與管理難題。

      螞蟻集團(tuán)也正基于 OceanBase 開(kāi)展大模型預(yù)訓(xùn)練工作。為做好大模型預(yù)訓(xùn)練,螞蟻需要將海量網(wǎng)頁(yè)內(nèi)容提取至內(nèi)部,再進(jìn)行網(wǎng)頁(yè)的數(shù)據(jù)清洗與標(biāo)注。這些網(wǎng)頁(yè)數(shù)據(jù)中,大部分屬于冷數(shù)據(jù),但仍有部分網(wǎng)頁(yè)更新頻繁,因此我們通過(guò)基于對(duì)象存儲(chǔ)的冷熱分離方案,高效適配這一需求;同時(shí),數(shù)據(jù)清洗與標(biāo)注場(chǎng)景的流量具有明顯突發(fā)性 ,當(dāng)一批網(wǎng)頁(yè)數(shù)據(jù)集中涌入時(shí),需要?jiǎng)討B(tài)調(diào)度計(jì)算資源實(shí)現(xiàn)彈性處理,而在這一過(guò)程中,就需要用到 OceanBase 的 Serverless 方案。



      數(shù)模融合,一個(gè)正在被驗(yàn)證的趨勢(shì)

      我認(rèn)為,數(shù)據(jù)與模型的深度融合,必將是未來(lái)的核心趨勢(shì)。在數(shù)據(jù)庫(kù)內(nèi)直接集成模型能力,能大幅降低模型開(kāi)發(fā)與使用的復(fù)雜度。

      以我們的混合搜索為例:當(dāng)文檔進(jìn)入數(shù)據(jù)庫(kù)內(nèi)部后,除了進(jìn)行數(shù)據(jù)處理外,也需要對(duì)文檔做切片、解析、embedding,以及多路搜索。這一過(guò)程既用到數(shù)據(jù)處理能力,也集成了模型服務(wù)能力,包括 Parse 解析模型、embedding 模型、Rerank 模型等。

      為此,OceanBase 支持了“Document in, Data out”,用戶(hù)只需將文檔寫(xiě)入數(shù)據(jù)庫(kù),通過(guò)混合搜索,就能一步獲取所需結(jié)果,真正實(shí)現(xiàn)開(kāi)箱即用。相比傳統(tǒng)開(kāi)發(fā)模式 —— 我們需自行尋找各類(lèi)模型與組件,反復(fù)實(shí)驗(yàn)拼湊,有了“Document in, Data out”,用戶(hù)真正能開(kāi)箱即用,大幅降低了 AI 應(yīng)用的開(kāi)發(fā)復(fù)雜度。

      當(dāng)數(shù)據(jù)庫(kù)集成了模型服務(wù)之后,OceanBase 也同時(shí)提供了 MaaS 平臺(tái)。所謂的 MaaS 就是 Model As a Service,提供了后訓(xùn)練到在線(xiàn)推理服務(wù)的全流程管理。MaaS 平臺(tái)支持微調(diào)等后訓(xùn)練,我們也支持對(duì)模型做量化,也支持做推理的加速、模型的評(píng)測(cè),以及各種算力的調(diào)度、模型的管理等。如今,OceanBase 的 MaaS 平臺(tái)已經(jīng)支持了業(yè)界不同場(chǎng)景主流的大語(yǔ)言模型,包括海外和國(guó)產(chǎn) GPU。

      AI 原生數(shù)據(jù)庫(kù)的設(shè)計(jì),必然要秉持開(kāi)源、開(kāi)放的核心理念。剛才我們已經(jīng)正式發(fā)布了 OceanBase 首款 AI 原生混合搜索數(shù)據(jù)庫(kù) seekdb——基于 Apache2.0 協(xié)議的 AI 原生混合數(shù)據(jù)庫(kù),主要有以下核心能力與優(yōu)勢(shì)如下:

      首先,seekdb 支持多?;旌纤阉鳎瑑H需一條查詢(xún),就能同時(shí)檢索關(guān)系、JSON、向量、全文等多種類(lèi)型的數(shù)據(jù);其次,它內(nèi)置 AI Function 功能。因構(gòu)筑于 OceanBase 原生架構(gòu)之上,所以它也天然繼承了 OceanBase 原生的能力,包括 HTAP混合負(fù)載處理、MySQL 高度兼容等能力。

      可能有朋友會(huì)問(wèn),seekdb 是不是 OceanBase 的輕量版?答案是,兩者并不同。它遠(yuǎn)比輕量版更輕, 輕上加輕。此前 OceanBase 輕量版最低配置為 2C 8G,而 seekdb 首個(gè)版本已支持 1C2G ,未來(lái)還會(huì)把它的內(nèi)存需求進(jìn)一步降低至 1G 甚至 500M。這意味著,seekdb 不僅能部署在臺(tái)式機(jī)、桌面端,未來(lái)更可適配各類(lèi)嵌入式環(huán)境。



      seekdb 是基于 Apache 2.0 協(xié)議的開(kāi)源產(chǎn)品,我們希望與業(yè)界開(kāi)發(fā)者共同探索,到底什么才是真正的 AI 原生數(shù)據(jù)庫(kù)。因?yàn)橛辛藰I(yè)界開(kāi)發(fā)者的參與,我相信,seekdb 的迭代速度也必將大幅提升。同時(shí), OceanBase在 AI 的能力上將會(huì)跟進(jìn) seekdb 能力演進(jìn),為大規(guī)模、超大型 AI 應(yīng)用提供落地能力和支撐。歡迎大家訪(fǎng)問(wèn) OceanBase seekdb 的官方網(wǎng)站—— oceanbase.ai,也誠(chéng)摯邀請(qǐng)現(xiàn)場(chǎng)及線(xiàn)上的開(kāi)發(fā)者們加入OceanBase seekdb的開(kāi)源社區(qū)共建開(kāi)放生態(tài)。

      OceanBase seekdb是一款專(zhuān)為開(kāi)發(fā)者打造的 AI 原生數(shù)據(jù)庫(kù),只需三行代碼,就能快速構(gòu)建應(yīng)用,實(shí)現(xiàn)關(guān)系、JSON、向量、全文的混合搜索。這里給大家舉一個(gè)簡(jiǎn)單的例子:

      第一步,創(chuàng)建一個(gè)集合;第二步,在集合中添加文檔,并且可靈活指定文檔的元數(shù)據(jù);第三步,直接使用 OceanBase 的混合搜索接口,直接獲取最終結(jié)果。

      今天,我們也正式開(kāi)源了 OceanBase 的 PowerRAG 產(chǎn)品。PowerRAG 被認(rèn)為是 OceanBase 基于混合搜索的最佳實(shí)踐。PowerRAG在 RAGFlow 的框架之上構(gòu)建,有兩個(gè)特點(diǎn)。第一個(gè)特點(diǎn),是基于混合搜索做的重新設(shè)計(jì);第二個(gè)特點(diǎn),該產(chǎn)品已在螞蟻集團(tuán)內(nèi)部真實(shí)業(yè)務(wù)場(chǎng)景中落地應(yīng)用,具備成熟的企業(yè)級(jí)能力。PowerRAG 文檔解析、處理能力,以及最終召回的效果,是具備企業(yè)級(jí)能力的,要好于業(yè)界已有的 RAG 解決方案。

      同時(shí),今天我們也正式發(fā)布并且開(kāi)源 PowerMem 解決方案, PowerMem 和 PowerRAG 一樣,也是基于混合搜索的一個(gè)解決方案。它兼容 Mem0 接口,幫助開(kāi)發(fā)者、用戶(hù)去管理大語(yǔ)言模型的上下文。同時(shí),PowerMem 的性能在 LOCOMO Berchmark 里達(dá)到了業(yè)界開(kāi)源 Memory 解決方案的 SOTA 水平(State of the Art),歡迎在座的朋友以及線(xiàn)上的開(kāi)發(fā)者關(guān)注和加入 OceanBase 的 PowerRAG 以及 PowerMem 開(kāi)源社區(qū)。

      今天是 seekdb 是發(fā)布的第一天,我們已經(jīng)和業(yè)界產(chǎn)品進(jìn)行了生態(tài)對(duì)接。這里面既包括全球知名的產(chǎn)品 Dify、Qoder,也包括 AI 領(lǐng)域的創(chuàng)業(yè)公司。當(dāng)然,我相信這些創(chuàng)業(yè)公司在剛開(kāi)始的時(shí)候就選擇 OceanBase 這樣一個(gè)能夠解決增長(zhǎng)問(wèn)題的產(chǎn)品,他們未來(lái)的增長(zhǎng)也一定會(huì)有更多的可能。

      未來(lái),我相信所有數(shù)據(jù)類(lèi)的產(chǎn)品都會(huì)用 AI 的方式重新改造一遍。ODC 是 OceanBase 面向開(kāi)發(fā)者的工具,ODC 正式推出 DataPilot。對(duì)于 ODC 而言,大家都非常熟悉它的自然語(yǔ)言轉(zhuǎn)化為 SQL,Text2SQL 的功能。但是,如果采用業(yè)界經(jīng)典的 Text2SQL 的解決方案,會(huì)面臨一個(gè)很大的問(wèn)題,那就是準(zhǔn)確率永遠(yuǎn)都沒(méi)有辦法滿(mǎn)足業(yè)務(wù)的需求。

      Text2SQL 領(lǐng)域有個(gè)權(quán)威榜單BIRD-bench,行業(yè)內(nèi)普遍認(rèn)為,該榜單得分達(dá)到 80 分左右后,再想突破就十分困難。而 OceanBase 創(chuàng)新性地采用了 Text2Metrics 解決方案:我們先定義統(tǒng)一指標(biāo),對(duì)領(lǐng)域術(shù)語(yǔ)進(jìn)行標(biāo)準(zhǔn)化規(guī)范,再通過(guò)這些指標(biāo)約束大語(yǔ)言模型的生成范圍。通過(guò)這一方式,我們將自然語(yǔ)言到 SQL 的轉(zhuǎn)化準(zhǔn)確率提升至 90 分以上 —— 目前已達(dá)到 92.2%,且在特定業(yè)務(wù)場(chǎng)景下,準(zhǔn)確率仍有進(jìn)一步提升空間。要知道,只有達(dá)到 90 分以上乃至更高的準(zhǔn)確率,自然語(yǔ)言轉(zhuǎn) SQL 技術(shù)才能真正落地生產(chǎn)系統(tǒng),具備實(shí)實(shí)在在的業(yè)務(wù)價(jià)值。

      我們還采用 Agentic AI 理念,對(duì)診斷監(jiān)控產(chǎn)品 OAS 進(jìn)行了全新設(shè)計(jì)。具體來(lái)說(shuō),我們采用 Agentic AI Multi-Agent 架構(gòu),它有一個(gè)主 Agent 負(fù)責(zé)核心的任務(wù)拆解與分配,再將不同細(xì)分任務(wù)精準(zhǔn)下發(fā)給對(duì)應(yīng)的專(zhuān)項(xiàng) Agent 執(zhí)行 —— 這個(gè)架構(gòu)相信很多在場(chǎng)嘉賓都非常熟悉。通過(guò)這一升級(jí),OAS 實(shí)現(xiàn)了從查指標(biāo)、找問(wèn)題到對(duì)話(huà)即診斷的跨越。用戶(hù)只需通過(guò)自然對(duì)話(huà),就能全程完成診斷流程,系統(tǒng)還會(huì)一步步呈現(xiàn)診斷過(guò)程中的詳細(xì)信息。這既方便開(kāi)發(fā)者人工介入干預(yù),也讓 OAS 真正具備了在生產(chǎn)系統(tǒng)中落地應(yīng)用的實(shí)用價(jià)值。

      今天我們也正式發(fā)布了OceanBase AI Stack 智能一體機(jī)。OceanBase 智能一體機(jī)最核心的組件是 OceanBase 的一體化架構(gòu),支持多模混合搜索的數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)之上,我們集成了 PowerRAG、Agent 開(kāi)發(fā)平臺(tái),以及 OceanBase 數(shù)據(jù)領(lǐng)域的Agent—— 包括之前提到的 ODC DataPilot、基于 Agentic AI 改造的 OAS 等。數(shù)據(jù)庫(kù)之下則搭載了 MaaS 平臺(tái),可靈活支持各類(lèi)模型與算力部署。

      OceanBase AI 智能一體機(jī)有兩大特點(diǎn):第一是功能全面覆蓋,從底層的算力,海外或者國(guó)產(chǎn)算力支持,到模型、數(shù)據(jù)、RAG,到 Agent 開(kāi)發(fā),再到數(shù)據(jù)領(lǐng)域智能體,能完整覆蓋企業(yè)從數(shù)據(jù)底座搭建到 AI 應(yīng)用開(kāi)發(fā)的全生命周期需求;第二個(gè)特點(diǎn),就是超高性?xún)r(jià)比,它定價(jià)親民,無(wú)需高昂成本,企業(yè)就能直接擁有 OceanBase 這套完善的端到端解決方案。

      最后,我們還是回到 OceanBase 的內(nèi)核,我們看看這一次OceanBase 的內(nèi)核,到底帶來(lái)哪些全新的能力?

      OceanBase 4.4 版本是面向混合負(fù)載的 TP/AP 融合及向量增強(qiáng) LTS 版本,它融合了 OceanBase 4.2.5 LTS 的 OLTP 能力與 OceanBase 4.3.5 LTS 的 AP 及向量能力,能夠同時(shí)兼顧核心系統(tǒng)以及多元化業(yè)務(wù)系統(tǒng)對(duì)數(shù)據(jù)庫(kù)的需求。



      在 OLTP 的性能方面,OceanBase4.4 版本相比 4.2.5 有了進(jìn)一步的提升,有大量主鍵沖突的場(chǎng)景,性能提升 15% 到 42%,回表場(chǎng)景的性能提升 5.7% 到 9.5%,PL 性能提升會(huì)更加明顯,對(duì)于 UDF 執(zhí)行的性能是提升了 2.3 倍,循環(huán)計(jì)算的性能提供了 4 倍,動(dòng)態(tài)語(yǔ)句的處理性能提升了 3.6 倍,AP 的性能也提到了進(jìn)一步的提升。相比 4.3.5 LTS,它的數(shù)據(jù)導(dǎo)入性能在 ClickBench 這個(gè)場(chǎng)景提升 37%,實(shí)時(shí)分析性能對(duì)于 ClickBench 提升 4%,TPC-H 提升 10%,TPC-DS 提升 13.7%,向量索引的性能也是得到進(jìn)一步的提升。

      向量索引總共有兩種索引方式,IVF 和 HNSW。IVF 的索引提升 15%,HNSW 的性能提升 4%-32%。同時(shí)在向量索引上,也針對(duì) ARM 架構(gòu)進(jìn)行大量的優(yōu)化,在 ARM 架構(gòu),性能有倍數(shù)的提升。

      OceanBase 4.4 版本的內(nèi)核能力也做進(jìn)一步增強(qiáng)。它具備更強(qiáng)的安全能力以及 Oracle 的兼容能力。OceanBase 4.4 版本不僅支持全密態(tài)數(shù)據(jù)庫(kù),還支持聯(lián)邦查詢(xún)和數(shù)據(jù)湖的融合,能夠幫助企業(yè),尤其是金融與政企行業(yè)企業(yè)打通數(shù)據(jù)孤島。

      OceanBase 4.4 版本同時(shí)支持存算一體架構(gòu),以及公有云上的存儲(chǔ)計(jì)算分離部署模式,適配多樣化部署需求。更值得關(guān)注的是,該版本新增了一項(xiàng)核心能力 —— 實(shí)時(shí)增量物化視圖。這一功能大幅強(qiáng)化了 OceanBase 的 HTAP 實(shí)力:讓一套引擎既能穩(wěn)定支撐 OLTP 核心交易處理,又能通過(guò)動(dòng)態(tài)實(shí)時(shí)的增量物化視圖,實(shí)現(xiàn)多維度的實(shí)時(shí)分析,實(shí)現(xiàn)真正的HTAP。



      結(jié)語(yǔ)

      各位嘉賓、朋友,AI 時(shí)代的浪潮已然來(lái)臨。無(wú)論你是企業(yè)管理者,還是深耕技術(shù)的同行,大家都在思考:如何真正把 AI 用好、用深、用在業(yè)務(wù)里。在這樣的背景下,一個(gè)開(kāi)放、靈活、具備多模與混合搜索能力的數(shù)據(jù)庫(kù),正成為企業(yè)邁向 AI 的關(guān)鍵基礎(chǔ)。它能幫你高效管理企業(yè)數(shù)據(jù),更能將數(shù)據(jù)能力與 AI 能力深度融入業(yè)務(wù)流程,讓 Data 與 AI 真正落地生根,為業(yè)務(wù)創(chuàng)造實(shí)實(shí)在在的價(jià)值。

      這就是我的分享,感謝大家一直以來(lái)對(duì) OceanBase 持續(xù)的支持。謝謝!

      更多企業(yè)在數(shù)據(jù)庫(kù)與AI上的應(yīng)用實(shí)踐,大會(huì)中的精彩回放和資料,可通過(guò)下方鏈接,前往查看:https://www.oceanbase.com/conference2025/resources?utm_source=itpub&utm_campaign=1127

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      三嬸到處說(shuō)我靠她兒找工作,聚會(huì)逼我感恩,我說(shuō)三句,她手抖不停

      三嬸到處說(shuō)我靠她兒找工作,聚會(huì)逼我感恩,我說(shuō)三句,她手抖不停

      麥子情感故事
      2026-05-15 15:22:11
      遠(yuǎn)藤保仁:利雅得勝利很強(qiáng),但鋼巴也不會(huì)完全保守的迎戰(zhàn)

      遠(yuǎn)藤保仁:利雅得勝利很強(qiáng),但鋼巴也不會(huì)完全保守的迎戰(zhàn)

      懂球帝
      2026-05-16 00:34:12
      蘋(píng)果深夜降價(jià)!iPhone17到手只要4499元

      蘋(píng)果深夜降價(jià)!iPhone17到手只要4499元

      大象新聞
      2026-05-15 09:46:09
      三胎生父被曝后,張柏芝案終于判了,好消息傳來(lái)難怪早已立好遺囑

      三胎生父被曝后,張柏芝案終于判了,好消息傳來(lái)難怪早已立好遺囑

      叨嘮
      2026-05-15 04:02:27
      有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

      有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

      夜深?lèi)?ài)雜談
      2026-02-18 20:55:58
      美股芯片股全線(xiàn)下挫,ARM跌近9%,中概股普跌,黃金跌破4520美元/盎司

      美股芯片股全線(xiàn)下挫,ARM跌近9%,中概股普跌,黃金跌破4520美元/盎司

      21世紀(jì)經(jīng)濟(jì)報(bào)道
      2026-05-15 23:09:08
      日乒公布2026亞錦賽國(guó)內(nèi)選拔賽名單,早田希娜、橋本帆乃香等人悉數(shù)出戰(zhàn)

      日乒公布2026亞錦賽國(guó)內(nèi)選拔賽名單,早田希娜、橋本帆乃香等人悉數(shù)出戰(zhàn)

      銜春信
      2026-05-15 12:23:53
      故宮建造時(shí)使用的木材,來(lái)自哪里?為何這些木材至今沒(méi)有腐爛

      故宮建造時(shí)使用的木材,來(lái)自哪里?為何這些木材至今沒(méi)有腐爛

      云霄紀(jì)史觀
      2026-05-15 01:49:45
      特朗普走了,黃仁勛還留在北京當(dāng)“吃播”

      特朗普走了,黃仁勛還留在北京當(dāng)“吃播”

      三叔的裝備空間
      2026-05-15 22:35:14
      鄭州再迎重磅首店,“必勝漢堡”三店同開(kāi)切入“一人食”賽道

      鄭州再迎重磅首店,“必勝漢堡”三店同開(kāi)切入“一人食”賽道

      大象新聞
      2026-05-15 16:54:40
      中路指揮續(xù)約國(guó)米!再戰(zhàn)兩賽季背后,是承上啟下般基礎(chǔ)支撐

      中路指揮續(xù)約國(guó)米!再戰(zhàn)兩賽季背后,是承上啟下般基礎(chǔ)支撐

      里芃芃體育
      2026-05-16 05:00:10
      男子謊稱(chēng)女兒患白血病騙取工友80多萬(wàn)元,甚至誘騙工友通過(guò)網(wǎng)絡(luò)小貸、消費(fèi)貸等方式籌錢(qián)出借,被判處有期徒刑10年6個(gè)月,并處罰金15萬(wàn)元

      男子謊稱(chēng)女兒患白血病騙取工友80多萬(wàn)元,甚至誘騙工友通過(guò)網(wǎng)絡(luò)小貸、消費(fèi)貸等方式籌錢(qián)出借,被判處有期徒刑10年6個(gè)月,并處罰金15萬(wàn)元

      大風(fēng)新聞
      2026-05-15 14:45:03
      小米價(jià)格徹底雪崩!16GB+1TB頂配旗艦,從5499狂跌至3133元

      小米價(jià)格徹底雪崩!16GB+1TB頂配旗艦,從5499狂跌至3133元

      小柱解說(shuō)游戲
      2026-05-15 01:21:41
      李國(guó)旭甩鍋洋助教,球迷怒斥老板:買(mǎi)外援別摳門(mén)

      李國(guó)旭甩鍋洋助教,球迷怒斥老板:買(mǎi)外援別摳門(mén)

      林子說(shuō)事
      2026-05-16 01:09:30
      麥金:真希望沃特金斯是蘇格蘭球員;捧起歐聯(lián)獎(jiǎng)杯是全隊(duì)目標(biāo)

      麥金:真希望沃特金斯是蘇格蘭球員;捧起歐聯(lián)獎(jiǎng)杯是全隊(duì)目標(biāo)

      懂球帝
      2026-05-16 05:21:10
      特朗普訪(fǎng)華剛結(jié)束,伊朗外長(zhǎng)就表態(tài):感謝中國(guó),不信美國(guó)

      特朗普訪(fǎng)華剛結(jié)束,伊朗外長(zhǎng)就表態(tài):感謝中國(guó),不信美國(guó)

      時(shí)光流轉(zhuǎn)追夢(mèng)人
      2026-05-16 00:32:45
      我有罪,大導(dǎo)演昆汀花1萬(wàn)美金,在包房舔腳半小時(shí),直到皮膚起皺

      我有罪,大導(dǎo)演昆汀花1萬(wàn)美金,在包房舔腳半小時(shí),直到皮膚起皺

      西樓知趣雜談
      2026-04-20 08:40:47
      全場(chǎng)2分!曾凡博低迷原因出爐!賽前親承帶傷,快對(duì)止疼藥免疫了

      全場(chǎng)2分!曾凡博低迷原因出爐!賽前親承帶傷,快對(duì)止疼藥免疫了

      籃球資訊達(dá)人
      2026-05-16 00:03:37
      萬(wàn)萬(wàn)沒(méi)想到,在特朗普結(jié)束北京之行前,中美竟訂下“三年之約”!

      萬(wàn)萬(wàn)沒(méi)想到,在特朗普結(jié)束北京之行前,中美竟訂下“三年之約”!

      古史青云啊
      2026-05-15 22:06:27
      越南女排邀請(qǐng)賽首場(chǎng)比賽:江蘇女排3-1戰(zhàn)勝平奠隆安VTV迎開(kāi)門(mén)紅

      越南女排邀請(qǐng)賽首場(chǎng)比賽:江蘇女排3-1戰(zhàn)勝平奠隆安VTV迎開(kāi)門(mén)紅

      陌識(shí)
      2026-05-16 00:26:31
      2026-05-16 05:59:00
      ITPUB學(xué)院
      ITPUB學(xué)院
      分享技術(shù)干貨,了解最新動(dòng)態(tài)
      1220文章數(shù) 629關(guān)注度
      往期回顧 全部

      科技要聞

      直降千元起步!蘋(píng)果華為率先開(kāi)啟618讓利

      頭條要聞

      黃仁勛在北京喝豆汁痛苦皺眉 問(wèn)“這是什么東西”

      頭條要聞

      黃仁勛在北京喝豆汁痛苦皺眉 問(wèn)“這是什么東西”

      體育要聞

      德約科維奇買(mǎi)的球隊(duì),從第6級(jí)聯(lián)賽升入法甲

      娛樂(lè)要聞

      方媛為何要來(lái)《桃花塢6》沒(méi)苦硬吃?

      財(cái)經(jīng)要聞

      騰訊掉隊(duì),馬化騰戳破真相

      汽車(chē)要聞

      高爾夫GTI刷新紐北紀(jì)錄 ID. Polo GTI迎全球首秀

      態(tài)度原創(chuàng)

      健康
      教育
      家居
      數(shù)碼
      手機(jī)

      專(zhuān)家揭秘干細(xì)胞回輸?shù)陌踩L(fēng)險(xiǎn)

      教育要聞

      老師掌摑多名學(xué)生后續(xù),系一名書(shū)法教師,當(dāng)?shù)毓继幜P結(jié)果

      家居要聞

      110㎡淡而有致的生活表達(dá)

      數(shù)碼要聞

      聯(lián)想發(fā)布ThinkPad T14 Gen 7 支持LPCAMM2可更換內(nèi)存

      手機(jī)要聞

      iPhone 17系列全系跳水,最高立減2500!

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 2025亚洲无码视频| 大又大粗又爽又黄少妇毛片男同 | 日本大胆欧美人术艺术| 色AV综合AV综合无码网站| 久久久久性色av毛片特级| 天堂av网一区二区三区| 中国久久中文| 日韩女同一区二区三区久久 | 亚洲国产三级在线观看| 欧美巨大极度另类| 美女色在线观看| 大桥久未无码吹潮在线观看| 欧美在线观看一区二区三区| 亚洲AV秘 无码一区二区三区臀| 福利姬液液酱喷水| 麻豆AV免费网站| 日本免费人成视频播放| 亚洲激情av在线| 欧美精品亚洲精品日韩专区va| 囗一交一一性一交| 色婷婷狠狠久久综合五月| 熟妇人妻无码中文字幕 | 国产激情艳情在线看视频| 潮喷在线播放| 成人片99久久精品国产桃花岛| 亚洲中文字幕永久在线全国| 国产又黄又猛又粗又爽的a片动漫| 日本不卡三区| 日本三级香港三级人妇gg在线| 国产成人无码av在线播放dvd | 亚洲综合熟女久久久30p| 性欧美老人牲交XXXXX视频| 国产97在线 | 亚洲| 国产老熟女狂叫对白| 国产亚洲精品自在久久vr| 中国少妇BBW| 九九热久久只有精品2| 在线亚洲欧美日韩精品专区| 国产无遮挡a片无码免费| AV秘 无码一区二| 东北女人啪啪对白|