Agent落地催生数据库变革,OceanBase推湖库一体架构
2026/07/01 11:29阅读量 2
AI Agent深入业务,要求数据库从存储系统演变为记忆系统,需具备实时上下文供给、多模态管理和规模级低成本。OceanBase提出“湖库一体”架构,统一结构化、非结构化和向量数据,支撑事务、分析与AI工作负载。其AI数据库产品体系包括Lakebase、DataStudio、DataPilot,据称可使整体TCO降低30%-50%。
事件概述
在AI Agent加速落地的背景下,数据库的角色正从传统的数据存储系统转变为Agent的“记忆系统”。Agent需要实时访问结构化、非结构化及向量数据,并依赖RAG(检索增强生成)和实时数据流驱动,这对数据库提出了新的要求:准确的上下文供给、海量Agent独立数据空间的低成本共存、以及对自我进化能力的支撑。
核心信息
Agent对数据库的新需求
- 上下文供给:Agent的所有动作可拆解为上下文加模型调用,数据库需在一次检索中从多形态数据中找出最相关信息,自然语言成为与Agent交互的新入口。
- 规模爆发:每个Agent应用(如闪应用)需要独立数据空间,但单个数据量小,数据库需支持海量库以极低成本共存并做到秒级响应。蚂蚁灵光已有3000万个闪应用。
- 自我进化:Agent通过总结过往经验优化,数据库需提供隔离的试验环境,并实现在线数据与离线数据的统一(数据飞轮)。
- 多模态混合搜索:结构化与非结构化数据需在统一底座上管理和调用。
数据库架构方向:湖库一体
湖库一体并非简单将数据湖与数据库合并,而是在统一底座上兼顾数据湖的开放性和海量存储,以及数据库的事务、一致性和实时处理能力。一份数据即可支撑在线业务、实时分析和Agent应用,无需多系统同步。
OceanBase的解决方案
OceanBase从数据库内核出发,将核心交易场景中验证的事务一致性、高可用、实时处理能力延伸到湖和非结构化数据之上,形成AI数据库产品线:
- OceanBase Lakebase:底层引擎,实现湖库一体与多模态数据管理,通过“多模表”将结构化、文本、图片、向量等纳入同一语义,通过“AI列”在数据原地完成摘要、标签、向量化等加工。支持S3兼容对象存储与Iceberg开放表格式,可对接Spark、Ray等引擎。
- OceanBase DataStudio:数据生产、治理与服务工作台,覆盖数据接入、加工、编排、语义建模、治理及Agent协作。
- OceanBase DataPilot:面向业务决策的数据智能Agent,支持自然语言分析、看板生成等。
关键背景与数据
- OceanBase诞生于阿里“双十一”场景,已服务超过400家金融机构,近七成万亿级资产银行核心系统基于其上。
- 是迄今唯一同时在TPC-C、TPC-H两项国际权威基准测试中登顶的数据库。
- 在相关场景中,OceanBase AI数据库可使整体TCO降低30%-50%。
值得关注
当Agent成为企业应用新入口,数据库的竞争维度从传统能力转向谁能为Agent提供统一、开放、低成本的Memory Runtime。OceanBase试图通过“湖库一体”将工程复杂性收敛到单一底座,降低Agent落地中的数据同步、系统拼装成本,这一定位可能影响未来AI基础设施的格局。
