5月19日-23日,国际顶级数据库学术会议ICDE 2025(第41届IEEE国际数据工程大会)于中国香港举办。本届会议中国高校和企业表现亮眼,其中数据库厂商OceanBase共有6篇论文入选,有1篇获“最佳工业和应用论文亚军”,研究方向包括分布式数据库、联邦学习、隐私保护等,展现了其在数据库与AI融合上的突破进展。


ICDE与SIGMOD、VLDB并称为数据库领域三大顶级会议,是中国计算机学会CCF推荐的A类国际学术会议,在全球学术圈中拥有极高的权威性和影响力。本届会议吸引近千名全球顶尖学者及行业专家参与,聚焦数据工程领域的前沿技术突破与行业应用实践。



伴随AI技术的爆发式发展,数据库作为数据存储和管理的核心系统,面临海量数据存储、复杂计算需求、隐私保护等多重挑战。以OceanBase为代表的数据库厂商正在创新探索数据库与AI的融合,建造AI时代数据底座。


被评定为“最佳工业和应用论文亚军”的《OceanBase单元化:构建下一代在线地图应用》,介绍了OceanBase的单元化架构设计。该架构将系统服务拆分为多个独立“单元”,每个单元可在单台服务器独立部署并支持跨区域多机协同,结合读写分离和混合架构,系统自动平衡事务型(OLTP)和分析型(OLAP)负载,实现高可用、弹性扩展、资源隔离和高性能,高效处理大规模数据和高并发访问。该架构已在高德地图落地实践,展现增强的容灾能力,并在写密集型和读密集型基准测试中均实现性能提升。


在AI重塑数据处理需求的背景下,OceanBase多项研究聚焦数据库与AI融合,探索智能化数据处理路径。


例如,针对纵向联邦学习中参与方选择效率低、数据多样性不足的痛点,《追踪数据多样性:纵向联邦学习中的参与者选择》一文提出VFPS-SM优化框架。该框架将参与方选择转化为“子模函数最大化”数学问题,结合KNN算法、top-k查询与加密技术,在保护数据隐私的前提下,使参与方选择效率最高提升365倍、模型训练效率提升35倍。这一技术可应用于医疗、物流、交通等领域,助力跨机构数据协作建模,例如加速多医院联合疾病预测模型的开发。


另一篇论文《如何响应安全且私密的SQL查询》聚焦数据安全与访问效率、查询精度的平衡。文章综述现有安全隐私SQL查询的算法,总结了一套通过模块化拆解复杂SQL查询的方法,结合安全计算与差分隐私技术,在保证数据安全、用户隐私的情况下,提高SQL查询的效率和精度。


在ICDE 2025上,OceanBase还受邀举办一场题为“AI时代的数据库”的研讨会,多位数据库与AI领域的资深学者和研究员参会发言,分享Data x AI领域最前沿的学术进展与创新实践。


AI技术的引入,正逐步将数据库推向全新时代。作为根自研的原生分布式数据库,OceanBase自2010年创立以来,始终坚持技术创新,多次在SIGMOD、VLDB、ICDE、AAAI等国际学术舞台展示硬实力,并与华东师范大学、中国人民大学、武汉大学、新加坡南洋理工大学等机构合作,共同探索数据库前沿技术。2025年4月,OceanBase CEO杨冰宣布公司全面进入AI时代,提出“Data x AI”战略,启动人才和组织体系升级,建设AI时代的数据底座。


校对 卢茜