This is Going to Sound Crazy, But What If We Used Large Language Models to Boost Automatic Databa...

📅 2026/7/5 15:17:11
This is Going to Sound Crazy, But What If We Used Large Language Models to Boost Automatic Databa...
文章核心总结主要内容文章提出Booster框架,旨在解决现有数据库调优器(成本型、机器学习型、大语言模型型)难以适应环境变化(如工作负载漂移、跨模式迁移、硬件变更等)的问题。其核心逻辑是:将历史调优 artifacts 结构化為查询-配置(QConfig)对象,通过大语言模型(LLM)基于查询语义生成单查询候选配置(种子),再通过束搜索组合为整体配置,注入现有调优器以加速优化。实验基于PostgreSQL和OLAP工作负载验证,Booster可使调优器性能提升最高74%,优化时间缩短最高4.7倍。创新点查询级历史知识复用:突破现有调优器的工作负载级粒度限制,从单查询语义出发,挖掘历史配置中的针对性优化经验。LLM引导的候选配置生成:通过QConfig的向量检索匹配相关历史经验,增强LLM提示词上下文,生成高质量单查询种子配置,并通过Sanitizer保证有效性。约束组合机制:采用束搜索算法解决多查询种子的参数冲突,组合为全局最优配置,兼容不同类型调优器的集成需求。普适性框架设计:通过标准化API(Parse/Link/Digest)实现与现有调优器的无缝集成,无需修改调优器核心逻辑。翻译部分(Markdown格式)