第35章:自定义 LLM、Embedding 与向量存储适配器 📅 2026/6/16 0:25:52 版本:LlamaIndex 0.12.x定位:把企业内部基础设施接入 LlamaIndex源码关联:llama_index.core.llms、llama_index.core.embeddings、llama_index.core.vector_stores1. 项目背景某大型企业的 AI 平台团队面临一个"三明治困境":上层是业务方强烈要求用 LlamaIndex 快速搭建 RAG 应用,底层是公司已有的基础设施——自建模型网关(统一鉴权、限流、审计)和自研向量数据库。在中间层的团队发现,LlamaIndex 官方 LLM 类(OpenAI、Anthropic 等)直接向公网 API 发请求,绕过了公司网关的审计链路;官方的 VectorStore 集成列表里也没有他们自研的向量库。基础设施组的态度很明确:“任何 AI 应用必须通过网关调用模型,不允许直连外部 API——这是安全红线。”不做适配的后果是三重困境:(1) 技术栈不兼容。公司的模型网关使用自定义鉴权 Header——X-Gateway-Token和X-Department-ID,响应格式也与 OpenAI 的choices[0].message.content不同,而是data.reply.text。官方 LLM 类直接构造 OpenAI 格式的请求体,无法适配这套私有协议。同理