Sampling 反制实战:让 MCP Server 主动调用 LLM 完成复杂推理与生成

📅 2026/7/2 11:41:42
Sampling 反制实战:让 MCP Server 主动调用 LLM 完成复杂推理与生成
引言:当 MCP Server 不再只是“工具人”2026年,Model Context Protocol(MCP)已经从一个实验性协议成长为AI Agent基础设施的核心支柱。根据阿里云百炼平台的官方数据,该平台已预置20+云端服务和50+本地服务。全网涌现的MCP Server数量在2026年初已超过2万个。然而,随着MCP Server从“被调用的工具”进化为“主动推理的智能体”,一个根本性的架构问题浮出水面:当Server需要LLM能力时,它该怎么办?传统方案是让Server直接集成LLM API——自己拿API Key、自己选模型、自己付账单。但这带来了成本失控、扩展瓶颈和灵活性缺失三大问题。MCP协议在2024年11月发布时就内置了一个优雅的解决方案——Sampling机制:Server可以请求Client代劳LLM推理,Server不持有模型、不持有API Key、甚至不知道Client实际用的是哪个模型。这个设计理念无疑是先进的。但现实是残酷的。根据MCP官方SEP-2577文档的披露,Sampling功能“概念上强大,但 adoption 一直很挣扎”——实现复杂、客户端支持率低。更致命的是,2026年4月14日提交的SEP-2577正式将Sampling标记为Deprecated(弃用),生效于2026年7月28日的协议版本。那么问题来了:Sampling被弃用之后,MCP Server如何实现“主动调用LLM完成复杂推理与生成”?