丘成桐入局量化：当菲尔兹奖得主重构组合优化

📅 2026/7/1 2:26:26

很多做组合优化的人其实都知道一个问题方差并不等于风险。但真到工程里大家最后还是很容易回到 Markowitz 那套均值-方差框架。原因不复杂。不是因为偏度、峰度不重要而是因为它们太难算。协方差矩阵已经够烦了。再往上走到 coskewness、cokurtosis维度直接爆炸。你想在几千只股票上做 MVSK 优化传统路线很快就会把内存和求解器一起打穿。所以这篇 YANDYaus Affine-Normal Descent我觉得值得看不是因为“菲尔兹奖得主入局量化”这个标题够响而是它真的碰到了组合优化里一个长期卡住的工程问题能不能不显式构建高阶矩张量也把偏度和峰度放进大规模组合优化如果这个问题成立很多过去只能停留在理论里的东西才有机会进到真正的投资组合系统。YAND 高阶矩组合优化论文首页1. 均值-方差的问题量化人都见过Markowitz 的框架很漂亮给定预期收益最小化组合方差或者给定风险预算最大化组合收益这套东西能成为行业标准一个重要原因是它足够可算、足够稳定、足够容易解释。但它也有几个实盘里绕不开的盲区。1上涨和下跌被当成同一种风险方差只关心波动大小不关心波动方向。组合涨 5% 和跌 5%在方差眼里都算“风险贡献”。但对基金经理来说这两件事显然不是一个东西。2尾部风险被压得太薄如果收益近似正态方差确实能描述大部分风险。问题是市场经常不近似正态。极端行情里相关性会同时抬升流动性会同时消失过去看起来分散的资产会突然变成同一笔交易。这时候你再看 VAR 或有效前沿会有一种熟悉的感觉回测里很科学实盘里很脆3参数估计太敏感均值-方差优化还有一个老毛病输入稍微动一下权重可能大幅跳。预期收益估计偏一点协方差估计抖一点最后出来的组合就可能完全不是同一个东西。这也是很多团队最后会在 MVO 外面套一堆约束、收缩、行业暴露限制和换手惩罚的原因。不是模型不优雅是裸模型太容易被噪声牵着走。2. 高阶矩为什么一直进不了主流程理论上偏度和峰度早就该进组合优化了。偏度描述收益分布的不对称性。峰度描述尾部有多厚。对资产管理来说这两个东西都很关键。你当然希望组合有更好的右偏也当然不希望左尾突然给你一刀。问题在计算。矩阶要处理的对象N1000 时大概多大工程感受二阶协方差矩阵约 10^6 个元素还能接受三阶coskewness 张量约 10^9 个元素开始难受四阶cokurtosis 张量约 10^12 个元素基本炸了这就是高阶矩优化长期尴尬的地方。大家都知道它有意义但一到几千只资产传统做法往往只有三条路1. 假设一个分布把问题参数化。2. 用因子降维把资产维度压下去。3. 做稀疏化或低秩近似牺牲一部分精度。这三条路都能用但都有代价。分布假设可能不贴近真实市场因子降维会抹掉个股层面的特异性低秩近似如果没有足够强的误差控制很容易变成“看起来很快实际偏了”。所以行业后来很喜欢 HRP 这类方法也不奇怪。HRP 很务实不硬求逆不追求均值不碰高阶矩先把分散化这件事做稳。但 HRP 解决的是“怎么更稳地分配风险”不是“怎么把偏度和峰度放进目标函数”。3. YAND 的关键不去搬那座张量山YAND 的思路很直接既然显式构建高阶矩张量太重那就别构建。它直接在收益矩阵上做文章通过结构化导数和 Hessian-vector product 去拿优化需要的信息。可以把传统路线和 YAND 路线简单画成这样传统 MVSK 收益数据 | v 显式估计协方差 / coskewness / cokurtosis | v 巨型张量进入优化器 | v 求组合权重 YAND 收益矩阵 | v 结构化导数核 Hessian-vector product | v 仿射正规方向 | v 精确线搜索 | v 求组合权重这里最有意思的是“仿射正规方向”。普通梯度下降看的是局部最陡下降方向。但 MVSK 这种目标函数的地形并不规整。它可能是病态的、扭曲的、非凸的。梯度方向在这种地形里容易来回晃牛顿法的二次近似也不一定可靠。YAND 换了一个视角它看当前等高线曲面的局部几何用微分几何里的 affine normal 来决定下降方向。这个方向有一个很适合金融数据的性质对仿射变换不敏感。资产收益率尺度不一样波动不同协方差结构也会被拉伸。一个优化方向如果对坐标缩放太敏感落到金融数据里就很容易不稳。YAND 试图让“下山方向”更多由几何形状决定而不是被坐标尺度牵着走。4. 论文里真正硬的地方是这三层设计我把它压成一张表层次传统做法YAND 做法数据结构显式高阶矩张量直接作用于收益矩阵优化方向梯度 / 牛顿方向仿射正规方向步长选择Armijo / Wolfe 这类近似规则精确四次线搜索最后一项也很关键。MVSK 目标函数本身带有四次多项式结构。YAND 利用这个结构做 exact quartic line search直接解析出更合适的步长。这解决了很多优化算法里最烦人的一个问题方向看起来对步长调半天换个样本又不稳对于量化系统来说少一个手调超参就是少一个未来出事故的位置。5. A股 5440 只股票的实验该怎么看论文用了 5 分钟级别的 A 股面板覆盖 5440 只股票。这个市场选得挺合理。A股有涨跌停、有散户结构、有明显的非对称和肥尾。你要验证高阶矩优化有没有意义A股比一个更接近正态的市场更容易暴露差异。原文里有几个结果我觉得可以拆成三个判断。判断一高阶矩不是越多越好论文里一个很实用的发现是高阶矩的增量价值在中等收益目标区间最明显。这句话对做策略组合的人很有用。如果你的收益目标非常低组合本来就已经足够分散偏度和峰度带来的边际改进有限。如果你的收益目标非常高组合被迫承担很激进的风险暴露方差和收益约束已经主导结果高阶矩也很难救回来。真正适合高阶矩发挥作用的反而是中间区域收益目标不低但也没有高到必须极端押注此时尾部形状和分布不对称开始变得值钱这点比“MVSK 跑赢 MV”这种结论更实用。它告诉你别见到新目标函数就全仓替换。先看你的产品目标到底落在哪个区间。判断二没有一个配置能通吃所有资产规模论文里不同求解配置的适用范围并不一样。场景更像该用的配置原因几十到几百只资产直接配置问题规模还可控几百到几千只资产PCG 停滞恢复需要更强的数值稳定性全市场大规模组合需要更严格工程封装估计误差、换手和约束都会上来这其实很像真实量化系统。论文里的算法是核心发动机但实盘系统还需要变速箱、刹车和仪表盘。判断三高阶矩价值是 regime 依赖的高阶矩不是全天候圣杯。在肥尾、强波动、相关性结构剧烈变化的市场窗口里它可能明显比均值-方差更有价值。在低波动、分布更温和的窗口里增量可能就没那么大。所以真正值得做的下一步可能不是简单把 YAND-MVSK 固定上线而是先识别市场 regime | v 判断高阶矩信息是否有边际价值 | v 动态切换 MVO / HRP / CVaR / MVSK这个方向更接近可交易系统。6. 真要落地还得过几关我不会把这篇论文理解成“组合优化已经被微分几何解决了”。从工程角度它至少还有几件事要继续验证。1交易成本高阶矩对分布形状更敏感也可能让权重对市场状态变化更敏感。如果组合换手明显上升理论效用可能会被成本吃掉。A股环境里冲击成本、涨跌停、T1、停牌和流动性分层都会影响结果。2估计误差偏度和峰度比方差更难估。如果样本窗口里没有足够尾部事件你估出来的峰度可能偏低如果窗口里刚好有一次极端事件估计又可能被放大。YAND 解决的是大规模优化问题不等于完全解决高阶矩估计问题。3约束系统真实组合里不会只有一个目标函数。行业暴露、风格暴露、个股上限、换手限制、跟踪误差、流动性约束全都要进来。YAND-MVSK 如果要进产品系统下一步一定要和这些约束一起跑而不是只看无约束或弱约束版本。7. 我会怎么用它如果只是做一个普通指数增强产品我不会第一时间把它放到主引擎。跟踪误差和换手成本太现实了。但如果是下面几类场景我会认真跟1. 中长期绝对收益组合2. 多资产配置或 FOF3. 更关注左尾风险的保险、养老金、LDI 组合4. 因子组合里的尾部风险控制模块5. 用来诊断现有 MVO 组合的偏度/峰度暴露。最稳妥的用法可能不是直接替代 Markowitz而是先做风险诊断原组合权重 | v 计算历史偏度 / 峰度暴露 | v 用 YAND-MVSK 生成对照组合 | v 比较收益、回撤、左尾和换手如果对照组合只是在回测里更漂亮但换手和估计误差明显变差那就先别急着上线。如果它能稳定降低左尾同时没有明显推高交易成本这才值得继续推进。8. 最后Markowitz 的伟大之处是把风险第一次清晰地写进了组合优化。但市场的风险从来不只是一条方差曲线。尾部、不对称、极端相关性、非凸目标这些东西一直都在只是过去算不动。YAND 这篇文章的意义是把一个长期“理论上知道有用、工程上很难落地”的问题往前推了一步。它不保证你从此躲开所有尾部事件。但它至少提醒我们当组合规模足够大、市场分布足够脏时风险问题可能已经不只是统计问题也是一道高维几何问题。复现代码、论文细节和更多 AI 量化研究我会继续放在析境科技AI量化平台。SeekGain 析境科技是国内首个个人AI量化平台也是连接量化研究者、AI 开发者和投资实践者的国内最大AI量化社群之一。我们聚焦机器学习在量化投资中的前沿应用持续分享论文复现、模型代码、核心 Alpha 因子、策略研究框架和 AI 量化工具链。核心价值1. 顶级圈层连接量化研究员、私募创始人、基金经理、券商金工分析师、GitHub 高星项目作者及前沿研究者。2. 每日高价值内容持续更新前沿论文、研报复现、模型代码、核心 Alpha 因子和可落地的量化研究案例。3. AI量化工具链围绕因子挖掘、策略复现、回测验证和量化 Agent帮助个人研究者把想法更快落到可验证的策略研究里。加入 SeekGain 析境科技和真正做研究的人一起把 AI 量化从概念推进到可复现、可验证、可迭代。

新闻详情

相关阅读

Agent-Skill模式实战指南：构建模块化与可编排的业务系统

我做了一个基于心理测评和场景记忆的 AI 伴侣产品 CandyAI

破局生物医药研发：实验数据标准化管理平台如何重塑科研新范式

大模型推理底层依赖缺失，解决 ImportError: Could not import the ‘cuda‘ module

VisualCppRedist AIO：一键修复Windows软件兼容性问题的终极解决方案

保姆级教程：PX4飞控mixer混控器从配置到PWM输出的完整流程（以DJI F450为例）

STM32CubeMX因为ioc文件版本不同而打不开

新手避坑指南：用严恭敏老师的PSINS工具箱跑通第一个SINS仿真（附完整代码）

大厂是怎么监控 Java 项目的 02

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！