Week1：机器学习基础+线性回归

📅 2026/7/6 3:01:13

目录一、学习摘要二、基础概念2.1 机器学习三要素2.2 期望风险与经验风险最小化2.3 任务划分三、核心推导3.1 线性回归数学模型3.2 MSE 损失函数凸性完整证明3.2.1损失函数表达式3.2.2凸性严格证明3.3 最小二乘解析解完整矩阵求导3.3.1.对编辑求梯度并令梯度等于零向量凸函数极值条件3.3.2 . 代入两条核心矩阵求导公式3.3.3.合并梯度等式3.3.4.求解最优权重四、难点分析4.1 解析解的理论局限性4.2 凸损失的现实意义4.3 多重共线性理论后果一、学习摘要学习内容本周学习了李宏毅老师的机器学习课程第 1 讲《机器学习基础介绍》和第 2 讲《Regression 线性回归》本周公式推导MSE 均方误差损失函数的凸性完整证明线性回归最小二乘解析解矩阵形式完整求导推导。学习目标建立标准化机器学习三要素数学定义从矩阵、凸优化角度理解线性回归最优解来源二、基础概念2.1 机器学习三要素任意机器学习任务由三组数学对象构成模型集 H所有候选预测函数构成的集合 ( h(x) )损失函数量化预测值与真实标签的偏差优化算法寻找使整体损失最小的最优模型。2.2 期望风险与经验风险最小化真实全局损失为数据分布下的期望损失真实数据分布P(data) 未知用训练集 N 个样本均值近似得到经验损失机器学习核心优化目标2.3 任务划分回归任务输出 y属于R的连续实数分类任务输出 y属于0到C中离散有限集合。本周仅研究回归任务以线性回归为基础模型。三、核心推导3.1 线性回归数学模型单样本原始模型分开权重与偏置其中 w特征权重 b 偏置项为简化矩阵运算构造增广向量模型简化为无偏置统一形式全部N个训练集写成矩阵形式其中设计矩阵第 i 行是全部样本预测值向量真实标签向量。3.2 MSE 损失函数凸性完整证明3.2.1损失函数表达式单样本平方损失整体经验均方误差损失展开二范数3.2.2凸性严格证明凸二次函数判定定理为凸函数A半正定。观察损失函数二次项矩阵对任意非零向量 v满足半正定定义因此二次项是凸函数为线性函数凸凹常数项为常数凸函数有限个凸函数相加仍为凸函数因此是凸损失函数。推论凸函数不存在局部最优≠全局最优梯度为 0 的点一定是全局最小点。3.3 最小二乘解析解完整矩阵求导优化目标系数 1/N 不改变最优权重可直接省略。3.3.1.对求梯度并令梯度等于零向量凸函数极值条件3.3.2 . 代入两条核心矩阵求导公式是对称矩阵因此第一项梯度简化为第二项梯度常数项梯度为 0。3.3.3.合并梯度等式两边消去系数 23.3.4.求解最优权重若可逆特征线性无关、无多重共线性等式两侧左乘逆矩阵得到最小二乘闭式解补充称为矩阵 X的摩尔-彭若斯伪逆当特征存在多重共线性时奇异不可逆无唯一解析解需引入正则化。四、难点分析4.1 解析解的理论局限性矩阵求逆时间复杂度为 O(d^3) d 为特征维度高维大数据场景下计算成本极高因此实际工程采用梯度下降迭代求解两种方法无优劣仅适用场景不同。4.2 凸损失的现实意义线性回归训练不会陷入局部极小无论初始权重如何梯度下降最终都会收敛至全局最优这是线性模型相比非线性网络的核心理论优势。4.3 多重共线性理论后果若两个特征线性相关行列式为 0不可逆此时有无穷多组权重均可达到相同最小损失模型参数无唯一解释性。

新闻详情

相关阅读

NSK长行程超大导程滚珠丝杠技术解析

PaddleOCR 多语言识别完整使用教程（适配你的 C++/Qt 部署场景）

ASP.NET 首页性能的十大做法

基于74HC32与MKV44F64VLH16的智能键盘设计方案

罗技鼠标宏终极教程：5步实现PUBG完美压枪控制

2026最新5款AI编程工具平替实测合集｜进阶开发者低成本高效开发权威教程

LP5812与PIC18F4553实现智能RGB灯光控制方案

PUBG罗技鼠标宏终极指南：5分钟实现完美压枪控制

N_m3u8DL-RE流媒体下载：3个实用技巧轻松搞定在线视频保存

acme.sh私钥加密存储：基于OpenSSL的自动化证书安全管理方案

免费二维码修复工具终极指南：三步拯救损坏二维码

星露谷物语终极MOD指南：5个步骤打造智能自动化农场

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！