《深度学习与大模型工程化》30/358

📅 2026/6/30 22:22:36
《深度学习与大模型工程化》30/358
这本书还挺不错的适合把知识点串一遍1. 机器学习和手动编码规则有什么区别手动编码规则精确指示机器如何执行任务是‘演绎法’已知通用规则将其应用在数据上得到特定结论。机器学习从数据中自行学习和改进算法是‘归纳法’已知大量数据和答案让模型从中归纳出通用规则。2. 深度学习的核心目标是什么借助多层神经网络模型实现对原始数据多层级、自动化的特征学习和抽象表示逐步将底层数据转化为高层级、有意义的信息最终完成分类、检测、生成等高级别认知任务。3. *运算符和np.dot()的区别是什么*是逐元素乘法np.dot()是矩阵乘法4. 广播机制是如何运行的从最右边的维度向左逐维度比较如果其中一方维度为1即可开始广播5. 布尔索引和布尔数组bool_idx(a_flat3) #返回一个布尔数组 #布尔索引通过与原数组形状相同的布尔值数组来筛选数据当布尔数组中某位置的值为true时将提取原数组对应位置的元素 a_flat[a_flat3]6. 线性回归模型核心思想找到一个线性函数使得函数的预测值和真实值之间的整体误差最小。7. 什么叫拟合寻找函数关系近似表达式的过程叫做拟合最终得到的公式称为经验公式。8. 线性回归中为什么用平方误差不用绝对误差绝对误差函数在零点不可导不利于优化。9. 解析解和数值解的区别为什么机器学习中主流思想是求数值解解析解analytical solution是通过严格的数学推导得到的精确解能用明确的公式表达数值解numerical solution是通过有限次迭代逼近精确解的近似解核心思路是不断猜测解并代入验证直至满足精度要求。主流思想是梯度下降法而不是对损失函数求偏导并令偏导数为0来求解的原因偏导数为0可能是鞍点。对于多元函数为了判定极值点引入高阶偏导数计算复杂度会随参数量和求导阶数指数级增长。求解解析解要全量数据而求解数值解可以对数据分批处理。10. 梯度下降公式和泰勒展开式有什么关系根据一阶泰勒展开式f(xϵ)≈f(x)ϵf′(x)其中 ε是一个足够小的数接下来找一个大于0的常数α使得−∣αf′(x)∣足够小然后替换ε得到f(x−αf′(x))≈f(x)−αf′(x)^2 这个式子小于f(x)得到迭代公式 x:x−αf′(x)11. 梯度下降法的算法流程从原始参数值开始计算该点的梯度沿负梯度方向更新参数 θt1​←θt​−α∇J(θt​)随着梯度值逐渐减小更新步长自动缩小避免越过最优解点当参数变化量小于阈值时判定收敛此时得到的参数值为终值12. 什么叫优化算法什么叫调参优化算法是自动的、迭代的调整模型参数以找到使损失值最小的那一组参数调参是调整超参数的过程