《深度学习与大模型工程化》30/358

📅 2026/6/30 22:22:36

这本书还挺不错的适合把知识点串一遍1. 机器学习和手动编码规则有什么区别手动编码规则精确指示机器如何执行任务是‘演绎法’已知通用规则将其应用在数据上得到特定结论。机器学习从数据中自行学习和改进算法是‘归纳法’已知大量数据和答案让模型从中归纳出通用规则。2. 深度学习的核心目标是什么借助多层神经网络模型实现对原始数据多层级、自动化的特征学习和抽象表示逐步将底层数据转化为高层级、有意义的信息最终完成分类、检测、生成等高级别认知任务。3. *运算符和np.dot()的区别是什么*是逐元素乘法np.dot()是矩阵乘法4. 广播机制是如何运行的从最右边的维度向左逐维度比较如果其中一方维度为1即可开始广播5. 布尔索引和布尔数组bool_idx(a_flat3) #返回一个布尔数组 #布尔索引通过与原数组形状相同的布尔值数组来筛选数据当布尔数组中某位置的值为true时将提取原数组对应位置的元素 a_flat[a_flat3]6. 线性回归模型核心思想找到一个线性函数使得函数的预测值和真实值之间的整体误差最小。7. 什么叫拟合寻找函数关系近似表达式的过程叫做拟合最终得到的公式称为经验公式。8. 线性回归中为什么用平方误差不用绝对误差绝对误差函数在零点不可导不利于优化。9. 解析解和数值解的区别为什么机器学习中主流思想是求数值解解析解analytical solution是通过严格的数学推导得到的精确解能用明确的公式表达数值解numerical solution是通过有限次迭代逼近精确解的近似解核心思路是不断猜测解并代入验证直至满足精度要求。主流思想是梯度下降法而不是对损失函数求偏导并令偏导数为0来求解的原因偏导数为0可能是鞍点。对于多元函数为了判定极值点引入高阶偏导数计算复杂度会随参数量和求导阶数指数级增长。求解解析解要全量数据而求解数值解可以对数据分批处理。10. 梯度下降公式和泰勒展开式有什么关系根据一阶泰勒展开式f(xϵ)≈f(x)ϵf′(x)其中 ε是一个足够小的数接下来找一个大于0的常数α使得−∣αf′(x)∣足够小然后替换ε得到f(x−αf′(x))≈f(x)−αf′(x)^2 这个式子小于f(x)得到迭代公式 x:x−αf′(x)11. 梯度下降法的算法流程从原始参数值开始计算该点的梯度沿负梯度方向更新参数 θt1←θt−α∇J(θt)随着梯度值逐渐减小更新步长自动缩小避免越过最优解点当参数变化量小于阈值时判定收敛此时得到的参数值为终值12. 什么叫优化算法什么叫调参优化算法是自动的、迭代的调整模型参数以找到使损失值最小的那一组参数调参是调整超参数的过程

新闻详情

相关阅读

致远OA任意文件上传漏洞批量检测工具设计与实现

专业字幕处理的技术架构解析：Subtitle Edit如何重构视频本地化工作流

CodeX安装教程

思路及解答DFS（深度优先搜索）

从CrewAI到自定义集群：多Agent框架的选型决策树

前端：谷歌浏览器播放视频报401错误

解决VSCode里ctrl+鼠标点击无法跳转python源码的问题

移动应用数据安全审计：从内存分析到网络协议解密的5大核心技术

从COMSOL到ABAQUS：一个材料小白的搅拌摩擦焊仿真踩坑全记录（含CEL模型避坑指南）

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！