分类与回归的概念分析

📅 2026/6/24 4:15:00
分类与回归的概念分析
分类 vs 回归本质区别一句话两者都属于监督学习区别只在输出值的类型回归Regression输出是连续数值预测多少 / 多大 / 多贵。分类Classification输出是离散类别预测是哪一类 / 是或否。用问句一眼分辨问法任务类型原因这房子能卖多少钱回归答案是一个数50 万 / 128 万…连续这封邮件是垃圾还是正常分类答案是二选一离散明天气温多少回归26.5°C 这种连续值这张图里是猫/狗/鸟分类三选一用户会不会点击这个广告分类会/不会 二分类用户对这个商品打几分1-5 星回归分数是连续区间严格说 1-5 是离散但评级预测常按回归做模型与目标函数的差别回归常用模型线性回归、岭回归、Lasso、GBDT 回归、神经网络回归。目标最小化预测值与真实值的差距损失函数MSE均方误差、MAE平均绝对误差评测RMSE、R²分类常用模型逻辑回归名字骗人其实是分类、SVM、决策树分类、GBDT 分类、Softmax 网络。目标把样本分到正确类别损失函数交叉熵Cross Entropy、Hinge LossSVM评测准确率、精确率、召回率、F1、AUC几个典型例子回归例子房价预测输入面积、地段、房龄 → 输出价格 325 万股价预测输入历史 K 线 → 输出明天收盘价 18.73用电量预估输入天气、日期 → 输出今日耗电 1240 kWh分类例子垃圾邮件识别输入邮件文本 → 输出 { spam, ham }医疗诊断输入 CT 特征 → 输出 { 恶性, 良性 }手写数字识别MNIST输入 28×28 像素 → 输出 {0,1,2,…,9}信贷风控输入用户信息 → 输出 { 违约, 不违约 }一个容易混的点逻辑回归为啥叫回归却是分类历史命名坑。逻辑回归本质是先算一个线性回归的得分 zwTxb再套一个Sigmoid​ 压到 (0,1) 之间当成概率最后按阈值如 0.5切成两类。它底层用了回归结构但任务是分类​ → 所以名字里带回归实际干的是二分类的活。 判断口诀看输出是要一个数还是要归个类别看模型名。两者还能互相转回归 → 分类把连续值分桶。比如预测年龄回归转成 {儿童, 青年, 中年, 老年}分类。分类 → 回归把类别标成序数。比如评分 1-5 星当回归做也行当 5 个分类做也行看业务诉求。