51-多通道输入 📅 2026/7/1 4:31:12 一、先通俗理解卷积卷积本质就是用一个小的过滤器卷积核在图片 / 特征图上滑动不断做加权求和提取局部特征的操作。比如一张 RGB 彩色图片[批量数, 3通道, 高H, 宽W]卷积层的作用用多个卷积核自动学习边缘、纹理、形状、高级语义等特征可以通过步幅、填充调整输出特征图的大小改变通道数量升维 / 降维特征。三点总结逐条拆解1. 输出通道数是卷积层的超参数什么是超参数不需要模型自己学习、需要我们人工提前设定的参数就叫超参数。 在nn.Conv2d(in_channels, out_channels, ...)里in_channels输入通道数由上一层输出决定不能随便乱设out_channels输出通道数必须我们自己指定属于超参数举例子输入是 RGB 图片in_channels3你设置out_channels16代表这一层用 16 组独立卷积核最终输出 16 张特征图16 个通道想要提取更多特征就把输出通道调大想要压缩特征就调小。2. 每个输入通道有独立的二维卷积核所有通道结果相加得到一个输出通道结果我们拿最简单的例子 输入3通道(RGB)想要得到1 个输出通道会分配3 个独立的二维卷积核比如 3×3 大小分别作用在 R 通道、G 通道、B 通道上每个通道单独卷积计算各自得到一张二维特征图把这 3 张特征图逐位置相加再加上偏置最终合并成1 张特征图 1 个输出通道。简单公式3. 每个输出通道有独立的三维卷积核接上上面的例子 输入 3 通道设置输出通道out_channels16每 1 个输出通道都需要一组「和输入通道数相同」的二维卷积核一组3个3×3二维卷积核堆叠在一起就构成一个3×3×3 的三维卷积核16 个输出通道就对应16 个相互独立的三维卷积核。卷积层权重形状规律nn.Conv2d的权重形状[out_channels, in_channels, kernel_h, kernel_w]第一维多少个输出通道 → 多少个三维卷积核第二维输入多少通道 → 每个三维卷积核包含多少张二维卷积核二、举个直观小例子巩固python运行# 输入3通道RGB输出16通道卷积核3×3 conv nn.Conv2d(in_channels3, out_channels16, kernel_size3)输出通道16是我们手动设置的超参数每生成 1 个输出通道需要 3 张 3×3 二维卷积核分别卷积 RGB 三通道结果求和总共有 16 组3×3×3的三维卷积核相互独立、各自学习不同特征边缘、色块、纹理等最终输出特征图形状[batch, 16, H_out, W_out]