保姆级教程：在Ubuntu 20.04上用YOLOv5s训练自己的人脸检测模型（附数据集）

📅 2026/6/30 16:36:11

从零构建人脸检测模型YOLOv5在Ubuntu 20.04的实战指南当计算机视觉遇上边缘计算人脸检测技术正从实验室走向日常生活。无论是智能门锁的身份识别还是社交媒体中的AR滤镜背后都离不开高效的目标检测算法。本文将带您用YOLOv5这一前沿框架在普通消费级显卡上打造专属的人脸检测系统。1. 开发环境搭建在开始模型训练前我们需要构建稳定的深度学习环境。推荐使用Anaconda管理Python环境它能有效解决依赖冲突问题。以下是具体步骤# 创建专用环境Python3.8与PyTorch1.7.1最佳适配 conda create -n yolov5_face python3.8 conda activate yolov5_face # 安装PyTorch与CUDA工具包注意选择与显卡驱动兼容的版本 conda install pytorch1.7.1 torchvision0.8.2 torchaudio0.7.2 cudatoolkit11.0 -c pytorch环境验证环节不可忽视执行以下命令确认GPU可用性import torch print(torch.cuda.is_available()) # 应返回True print(torch.cuda.get_device_name(0)) # 显示显卡型号提示若出现CUDA版本不兼容建议通过NVIDIA官网更新显卡驱动至最新版2. 数据集准备与标注优质数据是模型性能的基石。我们采用CASIA-FaceV5数据集包含多角度、多光照条件下的人脸图像。数据集组织结构应遵循YOLO标准格式CASIA-FaceV5/ ├── images │ ├── train # 训练集图片 │ ├── val # 验证集图片 │ └── test # 测试集图片 └── labels ├── train # 对应标注文件 ├── val └── test标注文件为.txt格式每行代表一个目标class_id x_center y_center width height使用LabelImg工具标注时注意以下要点标注框应紧贴人脸边缘避免包含过多背景区域对遮挡人脸采用合理推测标注3. 模型配置与训练YOLOv5通过.yaml文件定义模型结构。我们复制yolov5s.yaml并修改关键参数# yolov5_face.yaml nc: 1 # 仅人脸类别 names: [face] # 类别名称数据配置文件定义数据集路径# face_data.yaml train: ../CASIA-FaceV5/images/train val: ../CASIA-FaceV5/images/val nc: 1 names: [face]启动训练的命令行参数解析python train.py \ --data face_data.yaml \ --cfg yolov5_face.yaml \ --weights yolov5s.pt \ --epochs 100 \ --batch-size 16 \ --img-size 640 \ --device 0 # 使用第一块GPU训练过程监控指标包括mAP0.5交并比阈值为0.5时的平均精度Precision预测为正样本中真实正样本比例Recall真实正样本中被正确预测的比例4. 模型验证与优化训练完成后使用验证集评估模型表现python val.py \ --data face_data.yaml \ --weights runs/train/exp/weights/best.pt \ --batch-size 8 \ --task test # 在测试集上评估常见性能提升技巧数据增强调整hyp.scratch.yaml中的参数随机旋转degrees: 10色彩抖动hsv_h: 0.015迁移学习冻结部分层参数python train.py --freeze 10 # 冻结前10层超参数搜索使用进化算法优化python train.py --evolve5. 部署与实时检测将训练好的模型转换为ONNX格式便于跨平台部署python export.py \ --weights runs/train/exp/weights/best.pt \ --img-size 640 \ --include onnx实时摄像头检测命令python detect.py \ --weights runs/train/exp/weights/best.pt \ --source 0 \ # 摄像头设备号 --conf-thres 0.5 \ # 置信度阈值 --view-img # 实时显示窗口性能优化建议使用TensorRT加速推理调整img-size平衡速度与精度对视频流采用跳帧检测策略在GTX 1660 Ti上的典型性能分辨率FPS内存占用640x640452.1GB320x3201201.4GB

新闻详情

相关阅读

00-2 Jupyter操作文档

23 RAG 为什么答不准：召回、分块、排序的常见坑

AI建站工具从0到1全攻略：普通人如何用对话生成一个能上线的网站

烧了几百亿Token重写网关之后，他说：AI的能力早就溢出了，跟不上的是人

openeuler/libummu安全实践：如何安全实现用户空间内存共享

CTForge部署最佳实践：企业级安全框架的配置与调优

UnifiedBus安全架构：保障超节点系统安全的7个关键措施 [特殊字符]️

gala-gopher完整指南：从安装到部署，一站式掌握eBPF探针技术

oeDeploy分布式部署实战：Kubernetes集群部署全流程解析

AScript异步执行与await关键字

如何在1分钟内为Windows安装苹果USB网络共享驱动：完整解决方案

NoFences：你的Windows桌面需要一场空间革命吗？

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！