希望能掌握:写代码测试用例、局部逻辑验证、机器学习算法和模型优化、其他任务。
注:学习计划为AI产出,仅供参考。具体内容手打,主要是复习基础,掌握机器学习
一、学习准备与基础回顾
1. 编程语言基础
- Python:复习Python基本语法、数据结构(列表、元组、字典)、函数、面向对象编程等。
- C语言:主要复习C语言的数据类型、指针、结构体、文件操作等基础,因为机器学习库的底层实现常涉及C语言。
2. 数学基础
- 统计与线性代数:重点复习概率论基础、分布函数、假设检验,以及线性代数中的矩阵运算、特征值与特征向量等。
二、机器学习基础与算法
1. 机器学习基础
- 学习监督学习、无监督学习、强化学习等基本概念。
监督学习是不断向计算机提供数据(特征),并告诉计算机对应的值(标签),最后通过大量的数据,让计算机自己学会判断和识别。(输狗出狗、今日头条)
非监督学习与监督学习的区别是,只向计算机提供数据(特征),但并不提供对应的值(标签)。(猫狗自己归纳)
半监督学习是综合了监督学习和非监督学习两者的特点,利用少量有标签的样本,和大量没有标签的样本对计算机进行训练。
- 掌握常用的机器学习算法,如线性回归、逻辑回归、决策树、随机森林、支持向量机等。
2. TensorFlow与PyTorch
- TensorFlow:了解TensorFlow的基本架构、张量操作、图计算模型、自动微分等。通过官方文档和教程学习如何构建和训练简单的神经网络模型。
- PyTorch:学习PyTorch的灵活性和动态计算图特性。通过实践项目,如手写数字识别(MNIST),来熟悉PyTorch的API。
三、代码测试用例与局部逻辑验证
1. 单元测试
- 学习Python的unittest或pytest框架,了解如何编写和运行测试用例。
- 针对机器学习模型的输入、输出和内部逻辑编写测试用例,确保模型的健壮性和正确性。
2. 边界值与异常测试
- 学习如何为机器学习模型设计边界值和异常输入测试用例,以验证模型的鲁棒性。
四、模型优化与性能评估
1. 模型优化
- 学习交叉验证、网格搜索、随机搜索等模型选择和优化方法。
- 掌握正则化、dropout等防止过拟合的技巧。
2. 性能评估
- 学习使用准确率、召回率、F1值等评估指标来衡量模型性能。
- 使用模型评估库(如scikit-learn)来评估模型的预测效果。
五、OpenCV图像处理基础
- 了解OpenCV的基本操作,如图像读取、显示、转换等。
- 学习简单的图像处理技术,如滤波、边缘检测等。
六、实践项目
1. 实践项目
- 选择一个简单的机器学习或深度学习项目,如图像分类、文本分类等,从数据预处理、模型构建、训练到评估全程参与。