课程大纲 第一阶段 计算机视觉技术基石
第1课:图像处理基础
知识点1: CV背景介绍
知识点2: CV技术的工具箱:OpenCV完全解析(c++,python)
知识点3: 图像的基本操作:遍历图像,ROI选取等
知识点4: 机器学习在CV中的应用:KNN
实战项目: 手写字符识别
第2课:图像处理进阶
知识点1: 图像聚类算法
知识点2: 百图详解图像滤波器
知识点3: 特征提取与匹配(sift等)
知识点4: 坐标变换与视觉测量
实战项目: AR、图像拼接
第二阶段 CV领域的瑞士军刀:深度学习
第3课:神经网络初步与调参技巧 ( by Seven)
试听
知识点1: 线性分类器的基本框架;
知识点2: 深度理解向量点积的物理意义;
知识点3: 神经网络的前向传递和反向传播;
知识点4: 深入理解反向传播——数学推导和物理意义;
实战项目: 使用TensorFlow/Keras快速搭建神经网络进行图像分类
第4课:深度卷积神经网络原理与实践 (by Seven)
知识点1: 理解卷积操作的本质及其物理意义;
知识点2: 重新认识感受野及其计算方式;
知识点3: 多种多样的深度卷积神经网络结构
知识点4: 神经网络中的迁移学习技巧;
实战项目: 百行代码实现Kaggle图像分类竞赛Top-5%
第5课: 图像搜索技术 (by Seven)
知识点1: 基于无监督深度学习的图像搜索技术-Autoencoder;
知识点2: 基于有监督深度学习的图像搜索技术-ConvNets;
知识点3: 应用ConvNets作图像搜索任务的实践经验;
知识点4: 理解深度排序技术;
实战项目: 使用Autoencoder和ConvNets构建图像搜索系统
第6课:大规模车辆图片搜索/重识别 (by Seven)
知识点1: 深入理解Triplet Loss及其训练技巧
知识点2: 基于多任务的深度学习技术
知识点3: 融合多任务和Triplet Loss
实战项目: 使用TensorFlow/Keras由浅入深搭建规模车辆图片搜索系统
第三阶段 CV的重点攻坚:目标检测、语义分割
第7课:目标检测及其在无人驾驶领域的作用
知识点1: 目标检测的任务、Benchmark以及评价指标
知识点2: 2-Stage模型:R-CNN、Fast R-CNN、Faster R-CNN
知识点3: 1-Stage模型:YOLO系列和SSD
知识点4: 初步了解无人驾驶中的视觉问题(以KITTI数据库为例)
实战项目: 使用TensorFlow/PyTorch在COCO数据集上进行目标检测
第8课:深度学习在图像语义分割中的应用
知识点1: 全卷积网络FCN
知识点2: 基于Encoder-Decoder思想的U-Net系列方法
知识点3: 空洞卷积和Deep Lab系列
实战项目: 使用TensorFlow在CoCo数据集上进行语义分割
第四阶段 CV的技术前沿:RNN与GAN
第9课:RNN及其应用(image captioning and VQA)
知识点1: RNN介绍
知识点2: LSTM介绍和背后的梯度解释
知识点3: 基于RNN的图像解释和图像问答任务
实战项目: 使用Keras/PyTorch 搭建一个图像解释模型并分析成功与失败的原因
第10课:深度学习前沿:理解AlphaGo (强化学习) 和生成模型(GAN)背后的原理
知识点1: 深度强化学习原理
知识点2: 对抗生成模型原理及各种变法(Basic GAN, DC-GAN, W-GAN, 等)
知识点3: 基于GAN网络的风格迁移学习
实战项目: 手把手教你如何使用TensorFlow/PyTorch实现GAN 和 强化模型