小象学院-计算机视觉项目实战

240 阅读3分钟

计算机视觉的学习我认为最重要的地方在于完善两方面的能力

1)编程能力;

2)理论知识的储备。

二者相辅相成,缺一不可。以下我也从这两个点切入,简要的总结一下计算机视觉的学习路线(学习循序有先后):

1)Python编程基础

Python是做算法的标准语言,目前诸如PyTorch、TensorFlow等最流行的深度学习框架都是基于python的。所以在接触算法之前需要有一定的python基础。

对于python的学习,网上有很多推荐的文本资料,差不多都是看书然后敲代码学习的思路。不过个人认为,对于初次接触python编程的学习者而言,看视频教程是最合适的也是最快的。看书很容易陷入局部知识点的纠结之中,而这些知识点可能都不是很重要。但是看视频的话是有人给你过滤了一遍知识点的,所以学习速度会更快。

对于视频教程的话,在b站、网易云课堂等平台上搜python,一搜一大把,挑选一个你喜欢的风格即可。

2)理论知识储备

计算机视觉的学习现在绕不过深度学习,而深度学习的入门又绕不过“吴恩达”这三个字。我相信,很多人都是看着吴恩达的网课入门深度学习的。

学习完这门网课之后,你将至少明白什么是神经网络;神经网络的工作原理、结构;卷积神经网络;循环神经网络;以及计算机视觉、自然语言处理等方向的一些具体应用。

Note:我认为这门网课是整个计算机视觉学习的基础,他对后续你能不能形成自己的理解并有创新有很大的影响。所以,学习的时候最后对每一节课做出总结。同时遇见不懂的知识点的时候,最好不要闭门造车,建议可以网上搜索一下关键词,像github、知乎、微信公众号上都有很多总结性的资料。

3)了解计算机视觉发展现状

目前视觉上主要有几个基础任务,具体包括图像分类、语义分割、目标检测等。 需要学习者有一个全面的概览,做到计算机视觉各个方向是怎么做的心中有数。

具体步骤如下:

  • 首先阅读图像分类经典模型阅读: 具体包括vgg、inception系列、resnet。这些模型的论文网上搜关键词都有,建议先读原文,再配合者网上的各种论文笔记进行理解;
  • 从Pytorch、Tensorflow中挑选一个框架作为你的的深度学习编程框架。个人喜欢Pytorch,它简单易上手,对初学者友好。学术界也大多用Pytorch。不过工业界目前来说还是tensorflow主流。但是Pytorch的使用率也在逐渐上升