如何快速学习计算机视觉?

238 阅读3分钟

  计算机视觉是人工智能领域一个非常重要的方向,一直都是 AI 应用落地最为广泛的领域,所以 CV 从业/学习 人群基础应该也是 AIer 中最多的了,算法更新迭代快、从科研到训练到部署,涉及的技术栈比较多,可以说是十分的卷。有很多学习者是在校生,也就是本科或研究生,他们往往会有在校这几年时间学习计算机视觉够不够的问题,我的观点是:如果你能在校的这几年持续学习,水平一定还算可以了,至少毕业工作应该比较好找了,另外,学习对二三十的小年轻来说,什么时候都不会晚,一定要养成 终身学习 的习惯,因为人生中 往往不是等你完全准备好了 才跨入/面对下一个阶段,而是在不同阶段中不断成长进步。上大学或读研,一方面是能够学习更加专业的知识,更重要的是养成 自我研究能力和习惯。

  学习计算机视觉,我觉得可以从三个方面进行:

(1)理论知识:数字图像处理、高等数学、矩阵论、概率论等都是需要的,不然推导公式等会感觉吃力;

(2)编程能力:python 和 c++ 是用的最多的了,python主要训练的时候用,c++主要部署的时候用。这两门语言都会当然是最好的了,不过很多公司也可能是 训练 和 部署 的人分开的,所以一些专注于算法训练的人只会 python,也是有可能的。从 python 训练切入的话又会涉及训练框架,主流的如 pytorch 或国内百度的paddlepaddle等,从 c++ 部署切入的话又会涉及推理框架,主流的如 TensorRT;

(3)系统能力:现在的 CV 已经不是两年前的 CV 了,现在多模态、大模型越来越火热,SOTA 的 CV 模型往往已经不是纯 CNN 的架构了,会融入像 Transformer 等本来应用于自然语言处理领域的架构,有很多学者/研究者/工程师 都在推进 CV 和 NLP 大一统。从这个角度出发,你还必须具有系统的眼光来看待 CV 问题和发展。

  另外“工欲善其事 必先利其器”,学习过程中的一些小工具往往能帮助我们更加高效的学习,这些工具可能不是 CV 或 AI 的 “专业知识”,但掌握了学习和知识整理的效率会高很多,这些工具如:docker、git、一款适合自己的笔记软件、一款适合自己的论文管理软件、一款适合自己的编程软件(最好是可以远程的那种)如vscode、cmake、conda 等。

  说了这么多,在自我学习的过程中一定需要一些“过来人”的经验、技术、踩坑分享,这样对于学习会事半功倍。这里推荐可以多看看我的文章(可以关注我的公众号 [极智视界] 或掘金),我会持续输出一些 AI 领域的技术文章,主要面向 CV 的技术和经验分享,我想一定会对你的学习有所帮助。