研究方向与前景

233 阅读6分钟

1 知乎(23.9.3)

知乎作者的看法满足以下条件起码3个才可以选cv:

  • 本科有cv背景。至少要有机器学习深度学习理论基础,cv理论基础,基本的论文与代码阅读理解能力
  • 本科211及以上
  • 研究生入学之前已经有一个比较确定的cv子领域方向想要做下去
  • 导师cv方向,且不放养
  • 对cv有一定的热爱,有一定自驱力

AI for science前景觉得是不错的,但是这个方向还是建议读博,硕的话找工作比cv还困难,并且对science相关学科基础有一定要求

搜广推适合想卷算法但又不想去卷cv nlp这种的,方向更贴近工业界,可以考虑

2 知乎(22.8.31)

这两个差不多,简单说下情况,首先都卷的不得了,得发很多文章

CV:上手简单,缺乏可解释性,多炼丹,更玄学,发展已经很全面,难做出新东西,要挖掘新东西比较难,但是容易毕业,好水文章,nerf类似工作是一个还可以的方向

NLP:上手稍难相比较CV,稍具可解释性,目前非常火,属于最火的前沿,还在猛烈发展,没有进入冷却,但是随着transformer出现,也比较难做出新东西,多模态是一个还可以的方向,更容易水文章。

更好的是现在多模态和google pathways的发展,都是结合cv和nlp两个领域的东西,目前最好的,所以更合理的是研究双方融合的方向。

3 知乎(23 .4. 27)

知乎作者经验以下:

计算机系的不同,大部分课程最后的考核都是大作业,没考试挺好但大作业多起来真的不好。知乎这篇文章的作者所在小组经过精心合计,用一个项目抵了三次的大作业,但课程压力依旧不算小。科研方面,庆幸导师人挺好,不push也不瞎整,在组内跟着师兄之后是学到了很多东西的。下面的部分就把学到的一些东西做个简单整理吧。

深度学习中CV的整体流程 

首先要说明的是,半路出家后进入的计算机,底子相比于我的很多同学是很差的,所以这些碎碎念只是我自己的想法,不确保正确。 CV就是计算机视觉,是个大坑。进入计院之后发现,人均CV或NLP。深度学习这两年是真的火,所以各个反向都听卷的,CV相比于NLP来说还要更卷一些。新方法新论文每天层出不穷,光读摘要都读不完。具体来说,深度学习中的CV有目标检测、目标分割、目标重识别、小目标学习、小样本学习、终身学习、自动机器学习、弱监督学习、自监督学习、无监督学习等等,还有很多方向,现在想到的就这些。 以我熟悉的目标重识别来说,一般来说写个论文整体要确定以下几个东西:idea、方法、数据集、实验、写作。我现在只能算是刚刚入门,还没有经历过idea阶段。方法一般来说最为重要。在深度学习中,方法可以细分成数据处理、网络结构、损失函数,任何一点做出来创新或者有个花活,都可以写paper。其中最重要的是网络结构。网络结构在之前多是CNN,很多细分领域现在也仍用ResNet50做backbone。但是近些年,以我浅薄的认知,很多方向上用vision transformer去替代CNN会获得更优的效果。对于整个网络结构的优化,一般还是大公司大项目组做的事情,多数的小实验室还是利用一个较好的骨干网络,在末端进行优化微调来涨点来发论文。数据集的话一般在进入某个领域之后,就自然而然知道这个领域常用的数据集了。 我这一个月来,参与最多的还是实验的部分。写作方面,正式的话是帮师兄写了一篇paper的related work,在这个过程中学会了endnote,查文献写综述语法表达这些。写作终归是门槛不高的工作。

 常用的工具 

代码就是python,没别的,很贴心。写python就是pycharm专业版(可以连实验室服务器)加anaconda加服务器,也有时用jupyter notebook写一些小项目。框架就是pytorch,tensorflow很少很少。连服务器和传文件用xshell和xftp挺直观的,但直接用linux命令有时更好用。写论文查文献的时候用endnote导入确实方便很多,如果是写latex的话用overleaf比latex的软件好用多了。哎,要是之前美赛知道有overleaf这东西,那次也不必那么狼狈了。 

 我的弱项

 坦率来多,除去肯学习,剩下的都是我的弱项。首先就是代码能力不过关,之前刷了一个月的低强度的leetcode,相当于重新捡起来了python技巧,但是总的代码能力还是弱,leetcode中的勉强要费很大功夫做,难的基本上直接放弃了。另一方面,还是自己在写python项目时经验太少吧,或者说是对大的python项目不熟悉。我跟师兄缓了一天的实验进度,接下来的一天时间内要重新整理自己本地和服务器上的文件夹,整理干净了后续的实验项目才能高一些。而至于代码能力,12月份先不管,这个月主要是推进实验、写好几个论文大作业、准备矩阵分析考试这几个事情,下个月开始计划一下系统刷题吧。 找工作的隐忧 刷题一方面是为了之后在实验进展中少走一些弯路,但是更重要的是为了之后的找工作。但两年的研究生终归是有些短的。两年意味着我明年就要实习找工作。而对此我对自己不是那么有信心。 而更没有信心的,还是整个行业。现在做的工作正常来说是直接找算法岗的,但是我觉得自己在短时间内积累不出成果。而现在算法岗又是人间地狱又是诸神黄昏,完全梭哈算法岗实在是风险略高。所以我打算算法开发两手准备,明年的时候,要系统学一下java。这一定是一条很难走的路,但是坦白来讲,我不想之后要不得不做我不满意的工作。 总结 人生的痛苦或许是总量不变的。人的智慧的作用,只是把一些痛苦转移到另一些痛苦之上。 而我,愿意现在多吃一些苦,去换来之后的一点甜。 控制焦虑,继续努力。

 2023年更新 去大厂做Java开发了哈哈哈哈,cv狗都不做!