视觉智能中心-计算机视觉算法实习岗:主要做文字识别
一轮(无先后顺序):
- 自我介绍
- 最近的一个项目(GNN)介绍:背景,解决的问题,为何要选择这个方法,取得的效果,还需要解决的问题及思路
- BN的原理、作用
- 多分类和二分类的loss函数有区别吗
- ResNet的价值,为何要提出跳层结构,为何跳层结构可解决较深网络梯度消失的问题(可通过求导分析,链式结构是相乘,跳层结构是相加)
- 为何要大量采用3*3卷积核,为何两层3*3优于一层5*5
- 对图像特征的理解,每层卷积后的特征图可视化后是什么(底层图像特征一般是一些很简单的结构,如短横线、斜线、折线等)
- 有监督、无监督、半监督和弱监督的区别原理
- 需要多读各种模型、结构、方法的原始论文,理解其出发点和物理意义
- Softmax、Sigmoid
- 设计一个图像分类的网络,做图像分类的流程有什么
- 为何需要激活层
- 卷积核是怎样提取特征的
- 一道算法题