首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
计算机视觉
XiaoLinzzz
创建于2023-09-02
订阅专栏
一点有关于计算机视觉的笔记....
等 3 人订阅
共17篇文章
创建于2023-09-02
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
目标检测 II(Object detection II)
物体检测通常被视作一个区域(patch)分类的问题。 解决分类问题有多种方式:包括**两阶段的区域提议检测器**和**单阶段检测器**等
目标检测 I(Object detection I)
目标检测基础 分类与检测(Classification vs. Detection) 物体检测是指在图像中定位对象的技术。
图像分割 II(Image Segmentation II)
Segmentation as classification 像素分类(Pixel classification) 作为分类问题的图像分割。给定一个窗口(NxN 个像素),对中心像素进行分类。
图像分割 I(Image Segmentation I)
有多种方法可以进行图像分割,但许多方法都使用像素聚类(pixel clustering) 和图分析(graph analysis) 的某种组合。
生成式对抗网络(GANs)
GAN 架构 GANs(生成对抗网络)是一种机器学习模型,它学习如何从特定的分布中生成实例(例如,人脸图像)。它实际上包含两个神经网络:一个生成器(generator)和一个判别器。
图像生成(Image Generation)
前置:背景知识 概率符号说明 P(x) = 事件x发生的概率。 联合概率:P(x, y) 或 P(x \cap y) = 事件x和y同时发生的概率。
形状(Shape)
形状骨架(Shape skeletons) 形状(Shape) 二维形状的模型通常基于以下两种情况之一: 形状的边界轮廓(线段、角度) 形状的内部结构(分支)
纹理 (Texture)
Texture (纹理) 定义 图像处理 (Image Processing): 纹理是一个具有空间稳定性的区域(在该区域的每个地方都具有相同的统计特性)。
深度和立体(Depth and stereo)
深度提示(Cues for depth) 2D图像包含了多种深度感知的信息: 即使是静态的平面图片,我们也能从中感知到深度和三维空间,这得益于我们大脑的解读和一系列的视觉线索。
特征(Features)
识别的方法(Approaches to recognition) 使用 CNN 物体识别 检测局部特征,忽略空间位置
空间滤波(Spatial Filtering)
均值滤波器:采用均值卷积核,其所有权重都相等,即将一个区域的像素计算平均值,然后将窗口中计算的平均值设置为锚点上的像素值。
频率滤波(Frequency filtering)
傅立叶变换是一种将 signal 和 pattern 分解为一堆正弦曲线(Sinusoids)的方法 。
深度学习 I(Deep Learning I)
分类的基本架构 AlexNet 创新 ReLU(修正线性单元)激活函数 -- 训练更快 在 GPU 上训练 -- 并行化使训练更快(实际上当时需要2个GPU!)
卷积神经网络 I(Convolutional neural networks I)
Image recognition (图像识别) 什么是图像识别? 图像识别 (Image recognition):这里指的是对整个图像进行类别级别的识别。
光和阴影(Light and shadow)
成像 (Image formation) 漫反射 (Diffuse / Lambertian reflectance) 公式: $I_D(x) = I_LRN(x) \cdot L$ $I_D(x)$
边缘(Edge)
* 边缘检测是大多数视觉处理系统的第一步 * 基于边缘的特征具有理想的视觉识别特性 * 压缩信息 * 不变(Invariant)或可容忍(Tolerant)图像中的无关
卷积神经网络 II(Convolutional neural networks II)
降采样(Downsampling) 卷积神经网络中的降采样(Downsampling) 通常对卷积层的输出进行降采样。 减少输出大小和后续层中所需的计算次数。