数字图像基础
基本概念
图像的离散化
- 连续图像: 人眼直接感受到的图像.
- 数字图像: 把连续图像数字化/离散化后的图像, 是连续图像的一种近似.
扫盲
- 像素Pixel: 图像中的最小单位.
- 位图bitmap: 通过记录每一个像素值来存储和表达的图像.
- 色彩深度/位深度: 位图中每个像素点要用多少个二进制位来表示.
- BMP: Windows系统的标准位图格式.
二值图像
Binary Image, 每个像素只有两种可能的取值, 使用1位二进制来表示, 位深度为1.
计算: 存储512 x 512像素的二值图像需要多少内存?
解: 512 x 512 bit = 2^9 x 2^9 bit = 2^18 bit = 2^10 x 2^8 bit = 2^8 Kb = 256 Kb = 32 KByte
计算机进制: 2^10 = 1 K bit/8 = Byte
黑白灰
灰度图像: 黑白色调, 实际上由灰色描绘出细腻细节.
黑白图像: 只有黑色和白色, 细节丢失.
由于黑白图像只有黑色和白色两种颜色, 所以在图像处理和分析时, 常常对黑白图像进行二值化处理.
实际上, 只要是 仅有两种颜色的图像, 都可以被称为二值图像.
灰度图像
每个像素使用1个字节表示, 位深度位8, 可以表示256种级别的灰度.
0表示黑色, 255表示白色. 数值表示光学强度, 255-光学强度最大状态, 0-黑色.
计算: 存储512 x 512的灰度图像需要占用多大内存?
解: 512 x 512 x 8 bit = 2^8 K x 1 Byte = 256 KB
Tip: 除了1000以下的Byte, 向上的单位是KB, MB. Byte被缩写了.
彩色图像
- RGB, 每个像素都有红绿蓝三个分量.
- 一个像素点使用3个字节(一个颜色通道一个字节), 位深度为24位.
- 可以表示256 x 256 x 256 = 一千六百多万种颜色
RGBA图像
32位真色彩
- RGB图像+8位透明度信息Alpha
- 1个像素使用4个字节, 位深度为32位
256色彩色图像
- 每个像素用8位表示, 是调色板中的索引值
- 对于不同的图像, 所对应的这256种颜色的集合不同
- 保存和加载此类图像时, 需要将调色板和图像一同保存和加载
图像压缩
- 适当降低图像质量来减少它所占用的空间
- 不同的图像压缩算法, 对应不同的图像格式
图像格式
- BMP: 内存占用大, 不支持压缩, 不适用于网页
- JPEG:
- 优点: 有损压缩, 压缩率高, 内存占用小, 色彩丰富, 细节清晰细腻, 适合存储大图像
- 缺点: 不适合颜色单一且有大块颜色相近的区域, 或亮度差异十分明显的简单图片(参考用单反拍晨曦, 颜色断层). 每次编辑都会降低图像质量, 不适合需要进行多次编辑的情况.
- PNG: 无损压缩, 适用于有规律渐变色彩的图像(晨曦图)
- GIF: 支持静态和动态, 动态图片由多幅图片保存为一个图片, 循环显示, 形成动画效果. 只支持256色, 适用于色彩简单/颜色较少的小图像
- TIFF:
- 定义了四类不同类型的格式:
- 二值图像TIFF-B
- 黑白灰度图像TIFF-G
- 带调色板的彩色图像TIFF-P
- RGB真彩图像TIFF-R
- 优点: 支持RGN/JPEG等多种编码方式, 具有非常好的扩展性, 方便性, 可改性, 常用于印刷行业
- 缺点: Web浏览器不支持TIFF格式
- 定义了四类不同类型的格式:
色彩模式
- 二值图像, 灰度图像, RGB图像, RGBA图像
- CMYK(印刷四分色):
- C: Cyan青色
- M: Magenta洋红色
- Y: Yellow黄色
- K: blacK黑色
- YCbCr:
- Y: 亮度
- Cb: 蓝色色度
- Cr: 红色色度
- HSI:
- H; 色调
- S: 饱和度
- I: 亮度
图像类型
序列图像
时间上有一定的顺序和间隔, 内容上相关的一组图像.
- 其中的每幅图像称为帧图像
- 帧图像之间的时间间隔是固定的
深度图像
Depth Map:
- 三维场景信息的表达方式
- 每个像素点的取值代表这个点离摄像机的距离
- 采用灰度图表示, 每个像素点由一个字节表示
- 深度图像中, 像素点的取值并不代表实际的距离, 颜色的深浅只是代表相对距离的远近