一、媒体的分类
1.1.感觉媒体
- 直接作用于人的感官,产生感觉(视、听、嗅、味、触觉)的媒体,语言、音乐、音响、图形、动画、数据、文字等都是感觉媒体
1.2.表示媒体
- 是指用来表示感觉媒体的数据编码。如图像编码(JPEG、MPEG),文本编码(ASCII)和声音编码等等。感觉媒体转换成表示媒体后,能够在计算机上进行加工处理和传输
1.3.表现媒体
- 是进行信息输入或输出的媒体。如键盘、鼠标、扫描仪、话筒、数码相机、摄像机为输入表现媒体,显示器、打印机、扬声器、投影仪为输出表现媒体
1.4.存储媒体
- 是指用于存储表示媒体的物理实体。如硬盘、光盘等
1.5.传输媒体
- 是指传输表示媒体(即数据编码)的物理实体。如电缆、光缆等
二、颜色属性
2.1.颜色参数
- 色调:人眼看到一种或多种波长的光时所产生的彩色感觉
- 明度:表示色所具有的亮度或暗度被称为明度
- 饱和度:指颜色的纯度,或者说是颜色的深浅程度
2.2.颜色空间
-
三原色原理是自然界的各种颜色光,都可由红(R),绿(G),蓝(B)三种颜色按不同比例相配置而成,所以称这3种颜色为三基色
-
RGB颜色空间
-
YUV颜色空间:数字化位通常采用Y:U:V-8:4:4或者Y:U:V-8:2:2
-
CMY颜色空间
-
2.3.图形与图像
-
图像:也称为位图或点阵图,是由排成行列的像素组成的。常把一幅位图图像作为一个点矩阵处理,矩阵中的一个元素(像素)对应图像的一个点
-
图形:也称矢量图形,是用一个指令集合来描述的,这些指令用来描述图中线条的形状、位置、颜色等各种属性和参数。特点是放大后图像不会失真,和分辨率无关
-
分辨率:图形(图像)的主要指标由分辨率、点距、色彩数(灰度)
- 可分为屏幕分辨率和输出分辨率,单位:dpi(像素每英寸)
- 水平分辨率是指水平方向(横向)总的像素点数
- 垂直分辨率是指垂直方向(竖向)总的像素点数
- 分辨率越高,所包含像素越多,图像越清晰,印刷质量就越好
-
点距:指两个像素之间的距离,一般来说,分辨率越高,则像素点距的规格越小,显示效果越好
-
深度:指显示或存储每个像素所用的位数
三、数据压缩技术
3.1.压缩技术分类
- 无损压缩编码法:也称为冗余压缩法、熵编码法
- 有损压缩编码法,也称为熵压缩法
- 注:把信息中排除了冗余后的平均信息量称为"信息熵"
3.2.无损压缩法
- 去掉或减少了数据的冗余,这些冗余值可以重新插入到数据中,因此是可逆的,也是无失真压缩
- 它通常使用的是统计编码技术,包括哈夫曼编码、算术编码、行程编码等。它的压缩率比较低,通常是2:1-5:1
3.3.有损压缩法
-
压缩了熵,会减少信息量,因此是不可逆的。它通常可以分为特征抽取和量化两大类
- 特征抽取包括基于模式的编码、分形编码等
- 量化包括零记忆量化、预测编码、直接映射、变换编码等方法。其中,预测编码和变换编码是最常见的方法
-
有损压缩能够达到较高的压缩比,对于声音可达4:1
8:1,对于动态的视频数据可达100:1400:1
3.4.数据压缩标准
- JPEG(联合图像专家组)
- MPEG(动态图像专家组)
- DVI(数字视频接口)
- H.261
- H.263
四、音频数据
4.1.音频技术概述
- 声音的三个要素是:
- 音强:即音量,是声音的强度,取决于声间的振幅
- 音调:由声音的频率决定
- 音色:又叫音品,指声音的感觉特性。不同的发声体由于材料、结构不同,发出声音的音色就不同。物体振动,除了一个基音外,还有许多不同频率(振动的速度)的泛音伴随,正是这些泛音决定了其不同的音色
4.2.音频数据存储和传输
-
模拟信号转化为数字信号过程
- 采样
- 量化
- 编码
-
采样
- 每隔一个时间间隔就在模拟声音的波形上取一个幅度值,这个间隔时间称为采样频率
- 常用的采样频率为8kHz、11.025kHz、16kHz、22.05kHz(FM广播音质)、44.1kHz(CD音质)、48kHz(DVD音频或专业领域)。频率越高,音质越好。采样频率不应低于声音信号最高频率的两倍
-
量化
- 就是把经过采样得到的瞬时值将其幅度离散,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示。量化的级别通常用位(bit)来表示,位数越高则音质越好
-
编码
- 将声音数据写成计算机的数据格式
- 每秒钟所需的存储量可由下式估算出:
- 文件的字节数=采样频率(Hz)x采样位数x声道数÷8
4.3.音频数据格式
- WAVE
- MOD
- Layer-3
- Real Audio
- CD Audio
- MIDI
- CMF