每天进步一点点3.0(四)

271 阅读9分钟

本文已参与 [新人创作礼] 活动,一起开启掘金创作之路。

多媒体知识

多媒体的概念:

多媒体是(multimedia)一词产生于20世纪80年代初,狭义上的多媒体是指信息表示媒体的多样化。计算机技术和信息处理技术的进展,使人们拥有了处理多种媒体信息的能力。多媒体是利用计算机将文本、声音、图形、图像、动画和视频等多种媒体进行综合处理,使多种信息建立逻辑连接,集成为一个具有交互性的系统。广义上的多媒体一词可以视为多媒体技术的同义词,这里的多媒体不是指多种媒体本身,而是指处理和应用他们的一整套技术。
总结:
一、多媒体是信息交流和传播的工具,在这点上,多媒体与报纸、杂志、电视等媒体的功能相同。
二、多媒体是一种人机交互式模式,这里的“机”,主要是指计算机,或微处理器控制的其他终端设备。因为计算机具有良好的交互性,它能够比较容易地实现人机交互功能。从这个意义上说,多媒体与目前的电视、报纸、广播等媒体存在区别。
三、多媒体技术以数字信号的形式进行信息的存储、处理和传输。
四、从字面上看,任何两种以上的媒体就可以称为多媒体,但通常认为,多媒体中的连续媒体(声音和视频)是人与机器交互的最自然的媒体,必须包含他们。
五、计算机对自然状态下的文本、声音、图形、图像、视频等信息进行处理时,必须先对这些信息进行采样、量化、编码等处理,将他们转换成计算机能够接收的二进制信号。而以上处理的数据量非常之强大,因此,多媒体技术目前主要研究和解决的问题是表示媒体的数据编码、压缩和解压缩。

超文本:

网页是一种超文本(hyper text)文件。超文本有两大特点:一是超文本的内容可以包括文字、图片、音频、视频、超链接等;二是超文本采用超链接的方法,将不同位置(如不同网站)的内容组织在一起,构成一个庞大的网状文本系统。超文本普通以电子文档的方式表示,网页都采用超文本形式。

超媒体:

超媒体一词是由超文本衍生而来的。但要弄清这一概念,还必须从超链接说起。超链接大量应用于Internet的万维网3W中,它是指在Web网页所显示的文件中,对有关词汇所作的索引链接能够指向另一个文件。3W使用链接方法能方便地从Internet上的一个文件访问另一个文件(即文件的链接),这些文件可以在同一个站点也可在不同的站点。可见3W中的超链接能将若干文本组合起来形成超文本。同样道理,超链接也可将若干不同媒体、多媒体或流媒体文件链接起来,组合成为超媒体。

可见,超媒体是【超文本】和【多媒体】在信息浏览环境下的结合。它是对超文本的扩展,除了具有超文本的全部功能以外,还能够处理多媒体和流媒体信息。

在技术学上,人们把用数据库管理多媒体信息的方法称为多媒体数据库;用超文本技术来管理多媒体信息,其对应的名词就是超媒体。形象地说,超媒体=超文本+多媒体。它是以多媒体方式呈现的相关文件信息,意指多媒体超文本(Multimedia Hypertext)。

多媒体计算机系统的组成:

多媒体计算机系统是一个能处理多媒体信息的计算机系统。一个完整的多媒体计算机系统是由【硬件】和【软件】两部分组成。【硬件】包括计算机主机及可以接收和播放的多媒体信息的各种输入/输出设备;【软件】包括音频/视频处理核心程序、多媒体操作系统及各种多媒体工具软件和应用软件。

多媒体系统的硬件结构:

多媒体系统的硬件即:多媒体计算机,它应该是能够输入/输出并能综合处理文字、声音、图形、图像和动画等多种媒体信息的计算机。多媒体个人计算机(Multimedia Personal Computer,MPC)必须遵循MPC标准。

多媒体软件系统:

按功能分,多媒体计算机软件系统可分为三个层次:多媒体核心软件、多媒体工具软件和多媒体应用软件。

声音、图像的数字化过程:

声音媒体的数字化:

音频技术常识:

【声波】是指能引起听觉的由机械振动产生的压力波,振动越强,声音越大,振动频率越高,音调则越高。人耳能听到的声音频率为 20Hz ~ 20 KHz ,而人能够发出的声音频率为 300Hz ~ 3000Hz。

数字音频技术:

在计算机内,所有的信息均以数字(0或1)表示,用一组数字表示声音的信号,我们称之为【数字音频】。

数字音频与模拟音频的区别:
模拟音频在时间上与幅度上是连续的,而数字音频是一个数据序列,在时间上与幅度上是离散。若要用计算机对音频进行处理,就要将模拟信息(如语音、音乐等)转换成数字信号,这一转换过程称之为【模拟音频的数字化】。

模拟音频数字化的过程:采样、量化、编码。
采样:每隔一定时间间隔就在模拟波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号,该时间间隔为采样周期,其倒数为采样频率。【采样频率】是每秒的采样次数,采样频率越高,数字化音频的质量越高,但数据量也越大。

量化:将每个采样点得到的表示声音强弱的模拟电压的幅度值以数字存储。量化位数(即采样精度)表示存放采样点振幅值的二进制位数,它决定了模拟信号数字化后的动态范围。量化位数越大,对音频信号的采样精度越高,信息量也相应提高。在相同的采样频率下,量化位数越大,则采样精度越高,声音的质量也越好,信息的存储量也相应越大。

编码:将采样和量化后的数字数据以一定的格式记录下来。常用的编码方式是脉冲编码调制(Puls Modulation,PCM),其优点是抗干扰能力强、失真小、传输特性稳定。

声音合成技术:

使用微处理器和数字信号处理器代替发声部件,模拟出声音波形数据,然后将这些数据通过数模转换器转换成音频信号并发送到放大器,合成出声音或音乐。乐器生厂商利用声音合成技术生产出各种各样的电子乐器。

常见的声音文件格式:

.WAM、.MIDI、.MP3、.AU、AIFF等。

视觉媒体的数字化:

多媒体创作最常用的视觉元素分为【静态图像】和【动态图像】两大类。静态图像根据他们在计算机中生成的原理不同,又分为位图(光栅)图像和适量图形。动态图像又分为视频和动画。视频和动画之间的界限并不能完成确定。

静态图像数字化:

(1)定义:在计算机中,图形(graphics)和图像(image)是一对既有联系又有区别的概念。图形一般是指通过绘图软件绘制的由直线、圆、圆弧、任意曲线等图元组成的画面,以矢量图形文件形式存储。图像是由扫描仪、数字照相机、摄像机等输入设备捕捉的真实场景画面产生的映像,数字化后以位图形式存储。适量图像与位图图像可以转换,矢量图转换成位图,在保持图形时将其保存格式设置为位图图像格式即可;反之则比较困难,要借助其他软件来实现。

(2)图像数字化:将一幅真实的图像转变成计算机能够接受的数字形式的图像,这涉及图像的采样、量化、编码等操作。

(3)图像的存储格式:计算机图像是以多种不同的格式存储在计算机中的,每种格式都有自己的用途和特点,了解了多种图像格式的特点后,在设计输出时用户就能根据自己的需要有针对性地选择输出格式。常见地图像存储格式:.BMP、.JPEG、.GIF、.PNG、.TIFF、.PSD等。

动态图像的数字化:

(1)定义:动态图像也称为视频。视频是由一系列的静态图像按一定的顺序排列组成的,每一幅画面称为帧(Frame)。电影、电视通过快速播放每帧画面,再加上人眼视觉效应便产生了连续运动的效果。当帧速率达到12帧/秒以上时,可以产生连续的视频显示效果。

(2)视频信息的数字化:同音频相似,在一定的时间内以一定的速度对单帧视频信号进行采样、量化、编码等过程,实现模拟转换、彩色空间变换和编码压缩等,可通过视频捕捉卡和相应的软件来实现。在数字化之后,如果视频信号不加以压缩,数据量的大小是帧乘以每幅画面的数据量。

(3)常见视频文件格式:.AVI、.MPEG、.MP4、.MOV、.ASF、.WMV、.RM、.RMVB等。