1.1 数字视频基础知识
1.数字视频的基本概念
数字视频(Digital Video)包括运动图像(Visual)和伴音(Audio)两部分。
一般说来,视频包括可视的图像和可闻的声音,然而由于伴音是处于辅助的地位,并且在技术上视像和伴音是同步合成在一起的,因此具体讨论时有时把视频(Video)与视像(Visual)等同,而声音或伴音则总是用 Audio 表示。所以,在用到“视频”这个概念时,它是否包含伴音要视具体情况而定。
视频基础知识
2.数字视频分辨率规范
目前数字视频行业里的数字视频分辨率的规范,分为标清、高清和超高清3种。
(1)标清:物理分辨率在720p以下的一种视频格式,简称SD。720p是指视频的垂直分辨率为720线逐行扫描。具体地说,是指分辨率在400线左右的VCD、DVD和电视节目等“标清”视频格式,即标准清晰度。
(2)高清:物理分辨率达到720p以上的视频格式称为高清,简称HD。关于高清的标准,国际上公认的有两条:视频垂直分辨率超过720p或1080i;视频宽纵比为16∶9。
(3)超高清:国际电信联盟最新批准的信息显示,“4K分辨率(像素为840×2160)”的正式名称被定为“超高清”。同时,这个名称也适用于“8K分辨率(像素为7680×4320)”。消费电子协会(CEA)要求,所有的消费级显示器和电视机必须满足以下几个条件之后,才能贴上“超高清 Ultra HD”的标签:首先屏幕最小的像素必须达到800万有效像素(像素为3840×2160),在不改变屏幕分辨率的情况下,至少有一路传输端可以传输4K 视频,4K内容的显示必须原生,不能变频,纵横比至少为16∶9。在电视行业里,高清电视机命名为 HDTV,4K 电视机官方的命名 UHDTV,这个命名也就是超高清电视。标清、高清、超高清对比,如图1-1所示。
图1-1 标清、高清、超高清对比
3.电视制式
电视制式种类有3种:PAL制、NTSC制和SECAM制。我国及德国使用PAL制,韩国、日本、东南亚地区,以及美国等欧美国家使用NTSC制,俄罗斯、法国及东欧等国家使用SECAM制,不同的制式之间互不兼容。
因此,若视频拍摄机器是DV,则应选用DV-PAL进行编辑。
4.帧速率
数字视频是利用人眼的视觉暂留特性产生运动影像,因此,对于每秒钟显示的图片数量称为帧速率,单位是用帧/秒(fps)表示。
传统电影的帧速率为24帧/秒(24fps),PAL帧速率是25帧/秒(25fps),NTSC制帧速率为29.79帧/秒(29.79fps),SECAM制帧速率也是25帧/秒(25fps)。不管什么制式,大于10帧/秒的帧速度可以在视觉上产生平滑的动画,反之画面则会产生跳动感。
5.场与场序
在将光信号转换为电信号的扫描过程中,扫描总是从图像的左上角开始,水平向前行进,同时扫描点也以较慢的速率向下移动。当扫描点到达图像右侧边缘时,扫描点快速返回左侧,重新开始在第 1 行的起点下面进行第 2 行扫描,行与行之间的返回过程称为水平消隐。一幅完整的图像扫描信号,由水平消隐间隔分开的行信号序列构成,称为一帧。扫描点扫描完一帧后,要从图像的右下角返回到图像的左下角,开始新一帧的扫描,这一时间间隔,叫作垂直消隐。对于PAL制信号来讲,采用每帧625行扫描。对于NTSC制信号来讲,采用每帧525行扫描。
大部分的广播视频采用两个交换显示的垂直扫描场构成每一帧画面,这叫作交错扫描场。交错视频的帧由两个场构成,其中一个扫描帧的全部奇数场,称为奇场或上场;另一个扫描帧的全部偶数场,称为偶场或下场。场以水平分隔线的方式隔行保存帧的内容,在显示时首先显示第 1 个场的交错间隔内容,然后再显示第 2 个场来填充第一个场留下的缝隙。计算机操作系统是以非交错形式显示视频的,它的每一帧画面由一个垂直扫描场完成。电影胶片类似于非交错视频,它每次是显示整个帧的,一次扫描完一个完整的画面,如图1-2所示。
图1-2 隔行扫描与逐行扫描对比
A.对于隔行扫描视频,首先整个高场(奇数行)按从上到下的顺序在屏幕上绘制一遍;
B.接下来,整个低场(偶数行)按从上到下的顺序在屏幕上绘制一遍;
C.对于非隔行扫描视频,整个帧(计数顺序中的所有行)按从上到下的顺序在屏幕上绘制一遍。
解决交错视频场的最佳方案是分离场。合成编辑可以将上载到计算机的视频素材进行场分离。通过从每个场产生一个完整帧再分离视频场,并保存原始素材中的全部数据。在对素材进行如变速、缩放、旋转和效果等加工时,场分离是极为重要的。未对素材进行场分离,画面中有严重的抖动、毛刺效果。
由于场的存在,就出现了场序的问题,就是显示一帧时先显示哪一场。这并没有一个固定的标准,不同的系统可能有不同的设置。比如DV视频采用的是下场优先,而像Matrox公司的DigiSuite套卡采用的则是上场优先。影片渲染输出时,场序设置不对就会产生图像的抖动,在后期制作中可以调整场序。
6.脱机与联机
脱机(Off-line)编辑称为离线编辑,是指采用较大压缩比(如100:1)将素材采集到计算机中,按照脚本要求进行编辑操作,完成编辑后输出EDL表(编辑决策表)。EDL表记录了视音频编辑的完整信息。联机(On-line)编辑称为在线编辑,指先将 EDL 表文件输入到编辑控制器内,控制广播级录像机以较小压缩比(如2:1)按照EDL表自动进行广播级成品带的编辑,最终输出为高质量的成品带。在实际的制作中,常常将脱机与联机相互配合,利用脱机编辑得到EDL表,进而指导联机编辑,这样可以大大缩短工作时间,提高工作效率。
非线性编辑系统中有以下3种脱机编辑的方法。
第一种方法是先以较低的分辨率和较高的压缩比录制尽可能多的原始素材,使用这些素材编好节目后将EDL表输出,在高档磁带编辑系统中进行合成。
第二种方法根据草编得到的EDL表,重新以全分辨率和小压缩比对节目中实际使用的素材进行数字化,然后让系统自动制作成片。
第三种脱机编辑的方法在输入素材的阶段首先以最高质量进行录制,然后在系统内部以低分辨率和高压缩比复制所有素材,复制的素材占用存储空间较小,处理速度也比较快,在它的基础上进行编辑可以缩短特技的处理时间。草编完成后,用高质量的素材替换对应的低质量素材,然后再对节目进行正式合成。
7.时间代码
为确定视频素材的长度,以及每一帧的时间位置,以便在播放和编辑时对其进行精确控制,需要用时间代码给每一帧编号,国际标准称为SMPTE时间代码, SMPTE时间代码一般简称为时码。SMPTE时码的表示方法是“小时(h): 分钟(m): 秒(s): 帧(f)”。例如,一段长度为“00:03:20:15”的视频片段的播放时间为3分钟20秒15帧。
8.信号格式
摄像机拍摄图像时,通过扫描最初形成R、G、B 3个信号,然后将RGB信号转换为亮度信号和色度信号。亮度信号Y是控制图像亮度的单色视频信号,而色度信号只包含图像的彩色信息,并分为两个色差信号B-Y与R-Y。由于人眼对图像中的色度细节分辨力低而对亮度细节分辨力高,因此对两个色差信号的频带宽度又进行了压缩处理,对于PAL制来讲,压缩后的色差信号用U、V表示。
•UV信号称为分量信号(component)格式,也被称为YUV颜色模式,是目前视频记录存储的主流方式。两个色差信号可以进一步合成一个色度信号C,进而形成了Y/C分离信号格式。亮度信号Y和色度信号C又可进一步形成一个信号,被称为复合信号(composite),也就是人们常说的彩色全电视信号。对同一信号源来讲,YUV 分量信号质量最好,然后依次降低。Premiere 的内部运算支持 YUV 颜色模式,能够确保影片质量。
9.帧长宽比
帧长宽比是指帧的长度和宽度的比例。普通电视系统的长宽比是4∶3,而宽屏电视是16∶9。前者被目前标准清晰度电视所采用,后者被正在发展的高清电视所采用。
10.像素长宽比
像素长宽比是指像素的长度和宽度的比例。符合ITUR601标准的PAL制视频,一帧图像由720×576个像素组成,采用的是矩形像素,像素长宽比为1.067。而我们接触到的大部分图像素材,采用的是方形像素,像素长宽比为1。如果一帧像素是方形的图像,由以矩形像素为标准的系统处理显示,就会出现变形,反之也是同样。如图1-3所示,左侧是一帧像素长宽比为1的图像,右侧是以矩形像素显示后的变形图像。目前,在比较专业的涉及视频制作的软件中,像素长宽比都是可以调整的,以适应不同的需要,像Premiere、EDIUS等。
图1-3 对比显示
11.颜色模式
颜色模式可以理解为翻译颜色的方法,视频领域经常用到的是 RGB 颜色模式、Lab 颜色模式、HSB颜色模式和YUV颜色模式。
(1)RGB颜色模式
科学研究发现,自然界中所有的颜色,都可以由红(R)、绿(G)、蓝(B)这3种颜色的不同强度组合而成,这就是人们常说的三基色原理。因此,R、G、B三色也被称为三基色或三原色。把这3种颜色叠加到一起,将会得到更加明亮的颜色,所以RGB颜色模式也称为加色原理。对于电视机、计算机显示器等自发光物体的颜色描述,都采用RGB颜色模式。三种基色两两重叠,就产生了青、洋红、黄3种次混合色,同时也引出了互补色的概念。基色和次混合色是彼此的互补色,即彼此之间是最不一样的颜色。例如,青色由蓝、绿两色混合构成,而红色是缺少的一种颜色,因此青色与红色构成了彼此的互补色。互补色放在一起,对比明显醒目。掌握这一点,对于艺术创作中利用颜色来突出主体特别有用。
(2)Lab颜色模式
Lab颜色模式是由RGB三基色转换而来的,它是RGB模式转换为HSB模式的桥梁。该颜色模式由一个发光率(Luminance)和两个颜色(a、b)组成。它用颜色轴构成平面上的环形线来表示颜色的变化,其中径向表示色饱和度的变化,自内向外饱和度逐渐增高,圆周方向表示色调的变化,每个圆周形成一个色环。而不同的发光率表示不同的亮度,并对应不同环形颜色变化线。它是一种具有“独立于设备”的颜色模式,即不论使用任何一种显示器或者打印机,Lab的颜色不变。
(3)HSB颜色模式
HSB 颜色模式基于人对颜色的心理感受而形成,它将颜色看成 3 个要素:色调(Hue)、饱和度(Saturation)和亮度(Brightness)。因此这种颜色模式比较符合人的主观感受,可让使用者觉得更加直观。它可由底与底对接的两个圆锥体立体模型来表示,其中轴向表示亮度,自上而下由白变黑。径向表示色饱和度,自内向外逐渐变高。而圆周方向则表示色调的变化,形成色环。
(4)YUV颜色模式
•UV颜色模式由一个亮度信号Y和两个色差信号U、V组成,它由RGB颜色转换而成,前面我们已有所论述。
12.颜色深度
视频数字化后,能否真实反映出原始图像的颜色是十分重要的。在计算机中,采用颜色深度这一概念来衡量处理色彩的能力。颜色深度指的是每个像素可显示出的颜色数,它和数字化过程中的量化数有着密切的关系。因此颜色深度基本上用多少量化数,也就是多少位(bit)来表示。显然,量化位数越高,每个像素可显示出的颜色数目就越多。8位颜色就是256色,16位颜色称为中(Thousands)彩色,24位颜色称为真彩色,就是百万(Millions)色。另外,32位颜色对应的是百万+(Millions+),实际上它仍是24位颜色深度,剩下的8位为每一个像素存储透明度信息,也叫Alpha通道。8位的Alpha通道,意味着每个像素均有256个透明度等级。
13.常见的视频格式
常见的视频格式有AVI、MPEG、MOV、RM等。
(1)AVI格式
AVI(Audio Video Interleaved)格式即音频视频交错格式。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且压缩标准不统一。最普遍的就是高版本Windows媒体播放器,播放不了采用早期编码编辑的AVI格式视频;而低版本Windows媒体播放器,又播放不了采用最新编码编辑的AVI格式视频。
(2)MPEG格式
MPEG格式标准就是由ISO(International Organization for Standardization)所制订而发布的视频、音频、数据的压缩标准。
MPEG标准主要有以下5个,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。MPEG专家组建于1988年,专门负责为CD建立视频和音频标准,而成员都是视频、音频及系统领域的技术专家。他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO/IEC1172压缩编码标准,并制定出MPEG格式,令视听传播方面进入了数码时代。MPEG 标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。
(3)MOV格式
MOV格式是由美国Apple公司开发的一种视频格式,默认的播放器是苹果公司的QuickTimePlayer。具有较高的压缩比率和较完美的视频清晰度等特点,其最大的特点是跨平台性,即不仅能支持苹果系统,同样也能支持Windows系列。
(4)RM格式
RM格式是RealNetworks公司开发的一种流媒体视频文件格式,可以根据网络数据传输的不同速率制定不同的压缩比率,从而实现低速率的Internet上进行视频文件的实时传送和播放。它主要包含RealAudio、RealVideo和RealFlash三部分。这种格式的另一个特点是用户使用RealPlayer或RealOnePlayer播放器,可以在不下载音频/视频内容的条件下实现在线播放。另外,RM 作为网络视频格式,它还可以通过其RealServer服务器将其他格式的视频转换成RM视频并由RealServer服务器负责对外发布和播放。
(5)RMVB格式
这是一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源。
一部大小为700MB左右的DVD影片,如果将其转录成同样视听品质的RMVB格式,其文件大小也就400MB左右。不仅如此,这种视频格式还具有内置字幕和无需外挂插件支持等独特优点。
除此之外,常见的可用作其他用途的还有DV-AVI、FLV、ASF和WMV等视频格式,不同的格式用在不同的软件环境中。