2.2 数字音频的技术指标
2.2.1 采样频率、量化位数和声道数
数字音频是对模拟音频信号按采样的频率间隔,不断获取幅度的量值,使连续的声音转变为离散的数字量的结果。通常,数字音频的技术指标包括采样频率、量化位数以及声道数等。
1.采样频率
采样频率是指对声波每秒钟进行采样的次数,其单位为Hz。如图2-5所示,每秒钟的采样次数不同,对原始模拟信号的恢复能力也不同。
图2-5 数字音频的采样量化示意图
显然,每秒钟的采样次数越多,也即采样频率越高,采样值越能精确反映原来的模拟信号,数字音频的质量越好,但所需的存储空间也越大。反之,采样频率越低,数字音频的质量也就越差。根据奈奎斯特采样理论:只要采样频率高于输入信号最高频率的两倍,就能从采样信号系列中重构原始信号。数字音频常见的采样频率有:44.1kHz、22.05kHz、11.025kHz等。其中,CD音乐的采样频率为44.1kHz,FM广播的采样频率为22.05kHz,电话语音的采样频率为11.025kHz。
2.量化位数
数字音频的另一个重要技术指标是量化位数,它表示对声波的幅度轴(即声音的强弱)进行数字化的动态范围。简单来讲,就是每个声音样本在计算机当中用多少 bit 的位数来进行存储,也称为量化精度。量化位数越高,越能细致地反映声音的强弱变化,但所需的存储空间也越大。量化位数每增加1位,数字音频的动态范围就增加6分贝。常见的量化位数包括8位、16位等。
3.声道数
反映数字音频质量的另一个因素是声道数。声道数是指声音同一时间产生的波形数。简单地讲,声道是指同一时间有几个喇叭发出声音。常见的有单声道和双声道。记录声音时,如果每次生成一个声波数据,称为单声道;每次生成两个声波数据,称为立体声(双声道)。单声道缺乏对声音的定位能力,而立体声在录制过程中被分配到两个独立的声道,从而能够达到很好的声音定位效果,现场真实感更强。立体声更能反映人的听觉感受,但相应的数据量要比单声道的数据量加倍。立体声虽然满足了人们对左、右声道位置感觉体验的要求,但要达到更好的效果,仅仅依靠两个音箱是远远不够的。随着声音合成技术的发展,双声道立体声逐渐向多声道环绕声发展。早期运用3声道来增强人的沉浸感,后来发展到4声道(两前两后)、DVD的6声道(5.1声道)、7声道(6.1声道)、8声道(7.1声道),以及电影院的10声道等。
这里重点介绍一下5.1声道,如图2-6所示。5.1声道是杜比实验室发布的新一代家庭影院环绕声系统,包括中央声道、前置主左/右声道、后置左/右环绕声道,及所谓的0.1声道的重低音声道。其中,中央声道负责配合屏幕上的动作和人物对白;前置主左/右声道喇叭,用来弥补在屏幕中央以外或不能从屏幕看到的动作及其他声音;后置左右环绕声道负责外围及整个背景音乐,让人感觉置身于整个场景的正中央;而马达声、轰炸机的声音或是大鼓等震人心弦的重低音,则是由重低音声道来完成。
图2-6 5.1声道示意图