第2章 电路交换
电话通信交换系统在一百多年的历史中,经历了从人工交换到自动交换、从模拟交换到数字交换、从有线电话到无线电话,控制系统从布线逻辑控制到存储程序控制、从随路信令到公共信道信令的发展历程。目前,大部分电话业务都使用电路交换技术,电信运营商的固话网络是以电路交换机为中心组建的,并且波分复用光交换系统、N-ISDN网、智能网(Intelligent Network,IN)、移动通信网的业务交换点也使用电路交换技术。移动通信网的发展过程中,1G、2G和3G的语音业务,均采用电路交换。
在固话通信系统和移动通信系统中,都需要将语音信息转换为数字信息,但是采用的是两种不同的技术,本章首先剖析这两种技术在电路交换中的实现,随后详细介绍电路交换机的组成和功能(包括传统的固话通信交换机和移动通信交换机)、数字交换网络的工作原理、电路交换机的控制软件、电路交换的呼叫处理过程等。
由于无线信道环境差,移动用户的语音信息在数字化后,需经过信道编码处理,因此,本章在介绍移动通信系统的语音信息模/数转换时,还结合信道编码进行了简要分析。
2.1 语音信号的数字化
在数字通信发展的推动下,语音编码技术的研究开发非常迅速,出现了许多编码方案。语音编码技术分为波形编码、参量编码和混合编码三类。这些方案的目标主要有两个:第一是降低语音编码速率,第二是提高语音质量。前者针对语音质量好但速率高的波形编码,后者针对速率低但语音质量较差的参量编码。
1.波形编码
波形编码将时域信号波形直接变换为数字序列,目的是尽可能精确地再现原来的语音波形。基本原理是:在时间轴上对模拟语音信号按照一定的速率抽样,然后将抽样值(以下简称样值)分层量化,并用数字代码表示。解码就是将收到的数字序列经解码和滤波恢复为连续信号波形。波形编码具有低复杂度、低时延的特点,脉冲编码调制(Pulse Coded Modulation, PCM)、增量调制(Delta Modulation,DM)和它们的改进型(如自适应差分脉冲编码调制(Adaptive Differential PCM,ADPCM)均属于波形编码技术。对于比特率较高的编码信号(16~64kb/s),波形编码技术能够提供相当好的语音质量,对于低速语音编码信号(16kb/s以下),波形编码的语音质量显著下降,因而波形编码在对信号带宽要求不太严的通信中得到应用。例如,固话通信中采用单用户速率64kb/s的PCM模/数变换技术。对频率资源相当紧张的无线移动通信来说,这种编码方式不合适。
2.参量编码
参量编码指对信源信号在频域或其他正交变换域提取特征参量,并将特征参量变换成数字序列进行传输。其逆过程解码将收到的数字序列经变换后恢复成特征参量,再依据此特征参量重建语音信号。用这种编码技术实现低速语音编码,速率可压缩至2~4.8 kb/s。线性预测编码(Linear Predictive Coding,LPC)及其各种改进型都属参量编码技术,这种编码技术的缺点是语音质量较差,对噪声较为敏感,不适合在公共移动通信网等场合使用。
3.混合编码
混合编码的数字语音信号中既包括若干语音特征参量,又包括部分波形编码信息,它可将比特率压缩到4~16kb/s,其中在8~16kb/s内能够达到良好的语音质量和自然度,因而这种编码技术最适于数字移动通信环境。
虽然,混合编码能得到较低的比特率和较好的语音质量,但其复杂度也较高。目前,在2G和3G无线移动通信中,应用和研究得比较广泛的信源编码技术,如码激励线性预测编码(Code-Excited Linear Predictive,CELP)、矢量和激励性预测编码(Vector-sum Excited Linear Predictive Coding,VSELP)、正常脉冲激励线性预测编码(Regular Pulse Excited Linear Predictive Coding,LPC-RPE)和代数码激励线性预测编码(Algebraic Code Excited Linear Prediction,ACELP)均属混合编码方案。
2.1.1 固话通信系统语音信号的数字化
数字通信系统中,信源的信息可以是数字信号,也可以是模拟信号。如果是模拟信号,传输之前先转换为数字信号。将模拟信源信号变换成数字信号的过程是信源编码。通信中的语音、图像(传真、电视等)业务,其信源信号在时间上和幅度上均为连续的模拟信号。对于图像等多维信源,需要在空间上同时离散化。对于彩色图像,还需要将给定色度空间的3基色(红、绿、蓝)值也同时离散化。语音信号的数字化称为语音编码。这里以语音信号的PCM过程为例展开分析,PCM编码方法同样适用于图像编码。
PCM就是把时间连续、幅值连续的模拟信号变换成时间离散、幅值离散的数字信号,它包括抽样、量化、编码三个过程。
1.抽样
要把语音信号转换为数字信号,首先要在时间上对语音信号进行离散化处理,这一处理过程由抽样完成。抽样就是每隔一定时间T,抽取语音信号m(t)的一个瞬间幅值,得到一系列样值信号,即样值序列信号s(t)=s(nT)或称为脉冲幅度调制(Pulse Amplitude Modulation, PA M)信号。由于抽样后的PAM信号仍可能为任意值,因而它的幅值仍是连续的。
抽样间隔T是关键参数,它的大小由奈奎斯特抽样定理来决定。
奈奎斯特抽样定理:一个频带限于fm赫兹的连续信号m(t)可以唯一地用时间上每隔时间T(≤1/2fm)秒的样值序列来确定。其中,抽样频率fs≥2fm。
以采用理想的单位冲激脉冲序列作为抽样脉冲r(t),样值是抽样时刻nT时对应m(t)的瞬间值m(nT)。图2.1所示抽样及抽样后的样值频谱中,m(t)是原模拟信号;m(nT)是时刻nT的单个样值;r(t)是抽样脉冲序列;s(t)是原模拟信号全部的样值;M(f),R(f),S(f)是相应信号的频域表示形式。
图2.1 抽样及抽样后的样值频谱
可以看出,理想抽样信号s(t)的频谱S(f)与原信号m(t)的频谱M(f)之间的关系,即抽样后的信号频谱由无限多个分布在fs各次谐波的上下边带组成,而其中位于n=0处的频谱,就是语音信号频谱M(f)本身,只是幅度相差一个常系数。
设信源信号频谱限制在0~fm之间,在接收端只用一个低通滤波器把原始信号频带滤出,即可获得原始信号的重建,图2.2所示为抽样频率对原信号频谱的影响。
图2.2 抽样频率对原信号频谱的影响
要获得原始信号的重建,必须使fm与fs-fm之间有一定宽度的防卫带。若抽样频率fs<2fm,则以 fs为抽样频率的下边带将与原语音信号的频带发生重叠而产生折叠噪声,如图2.2所示。为了避免折叠噪声,对频带为0~fm内信号的抽样频率fs应留有一定的防卫带,即fs>2fm。例如,语音信号抽样时留出了8000-2×3400=1200Hz的防卫带。
2.量化
抽样后的PAM信号,在时间上离散,但幅值连续,仍是模拟信号。要把它变成数字信号,必须对抽样信号进行幅度的离散化处理,即还需要量化和编码两个过程的处理。
量化分为均匀量化和非均匀量化。
在通信中,对信号失真的情况一般用信噪比来度量。数字通信系统的语音通信中,失真噪声主要是由量化所带来的,叫量化噪声。
根据通信网传输标准的要求,长途通信经过3~4次音频转接后仍应有好的语音质量。依据语音信号统计结果,对通信系统提出的要求是:在信号动态范围40dB条件下,信噪比不应低于26dB。
为了在动态范围内保证信噪比的要求,采用均匀量化时编码位数L应满足L ≥ 11bit,因此需要的量化级数高达N=211=2048,这样不仅使设备复杂,而且比特率过高,以至于降低信道利用率。如果减少编码比特数,那么量化信噪比又不能满足要求,为了解决这一矛盾,采用了非均匀量化方法。
非均匀量化的特点是:信号幅度小时,量化间隔小,量化误差也小;信号幅度大时,量化间隔大,其量化误差也大。采用非均匀量化后可做到在不增大量化级数N的条件下,使信号在较宽的动态范围达到所需的指标要求。非均匀量化实质是提高了弱信号的信噪比,降低了强信号的信噪比,使信噪比在较宽的动态范围内均匀。
要实现非均匀量化,就要使输入信号经量化器处理后得到非均匀量化的量化值。目前主要有两种压缩-扩张特性即A律和μ律,中国、欧洲和俄罗斯采用A律压缩—扩张特性,美国、加拿大、日本和韩国等采用μ律压缩—扩张特性。
A律压缩—扩张特性是指符合下式的对数压缩—扩张规律:
式中,x为量化器归一化输入电压;y为量化器归一化输出电压;A为常数,其值为87.6,它决定压缩—扩张程度。
μ律压缩特性是指符合下式的对数压缩规律:
式中,x为量化器归一化输入电压;y为量化器归一化输出电压;µ为常数,其值为255,它决定压缩—扩张程度。
为了实现数字化,还要对量化值进行编码处理,在设备中量化和编码是同时进行的。
输入的语音信号在-20~-40dB的范围内时,A律的量化信噪比稍高于µ律;在低于-40dB后,µ律的量化信噪比高于A律。一般说来,语音信号的电平在0~-40dB的动态范围内。无论采用A律还是µ律都可以获得良好的压缩效果,实现ITU-T的指标。这里只介绍A律压缩—扩张特性。
A律13折线压扩特性是国际电报电话咨询委员会(International Telegraph and Telephone Consultative Committee,CCITT)建议在数字通信设备中使用的压缩—扩张特性,图2.3所示为13折线压扩特性。CCITT现为国际电信联盟(International Telecommunication Union,ITU)的电信标准化局(Telecommunication Standardization Sector of the International Telecommunications Union,ITU-T)。
图2.3 13折线压扩特性
由图2.3中折线可以看出,在x轴0~1(归一化的输入信号值)范围内为1、1/2、1/4、1/8、1/16、1/32、1/64、1/128、0。在y轴0~1(归一化量化输出值)范围内均匀分为8个段,其分段点是8/8、7/8、6/8、5/8、4/8、3/8、2/8、1/8、0。将x轴、y轴相应分段在x-y平面上相交点连线就是各段的折线。图中只画出了正幅值的压扩曲线。正负幅值的折线各有8个段落共16个段。第一象限的第1、第2段斜率相同(斜率均为16)并通过原点,则正、负的4段为一条直线段,剩下正、负两边各有6个线段。这样,正、负值的压扩特性共由2×6+1=13个线段组成,故称13折线。
为了减小量化失真,还要将每个量化段等分为16个量化间隔,则总量化级数为N=2(正、负极性)×8(段落)×16(段落等分)= 256级。A律13折线的第1、2段量化间隔相等,其量化间隔最小,设第一段16等分中的每一等分为量化间隔Δ(归一化值),则过载电平 U的归一化值为U=2048Δ。
13折线量化段电平(归一化值)如表2.1所示,它反映了13折线量化的量化间隔与最小量化间隔Δ的关系,表中第一段的段内最小量化间隔为Δ。
表2.1 13折线量化段电平(归一化值)
3.编码
语音信号经抽样、量化后,还必须变为数字代码,这个变为数字代码的过程叫编码。按13折线(A=87.6)量化规律进行编码。A律13折线采用量化级数N=256,即每个样值信号经量化后编成8比特码,由8比特码组成一个码字近似地表示样值。
A律13折线的非均匀量化段是奇对称的上、下8个量化段,每个量化段又均匀等分为16个量化级。8比特码字分别用a1,a2,a3,a4,a5,a6,a7,a8来表示:a1表示极性码(a1=1表示正极性, a1=0表示负极性);a2,a3,a4共3比特为段落码,表示8个非均匀量化段;a5,a6,a7,a8为段内码,表示每段16等分的哪一等分段。
至此,模拟语音信号经PCM处理变成了数字信号。
2.1.2 差值脉冲编码
语音信号的相邻样值之间存在很大的相关性,即语音信号相邻样值间的差值一般不会很大。因此,样值差值的动态范围要比样值本身的动态范围小,这就有可能对样值的差值进行编码。这种方法将减少码字比特数,提高通信系统的容量。
样值与差值序列的关系如图2.4所示,将样值序列图2.4(a)变换成差值序列图2.4(b),对差值序列进行编码,然后经信道传输,接收端对恢复后的差值序列进行累加处理如图2.4(c)所示,就可恢复出样值序列即PAM信号,如图2.4(c)所示。这种以瞬时样值之差进行编码调制实现的数字通信,称为差值脉冲编码调制。
差值脉冲编码调制有多种方式,对差值编1比特码,称增量调制;对差值编多比特码,称为差分脉冲编码调制(Differential Pulse Coded Modulation,DPCM)。为了减少量化误差,其抽样周期要小于等于PCM中的抽样周期,即抽样频率大于等于8kHz。为了提高信噪比或降低数码带宽,还有多种编码方式,如自适应脉冲编码调制ADPCM等。
图2.4 样值与差值序列的关系
2.1.3 数字复接
光纤通信、数字微波(卫星)通信,以及数字程控交换技术的发展,推动了数字通信网的构成和发展,迫切地需要把各种低速的数字信号变换成高速数字信号,以便合理地采用大、中容量的传输信道,满足用户的需要。
数字信号的时分复用也称为复接,参与复接的信号称为支路信号,复接后的信号称为复用信号或群路信号。从复用的数字信号中把各支路的数字信号一一分开则称为分路。
由同一主振器提供时钟的各个数字信号叫做同源信号,同源信号的数字复接称为同步复接。由不同时钟源产生的数字信号称为异源信号,异源信号的数字复接称为异步复接。
对于速率完全相同或相互成整数倍的数字信号,可以用较简单的方法实现同步复接。而对于异源信号,因为各自的数码率可以在标称值上下有些偏差,称准同步(Plesiochronous)信号,若用简单的方法复接,合成信号会出现重叠和错比特现象,从而丢失信息。因此,异步复接的前提条件是,必须先使异源数字信号的瞬时数码率达到一致,即同步。可见,对异步信号的复接必须使各支路的数字信号速率相同(同步化),且保持固定的相位关系。
准同步数字复接中应用最多的是比特调整技术。比特调整又称为码速调整。一般有正码速调整、正/负码速调整和正/零/负码速调整三种,其中正码速调整应用较普遍。每一个参与复接的数字码流都必须经过一个码速调整装置,把标称数码率相同而瞬时速率不同的码流调整到同一较高的速率,然后再复接。
码速调整装置的主体是缓冲存储器,还有一些必要的控制电路,输入时钟频率即为输入支路的速率fL,输出时钟频率即为复接支路时钟的频率fm。正码速调整技术中,输出频率fm大于输入频率fL。
由于欧洲和北美固话通信的体制不同,因而存在两种复接方式,我国采用欧洲的体制,这里主要介绍这种体制。首先将30个64kb/s用户的数字信号复接成一个2.048Mb/s的信号,然后4个2.048Mb/s信号复接成标称速率为8.448Mb/s的二次群信号,以此类推,4个8.448Mb/s信号复接成一个34.368Mb/s的三次群信号,4个34.368Mb/s的三次群信号复接成一个139.264Mb/s的四次群信号。准同步数字体系(Plesiochronous Digital Hierarchy,PDH)的数字复接如图2.5所示。随着数字速率的进一步提高,这种复接体制暴露出越来越多的缺点。因此,目前,干线传输的同步数字体系(Synchronous Digital Hierachy,SDH)已经逐渐发展成为主要的复接方式。
图2.5 PDH数字复接体系
2.1.4 移动通信系统语音信号的数字化
1.移动通信系统语音信号数字化的基本理论
与固话网的速率相比,移动通信系统语音信号的传输速率非常低。这是必须的,因为在移动通信中可用带宽相对较低。另外,恶劣的传输环境包括衰落和来自其他移动终端的干扰,要通过信道编码实现差错保护。所以,通过空中接口传输语音信号需要两个步骤。首先压缩语音信号,降低传输速率;然后通过信道编码技术提供差错保护。
第二代移动通信系统语音信号速率从IS-136中的7.95kb/s到GSM中的13kb/s(注意,这里的速率值是信源编码后而非信道编码后的值),都采用了LPC压缩技术。LPC本质上源于对人类语音的演变过程建立模型,作为激励波形来驱动一组滤波器。LPC语音模型如图2.6所示。激励波形和长期滤波器构建源自肺部和声带的语音模型,短期滤波器表示声道模型。如图2.6所示的LPC模型中激励波形是周期性脉冲与类似噪声信号的混合。“长期”用于描述图2.6中的第1个滤波器,对应声带振动引起的语音音调周期的约值。音调周期一般在2.5~15ms数量级的范围。“短期”表示时间在1ms的数量级。
由于LPC语音模型的输出在给定采样时间内基于以前样值的加权和,再加上采样值(输入)得到的新值,所以被称为线性预测编码。具体而言,该特性体现在图2.6所示的“短期滤波器”上。“短期滤波器”的简单框图用图2.7表示。采样间隔n时的输出ˆ( )sn 通过将采样输入e(n)加到线性预测器上得到。
图2.6 LPC语音模型
图2.7 用于线性预测的短期滤波器
线性预测器模型可以简单地表示为
当前输出值基于此前的m个样值,相邻样值间隔125μs。ai是自适应加权因子。对式(2.3)进行z变换,得到传输函数H(z)=S(z)/E(z)。
该传输函数正好是全极点线性滤波器。采样次数m的典型值在10以内,表示滤波器工作在相对“短”的1ms左右。
长期滤波器模型通常是全极点滤波器,但是仅有一两个极点。具体而言,它由单极点滤波器表示,传输函数为
参数 p 为音调周期与采样间隔(125 µs)的乘积,被周期性地调整和测量,所以,它在20~120之间变化,对应的实际时间为2.5~15ms。参数b是加权因子。
如图2.8所示为基本LPC系统的构成,包括语音产生端的编码器和接收端的译码器。它采用了图2.6和图2.7所示的LPC语音产生模型。系统将模型输出与实际语音样值进行比较,通过周期性调整激励和滤波器参数,以减小差异信号。首先考虑编码器,量化的输入语音样值s(n),每125 μs产生一次。这些值和语音模型输出ˆ( )s n 之间的差异ε(n),通过调整激励发生器和滤波器参数实现了 (n)ε 的最小化。然后,所得到的参数在采样空隙传输至接收系统。接收系统即译码器进行相反的处理过程,用接收参数调整激励发生器和滤波器。
图2.8 基本LPC系统的构成
GSM系统采用LPC-RPE压缩技术。IS-136和IS-95采用CELP压缩技术实现语音编译码。下面介绍这些不同的编译码技术,首先分析CELP技术。CELP系统组成如图2.9所示(图中未显示的是加权滤波器,它通常用于加权输入信号样值和差错样值)。注意到系统与图2.8所示的LPC编译码器看起来类似,主要差别在于图2.9所示的激励发生器取决于所选择的一组高斯码字。参数G表示用于调整所选码字幅度的增益参数。图2.9所示的长期滤波器通常设计为式(2.5)所示的单极点滤波器,传输函数为1/(1-bz-p)。如前所述,参数p表示准周期性语音的估计音调周期;参数 b 为可调加权因子。随机码字和长期滤波器的混合用于建立声带激励模型。“短期滤波器”用于建立声道模型。
图2.9 CELP系统组成
CELP采用矢量量化技术,即收集构建矢量的许多量化差错样值后,对参数进行周期性调整的技术。矢量量化提供压缩优势。例如,125μs进行一次语音采样,每5ms调整一次,所以每5ms产生的40个样值(5ms/125μs=40)构建一个矢量。激励码字集包含适当数量的随机码字,每个矢量含有40个量化样值。用滤波器参数、增益和码字这三个参数的均方误差最小化来决定每个间隔的最佳参数和码字。正是这些参数通过空中接口在语音信道发送,用于译码器重建语音信号,如图2.9(b)所示。这些参数而非实际语音信号的传输,导致语音信道的比特率在很大程度上被压缩。
下面分析由IS-136编译码器产生的简单例子。
(1)短期滤波器是一个10极点的全极点滤波器,传输函数为该滤波器有10个待定系数。这些系数每20ms发送一次,每个系数用4bit就可以精确表示,所以编码器每20ms仅需要40bit就可以表示。
(2)其他参数为音调周期p、加权系数b、增益G和所选码字都各用7bit表示,每5ms收集一次,这4个参数对应每5ms的28bit。
(3)每20ms发送的总比特数为152(=40+7×4×4),比特率为7.6kb/s(在下面的IS-136中,可以看到通过语音信道每20ms发送159bit,则总的比特率为7950b/s)。
所以,使用矢量量化CELP,能使比特率得到足够的降低。
介绍完一般的语音压缩技术以后,下面具体分析第二代蜂窝系统中使用的语音压缩/编码技术。
2.IS-136系统的语音信号数字化过程
北美第二代蜂窝系统IS-136语音压缩系统采用CELP的变形VSELP。系统中模拟语音信号采样率8000Hz。每个样值量化编码为13bit,而不是固话通信的8bit。VSELP框图如图2.10所示。
图2.11 IS-136语音编码的差错控制过程
注意到图2.10所示的VSELP编译码器与图2.9所示的基本CELP编译码器非常类似,主要差别在于VSELP使用两个随机码字集。而CELP只使用一个。用式(2.5)所示的单极点滤波器表示长期滤波器,其音调参数由图2.10中的参数L给定。图2.10中的增益参数β与式(2.5)中的参数b对应。L是采样间隔(125µs)的倍数,取值20~146,对应用7bit表示的127个可能值的某一个。编码器的加权合成滤波器H(z)和滤波器A(z)都与式(2.4)所示的全极点传输函数相对应。共有m=10个加权参数,记为iα,i=1,2, …,10,如图2.10所示。
图2.10 IS-136的语音压缩系统VSELP
信号样值经加权滤波器W(z)加权,该加权滤波器同时具有零点和极点,W(z)的分子(零点)和分母(极点)具有相同的参数iα。码字集的基本单元是码字,每个码字由来自40个样值的随机矢量给出。对每个码字集而言随机矢量定义为:由含40码字且每个码字7 bit的随机基矢量构成。所以,每一个码字集一共有27=128种可能的码字。
编译码器工作过程如下:将差错项 (n)ε 平方,每隔5ms将相应40个样值累加一次。然后,在不同的码字和参数下将差错项平方的累加和最小化。先将长期滤波器作为唯一激励进行最小化,然后依次转到图2.10中的参数码字集I和码字集H。参数和码字差错项平方的累加和最小化值,经基站和移动台之间的空中接口传输至图2.10所示的接收译码器。需要强调的是,通过空中接口传输到译码器的,不是压缩的信号样值或差值,而是自适应变化的CELP参数。图2.10(b)所示的译码器,同图2.9(b)中CELP系统的译码器一样,再生得到2.10(a)所示的编码器语音。参数和码字每隔20ms传输一次。IS-136系统的每40ms帧有两个时隙,每个时隙载有260个数据比特,用于提供全速率语音传输。每20 ms传输VSELP参数,每个IS-136帧就提供两次编译码器自适应处理。159bit的参数,每20ms发送一次,相当于7.95kb/s语音速率。
下面分析为什么经信道编码得到语音编码速率为13kb/s,而不是7.95kb/s。含不同参数和码字的159bit的内容如下:
(1)3个增益β,γ1和γ2,每5ms子间隔共8bit,20ms计32bit;
(2)每5ms子间隔的7bit H码字,和每5ms子间隔的7bit I码字,20ms共56bit;
(3)每5ms子间隔的7bit传输参数L,20ms总共28bit;
(4)每20ms共38bit用于表示10个滤波器参数;
(5)最后,每20ms帧的5bit能量参数。
总计以上5项,每20ms共159bit。
这159bit在传输之前必须保护,避免因恶劣无线环境可能导致信道差错。用前向差错控制,具体方法是:某些信息使用循环冗余校验(Cyclic Redundancy Check,CRC)和卷积编码相结合的方法。与其余未编码保护的控制比特一起,将159bit原始参数转变为260bit数据,每20ms传输一次。然后,这260bit数据在40ms的IS-136帧两个时隙中交织。
图2.11给出了IS-136语音编码的差错控制过程。159bit被分成两组,第1组77bit,第2组82 bit。第1组实现差错保护。没有保护的码字参数比特在第2组发送。L参数在第1组发送,其他参数作为混合组比特发送。第1组77bit中有12bit作为最重要的比特。这12bit选自能量参数和10个滤波器参数中的5个,且这12bit首先通过7bit的CRC处理。经过CRC编码后的序列和第1组比特传送至码率为1/2的卷积码编码器,加上卷积编码的5个尾比特,组成89bit卷积码的输入信息。卷积码编码器生成的178bit加上第2组82个未保护比特,构成20ms帧的260bit输出序列。这260bit在两个时隙中还需要交织处理,以实现进一步保护。
3.IS-95系统的语音信号数字化过程
除只用一个码字集外,IS-95采用的语音压缩技术与IS-136中的语音压缩技术类似。IS-95采用图2.9所示的CELP型技术,采样间隔125 µs。这种情况下,每个样值至少量化编码为14bit,然后与LPC型滤波器的输出进行比较。这里滤波器的输入是一个从差错码字集中选择的随机矢量。每20ms进行一次最小均方误差判决,同IS-136一样,经最小均方处理的CELP系统参数传输至接收端译码器,如图2.9所示。
IS-95可以有多种语音比特率,这里只介绍全速率的情形。全速率IS-95系统反向和前向业务信道每20 ms帧172 bit。正是这些CELP参数的输入比特经信道编码和调制以后,通过空中接口传输至译码器。循环冗余校验码检错、卷积编码和分组交织等提供了类同IS-136系统的语音保护功能,如图2.11所示。
更准确地说,每20ms帧172bit的CELP译码器输出,用于IS-95语音比特速率8.55kb/s(而不是172bits/20ms=8.6kb/s)。IS-95全速率业务信道可用于传输用户业务和信令。由于需要用1bit表示该信息是信令还是用户业务信息,每20ms帧实际发送业务信息171bit。这171比特分布在CELP的不同参数中,如同IS-136的VSELP译码器的情况。171bit的组成如下:
(1)IS-95的CELP译码器使用单极点长期滤波器。它的音调参数L同IS-136一样,每5ms更新一次,每次更新后传输7bit,每帧28bit。
(2)每5ms子间隔的3bit用于传输长期滤波器的增益系数。
(3)每帧传输40bit的短期滤波器系数。
(4)分别用7bit和3bit表示每次更新的参数激励码字和增益G,每帧更新8次,即每帧80bit。每帧需要传输的CELP参数共160bit。
(5)为了进一步控制差错,每帧需11个奇偶校验比特附加在160bit后面。
4.GSM系统的语音信号数字化过程
在第二代数字蜂窝系统GSM中,语音压缩采用规则脉冲激励的线性预测编码(LPC-RPE)。同前面分析的两种压缩过程一样,LPC是该技术的基础。GSM中的信源编码遵循图2.8所示的基本LPC形式。GSM技术和上述两种基于CELP技术蜂窝系统的差别在于激励发生器的选择。GSM采用幅度可变的规则脉冲,提供滤波器激励,而非其他系统所采用的CELP随机码字的方法。选择这些脉冲的幅度使得均方误差最小,如图2.8(a)所示。GSM系统提供稍低的压缩效率,性能优于其他两种方法,体现在:每20ms间隔260bit由语音编码器产生,实现13kb/s语音速率。
LPC-RPE所用的长期预测滤波器是单极点类型。其过程为:① 通过最小均方误差估计,每隔5 ms确定一次时延和增益参数。7 bit和2 bit分别用于表示时延和增益参数。260 bit中36 bit的时延和增益参数每20 ms组合一次。② 对短期滤波器8个系数的估计,每20 ms占据另外36bit。③ 20ms帧余下的188bit中,每5ms含47bit,表示该间隔适当的激励信号的参数。
LPC-RPE语音编码后的差错保护如图2.12所示。与前面所述的IS-136系统的情况一样,将每20 ms的260 bit语音编码器输出分成两组。其中,182 bit的重要信息为第1组,78 bit的非重要信息为第2组。差错保护用于重要比特。同IS-136系统一样,第1组进一步被分成两组:182bit中的50bit通过3个奇偶校验比特实现保护,检测但不纠正错误,然后,这53bit、余下的132bit和4个尾比特经码率为1/2的卷积码编码器编码,卷积编码器的输出为378bit。差错保护后再交织。
图2.12 LPC-RPE语音编码后的差错保护
卷积码编码器输出端的378bit加上未保护的78bit构成20ms帧的456bit,提供速率为22.8kb/s(=456bit/20ms)的语音通信。这正是GSM系统采用的语音通信比特速率。经交织提供进一步的信号保护后进行调制与传输。