WebRTC音视频实时互动技术:原理、实战与源码分析
上QQ阅读APP看书,第一时间看更新

序言

2021年1月29日,WebRTC正式成为W3C和IETF标准。自2011年Google宣布WebRTC开源,已经十年了。记得2011年10月,我约了当时还在VisualOn的刘华平和华平科技的刘睿在上海讨论基于WebRTC创业计划。

WebRTC的前身是GIPS(Global IP Solutions)。GIPS最早全名叫作Global IP Sound,是和Sprit DSP一样的终端语音通信解决方案。很多运营商都使用了GIPS或Sprit DSP的方案做3G的底层通话SDK。GIPS的突出特点是包括编解码、回声消除、降噪等3A算法。GIPS团队中也不乏大师,比如Ken Vos、Bastiaan Kleijn。Ken Vos(也是后来发明SILK的科学家)的iLBC和iSAC编码器(2000年后唯一基于FFT的语音编码器)都开创了编解码考虑网络丢包影响的先河。发明回声消除动态延时估计算法的Bastiaan Kleijn大师的论文一直被后来的工程师膜拜,它从根本上解决了延时估计的问题。GIPS后期开始做视频通信SDK方案,所以也把全名由Global IP Sound改成了Global IP Solutions。但星光闪耀的GIPS在商业上不算成功,最后在2011年以不到7000万美元的价格卖给了Google。而同年5月,微软收购同样技术领先的Skype时花费了85亿美元。

如果把端到端通信互动技术分解一下,会发现其中有几个技术难点:客户端技术、服务器技术、全球设备网络适配技术和通信互动质量监控与展示技术。在被收购时,GIPS更像一个完整的客户端解决方案。所以后期Google的开发者在里面增加了P2P通信技术和一些简单的互联互通协议,以及基于Web展示的质量监控,使整个方案逐渐完整起来。

李超先生拥有十多年的实时音视频研发经验,曾带领团队研发过多个直播平台,先后任职沪江网高级架构师、新东方音视频技术专家。这本书从代码出发,详细介绍了如何使用WebRTC搭建一对一通信服务,并对内部的协议、拥塞控制技术和交互逻辑也做了详细的剖析,是一本难得的WebRTC开发书籍。

十年弹指一挥间,一本书囊括了李超先生多年的经验总结。很荣幸能为李超先生的作品作序。

声网Agora技术VP & 合伙人,高泽华

2021年3月29日