
前言
信息技术的快速发展、新业态和个性化服务的不断演进,促使大型互联网公司在服务用户过程中积累了海量用户数据,其中包含有大量的隐私信息。隐私信息是指个人敏感信息,包括指纹、掌纹、虹膜、身份证号码、电话号码、住址、住房类型、居住时间、过敏信息、疾病和药品使用状况、犯罪信息、出行地、出行时间、监控录像、财务状况、交通工具、车辆识别码、信用记录、购买记录、品牌爱好、社交账号等。当前用户数据的频繁跨境、跨系统、跨生态圈交互已成为常态,加大了隐私信息在不同信息系统中有意或无意留存,但随之而来的隐私信息保护短板效应、隐私侵权追踪溯源难等问题越来越严重,给国家行政主管部门的测评与监管、个人信息流转管控,以及隐私信息保护等相关工作带来巨大挑战。
现有隐私保护技术大都聚焦于相对孤立的应用场景和技术点,解决特定应用场景中存在的具体问题,缺乏能够将隐私信息与保护需求一体化的描述方法及计算模型,并缺乏能实现跨系统隐私信息交换、多业务需求隐私信息共享、动态去隐私化等复杂应用场景下的按需隐私保护计算架构,无法满足复杂信息系统的隐私保护需求,导致电子商务、社交网络等典型应用场景下的隐私保护问题尚未得到根本性解决。
为此,2015年,李凤华研究员、李晖教授、贾焰教授、俞能海教授、翁健教授等在国内外首次提出了隐私计算理论与关键技术体系,并于2016年在《通信学报》期刊正式发表。隐私计算是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄露代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。具体是指在处理视频、音频、图像、图形、文字、数值、泛在网络行为信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,支持多系统融合的隐私信息保护。隐私计算涵盖了信息搜集者、发布者和使用者在信息产生、感知、发布、传播、存储、处理、使用、销毁等全生命周期过程的所有计算操作,并包含支持海量用户、高并发、高效能隐私保护的系统设计理论与架构。隐私计算是泛在网络空间隐私信息保护的重要理论基础。
本书针对泛在互联环境下的体系化隐私保护需求,基于作者在该领域多年深耕所积累的系列论文和专利,高度凝练并系统介绍了隐私计算理论及其关键技术,主要内容包括隐私计算框架、隐私计算形式化定义、隐私计算的重要特性、算法设计准则、隐私保护效果评估、隐私计算语言等内容,并展望了隐私计算的未来研究方向和待解决问题。结集出版本书是为了促进隐私计算被广泛研究与完善之举措,我们期待能指引泛在互联环境下的隐私保护、隐私侵权取证与溯源等方面的基础理论研究,并指导隐私保护相关的关键技术攻关、信息系统开发等工作。
全书共5章,主要内容如下。
第1章为绪论,阐述了用户数据、个人信息与隐私信息的定义、隐私防护与隐私脱敏技术的概念与区别、隐私保护的“四权”,并指出了隐私保护面临的技术挑战。
第2章阐述了隐私保护相关技术的发展现状,包括隐私防护技术、隐私脱敏技术、隐私保护对抗分析,以及隐私计算发展现状。
第3章详细阐述了隐私计算的理论体系,包括隐私计算定义、隐私计算关键技术环节与计算框架、隐私计算的重要特性、隐私智能感知与动态度量、隐私保护算法设计准则、隐私保护效果评估、隐私计算语言、隐私侵权行为判定与追踪溯源、隐私信息系统架构等内容。
第4章从概率论、信息论与隐私计算的关系角度阐述了隐私保护算法的基础理论,然后介绍了典型的隐私保护算法,包括基于匿名的隐私保护算法、基于差分的隐私保护算法和基于隐私-可用性函数的隐私保护算法,并结合图片共享场景介绍了隐私信息传播控制、跨系统交换的隐私信息延伸控制等内容。
第5章具体从隐私计算的基础理论、隐私感知与动态度量、隐私保护算法、隐私保护效果评估、隐私侵权行为判定与溯源等方面展望了隐私计算的未来发展趋势。
本书主要由李凤华研究员、李晖教授、牛犇副研究员完成,是作者多年来在隐私计算方面研究成果的高度凝练。第1章主要由李凤华、李晖等完成,第2章主要由牛犇、朱辉、李晖等完成,第3章主要由李凤华、李晖、牛犇等完成,第4章主要由李晖、牛犇、李凤华、朱辉等完成,第5章主要由李凤华、李晖、牛犇等完成。本书还包含了所涉论文、专利合作者的贡献,在编写过程中还得到孙哲、何媛媛、王新宇等博士,张文静、王瀚仪、尹沛捷、李效光、罗海洋、陈亚虹等博士生,杨志东、贺坤等硕士,毕文卿、张立坤等硕士生的协助,在此表示衷心感谢!感谢人民邮电出版社的大力支持,感谢为本书出版付出辛勤工作的所有相关人员!
本书的出版得到国家重点研发计划(No.2017YFB0802200)、国家自然科学基金(No.61932015、No.61872441、No.61672515、No.61502489、No.U1401251)、中国科学院青年创新促进会人才资助项目(No.2018196)的支持和资助。
本书仅代表作者对隐私信息全生命周期保护——隐私计算的理论与技术的观点。由于作者水平有限,书中难免有不妥之处,敬请各位读者赐教与指正!
李凤华
中国·北京
2021年2月