前言
随着信息技术的发展和应用,人类社会所产生的数字信息不断加速并呈现爆炸式增长。作为信息载体的大数据的重要性不断凸显,已成为网络空间中重要的战略性资源。各类数据驱动的应用在金融、交通、能源、电信等国民经济重要行业、重大基础设施运行中发挥了重要作用,标志着人类社会正步入智能化时代。正因为大数据的价值举足轻重,所以在加快推动数据资源开放共享和应用开发的同时,必须构筑大数据安全保障体系,保护公民的隐私权和国家的大数据安全。如何应对大数据时代的数据安全与隐私保护问题,已成为当前的研究热点。
本书系统地介绍了大数据安全与隐私保护的相关概念、定义和技术,阐述了二者之间的联系和区别。本书具有以下特点:
(1)系统性强。本书构建了大数据安全与隐私保护技术框架,针对大数据环境系统梳理了散见于各种文献中的有关理论与方法,将其归纳为安全存储与访问控制技术、安全检索技术、安全处理(也称安全计算)技术和隐私保护技术四大类,有助于读者建立对大数据安全与隐私保护的宏观认识,适合专业人员快速学习和系统掌握相关基础知识。
(2)内容全面。本书内容不仅涵盖了大数据安全保护的各项关键技术,如安全存储与访问控制技术、安全检索技术以及同态加密、可验证计算等安全处理技术,还涵盖了用户数据隐私保护技术,如与社交网络大数据、位置轨迹大数据、差分隐私等相关的新型攻击与保护技术。
(3)易于理解。对于重点介绍的安全存储与访问控制技术、安全检索技术、安全处理技术和隐私保护技术,本书从技术核心贡献、领域发展综述和最新研究进展等不同角度进行阐述,深入浅出,便于读者深入理解。
本书共5章。第1章介绍大数据的基本概念和随之带来的新型安全挑战,以及新的安全技术框架。第2章介绍大数据安全存储与访问控制技术,包括传统的访问控制技术及其发展,以及大数据时代访问控制技术面临的授权管理难度大、访问控制策略难以适用的新问题和解决方案。第3章和第4章针对大数据环境分别介绍数据的安全检索和安全处理技术,包括密文检索、同态加密、可验证计算、安全多方计算、函数加密和外包计算等技术。第5章介绍大数据场景下的隐私保护技术,包括攻击者针对用户身份隐私、社交关系隐私、属性隐私、轨迹隐私等进行的各类攻击和典型保护方法,以及目前引发高度关注的本地差分隐私保护技术。
本书由冯登国研究员规划和统稿。第1章由冯登国研究员执笔,第2章由李昊副研究员执笔,第3章由洪澄副研究员、迟佳琳博士和张敏研究员执笔,第4章由冯登国研究员执笔,第5章由付艳艳博士和张敏研究员执笔。
随着理论和技术的不断发展,社会和研究人员对数据安全和隐私保护的认识也在不断变化。在这种背景下,相关的研究和应用的边界也在飞速扩展,想要在一本书中覆盖大数据安全与隐私保护的整个研究领域的疆界也越来越困难。因此,本书难免存在不足之处,敬请读者多提宝贵意见。
本书得到了国家自然科学基金项目(U1636216)的支持,得到了大数据安全与隐私保护讨论班的老师和同学们的帮助,也得到了清华大学出版社的大力支持,作者在此一并表示衷心的感谢。
冯登国
2018年春节于北京