大数据智能核心技术入门:从大数据到人工智能
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3 何谓大数据智能

图灵的智能之问

大数据如何通过智能算法学习和预测产生价值,大数据如何智能化处理?或者说机器如何智能?系统如何智能?这可谓仁者见仁,智者见智,从早期的符号派智能到专家系统,从数据挖掘到商业智能,再从机器学习到深度学习,这个过程曲折而有趣。我们先来看看艾伦·图灵是如何探讨智能这一问题的,作为计算机科学和人工智能领域的先驱,图灵在1950年发表的著名论文Computing Machinery and IntelligenceMachinery C. Computing machinery and intelligence-AM Turing[J]. Mind, 1950, 59(236): 433.,详细讨论了机器能否拥有智能这一问题,但这也只是个开放性的讨论,其实图灵也未能定义什么是智能,但其提出了著名的“图灵测试”图灵测试:图灵采用“问”与“答”的模式,即观察者与两个测试对象(测试对象和观察者隔开)进行通话,其中一个是人,另一个是机器。要求观察者在不看测试对象外形的情况下,不断提出各种问题,从而辨别回答者是人还是机器。当人不能区分回答是机器行为还是人的行为时,就说明做出回答的机器是智能的。(见图1-3)。直到1956年的达特茅斯(Dartmouth)学术会议,人工智能(Artificial Intelligence, AI)这一学科概念才被正式提出,其参考定义为:“研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。”罗素,诺维格,殷建平.人工智能:一种现代的方法.北京:清华大学出版社,2013.人工智能研究通过了解人类智能的实质,并研发出一种新的能以人类智能相似的方式做出反应的智能机器。真正的人工智能应该还可以对人的意识、思维的信息过程进行模拟,这将涉及意识、自我、思维、心理、记忆等问题,但由于人类对大脑神经科学和上述问题还知之甚少,所以人工智能的发展比预想的要慢得多。

图1-3 图灵测试示意图

一般来讲,智能是知识与智力的总和,符号派AI研究人员认为知识是智能行为的基础,智力是获取知识、运用知识的能力,它来自人脑的思维活动,同时,对外界事物的感知和认知能力,也是智能的重要基础及组成部分,智能还涉及意识、心理和记忆等复杂问题。概括来讲,智能至少包括三个方面的能力:理解、分析和解决问题的能力;归纳、演绎推理能力;自适应生存和发展能力。机器和系统要智能,至少具备初步的自动控制、分析推断和自适应学习能力,AI发展了60多年,上述真正意义上的智能,可以说直到现在都还没有诞生。值得一提的是,迄今为止,我们对人类智能本身都还知之甚少,图灵当时做了个比较乐观的预测,他预测在2000年左右,机器极有可能会通过“图灵测试”,拥有初步的智能行为,现在看来这一时间延后了,从当前语言学习、自然语言处理和神经科学的技术发展现状、问题来看,要解答图灵的智能之问,还需要AI研究人员继续付出艰辛的努力。

大数据如何助力人工智能

虽说大数据和人工智能没有必然联系,但从近几年深度学习的发展趋势来看,基于大数据的深度学习为弱人工智能(相对于强人工智能)弱AI(Artificial Narrow Intelligence, ANI):1980 年UC Berkeley哲学教授John Searle提出弱人工智能以及强人工智能的分类,弱人工智能是处理特定问题,机器只能模拟我们的行为表现,而不是真的懂得思考,可看成是人类的工具。强人工智能(Artificial General Intelligence, AGI)则认为机器具有与人相同,甚至超越人类程度的思考、感知、智慧等能力。当前AI的主要研究和应用集中在弱人工智能方面,比如AlphaGo只能下围棋而不能做其他工作,这种机器看起来像是智能的,但其内核没有类人的推理能力和自主意识。能否能实现强AI,是否有必要发展强AI,还有争议。的普及应用提供了关键技术支撑和成功应用范例。从某种程度上讲,没有大数据的“喂养”,就没有深度学习的成功,当前人工智能领域实现的阶段性突破,都跟大数据驱动的深度学习有莫大关系。比如AlphaGoAlphaGo:直译为阿尔法围棋,亦被音译为阿尔法狗、阿法狗、阿发狗等,是于2014年开始由英国伦敦DeepMind公司(后被Google收购)开发的人工智能围棋程序,并于2016年在与李世乭的人机大战中以4∶1获胜。、自动驾驶、图像识别、语言识别等各领域的重大进展,都有深度学习的影子。

从人类社会发展的四个典型时代来看(见图1-4),从农业时代到工业时代,通过机械动力的优化,放大了我们的体力,让我们得以改造物理世界;从工业时代到信息时代,通过信息化和网络化等数字优化,放大了我们的时空感知能力;从信息时代到智能时代,将通过大数据和智能算法的优化,放大我们的脑力,从而改造提升我们的智能化管理和决策水平,强化我们理解问题的洞察能力。

图1-4 人类社会发展的四个典型时代

设想,在未来的智能时代,如果你是一名警察,只需要手握连接安全云(全国公安大数据智能决策中心)的智能终端,那么摄像头照到的任何事物,包括人脸、车牌、身份证等,不仅能追溯到当事人的历史信息(比如有无前科、犯罪记录、家庭环境等,这些现在就可以做到),而且能预知当事人的行为趋势,有多大概率会违法、犯法(就像电影《少数派报告》《少数派报告》:2002年的一部科幻电影,讲的是人类研发出了能提前侦察人脑电波的“先知”,来知晓某个人的犯罪倾向,从而提前进行预防。一样,当然这种机器学习预测行为会触及人类社会更深层的隐私问题);如果你是一位农民,用你的智能手机,照照田间地头,就能了解到这个农作物长的什么虫,该用什么药,还能知道基于当前情况,农作物生病会持续多长时间,会减产多少,就像京东的“猪脸识别应用竞赛”,不只是一般的信息化养猪,而是希望能实现个性化、定制化养猪;如果你是一名医生,通过医疗智能终端,则不仅能了解到体检者当前的各项健康指标,而且能预测体检者的某些大病概率;上述种种,都是大数据智能技术的典型应用场景,对于未来的大数据智能,上述场景的实现时间不会太遥远。所以,近几年来,领先的IT公司(如Google、Facebook、苹果、微软、亚马逊、华为、阿里、百度等)无不在大数据智能领域投下了重注,不管是技术、人才,还是资金,都堪称大手笔。

为什么领先的IT公司对大数据驱动的智能技术如此关注?各行各业都对大数据和人工智能寄予厚望?这都有赖于机器学习,特别是深度学习这些年的突破性发展(当然也有炒作的因素,后续章节我们会详细探讨),深度学习作为人工智能新兴的关键技术,被AI研究和应用人员寄予厚望。从技术角度看,一方面是物联网、移动互联网的大数据采集,以及基于云的大数据存储计算、大数据的分布式集群化管理;另一方面是专家系统、数据挖掘和人工智能、深度学习技术的高速发展。两大智能关键技术方向在加速汇聚。

大数据智能的深度融合之路

如果大数据智能是一个人,那么眼耳鼻舌身意和神经感知就是物联网,环境感知的一切信息就是大数据,获取知识和记忆的无限大脑存储就是云计算,而人工智能负责经验的积累、学习和智慧决策。大数据智能技术的应用是指基于大数据和人工智能分析引擎,通过基于云计算的大规模机器学习、深度学习或强化学习等关键技术,对海量数据进行智能处理、挖掘和分析预测,帮助我们深度洞察数据中所包含的价值信息和关键知识,或通过建立自动、闭环、迭代的智能学习系统寻求相关问题的最佳解决方案,从而提升我们的认知、管理和决策能力。换句话说,大数据智能的成功普及将是传统信息化的终点,信息化走向智能化之后,整个高科技助力的相关产业链(包括传统产业的升级)都会产生质的变化(见图1-5)。

图1-5 从大数据到大数据智能的融合式发展

总之,大数据智能是大数据与人工智能的深度融合,而这种融合趋势是不可避免的,怎么更快速、更明智地进行智能分析和辅助决策是关键,而智慧决策的自动化和自学习化是大数据智能系统发展的必然,也是下一个待突破的AI堡垒。这种融合将加速各领域的技术创新和智能应用的爆发,比如加快药物研发进程、精准诊断疾病、安全自动驾驶、保障公共安全,以及许多尚未发明的重大创新应用。后大数据时代,我们需要大数据智能。