人工智能“三兄弟”:算量、算法、算力
算量(数据)、算法、算力是人工智能发展的三大要素。但到底什么是算量(数据)、算法、算力呢?
算量(数据)
我们每个人都生活在数据世界里。例如,5分钟前你收到了某APP的推荐消息,也许你下意识地点击进去,仔细浏览了相关介绍,也许进一步点击了购买链接,正犹豫不决是否要下单……殊不知,你的打开消息、点击链接、页面停留(犹豫不决)等都形成了在线的行为数据,而且商家正在收集你的这些数据,以决定下一步是否要继续向你推荐同类商品。
此时此刻,也许不只是你一个人,很多人都和你一样在打开、点击、犹豫不决,或者已有人正在下单……如此种种也都在形成数据,这些数据会影响商家下一步的产品设计和营销策略。
无独有偶,也许你正通过输入关键词搜索一款感兴趣的商品,网页上立即出现了各种不同款式的商品,你选择了最中意的产品并购买,接下来的交易支付、物流配送、到货通知、验货取货、满意度评星等环节也都在产生着记录,形成对商家很有价值的数据。商家利用这些数据可以改善产品服务、加强经营管理、制定新的市场策略……
由此可见,我们在互联网上的任何行为动作均可形成数据,商品交易也可形成数据。不只如此,大街上的摄像头、下水管道的传感器、河道水质检测器、大楼烟雾报警器采集产生的信息,银行交易流水、手机通话记录、微信聊天,以及基于互联网的各种媒体每天的新闻报道等,都在不断地产生数据。
那么,到底该如何定义数据呢?
我们身边充斥着各种信息,但信息只有被记录下来,才能称之为数据。因此,凡是那些能被记录下来——尤其是能以电子化的方式记录下来的信息,均可称为数据。
数据并非近些年才有,而是从古至今一直都存在,人类从很早以前就有记录数据的习惯。例如,用壁画记录数据,放羊的时候,在墙壁上画几头羊,回来时要对照有没有丢;再比如打绳计数法,每打一个结代表一个或一次等。
如今,我们已身处大数据时代。其实,大数据的本质依旧是数据,只是运用了大数据的思维和方法对数据进行使用。大数据中的数据(data)种类繁多,错综复杂,本身没有用,经过一定的处理后才能派上用场。这些数据携带很多信息,经过一定的梳理和清洗后可形成有用的信息(information);这些信息中包含着许多规律,可以借助智能算法进行挖掘,提炼成知识(knowledge);而知识可以应用于问题解决和决策支持等实践,这便产生了智慧(intelligence)。
算法
还是同样的例子,当你看到手机弹出一个关于手办玩具的广告推荐信息,你点击进去并进行购买,这时后台会帮你做好标签:点击进去,证明你不讨厌该类广告,下次还能给你继续推荐;你购买了,证明你不仅不讨厌,甚至还喜欢这类产品,以后跟这个相关联的产品也都可以推荐给你,促进销量。而你看到了运动鞋,非但没有点击进去,相反还滑走不看了,那么后台会给你做一个标签“不感兴趣”,以后不再推荐给你……
诸如此类,这种采集数据(各种动作,如点击与否/购买与否)→提取特征(做好标签)→形成决策(是否继续推送/下次推送什么产品)的“输入数据、产生决策结果”的链条,就是算法在起作用。
那么,到底该如何定义算法呢?
算法是对解决方案的准确而完整的描述,是一系列解决问题的清晰指令,代表着用系统的方法描述解决问题的策略机制。也就是说,算法对于具有一定规范的输入,能够在有限的时间内给出所要求的输出。
很早以前,算法已经存在。算法的雏形是规律,例如4000多年前,中国的大禹曾在治理洪水的过程中发现了勾股术,并且使用勾股术成功测量了两地的地势差。
除此之外,还有很多例子证明了算法从古至今都存在。比如“算法”这个单词最早出现在公元825年(相当于我国的唐代)波斯数学家阿尔·花剌子密(Al-Khwarizmi)所写的《印度数字算术》中。
如今,算法不再局限于数学领域的应用,而是升级为解决多领域复杂问题、提供多行业应用方案的有力助手,成为人工智能时代的关键要素。算法无论在政务领域还是在商业领域都有着极大的应用,可以应用到智慧政务、公安防诈、无人驾驶、内容推荐、人脸识别、货品陈列等多个行业领域。换句话说,我们早已生活在算法的世界里。
一个好的算法设计,除了需要解决问题之外,通常还要尽力达到“双低”:一是计算工作量小,速度越快越好;二是所需内存空间小,占地越小越好。而关于计算速度、计算量则与接下来要讲的算力相关。
算力
大数据时代,数据是一种资源。因此,产生了数据,就需要存储或调取这些数据;而要应用算法解决问题或辅助决策,则需要计算这些数据。存储、调取和计算对应的数据资源,离不开算力的支撑。
小到手机,大到超级计算机,人工智能每完成一次信息推送、人脸识别或音译转换等,都需要硬件芯片的算力支持。
“算力”听起来比较抽象,但我们平时用手机时都深有体会。我们会发现,有些手机装很多应用都不卡,玩大型游戏也不卡,有些则不然。这是因为不同的手机有着不同的配置、CPU、显卡及内存,因此有着不同的计算和运行能力。
通俗来说,算力就是计算能力,算力的大小代表着对数字化信息处理能力的强弱。
如今,我国正在大力构建算力网络,以提升数据资源效用。2022年2月,国家发改委等部门印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏建设国家算力枢纽节点,并规划了10个国家数据中心集群,全面启动“东数西算”工程。
来自国际数据公司IDC发布的《数字化世界——从边缘到核心》以及《IDC:2025年中国将拥有全球最大的数据圈》白皮书指出,预计到2025年,中国将成为全球最大的数据圈,数据量增至48.6ZB,占全球数据圈数据总量的27.8%,同时非结构化数据将占据数据总量的80%~90%。
未来,各行各业对算力的需求只会越来越大。
算量(数据)、算法、算力“三兄弟”
算量(数据)、算法、算力之间的关系,就像“厨师炒菜”,数据相当于“食材”,算力相当于“厨房”,算法就相当于厨艺大师的“手艺”。
即使是同样的食材和同一个厨房,不同厨师做出来的菜肴,其味道也会有很大差异。因此,算法在人工智能领域相当于核心的工艺技术,需要大力推进其产业化,进行技术创新。
人工智能“三兄弟”不可或缺,正因为算量(数据)、算法、算力为人工智能发展奠定了雄厚的基础,整个社会才能够向着数字化、智能化、信息化的方向快速迈进。
【拓展阅读】
八卦一下算法的“前世”
很久很久以前,在公元前1世纪,《周髀算经》就作为中国最古老的天文学和数学著作之一,在算法历史上留下了浓墨重彩的一笔。作为“算经十书”之一,这部巨著采用当时朴实的“大白话”来确定天文历法,揭示了日月星辰、四季更替、气候变化的运行规律,为百姓的作息提供了强有力的依据。
自唐代起,与算法论述有关的书如雨后春笋般涌现,比如唐代的《算法》、宋代的《杨辉算法》、元代的《丁巨算法》、明代的《算法统宗》、清代的《开平算法》等。这些书籍都涉及古人对算法的探索,彰显着我们的老祖宗在算术方面的高瞻远瞩。
在现代的数学认知中,欧几里得算法被西方人公认为是史上第一个成型的算法。
经过几个世纪的发展,到公元825年,波斯数学家阿尔·花剌子密站在欧几里得这位巨人的肩膀上,第一次在数学上提出了“算法”这一概念——演算法(Algorithm),随后传到了欧洲。事实上,“Algorithm”这个词,直译便是“花剌子密的运算法则”,可见其为西方算法打下了怎样坚实的江山。
到了近代,在19世纪80年代,“软件之母”阿达·拜伦(Ada Byron)为巴贝奇分析机编写了人类史上的第一个算法程序——求解伯努利方程的程序。阿达关于算法的研究实现了计算机科学的本质性飞跃,以现在的观点来看,阿达首先为计算制作了“算法”,然后制作了“程序设计流程图”,这个珍贵的计划被认为是“第一套计算机程序”。