专业伦理与职业素养:计算机、大数据与人工智能
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4.1 图灵测试

1950年,在计算机发明后不久,图灵提出了一套检测机器智能的测试,也就是后来广为人知的图灵测试。在测试中,测试者分别与计算机和人类各交谈五分钟,随后判断哪个是计算机,哪个是人类。当时图灵认为,到2000年,测试者答案的正确率可能只有70%。每一年,所有参加测试的程序中最接近人类的那一个将被授予由图灵创办的勒布纳人工智能奖。

到目前为止,还没有出现任何程序能够如图灵预测的那样出色,但它们的表现确实越来越好了,就像象棋程序能够击败象棋大师一样,也许计算机最终一定可以像人类一般流畅交谈。当那天来临的时候,会话能力显然就不能再代表智力了。

数十年来,研究人员一直使用图灵测试来评估机器仿人思考的能力。如今,研究者认为应该更新换代,开发出新的评判标准,以驱动人工智能研究在现代化的方向上更进一步。新的图灵测试会包括更加复杂的挑战,例如,由加拿大多伦多大学的计算机科学家赫克托·莱维斯克所建议的“威诺格拉德模式挑战”。这个挑战要求人工智能回答关于语句理解的一些常识性问题。例如,这个纪念品无法装在棕色手提箱内,因为它太大了。问:什么太大了?回答0表示纪念品,回答1表示手提箱。

也有学者建议在图灵测试中增加对复杂资料的理解,包括视频、文本、照片和播客。例如,一个计算机程序可能会被要求“观看”一个电视节目或者视频,然后根据内容来回答问题,像“为什么电视剧《天龙八部》中,契丹人萧远山的儿子叫乔峰?”