反馈:化解不确定性的数字认知论
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

前言

反馈是什么

在2019年,曾经有朋友和我讨论,传统搜索引擎的地位会被采用相近模式的新竞争者取代吗?我告诉他,概率不大。互联网超级应用的核心优势在于海量的用户反馈数据。在搜索引擎里,有亿万用户正在通过搜索与内容产生互动,这些反馈数据和其他信号一起对内容质量和相关性进行排序。更重要的是,反馈数据的规模已经形成不断自我强化的正反馈效应,即用户搜索和点击越多,搜索引擎就越能准确地对内容进行排序,从而促使更多用户使用。如果不能用新一代的规则建立新的正反馈效应,产品很难在存量市场里实现“翻盘”,就像很多“搜索市场争夺战”在成熟的PC(个人计算机)搜索市场打响却并未改变竞争格局,而短视频、社交等其他赛道的应用产品内的搜索则很难使用户对其形成第一认知,并以此促进用户规模和反馈规模的正反馈循环。不仅搜索引擎如此,推荐引擎等互联网分发产品背后的运行逻辑也是如此,即大规模的用户在以海量、实时的浏览行为对内容、商品和服务的质量做出反馈。

互联网的变革,本质上是大规模用户行为的实时数字化反馈。普通数据价值有限,反馈数据才更有价值,用户的应用反馈是基于某种假设的反馈,其中包含需求的表达、质量的评估等关于世界如何运转的规律。但是,这需要算法的自学习能力、符合高价值数据分布和算法自学习机制的产品架构,才能充分释放海量反馈数据的潜在知识价值。

这一代AI技术也是基于反馈机制创新实现了突破。对于样本数据中隐藏的规律,算法会有一个初始预测假设。然后,复杂的高维计算会被简化为梯度反馈问题来优化求解。我们也可以简单理解为,预测值与真实值的偏差度量会被反馈给模型,进而向偏差最小的方向自动调整模型参数,并不断重复这个假设和反馈的循环以达到持续学习的效果。就像在练字的过程中,我们要从字帖与自己书写的字之间的偏差中找到改进方向。智能在并不追求细节完全精确的海量数据反馈下涌现,结合强大算力,神经网络计算模式在反馈机制创新的作用下,将具备越来越强大的自学习能力。

DeepMind(一家AI研究公司)首席研究科学家、伦敦大学学院教授大卫·席尔瓦及其合作者在一篇题为“Reward is enough”(奖励反馈)的论文里提到,人工智能及其相关能力不是通过设置和解决复杂问题产生的,而是通过坚持一个简单而强大的原则——奖励最大化产生的,这本质上也是一种反馈机制。

不仅是在互联网和AI领域,反馈还有更广义的存在价值和内涵。反馈是有假设检验能力的信息,能够基于此发挥推动假设演变的交互作用。而假设是我们在深入认识这个世界的动态过程中不断更新的认知和状态,假设也是世界自身向前演化的基础方式和起点。对于观察者的认知过程,假设就是A/B测试里面的题目,反馈就是结果。对于被观察者的演变过程,例如人们基于生物的基因变异会提出新假设,而自然选择就是反馈。观察者的认知和被观察者的演化,其实是同一个过程的两个视角。

“一切只能证伪不能证明。”波普尔说,一切真理换个角度看都是等待证伪检验的假设。反馈则是一种测量,是一种分类,是化解复杂性的根本方式。我们通过反馈对假设的检验来收敛相对分散的假设,并使我们有足够的信心将这些假设付诸实践。这个过程就是从假设与反馈的偏差中找到打开新世界的线索。只有在我们把脚伸进水里的那一刻,皮肤感受到的刺激才能告诉自己这里的水温适不适合游泳,我们的感受就是反馈。就像歌词里写的“不去开始就永远不知道”,就是这个再简单不过的检验方式所包含的信息,在驱动认知与万物演化。

我们将要讨论的反馈和经典控制论里的“反馈”并不完全相同,本文中的反馈是基于主动、有倾向性的假设,是对假设的测试、应用、模拟,是对假设的检验和推动。而假设也会在反馈的驱动下,基于从假设到反馈的快速循环形成知识进化和持续升级的复利效应。例如,算法模型的预测就是一个主动假设,并非被动和随机。建立假设的能力和反馈一样重要,假设和反馈共同决定了效率。更准确的界定是“假设-反馈循环”(Hypothesis Feedback Loop,HFL)框架下的反馈。或许,我们称之为“数字认知论”会更贴切一些。在这个框架里,抽象演绎体系和实证归纳体系统一在一起,并在相互推动中被不断加速。特别是以数字化的方式抽象概括、虚拟化之后,以数学逻辑的方式基于HFL可以实现更快演化。下一步,HFL还要将数字化升级为智能化,加速万事万物运转,使整个社会的成本历史性地下降。

反馈看起来极其简单而常见,但它的内涵远不仅是维纳最早在经典的控制论中提到的,反馈是为了消除偏差、带来控制,如今更多是从偏差反馈中拟合、学习和解释世界。我们希望讨论的是,当它与具体的场景结合起来并运行于其基础层面时,呈现出的不同具体实践。

反馈为什么如此重要

反馈在一个强调学习能力的时代尤为关键。我们的世界正在不同层面上经历两个转变,一个是从由水平、规模驱动的增长转向由深度和创新驱动的增长;另一个转变是大环境正在加速复杂化。应对这些变化,需要我们提升学习效率,而学习的本质就是假设和反馈的循环,特别是在数据和智能算法革命性加速反馈效率的新技术条件下。其实,认知的突破和世界的演进都是在反馈的驱动下发生的。

复杂性和不确定性混淆的世界

复杂性和不确定性经常被混杂在一起。复杂性是计算问题,是由很多简单因素和规则的叠加、交互影响和反馈效应加速带来的。比如,“少了一颗钉子,掉了一个马掌,失去一匹战马,输掉一场战争,灭掉一个国家”的混沌现象,比如天体之间的三体现象。不确定性是世界运行规则及对其本质属性的认知问题,如量子态。我们将重点讨论可计算的复杂性,人们平时所说的“不确定性”并不是量子物理所描述的不确定性,其本质上是复杂性。为了保持表述一致,本书中也会使用“不确定性”这个词语,其内含与大众用法一致,即表达认知层面的不明确。

瑞典皇家科学院将2021年的诺贝尔物理学奖授予三位在复杂系统研究上做出突出贡献的物理学家,他们正在尝试以更多元的交叉视角来寻找对复杂系统的更好解释。今天的世界越来越呈现出复杂系统的特点,创新和复杂性就是这个不断加速中的世界所呈现出的两面性。更加违反直觉的是,这种复杂性通常都是在没有控制的情况下,由极少数简单的反馈规则演化而来;开放系统的内外部反馈使其比封闭更容易在混乱中形成自发秩序;不精确的,由自适应性反馈驱动的演进系统,也比追求精确控制性的系统更容易在快速变化中获得生存机会。无论是否准备好,我们就生存在这些新假设中。有很多我们已经习以为常却在不断失效的做法,都需要在新的假设之下被重新评估。

以简单化解复杂的反馈机制

1997年,击败国际象棋世界冠军卡斯帕罗夫的方法是基于大量人工规则的深度搜索,早期的机器翻译也是基于大量人工规则,然而这些方法后来都因为不可逆变得越来越复杂而不可持续。基于通用、简单的反馈机制和算法规则配合算力和数据的放大来解决问题被证明是可持续的,算法会不断提升通用性,强化学习就是简单反馈规则在海量重复学习中涌现智能性,ChatGPT(预训练语言大模型)代表的大规模预训练模型基于简单规则和海量数据就能涌现让人意外的语言能力。而基于人工规则的系统更适合在数据驱动的模式下做可靠的底线保障。

在进化的过程中,基因变异形成的新假设和自然选择的反馈,共同帮助生物向更强大的适应能力演化;科学家的假想和思想实验,以及实验室内外不同形式的实验和实践反馈,在推动科学发展;互联网通过海量用户行为“投票”反馈来决定排序策略的预估模型,从而实现个性化;AI算法根据反馈数据调节模型参数和网络结构,从而涌现智能;反馈信息促进了脑和思维的形成。甚至,我们身边的更多例子都在基于这个朴素的方式运行。就像我们在读过本书之后才能形成反馈,才会知道自己对它的预期是否准确,这可以帮助我们在以后做出更好的判断。

这看似是一个简单的框架,却在不同的组织团体内、在不同的生物神经系统内、在不同的具体情景下,表现为形式不同的反馈传递机制。而且,这种细小的差别会在反馈循环中被迅速叠加和放大,在不同的反馈循环之间交互影响,这造就了世界的复杂万象。反过来看,在同一类别、同一领域中,不同参与者、不同模式的差异,就有来自不同“假设和反馈”机制的作用。这也是我想在这本书里讨论的,简单的规则在反馈机制作用下演化出一切,在案例、规律、原理三个层面分别展开。切入点可以是反馈的结构、主体、关系、机制等角度,也可以是反馈数据的规模、速度等角度。

这个简单框架的复杂性还体现在,任何看似确定的假设都已经被市场充分消化,基于此的静态推演不可靠,因为参与者总是会基于此做出进一步的反馈,就像股票市场。特别是在复杂交互增加的环境中,只有持续的动态反馈机制才可以帮助我们更好地把握明确的机会。

数字化加速反馈,逼近认知加速的奇点

反馈本身没有意义,以不同的方式更高效地转化和利用反馈中隐藏的信息,才使反馈有了意义。如果说这个时代有什么特别之处,一个很重要的变化是数字化从根本上改变了反馈数据的规模、全面性、速度、精度,在反馈数据质量和效率同步提升的背后,是数字化技术创新与反馈结构、机制的共同进展。显著的例子,包括互联网和物联网节点的密度及其产生的实时数据流;也包括AI深度神经网络的深度和层次结构,在反向传播反馈机制下涌现的智能;还包括区块链技术支持下的个体对个体的去中心化反馈结构,以新信用机制催生Web3.0(第三代互联网)。基本的反馈机制规律会以不同的形式重复出现在不同的应用场景,并起到决定作用。

此外,AI在处理大规模数据方面也具备了统计潜在规律并发现假设的能力,从而能够实现自学习。特别是在物理等自然学科陷入实验手段不足的困境阶段,新的研究范式出现,对我们来说是一个好消息。

这些重要的变化组合在一起,就形成了更加快速的HFL,就像把整个世界装进了数字化的加速器,随时有新的撞击帮我们打开新的世界。如果说互联网改变了连接价值的方式,那么数字化将改变创造价值的方式。当数字化和智能化的能力越来越普及,比软件、数据和算法这些工具更重要的是数字化和智能化的思想,我们是否建立了适合新时代的世界观、数字化思维方式和基础知识体系?这正是当下造成基础创新空白的主要瓶颈。基础的思想通常被认为是虚的东西,具体的工作更容易量化为短期成果。

在未来,智能就是在数据反馈中高效自学习的机制,物联网和云计算就是反馈数据获取、加速连接与计算的助推器,最终将整个世界装进云端模拟引擎。更进一步,数字化模拟可以更高效地获得反馈,还可以通过算法等反馈机制创新实现对反馈学习的加速。

基于数字化反馈的商业3.0

数字化反馈、计算、模拟技术的进展使远期和微观事物的实时可见性得到了显著提升,可以支持算法自学习和实时优化。如果说工业时代是存量的博弈,产生了基于市场空间竞争的五力模型和基于心智空间竞争的定位理论,在互联网时代则产生了低成本和快速的MVP(最小可用产品)测试模式。在今天,随时可用且实时在用户的使用反馈中自学习、自主进化的产品和服务,在新的数字时代,我们称之为RSS(Real-time Self-Learning System,实时自学习系统)。例如特斯拉影子模式(Shadow mode)、实时升级的推荐策略、柔性响应的供应链。这应该是属于数字化、智能化时代的定义性模式,我们会在第4章讨论这一课题。

这个时代给我们的另一个关键信号是,从假设到反馈的循环周期正在数据和算法的推动下变得越来越短,世界将被这种趋势彻底改变,一切的竞争将归结为学习速度的竞争,这就是RSS的价值。商业战略需要参与所在时代市场内在结构演化中发生的根本变化。在今天,我们和我们的公司,显然需要使战略基于高效的反馈系统,建立学习效率优势,并善于利用反馈效应。

如何建立数字时代的反馈系统

回归最基本的框架,世界上有三类反馈系统对我们极其重要,第一类是来自外部世界的反馈,可数字化的反馈,就像雷达告诉我们距离车库的墙还有多远。在本书里,我们会讨论互联网和AI如何回归本质,在反馈机制创新的指引下找到下一阶段的方向,并实现人类认知外部世界能力的本质性进展。第二类来自人类本能对外部世界的反馈,古老的大脑边缘系统和快速进化的人类文明之间的不同步,导致了由内而外的过激前反馈问题,这是导致焦虑、肥胖等现代社会病的部分原因。我们从中也可以理解用户为什么投诉我们的服务,新消费面对现代社会中人们焦虑的本能如何做出恰当反馈,提供满足感。第三类是独立于人与自然界之间,修补两者之间的裂缝,以各自的HFL机制,相对平行独立的反馈演化系统。受限于碳基生命的缓慢进化周期,人类在自己创造出的多重混合进化系统中,正取得更快的进化和更强的适应能力。例如,在自然界之外,人类创造了令人沉浸的艺术世界,提供满足感的消费世界,以及元宇宙和人机结合体。其中,我们将重点讨论“新消费”“个人化创造力”“自组织”“科技和智能”,并尝试从中找到不同系统如何基于反馈机制实现演化,从而获得这些领域内趋势和机会的洞见。例如,我们会在组织部分讨论公司的内外部反馈效率如何基于“最小反馈单元”实现提升,Web3.0会如何基于新的去中心化反馈机制重新组织世界等具体课题。

然后,基于此的商业世界也会发生根本性的变化。例如,如何建立自己的数字化反馈流(新假设在应用和测试中的实时、全面、连续的反馈数据流)?特斯拉、亚马逊、TikTok(短视频应用)这些领先企业如何基于数字化反馈流变革业务?如何基于反馈效应制定适应当今时代的商业战略?如何基于数字化反馈优化决策?如何为高效公司反馈系统设计机制?我们会在第4章从数据、人、组织、机制、技术等不同的角度讨论具体的方法和规则。

最后,我们会在第5章重点讨论模拟计算如何高效地处理复杂性问题,以及如何实现对反馈的终极加速。在第6章会提及如何基于数字化反馈建立新的认知科学。

这些内容是写给未来的读者的,有些内容会有生涩的新知识,但这也许就是我们面向下一个时代缺少的,我们现在可以一次性刷新认知。特别是对于那些希望在数字时代持续引领创新的新一代管理者,以及新一代的跨界思考者,他们不会再以传统的狭窄学科界定自己。当然,不同的读者可以选择与自己相关性更高的反馈应用场景来了解,不同的场景之间并没有严格的依赖关系。

对于简单本质的追求

本书追求以尽可能简单的方式解释复杂,当我们躺在草地上仰望星空,看不见的引力作用于自己;当我们眷恋家乡土地上长出的美味,我们会更加理解自己的本能;当我们追赶牛群,它们逃跑的时机和路线可以教会自己博弈论;当我们和孩子一同玩耍,可以了解生物智能是如何学习的。伟大的知识作用于身边每一个细节,自己睁开眼睛就可以学到,就像海滩上捡贝壳的孩子,这就是亚里士多德说的第一性原理。所以,在不同的领域,我一直在用同一个方法和体系工作,因为我相信所有好的方法都可以还原为基本的常识,而对常识的组合运用可以解决所有问题。

几乎没有一个未知课题的研究会完全按照预期发展,如果有,这种研究可能很难有新突破。本书并不是按照一条线写下来的,我并没有对各部分的语言风格做完全的统一,因为对一些特定领域的知识做简化的表达可能会使其丧失准确性。有不同兴趣的读者可以选择阅读不同的部分、不同的专业方向和专业深度,不求甚解,各取所需,它们都是围绕“反馈”的不同方面来展开的。本书试图客观描述这个时代的内在客观规律和相同中的不同,很多观点是一种新的假设,如果你能证明它是错误的,那么它的价值在于提供了更多反馈,从而激发了新的假设。微小的努力只要有反馈就有意义。