导航
当前位置:首页 > 知识库 >

《人工智能的未来》读后感及读书笔记

2022-08-18 22:28 作者 :小品 围观 :

书籍信息

全书名:《人工智能的未来》

英文名:《OnIntelligence》

作者名:杰夫·霍金斯,桑德拉·布拉克斯莉

译者名:贺俊杰,李若子,杨倩

前言

人工智能是时下最热门的科技领域之一。在经过多年的技术演化以及三次浪潮之后,人工智能已经逐渐深入到了我们生活的方方面面。搜索引擎、智能翻译、智能导航、智能推荐也已经成为我们日常生活中不可或缺的习惯。

但这些所谓的「人工智能」真的能称为智能吗?真正的智能到底该怎样界定?

当我们仔细思考这些问题的时候,发现当下的人工智能并不能给我们一个确切的答案。人工智能专家和计算机工程师所创造出的人工智能,巧妙的绕过了「智能」这个概念,仅从功能性的角度,通过机器的行为来判定其是否智能。但很显然,智能行为并不能作为判断是否具备智能的依据。

为了搞清楚什么是真正的智能,杰夫·霍金斯花费了多年的时间去研究人类大脑的运作机理,并写下了《人工智能的未来》一书。通过此书,我们将了解到大脑的空间-时间模式、记忆-预测模型、意识与创造,以及智能的未来。

一、人工智能的局限

2016年,人工智能AlphaGo以悬殊的比分战胜世界围棋冠军李世石。被誉为人类智能巅峰的最后一道防线:围棋,也在AlphaGo强大的性能面前遭到无情地碾压。一时之间,恐惧来袭,人们开始担心自己会被机器所取代。

在围棋领域,AlphaGo的确是当之无愧的大师,它依靠强大的并行计算能力、深度学习算法以及几百万份棋谱数据,战胜了最聪明的人类。它是如何做到的呢?

它的每一步落子,都经过了无数次的运算,它从数据库中调用历史的棋谱,与当前的形势比对,通过算法计算出最优解(或者说胜算最大的棋招)。面对AlphaGo,其实就相当于面对人类历史上所有顶尖高手的集大成者,以一人之力敌万人之智,胜算当然渺茫。

更为关键的是,AlphaGo可以通过7x24小时不停歇地与自己对弈,来提升自己的技能。我们所说的「士别三日刮目相看」,在AlphaGo这里,可能只需要一个小时。

于是,在这位强大的机器大师面前,人们被震慑住了。因为以人类大脑的计算能力与学习效率,是远远赶不上机器的,这种差距只会越来越大。

从行为上看,AlphaGo的确具备了智能,它不仅会下棋,还会学习,而且在围棋领域凌驾于人类智能之上。这符合人工智能专家和计算机工程师的理念。他们认为,人类智能就是一种算法,和计算机算法没有本质区别,只要计算机的计算能力足够强大,算法足够优秀,就足以涌现出匹敌人类的智能。

但问题是,拥有类似人类的行为真的能作为拥有智能的依据吗?或者说,AlphaGo真的理解围棋吗?答案很显然是否定的。

AlphaGo并不理解什么是围棋,它只是根据算法,通过历史数据来计算最优解。至于围棋中所包含的战略思想以及人性的博弈,它都不理解。

除此之外,除了下围棋,其他事情AlphaGo也一概不会。从这个角度来看,与其说它是人工智能,不如叫它专业围棋机器,更恰如其分。

这是目前人工智能的局限,也是人工智能专家与计算机科学家在开发人工智能时所进入的一个误区,就是绕开了「智能」本身,绕开了对人类大脑的探究,仅通过机器行为去定义智能。这种极度务实的思想的确可以创造出实用的机器人产品,但却无法创造出真正的智能。

要探索真正的智能,必然要从具备智能的人类大脑开始。

二、人类大脑

我时常思考「我」的本质到底是什么。很显然,「我」并不是站在镜子前的这个人体,因为这个人体只是受「我」支配的无数个细胞的集合。最终我想通了,其实「我」就是藏在颅骨中的那一团如浆糊般的物质,或者更确切地说,是包裹在这团物质表面的那一层薄薄的神经组织,大脑皮层。

人类的一切思维、意识、思想和行为指令,都诞生于大脑皮层。正是大脑皮层,将我们的思维、意识与器官、行为统合在一起,使我们成为一个完整的智慧生物个体。

大脑皮层并不大,仅有两毫米厚,但就在这狭小的空间内,密密麻麻布满了上百亿个神经细胞。这些神经细胞通过神经突触彼此连接,进行着信号的输入以及指令的输出,同时还存储着宝贵的记忆。

大脑皮层分化出了不同的功能区域,比如视觉中枢、听觉中枢、运动中枢等。每一个功能区域都有严格的层级划分,就像一个公司拥有董事长、经理、员工等不同的权力层级。低级区域通常作为信号的感知区域,而高级区域则负责统筹信息解码以及指令发布。

以视觉为例:当光携带着信息在视网膜上成像之后,最先被低级感知区域感知,然后向上传送。不同层级的区域,对信息有着不同的专业化解读,如物体的大小、形状、颜色、运动状态。最终,所有层级感知到的信息会汇集到高级区域,由高级区域对复杂的信号进行统筹解码,之后,你便理解了你看到的东西到底为何物。同时,高级区域还会发布相应的指令,来指导你的身体完成相应的行为。

假设看到的是美丽的风景,高级区域就会发布各种复杂的指令,让你感到身心愉悦,并发出赞叹。

大脑皮层虽然分化出了多种不同的功能区域,但科学家们经过长时间的研究,却发现了一个极为反直觉的现象,即大脑皮层各功能区域的基本功能,或者说算法都是一样的,唯一而微小的差异仅体现在神经的连接上。

这意味着,无论是视觉中枢、听觉中枢、运动中枢还是其他中枢,它们都沿用同一套算法,具备相同的基本功能。

近些年经常被提及的「大脑可塑性」很好的说明了这个观点:某些患者因为疾病或者事故导致大脑运动中枢受损,瘫痪在床,失去了运动能力。但经过多年的训练,大脑其他功能区域接替了原有运动中枢的职能,患者又恢复了运动能力。

这也恰好说明人工智能专家和计算机工程师们试图通过不同的代码和算法使计算机获得「机器视觉」、「机器听觉」的做法是错误的,因为这本身就与大脑的运作机理相悖。

我们的大脑皮层从一开始就是一个统一的功能模版,在成长的过程中,根据传入的信号种类,分化出不同的功能区域:视觉信号到达的区域分化成了视觉中枢,声音信号到达的区域分化成了听觉中枢,以此类推。

要想搞清楚大脑皮层的功能机理,就要从输入信号说起。

三、空间-时间模式

首先,我们又要丢出一个反直觉的观点:无论视觉、听觉还是触觉,大脑皮层接收到输入信号基本是相同的。

你可能一头雾水:图像是光信号,声音是空气的波动,而触觉则来自于皮肤感受到的压力,难道光、声波和压力是同一种东西?

答案当然是「否」,这里所说的输入信号相同,是指光、声波和压力在被感受器(这里指眼睛、耳朵和皮肤)接收时,都会先转换成电脉冲(或者叫动作电位),再通过神经传导进入大脑皮层。

也就是说,无论视觉、听觉还是触觉,大脑皮层接收到的都是一股股电脉冲信号,或者我们可以称其为一组组模式。

当我们看到朋友的脸,一组模式进入了大脑皮层的视觉区域;当他跟我们打招呼,一组模式进入了大脑皮层的听觉区域;当我们拍拍对方的肩,一组模式进入了大脑皮层的触觉区域。

这些模式之间的差异,就在于感受器不同,传输路径和层级不同,以及去向不同。但无论源自哪里,对于大脑皮层而言,它们都是动作电位,都是模式。

这些模式还携带了空间和时间的信息。

以视觉为例:我们查看周围的事物,整体的空间感和层次感,物体的边缘和位置,都会被我们一并觉察;而我们的眼球并非静止不动,哪怕我们刻意定睛,眼球每秒钟也会发生3次不自主的扫动。这就导致大脑皮层接收到的模式始终在发生连续不断的变化,这是一个连续的过程,让我们感受到的世界不是静止的图像,而是连续动态的影像。

有一个「感觉替换」的实验很好地说明了大脑皮层接收到的都是模式:

科学家发明了一种可以让盲人通过舌头来「看」到物体的装置。这种装置主要分为两个部分,一部分是头戴摄像头,用于采集图像信息,充当盲人的双眼;另一部分是藏在舌头下的一个压力传感器,类似于人的视觉神经。

当摄像头采集到图像之后,将信息传输到舌头下的传感器,传感器将图像一个像素一个像素转换成压力点,形成一组模式传输到大脑皮层。经过训练,大脑皮层很快就可以解析这组模式,盲人也就「看」到了摄像头采集的图像。

原本舌头上的触觉却在脑海里形成了视觉影像,这足以说明这种空间-时间的模式对于大脑皮层而言都是一样的,无论这种模式源自哪里。

可以说,我们对于世界的感知和认知,都基于这样的一组组模式。如果没有模式,我们将永远处于没有觉知的黑暗之中。而通过这些模式,大脑皮层也在我们脑海里塑造了一个近乎与真实世界一样的虚拟世界,这就是记忆。

四、记忆

计算机拥有强大的计算能力,每秒可进行上亿次的运算,相比之下,大脑皮层的运算速度简直跟蜗牛一样。

但奇怪的是,人类可以轻轻松松作出复杂的动作,而机器却不行。比如一个简单的例子:接住别人抛过来的球。

我们只需要盯着球飞行的弧线,提前判定好落点,然后伸出手,就可以轻松接住。哪怕是小孩子,玩过一段时间也能轻松做到。但如果让机械手臂来完成这个动作,哪怕是再复杂的算法,再强大的计算性能都很难办到。

对于机械手臂来讲,它要时刻追踪球的位置,然后根据角度、速度、重力加速度等各种物理量,时刻运算球的落点,并不停地进行修正。即使准确判断了球的落点,但要精确的控制机械手臂的角度,弯曲度,手指张开的角度,依然是一件极其困难的事,哪怕它一秒能运算上亿次,也会看着球从手中溜走。

这样看来,似乎人类大脑的计算能力更强?但显然不对,那到底是什么原因导致人类能够作出如此复杂而精准的动作呢?答案是记忆。

计算机想要得到答案,必须靠即时演算。但人不一样,人要得到答案,只需要从记忆中取出即可。

人一旦有了接球的经验,就会将其作为记忆存储到神经元的连接点上。当再一次遇到接球的情况时,就会直接将之前存储的记忆唤醒,这些记忆中包含着一连串的肌肉命令,会让你的整个身体协调地完成接球的动作。你练习得越多,记忆就越深刻,接球的动作就会越协调、越精准。

人类的记忆有如下几个特点:

4.1按时间顺序的模式序列

我们的记忆不是一幅静止的画面,也不是某一个时间上的断点,而是一个有时间顺序的序列。我们无法一股脑儿回忆起整个事情的全貌,一定是顺着事情发生的时间一点一点回忆。我们背书,我们唱歌,我们讲故事,必然是从开头到结尾,有了前文,我们才能回想起后文。而如果你要倒着背书或者倒着唱歌,你就会不知所措,不知从何开始。

4.2自-联想记忆

自-联想是人类大脑记忆网络中一种独特的现象,它体现了反馈的重要性。当输入通过神经元产生输出,输出又会被传回给输入,从而形成一个反馈回路,记忆由此诞生。

这种反馈回路的好处就在于,当我们想要回忆某一件事情时,我们不需要回忆完整的情节,而是只需要一个记忆片段,甚至是一团混乱的记忆画面,就可以激活全部的记忆。

比如睹物思人,当我们看到某一个物件,甚至只是闻到一种香味,与之相关的某个人的全部细节就会浮现在我们脑海里;我们偶然听到一首以前经常听的歌,我们瞬间就会穿越时空,置身于当时的情景之中,周围的环境、人物、气息都会历历在目。

4.3恒定表征

恒定表征代表了我们的记忆是恒定的,但这并不意味着我们能够完整而精确地记住每个细节。恰恰相反,我们的记忆无法做到精确,这点和计算机的差距尤为巨大。计算机的存储是精确的,哪怕只是改动一个字符,结果就会面目全非。但大脑不一样,无论模式怎么改变,我们的记忆都会保持恒定。

比如我们在不同光照条件下观察朋友的脸,光线有明有暗,光照角度有高有低,光源有火有灯泡,对于我们的视觉中枢来讲,这些都是不同的模式,但我们都能认出这是朋友的脸,甚至哪怕他做过轻微的整形手术,我们也能认出。

还有一个比较常见的恒定表征的例子是签名。无论我们握着什么样的笔,用什么样的姿势,在什么样的纸上书写,我们运笔的力道和角度都基本一致,签出来的名字也基本一样。毕竟,签名的恒定表征早已存储在了我们的运动皮层当中。

人的记忆不如计算机存储信息那般精准,但它的容错性、敏感性却远超性能最强的计算机。这其中最核心的地方在于,神经系统记忆的并不是精确而独立的事件,而是各种模式之间的相互关系。

无论是我们看到、听到的,还是感觉到的,这些输入、输出模式相互关联,都以恒定的形式存储在我们的大脑当中,作为我们认知世界、预测未来以及产生行为的基础。

五、预测

试想一个场景:

我们正在音乐厅里聆听钢琴师演奏一首我们熟悉的音乐。当琴声响起,我们对于这首曲子的记忆瞬间被唤醒。我们跟着这优美的琴声行进,不对,是琴声跟着我们记忆中的旋律行进。

通常我们的大脑更超前,当后面的旋律还未响起,我们已经知道旋律接下来应该如何走,一切显得自然而然。突然,钢琴师弹错了一个音符,这突如其来的异常让你变得警觉,甚至扰乱了你脑海里的旋律进行,你的注意力在接下来的几秒钟内都会被这个错误的音符所吸引。

类似的事情在生活中不胜枚举。椅子的位置好像变了?今天的菜好像咸了点?我原本放在这里的笔记本去哪了?我们不会留心正常的状态,但对异常却格外敏感。

这是因为,我们在做某一件事情之前,我们脑海中相应的神经元就会激活,这些被唤醒的记忆会作出预测,并与外部实际的输入模式相比对,当外部输入的模式与记忆吻合,我们就会觉得很自然,而一旦出现冲突,我们就会立马察觉。

这里所谓的「预测」,并非指对未来的预言或者猜测。而是指神经元在感受到确实的输入模式之前,就开始变得活跃,相应的记忆也被唤醒,然后在外部输入模式确实传入之后,将符合记忆预料的情况与实际情况进行比对。

这种预测无时无刻都在发生。看书、写字、走路、吃饭,我们对于这个世界的所有觉知,都是外部输入模式与基于大脑原有记忆的预测的结合。

还有一个例子可以很好地证明这一点,那就是「填补」。

我们将汉字的一部分遮住,但我们依然能认出这个汉字,是因为我们记忆中有这个完整的汉字;我们的影视作品其实是一张张静态的序列帧,但我们却可以看到连续的动态画面,也是因为大脑通过记忆将其填补完整。

可以说,大脑利用记忆在我们脑海里塑造了一个完整的世界模型,我们的每一个行为都是对这个模型的强化和修正,我们的每一次全新经历都会使这个世界模型更为完善。

正是由于这个记忆模型的存在,我们对于世界的感知才变得相对稳定和连续。同时,我们的行为也直接受到该模型的影响。

比如我通过游泳瘦了10斤,我们的记忆会将游泳与瘦身相互关联,基于该记忆的预测,会促使我继续游泳,保持身材。

先有预测,再有行为,而行为会使预测成为现实,这有点像心理学上提到的「自证预言」。而这也恰好解释了一开始我们提到的,行为为何不能作为拥有智能的依据。因为行为只是智能的一种外在表现,而真正体现智能核心的,是预测。

六、意识与创造

预测,作为智能的核心,有一个基本前提,那就是这个世界本身的基本结构遵循一定的规律,是可被预测的。如果世界本身杂乱无章,毫无秩序,那我们的记忆、预测和行为也会处于一片混沌之中,因而毫无意义。

这种遵循世界规则来进化和发展的现象也同样发生在自然界的其他生物身上。那其他生物拥有智能吗?只能说,他们不具备像人一样的智能。

人类智能相比于其他生物的智能,主要有两方面的不同:

第一,人的大脑皮层比其他生物的脑皮层要大得多,这就导致人类大脑皮层中可以容纳更多数量的神经元,形成更为复杂的层级结构,储存更为丰富的记忆,进行更加复杂的预测,从而理解更为复杂的世界结构并作出更多更复杂的行为。

第二,人类具有语言能力。虽然其他动物也会有沟通的方式,但那些叫声或者肢体动作只能表达最原始最简单的意思。而人类的语言系统异常发达,更重要的是,人类的语言天生与记忆预测相关联。我们的语言既表达了我们自身的记忆,又可以唤醒别人的记忆,它同时还是我们认识这个世界、塑造记忆的手段。也正是因为语言,人类成为地球上唯一个可以传播世界知识的物种。

由于智能上的差异,人具备了创造力,并把能否创造作为区别于其他生物和智能机器的标准。

很多人认为创造需要极高的天赋或者不寻常的能力。但从记忆-预测的角度来看,创造仅仅就是大脑的通过记忆进行类推和预测的一种活动而已,并没有想象中的那么遥不可及。创造力可以体现在极其微小的细节以及日常琐事上。比如我不会中提琴,但我会小提琴,我利用小提琴的记忆,很快掌握了中提琴的演奏技法,这就是一种创造力,只是平时被我们所忽略。

而那些公认的天才般的创造,画作、文章、影视作品、发明,与日常的创造并没有本质上的不同,它们依然是基于记忆,基于这个世界最基本的事实,只是在预测方面超出了人们的预期,因而显得独特并富有艺术性。

除了创造,我们经常提及的意识也是基于大脑的记忆-预测系统。虽然如今我们依然无法给意识下一个准确的定义,但我们可以将意识大致分为两类:

第一类是我们常常说起的自我意识。这类意识本质其实是陈述性记忆。我将一段时间的记忆陈述给对方,而对方听到的也就是我那段时间内的意识。如果我某一次酩酊大醉,昏睡了两小时,当我醒来,会认为我在这两小时内失去了意识,因为没有任何记忆。这类意识最大的特点就在于,会随着记忆的产生而产生,也会随着记忆的消失而湮灭。

第二类称为可感受性。为什么不同的颜色会给人带来不同的感觉?红色会带来热情的感觉,蓝色会带来清爽的感觉。而这种感觉每个人也不尽相同。这很难理解。

或者我们与大脑联系起来,为什么视觉和听觉给人的感觉不一样?我们前面讲到,大脑皮层不同区域的基本功能和底层算法是一样的,视觉、听觉的输入信号也基本相同。从这个角度来看,我们对于视觉和听觉的感受应该是完全相同的。但事实是,我们对视觉和听觉的感受存在很大的差异,这种差异是如何产生的?可感受性又该如何解释呢?

目前还没有满意的答案,但有两种假设值得探究:

一种就是虽然视觉和听觉在大脑皮层中的工作原理相似,但处理方式却不同;另一种就是视觉、听觉的输入信号虽然相同(都是动作电位),但空间-时间模式存在差异。

但无论结果如何,记忆及预测都对意识起到了决定性的作用。

七、智能的未来

提到智能机器,我们脑海里的第一反应,估计是影视作品中的人形机器人。它们的外形和人类高度相似,说话的时候眼睛闪着光芒。它们运算能力超强,知识渊博,通晓古今,操着一口永远是平声的语调帮我们答疑解惑。

如今市面上也出现了人形机器人,但那只是计算机外面套了一个人类的外壳,我们一眼就能看出巨大的差异。

相比人形机器人,专业型的功能机器人更为普遍,比如流水线上的机械手臂,胖胖圆圆的家庭机器人,扁扁的扫地机器人。但这些机器人只能算是特异化的计算机,只能严格按照计算机程序来工作,它们并不具备真正的智能。

即便是被认为相当智能的谷歌搜索引擎,AlphaGo,由于它们不具备预测的能力,也不能被称为真正的智能。

要想打造真正的智能机器,就不得不正视大脑皮层的运作机理。那么建立记忆系统,实现预测能力就不可避免。

首先,在结构上要建立分层级的存储系统;然后,需要超大容量的存储器。另一个比较困难的问题在于连通性,神经元之间的连接是产生记忆的基础,这些连接纵横交错,排布极为紧密复杂,即便以目前的纳米级工艺,也很难做到。不过,以目前的技术发展速度来看,在不远的将来,这种完全模拟神经系统的构造应该可以创造出来。

未来的智能机器,将在4个方面超越人脑:

7.1速度

当智能机器具备思考能力,其思考的速度会比神经元快上许多倍。它可以在几分钟内读完一本书,与人交流的时候不得不放慢思维的速度,以免我们跟不上节奏。

7.2容量

人脑的容量已经很庞大,但由于智能机器的存储容量几乎可以无限扩展,因此它总会超过人脑的容量,而它的飞速思考能力也足以匹配超大容量,让它能够及时地在庞大的数据库中进行检索。

7.3可复制性

每一个人脑从诞生到成熟,都必须经过长时间的学习和训练,对于人类的自然成长而言,这一过程不可或缺。但智能机器不同,物理构造、计算机代码、存储信息都可以直接复制。假设两个不同领域的智能机器,通过相互复制各自领域的信息,就可以立马获得相关的知识,这可比人类的学习要快多了。

7.4感觉系统

人类的感官有限,因而所能体验到的感觉也有限,大体上只有视觉、听觉、触觉、嗅觉、味觉等寥寥数种。但大自然中所存在的感觉却远不止于此,比如蝙蝠的回声定位,对于人类而言,就是一种全新的感觉。

而智能机器却有机会感受这些人类不曾体验过的感觉,只需要给它加装相应的传感器。比如给它装上天气传感器,它就有机会领略天气的细微变化。给它装上声纳,它就可以倾听来自海洋深处的声音。

后记

虽然智能机器终将在多个领域超越人类,但能够制造出真正的智能机器,说明人类本身对于智能的认识已经达到了相当的高度,必然有方法对其加以限制。而反观智能机器给人类社会带来的福利,却可以远远超出我们的想象。

真正的智能机器,将可以体验更多的感受,思考更深入的理论,帮助人类发掘宇宙中更多的神奇。

标签:
相关文章