追蹤AI最新趨勢

對話AI奠基人謝諾夫斯基：一切都將在你的有生之年發生轉變

騰訊科技 · 2023/05/31 17:43

来源：腾讯科技
作者：张小珺

特伦斯·谢诺夫斯基（Terrence Sejnowski）是杰弗里·辛顿（Geoffrey Hinton）之外，另一位深度学习奠基人、先驱人物。最近，他们私下交流了许多次关于AI威胁论的看法。

38年前，两人齐心合作，研发了玻尔兹曼机（Boltzmann Machines），这是一种用于模式识别的神经网络。上世纪80年代，在深度学习经历了漫长的寒潮与黯淡后，它的出现为极少数相信“连接主义”、“神经网络”和“深度学习”的研究人员，带来了一丝曙光。

“我们就是AI的莱特兄弟。”谢诺夫斯基说。

辛顿与谢诺夫斯基都出生于1947年。辛顿出生于加拿大，专长是人工智能和心理学；而谢诺夫斯基出生于美国，更擅长物理学和神经科学。两人有一个共同的内心力量：对大脑充满兴趣。

“我们有同样的直觉，”谢诺夫斯基说，“这个直觉是，视觉、语音识别、语言问题等都是极其困难的问题，必须解决；而唯一证明这些问题可以解决的存在就是，大自然已经解决了这些问题。为什么不深入研究一下？”

在很长一段时间里，深度学习都不是人工智能的主流学派。彼时的统治者是MIT人工智能实验室的马文·明斯基（Marvin Minsky），他曾尖锐指出深度学习的重大缺陷，并围绕自己对人工智能的见解构建了一套体系。绝大部分科学家都是他的追随者，信奉“符号主义”。

这是势力悬殊的两个学派。“符号主义”是一种基于逻辑推理和编程规则的学派，将人类思维视为通过符号和语言进行推理的过程，就像人类使用字母和单词构建句子来表达思想；而“连接主义”则更像是逆向工程大脑，通过模拟神经元之间的连接和权重调整来处理信息。

后来，辛顿成为AI教父级人物、深度学习之父，以4400万美金将自己的公司卖给Google后出任Google科学家，而他的学生IIya Sutskever参与创立了如今炙手可热的OpenAI。

谢诺夫斯基则是美国四院（国家科学院、国家医学院、国家工程院、国家艺术与科学学院）院士，也是全美在世仅三位的四院院士之一，他有一档知名的慕课《学习如何学习》（Learning How To Learn），并出版了一本全球销量超300万的书籍《深度学习》（The Deep Learning Revolution）。

二人维持了一生的友谊。

近期，辛顿骤然从Google辞职，公开呼吁AI的可能性危险。他表示，过去几个月让他改变了对人类大脑与数字智能的看法。“毛毛虫提取养分，转化为蝴蝶。人们已经提取了数十亿认知的精华，GPT-4就是人类的蝴蝶。”以此暗示数字智能可能是比大脑更智慧的智能体。

而谢诺夫斯基对此表现得更乐观一些。

“我很高兴杰弗里有所担心，因为至少有人在担心。”今年5月，腾讯新闻对话了现年76岁的特伦斯·谢诺夫斯基，他再三拿莱特兄弟发明飞机类比，认为如今正处在这样的时刻。“我们刚刚起飞，不知道如何控制这架飞机，我们需要弄清楚如何控制它。这将是未来10年的方向。”

对话中，他谈到神秘莫测的大脑、AI派系对决颇有冲击力的一幕、人工智能的潜在危险，以及大语言模型的未来演进方向等话题。他认为，大脑中还有几十个被这些大型语言模型忽略的部分，几乎可以肯定它们会在未来10年内被加入进来，如人类的情感、长期记忆。

他判断，未来，“每家公司都会建立自己的模型”。

我们就站在人类历史一个全新的起点上，谢诺夫斯基感叹道：“我们正在穿过这扇门，以后再也不会一样了。”

以下是对谢诺夫斯基的访谈，略有删减。

01 谈大脑：它比任何人类创建的神经网络模型更强大

腾讯新闻：你好，谢诺夫斯基先生。我这样称呼你对吗？Mr. Sejnowski。

谢诺夫斯基：你可以直接称我为Terry。

腾讯新闻：好的，Terry。你是什么时候决心要成为一名科学家，尤其是什么时候想要成为一名神经网络、深度学习和人工智能方向科学家的？

谢诺夫斯基：

我对大脑一直抱有浓厚的兴趣和好奇。在本科和研究生阶段，我主修物理，因为我认为在所有科学领域，物理学的理论力量最具挑战性。大脑高度复杂，物理工具对训练很有帮助。
在深入研究前，我意识到若是真想了解大脑，必须了解关于神经科学的知识，即大脑的生物基础。我旋即转向神经科学，在哈佛大学医学院神经生物学系进行了博士后研究。在那儿，我认识到要理解大脑，不能仅仅将其视为物理或生物问题，因为大脑具有学习和思考的能力，这是计算的用武之地。
我创立了一个名为“计算神经科学”的领域，最近荣获神经科学领域的格鲁伯奖（The Gruber Prize）。现在这个学派发展迅速。
这个话题与我们今天要讨论的内容相关，我们发现大型语言模型和人脑之间存在许多相似和差异之处。我们可以进行许多有价值的讨论。

腾讯新闻：在你漫长的科研生涯中，一个闪耀瞬间便是与杰弗里·辛顿教授一起研发了玻尔兹曼机，你当时有意识到这个机器会成为人工智能教科书上重要的一笔吗？

谢诺夫斯基：

那是我生命中最激动人心的时刻之一。和杰弗里一起工作，是令人兴奋的机会。杰弗里有强烈的计算直觉，我们在背景上补充而契合。他的背景是人工智能和心理学，我的则是物理学和神经科学，我们完美地融合在一起，保持着持久的友谊。
正如你所指出，玻尔兹曼机具有里程碑意义。它证明了马文·明斯基和西摩尔·帕普特（Seymour Papert）是错误的。明斯基和帕普特在1969年关于《感知器》（Perceptrons: An Introduction to Computational Geometry）的著名书籍中对感知器的局限性提出了很好的证明，他们的观点是没有人能将感知器的学习规则推广到具有多层和多个隐藏层的多层感知器。但杰弗里和我发现，如果扩展架构，我们就可以展示出一种优雅的学习算法。
这个算法和架构之所以美妙，是因为它非常优雅。它受到了我背景中物理学启发，我很喜欢它。它就像是一个热力学证明，证明我们有一个学习算法。但与反向传播（Backpropagation）不同的是，它是全局的。你不需要通过反向传播计算误差，你只需要计算输入和输出在两种不同条件下的相关性。一种是当输入存在，另一种是当输入消失。我们称之为“休眠阶段”。所以当你计算相关性减弱，对于小型网络很有效，它需要达到平衡，你必须计算平均相关性。它需要更多的计算，所以实际上效率不高。

腾讯新闻：相比更早的神经网络之一感知机（Perceptrons），玻尔兹曼机在哪些方面使深度学习变得更好了？依旧不足的是什么？

谢诺夫斯基：

玻尔兹曼机的美妙之处首先体现在它可以容纳许多隐藏层，就像深度学习可以使用隐藏层一样。从80年代开始，它就已经是深度学习网络了。只是当时我们并没这样称呼它，但你可以构建更深层次的结构。
另一个值得注意的是，玻尔兹曼机既可用于监督学习，当然大部分工作是使用反向传播完成，也可以用于无监督学习。它能学习概率分布，不仅仅是学习将输入进行分类的映射关系，还能在高维空间中发展出内部的概率分布。
局限性嘛，就像我之前说的，它需要更多计算资源，计算成本高。而且，当你有多个隐藏层时，随着层数增加，它需要更长时间才能在输入向上传递并回传到底层。整个网络必须成为一个单一协调的整体。这在物理学中被称为相干性（Coherence）。就像在接近临界点时，比如水和蒸汽之间的相变（Phase Transition，指一种相态朝另外一种相态转变的过程），有一些特殊现象发生，整个系统变得相干。我们发现玻尔兹曼机必须实现全局的相干性。
这个算法非常有潜力，杰弗里花了很多精力来展示它可以逐层构建。它仍然是一个可行的算法，只是需要更多计算资源支持。

腾讯新闻：那些年，很少有人相信神经网络和基于神经网络的深度学习对于人工智能真正可行，认为这不过是自负者的玩笑。当杰弗里·辛顿第一次找到你提出合作意愿时，他是怎么对你说的？你为什么选择相信他？

谢诺夫斯基：

1979年，我们在圣地亚哥的一个小研讨会上结识。当时，并没有像你描述的那样引起太多关注。实际上，几乎没人注意我们。
换句话说，在全球范围，关注这个领域的人非常少。那次会议上，只有十几个人。我们是研究人员，从事与其他人不同的研究。我们很高兴能一起工作，因为我们有同样的直觉。这个直觉是，视觉、语音识别、语言问题等都是极其困难的问题，必须解决，而唯一证明这些问题可以解决的存在就是，大自然已经解决了这些问题。因此，我们的观点是，为什么不深入研究一下？让我们看看自然为我们做了什么，并尝试逆向工程大脑。
当你这样做时，你不想复制大脑的技术，因为它在能源使用和规模方面比我们先进得多。即使是今天的神经网络也无法接近大脑的一小部分。
但是，你可以从大脑中获取一些通用原则。我们试图提取这些原则，来创建人工大脑版本。
当时人工智能领域缺乏的最重要的原则是，你可以学习权重，可以通过示例来学习解决问题。这确实是大脑适应世界的一种重要方式。大脑可以学习语言、运动、物理和社交技巧。换句话说，这些都不是像编写计算机程序一样在你内部编程的东西。
大脑中的天生部分是体系结构和突触可塑性的机制，这些允许大脑在出生时具有接近成年所需的连接的生物机制，然后通过学习优化这些连接。这些就是原则：大规模的连接，许多单元之间的连接，并有学习算法。
尽管我们在80年代使用的学习算法如今仍在使用，但之后发生的是，由于摩尔定律的发展，神经网络的规模以惊人速度扩大，无论是单元的数量还是参数的数量，现在已达到万亿级别，与大脑相比仍然非常小，因为大脑大约有10的14次方、10的15次方和10的12次方的连接，仍然多出约一千倍的连接和参数。

腾讯新闻：人类的大脑给你们的研究工作带来了哪些灵感？你曾经说：“我们确信我们已经弄清楚了大脑是如何工作的。”那么，人类的大脑是如何工作的？

谢诺夫斯基：

我不想给你一种我们已经理解了大脑如何工作的印象。它仍然是一个巨大的谜团。我们对大脑了解甚少。这就是为什么我从事神经科学，大脑比任何人类创建的神经网络模型更强大。
在我写作的《深度学习》一书中，我有一个完整章节展示了卷积网络（ConvNet）的架构。卷积网络是2012年在NIPS会议（神经信息处理系统大会，是一个关于机器学习和计算神经科学的国际会议）上取得重大突破的一种网络，杰弗里展示了通过这种网络可以将图像数据集上的错误率降低20%，这相当于向未来前进了20年。
所以，如果你看一下卷积神经网络，它的架构在信号经过不同层的方式上，与灵长类动物视觉系统的架构相似。在视觉输入中，存在一种卷积架构进行预处理，还有许多其他机制，如归一化、分组等等，这些机制在视觉皮层中都存在，视觉皮层大约有12层，按顺序处理信息。这是一个卷积神经网络受到视觉架构启发的案例。
现在正发生的是，很多关于转换器（Transformer）的发现，例如用于自然语言处理的转换器以及从分析这些网络中出现的循环网络等其他架构，帮助我们理解它们的工作原理，并为分析神经数据提供了工具、技术和方法。
因此，与上个世纪相比，AI和神经科学之间的合作进展非常快。以前的研究进展缓慢、痛苦而复杂，记录一个神经元的活动很困难。但现在我们有了同时记录数十万个神经元的工具和技术，这让我们能更全面地了解不同神经元如何协调工作。
令人兴奋的是，现在工程师和神经科学家之间的交流，正在加速我们对大脑如何工作以及如何改进人工智能的理解。

02 谈派系对决质问明斯基：你是魔鬼吗？

腾讯新闻：人工智能领域一直存在深度学习的反对派，也就是所谓AI建制派（比如马文·明斯基），他们是怎么想的？今天来看，你们这些相信“连接主义”、“深度学习”、“神经网络”的少数者学派，相比相信“符号主义”的大部分AI建制派，底层对于世界认知的最大不同是什么？

谢诺夫斯基：

20世纪，计算机的性能有限，它们只能有效地处理逻辑问题。因此，人工智能是基于编写包含符号并操作符号的逻辑规则的。回顾起来，那些编写规则并尝试解决困难问题的程序员们，错误之处在于没有真正意识到自然界解决这些问题有多困难。
视觉是复杂和困难的，大脑细胞处理它们如此高效，以至于感觉起来就像很容易的事。你看出去，就能看到物体，这有什么困难呢？
这里有一个DARPA拨款的真实故事。DARPA是美国的国防高级研究项目管理局，是军方的研究部门。20世纪60年代，麻省理工学院的人工智能实验室获得了一大笔拨款，用来建造能打乒乓球的机器人。他们获得了这笔拨款，但后来意识到他们忘记申请资金来编写视觉程序。于是，他们索性将这个项目分配给研究生作为暑期项目，因为它看上去似乎很容易。（这不可思议）
2006年，达特茅斯召开了人工智能大会50周年纪念会议，我见到了明斯基。我问他这个故事是不是真的。我听说过这个故事，但感觉有点夸张色彩。
结果他反驳道，你得知的事实是错的，“我们没有把它交给研究生，而是分配给了本科生”。这个看上去容易解决的问题，最终被证明是“陷阱”，吞噬了整整一代计算机视觉研究人员的青春。
回顾起来，他们是尽力而为，根据当时的计算机条件做到最好。但问题是，随着问题变得越来越复杂，如果你试图通过编写计算机程序来解决它，程序会变得越来越庞大，这需要极大的人力投入。编写程序异常昂贵，无论是付给程序员的成本，还是程序行数达到数百万行时的成本，都会让你觉得它无法扩展。
这就是当时人工智能面临的问题：无法扩展。即使你给了他们数十亿美元，并让他们编写数十亿行的计算机程序，他们仍然无法解决问题。解决方案如此笨重。
他们当时并不知道。实际上，我们只需要一个隐藏层的小型网络，就可以证明我们能解决感知机无法解决的问题。但我们不知道的是，当你拥有10个隐藏层时会发生什么。我们不知道，因为我们无法模拟这个过程，它太复杂，计算量太大。
终于，在等待了30年后，现在我们知道了。计算机的速度提高了数百万倍，现在我们可以开始解决现实世界的问题了。
现在人们认为我们是对的，但当时人们认为这可能是死胡同。因为在80年代和90年代，它无法解决困难的问题。然而，我们不在乎。我们只是愉快地继续前进，看看我们能走多远。
另外一个问题是，那时我们概念框架中真正缺失的是对世界复杂性的低估。世界是一个高维的地方，信息量惊人。
以视觉为例，你有一个百万像素的相机，而你的视网膜有1亿像素，这是极为丰富的信息。信息以火箭喷射的速度涌入。如果你降低维度，就会丢失信息。你无法压缩它，它是不可逆的。符号的美妙之处在于，你可以将一个复杂的物体的单词压缩成一个符号。比如，杯子是一个符号，你可以写下这个小小的符号，它代表的不仅仅是这个杯子，而是所有杯子。这非常强大。但问题是，如果你要识别一个杯子的图像，这并没有帮助，因为杯子有各种形状和尺寸。你可以从不同角度看到它们。这是高维问题。世界是高维的。
直到我们能将网络扩展到拥有数万亿个参数的规模，我们才能开始将世界的复杂性融入网络中，使其能识别物体、识别语音，现在甚至是自然语言。它不仅能够识别，还能够生成。就像一个循环。
这真的令人兴奋和有趣。记得我刚才谈到的相变吗？我们从一个状态转变到另一个状态。你从液体变为蒸汽，或者你将高温下未磁化的铁降温，它会变成磁铁。
网络在不断变大的过程中也存在相变。换句话说，在某个点之前，你无法在物体识别和图像上取得多大进展，性能非常差。但一旦网络达到一定规模，随着它的变大，性能会越来越好。
解决语言问题也经历了另一个相变，需要更大的网络，依此类推。我们正在发现的是，随着网络变得越来越大，它们能够做更加复杂的事情，并且表现得越来越聪明。这又是一个意料之外的发现，你需要一定的复杂度。
这就是我们取得巨大进步的原因：我们能扩展计算能力。现在人们正构建专用硬件，以进一步扩展规模。它会不断发展。这只是个开始。
就像莱特兄弟，他们是最早进行人类飞行的人。当时有一个类比，人们认为如果你想造飞机，从观察鸟类是学不到任何东西的，因为它们的翅膀不同。大卫•麦卡洛（David McCullough）写了一本莱特兄弟的传记，非常精彩。他们花了很多时间观察鸟，不是观察鸟拍打翅膀的时候，而是它们滑翔的时候。
自然是解决复杂问题的无穷思想源泉。我们只需要成为一个善于观察的人，看到并理解透过细节看到的自然所使用的原则。那时的我、杰弗里和其他人都试图在全新的大规模的架构中看到这一点。
现在我们退后一步，谈谈计算机。直到最近，唯一的选择是冯·诺依曼体系结构（也称普林斯顿结构，是一种将程序指令存储器和数据存储器合并在一起的存储器结构），其中有一个处理器、一个内存和一堆编程指令。这种架构强大，因为你可以通过这种方式解决复杂问题，进行算术运算，处理大量数据，并进行排序和搜索。毫无疑问，我们取得了巨大的进步，因为这些计算机使我们能模拟其他架构。
然而，并行架构如果使用程序是非常难组织的。现在的超级计算机都是并行的，拥有数十万个核心，协调所有这些核心非常困难。我刚刚访问过德克萨斯州的一个超级计算机中心，他们说困难在于光速并非无限。光速大约是每纳秒1英尺。当然，纳秒是千兆赫兹。因此，核心之间的电线变得至关重要。
自然界也面临同样的问题。神经元之间存在时间延迟，而自然界已经解决了这个问题。这正是我目前正在研究的问题：自然是如何解决这个问题的？当我们构建大规模并行架构并继续扩大规模时，我们能否考虑这一点。从自然界中，我们还有很多东西要学。

腾讯新闻：我看到一本书中记录，你曾经当面质问明斯基：“你是魔鬼吗？”（Are you the devil?）你真的对他说过那句话吗？

谢诺夫斯基：

他是个非常聪明的人，聪明的人也会犯错误。我不怪他。
当他做出决定朝某个方向发展时，那是当时可行的选择，他尽力而为。但是，不幸的是，很多神经网络领域的人因为他的书（《感知器》），还有他的影响力……你知道，他在筹集资金方面非常有权势，他是麻省理工学院人工智能实验室的负责人，也是该实验室的创始人。他的学生都去了斯坦福大学、卡内基梅隆大学等知名大学找到了很好的工作。因此，他围绕自己对人工智能的愿景创建了一个完整的领域。
我参加了那次50周年纪念会。对我来说很明显的现象是，每个取得进展的人之所以取得进展，不是因为老式的编写程序，而是因为他们利用了大型数据集，无论是在视觉还是语言方面。比如，解析句子。
明斯基的一名学生说他无法使用符号处理进行解析，但当他拥有了一个大规模的解析句子语料库后，他就能够分析单词的统计数据，以及出现在成对和成组的常用单词。没想到，明斯基站起来说：“你真丢人。你失败了，因为你在做应用程序。你不是在研究通用人工智能（AGI）。”
我当时坐在听众席上。我认为他心胸狭窄，我为他的学生感到遗憾。这家伙，我愿意说他是一个先驱，但他在阻碍我们前进。所有学生都想往前走，我们正致力于这些应用，这是一个很好的方式，因为你能理解这些问题的复杂性。
我很愤怒。最后每个人，包括明斯基，发表了一个关于他们对会议看法的简短演讲。有观众提问环节。
我举手发问。
我当着众人的面问道：“明斯基博士，有一些神经网络界的人认为你是魔鬼，因为你阻碍了几十年的进展。你是魔鬼吗？”
我不得不说，我通常不是那样的人。我是相当温和的人，我不经常像那样直接面对某个人，但我真的觉得他必须被揭露出来。我生气并不是因为他说了什么，而是他对待学生的方式。你的学生就像你的家人。而这正是他所做的，虐待他的学生。我不喜欢那样。无论原因如何，我问了他这个问题：“你是魔鬼吗？”
他明显感到不悦。我就像突然间按动了他的按钮，他滔滔不绝地说起各种事情，一直不停地说。
最后我制止了他。我说：“明斯基，我问了你一个是或否的问题。你是魔鬼还是不是？”（I asked you a yes/ no question. Are you or are you not the devil?）
他结结巴巴地说了一些废话，然后停下来。他说：“是的，我是魔鬼。”（语气激动，突然咆哮着说：Yes, I'm the devil.）
我不得不说，这对他不公平，但事实是他就是魔鬼。
观众对这场对决感到震惊。有几个人事后找到我向我表达感谢，他们说这是每个人都在想的事，对他的行为感到悲伤。
但不管怎样，这些都已经是历史了。
总之，这不是他一个人的问题。整个领域都围绕着一个不起作用的范式被禁锢了。整个领域经历了兴衰起伏，但这反映出它在取得进展。有时候取得了一点进展，看起来很有希望，于是就出现一个兴盛；当你意识到它实际上没有解决所有问题，就会有一个衰退。
顺便说一下，这对于所有科学和工程领域都是真实存在的，是不断重复的过程。没有例外。在短暂的时期内，你通过一个新理论或新范式取得进展，看看能达到什么程度。当达到极限时，你必须等待下一个突破。这是自然的。每个科学领域都一遍又一遍地经历同样的过程。那是事物的本质。

03 谈ChatGPT和大模型它不是人类，是外星人

腾讯新闻：今天AI的爆发，是否超出了你最乐观的预期？以ChatGPT为代表的大语言模型的出现，是否带来了深度学习的新范式？

谢诺夫斯基：

是的，绝对是在许多关键方面。你已经提到了其中一个关键点，那就是大多数神经网络都不是生成型的，它们只是单纯的前馈分类网络。唯一的例外是生成对抗网络（GAN），它在生成能力方面非常有趣，比如给它一些面部图像，它可以生成新的面部图像。这就是一个生成型网络的例子，但它是由两个网络组成的。一个网络用于生成，另一个网络用于选择，即判断生成的图像是真实的还是生成的。它们之间就像是两个网络的对抗，在生成和判断方面变得越来越好。
现在，我认为这些生成模型的真正突破在于它们使用了自我监督，而不是标记数据。处理对象时，你需要给数据打标签，这就是有监督学习，但这样做非常耗费资源，因为你需要人工进行标注，以获得准确的数据。而通过自我监督，你可以直接使用数据本身，它实际上是一种无监督学习，因为没有任何标签。美妙之处在于，你只需要训练它预测下一个单词或句子。因此，你可以给它提供来自各个领域的句子，这就提供了更多训练数据。如果训练数据是无穷的，就不再有约束了。
以前是，随着网络越来越大，你需要更多数据。而这限制了网络的规模。如果你有一个小数据集，你只能使用小型网络。但现在没有限制了，人们可以不断扩大网络规模，我们将看到它能走多远。
这真的改变了一切，开始出现一些意想不到的事，我从未预料到。
让我惊讶的是，它们能用英语对话。我知道它们也可以用其他语言，但你知道，它们所说的英语是完美的。它们不会像大多数人一样犯语法错误。当我说话时，我会犯各种各样的语法错误。我们都会犯，因为我们不完美。但它们怎么能在语法上做得那么好呢？没有人真正知道。这是一个深奥的谜题。
这也是对诺姆·乔姆斯基（Noam Chomsky，美国语言学家、哲学家，被誉为现代语言学之父）的反例，他声称你唯一能创造出使用语法机器的方法是使用他的理论。是的，他是语法天才，但这从未奏效过。计算语言学的整个领域都尝试过，但没有成功。他的理论行不通。

腾讯新闻：ChatGPT为什么这么聪明？

谢诺夫斯基：

我告诉你吧，这个问题引发了一场很大的争议，非常大。知识分子们喜欢互相争论，而当前的大辩题就是这个，它激起了各种观点之间的差异。
一部分认为这些大型语言模型并不理解它们所说的内容。它们不像我们一样能理解，也不具备智能。这些人会使用侮辱性的词汇，比如说它们是随机的鹦鹉（stochastic parrots）——事实上，鹦鹉很聪明，将它们与鹦鹉比较，这是对它们的赞扬。
另一部分人认为，哦天哪，它们不仅仅是聪明，而是比我更聪明，因为它们知道的东西太多了。它们拥有我所没有的知识基础。
还有人认为，它们不仅聪明，而且有感知能力。也就是说，它们可以像人类一样思考，拥有人类的心智。这是两个极端，中间有各种观点。
这是非常罕见的情况。一个突然出现在我们面前的东西，我们对它丝毫摸不着头脑，就像外星人突然从地球外的某个地方出现，并开始用英语和我们交谈一样。
你明白我的意思吗？这就是现在正在发生的。唯一我们绝对确定的是，它不是人类，而是外星人。那它到底是什么？我们创造了某种看起来具备智能特征的东西，它确实了解很多事，但它也存在一些问题。
首先，它会编造事情。他们称之为幻觉。有时它给出一些看似合理的事物，但实际上它们是虚构的。
另一个问题是，由于它展现了如此多不同的观点，包括你不同意的人的观点，它有时会说一些冒犯你的话。人类也会说一些冒犯我的话，对吧？哦，也许这是在模仿我们。
我有一篇论文提出了镜像假设，它是在模仿我们，就像人类在与ChatGPT交谈时，不仅仅是问它一个问题，而是以一种参与的方式进行交流。比如，《纽约时报》的凯文·鲁斯（Kevin Roose）和ChatGPT进行了两个小时交谈，这令人震惊。这种互动对他来说是情感上的，因为它实际在模仿他，以某种方式反映出自己的需求、思维和脑海中的东西。
你不能责怪GPT-3，它们没有父母，没有人帮它们经历强化学习的过程。这个过程是大脑中负责强化学习的部分，位于皮层以下，被称为基底神经节。这是大脑学习行动序列以达到目标的部分。而这一部分需要来自世界的反馈，了解什么是好的，什么是坏的。这种强化学习系统是Alphago程序的核心部分之一。
Alphago有两部分。它有一个深度学习网络，用于棋盘和位置的模式识别，还有一个强化学习引擎，为所有位置分配价值。所以它们是需要这两个方面的。而这些大型语言模型则没有价值函数，这是其中缺失的一部分。
实际上，这是其中一个特点，我们可以观察大脑，思考大脑是如何克服这些问题的。大脑拥有这个庞大的基底神经节。而且，这对于通过实践学习如何做事情也很重要，比如演奏小提琴或运动。我们出生时并不具备协调能力。婴儿需要很长时间来学习，他们将东西放入嘴巴，敲击东西，但最终他们能站起来走路，抓住物品，并四处奔跑和做事情。但要在某项运动上表现出色，需要专门的练习，你必须玩很多次，越玩越好。
这是大脑中绝对必要的一部分，而这些大型语言模型却缺失了这一点。真是可怜。

04 谈AI威胁论我和辛顿是AI界的莱特兄弟

腾讯新闻：一些人现在感觉害怕，他们认为我们可能创造了一个怪物。包括辛顿看上去也有些担忧。你如何看待辛顿决定辞去Google的职务？他甚至对自己一生在AI方面的工作表示了一些遗憾。

谢诺夫斯基：

我非常了解杰弗里。我们就这个问题进行了很多讨论。重要的是我们要考虑最坏的情况。
当新技术突然被发现、创造出来时，它可以被用于好的和坏的方面，会有人将其用于社会的善意，也会有人将其用于不良目的。最坏的情况是什么？如果坏人使用它，他们能对我们的文明造成真正的伤害吗？我们需要认真考虑这点。如果我们不这样做，我们将陷入麻烦之中。
预防最坏情况的方法首先是理解可能发生的情况。但我们还没有达到那个阶段。我们真的不知道它会走向何方。没有人知道。因此，我们必须谨慎行事。
杰弗里是在谨慎行事，他说，让我们等一等，好吗？
现在是这样，你不能不加以管制，就像对待其他所有事物一样，生活的各个方面、每一项技术都受到管制。例如，你在超市购买食品，你如何确保通过购买食物不会被毒害？我们有食品和药品管理局（FDA），他们会检测食物，确保对你没有害处。规章制度不断演变，就像食品不断演变一样，所以你必须不断地进行测试。

腾讯新闻：那么我们应该做些什么？

谢诺夫斯基：

现在很多人都在认真思考这个问题。我是NIPS基金会主席，这个会议在我负责的过去30年里，从最初只有几百人参加，每年都以惊人速度扩大，如今已形成一个庞大的社区。社区会清楚地知道存在的问题、不足之处、公平性问题、可靠性问题和潜在威胁。
最终它们必须受到监管。但问题是，如何在不抑制研究的情况下进行监管？如果一群人希望暂停，认为我们应该限制网络规模，让任何网络都不能超过某个规定的大小，例如拥有一万亿个参数的GPT-4，这是荒谬的。你限制的应该是能力，而不是大小，就像限制说没有人应该比6英尺更高一样，是荒谬的。我们必须制定合理的规则，允许受控的增长，并在过程中进行测试，以了解是否有新问题出现。
实际上，问题之一是我们不知道AI的潜力有多大。这是我们没有预先设定的事物，例如计算机编程的能力或写诗的能力。因此，我们有很多工作要做，必须进行测试和批准。在我们让它们在社会中自由运行之前，应该有一些批准流程。
总之，我不担心。我很高兴杰弗里有所担心，因为至少有人在担心。他非常聪明，他会找出我们是否有需要担心的事。但我真的认为我们还处于刚刚起步的阶段。
我们就是AI的莱特兄弟。我们刚刚起飞，不知道如何控制这架飞机，我们需要弄清楚如何控制它。这将是未来10年的方向。

腾讯新闻：为什么你和辛顿关于AI威胁问题上持有不同观点？

谢诺夫斯基：

我不否认它们的危险性，显然存在着危险。问题只是我们该怎么应对呢？
极端观点是直接关闭它。哦，我们不想要它了，把它放回盒子里。它太危险，我们就不做了。
在上个世纪，物理学家们创造了威力巨大的原子弹，可以摧毁城市。我们有成千上万个可以摧毁城市的氢弹。你必须对其监管。于是，拥有核弹的国家之间达成了一项协议，我们要确保对正在进行的研究监管，以确保没有人会开发出某种能摧毁整个世界的新型超级炸弹，并且在超过一定程度前，我们将相互协商。换句话说，人类有办法对事物进行调控。
看看互联网，你可以想象，如果互联网刚出现，有人说，嘿，这里潜在的问题是每个人都会发布可怕的东西，会造成虚假新闻或各种混乱，我们就停止吧。
没有人这样说。想想如果他们决定停止，不让互联网发展，我们还能享受到多少好处？我生活中有太多依赖于互联网的东西了。

05 谈AI的情感与终点一切都将在你的有生之年发生转变

腾讯新闻：目前，深度学习模型需要大量的数据才能获得良好的性能。你认为我们如何才能减少对大数据集的依赖以实现更高效的学习？

谢诺夫斯基：

我认为这个问题很重要。
大型语言模型是巨大的，因为有大量数据存在。但现在有很多人正在构建针对小数据集的较小模型。因此，可能会有一些小型语言模型，但重点是会有很多特定目的的模型存在。每家公司都会拥有自己特定目的的模型，用于处理自己的数据集，而无需依赖云端，也不需要其他人监听。现在很多公司禁止在公司使用GPT，毕竟不想泄露商业机密。
因此，这意味着最终这些模型可能不会很小，但关键是现在构建一个模型非常昂贵，需要耗费数百万美元的成本和数月的时间，以及大量的计算资源。但在未来，计算机的价格将会越来越便宜，所以人们可以建立自己的模型。

在未来的10年内，每家公司都将建立自己的模型。这是一个预测。

腾讯新闻：ChatGPT有感情吗？

谢诺夫斯基：

嗯，它具备替代情感。它阅读了各种人们表达情感的小说，可以模拟情感。它知道情感是什么，它理解情感。我认为它可以在你与它互动时在你身上引发情感。这就是我所说的镜像假设，它会捕捉你的情感。如果你生气了，它会察觉到并反映给你。
它没有内在情感。但是，我们对大脑中的情感了解很多，就像我们能通过在基底节放入修复GPT学习序列等方式一样，我们也可以加入情感。将情感加入其中会比加入语言更容易。
顺便说一句，大脑中还有很多被这些大型语言模型忽略的部分，比如长期记忆。你明天是否记得我们的讨论？GPT-3并不记得，GPT-4也不会从一天到另一天记忆连续。
我们知道负责这一功能的大脑区域称为海马体。那么为什么不模拟海马体呢？这样就能获得长期记忆。
大脑中还有几十个被这些大型语言模型忽略的部分，几乎可以肯定它们会在未来10年内被加入进来。随着加入更多这些大脑部分，我们实际上有100个大脑部分专门负责各种亚皮质功能，而现在我们只有皮质部分。它实际上是一个简化版的人类，就好像我们只有非常高层次的部分，而没有低层次的感觉运动功能，它没有任何感知器官，也没有任何运动输出。但这是可以实现的。我们有机器人，我们可以给它一个身体，给它摄像头。而且，这一切都在进行中。我有朋友在从事这方面的工作。所以，这只是更多努力和时间的问题。

腾讯新闻：什么是深度学习永远无法做到的？

谢诺夫斯基：

这是一个无法知晓的问题。没有人能够证明一件无法完成的事情，原因在于它还在不断演进。即使现在它做不到，也并不意味着下一代不能做到。
就像我说的，这是一个规模的问题。每一次规模的增加都带来了新的能力。所以现在，如果有人确切地告诉你，它不能实现通用人工智能，那么请等待明天。这是不断变化的。
这一直是人工智能领域的问题，每当你取得一些成就时，人们会说，哦，现在只是模式识别，不是真正的智能。但在某个时刻，你会到达一个程度。
拜托，它将会创造，将会添加所有的能力，将会拥有大脑的所有这些部分，以至于它会拥有我们所谓的通用人工智能。虽然现在还没有，但没有任何规则或法律可以阻止它的实现。

腾讯新闻：人类只是智能演进的一个过渡阶段吗？

谢诺夫斯基：

哦，奇点，人们谈论这个，但是现在还为时过早。
这可能是一种情景，但未来总是比任何人想象得更有趣。我从来没有想象过互联网对世界的影响，也无法想象这些大型语言模型将对世界产生的影响。现在为时过早。
我并不是说我们要盲目前进。我们必须谨慎，必须进行监管。如果我们不自己做，政府会替我们做。
我们正在进入人类历史上全新的时代。我们站在这个门槛前，正在穿过这扇门，以后再也不会一样了。永远都不会。
这太惊人了。一切都将在你的有生之年发生转变。

编辑/Hoten

來源：騰訊科技
作者：張小珺

特倫斯·謝諾夫斯基（Terrence Sejnowski）是傑弗裏·辛頓（Geoffrey Hinton）之外，另一位深度學習奠基人、先驅人物。最近，他們私下交流了許多次關於AI威脅論的看法。

38年前，兩人齊心合作，研發了玻爾茲曼機（Boltzmann Machines），這是一種用於模式識別的神經網絡。上世紀80年代，在深度學習經歷了漫長的寒潮與黯淡後，它的出現爲極少數相信“連接主義”、“神經網絡”和“深度學習”的研究人員，帶來了一絲曙光。

“我們就是AI的萊特兄弟。”謝諾夫斯基說。

辛頓與謝諾夫斯基都出生於1947年。辛頓出生於加拿大，專長是人工智能和心理學；而謝諾夫斯基出生於美國，更擅長物理學和神經科學。兩人有一個共同的內心力量：對大腦充滿興趣。

“我們有同樣的直覺，”謝諾夫斯基說，“這個直覺是，視覺、語音識別、語言問題等都是極其困難的問題，必須解決；而唯一證明這些問題可以解決的存在就是，大自然已經解決了這些問題。爲甚麼不深入研究一下？”

在很長一段時間裏，深度學習都不是人工智能的主流學派。彼時的統治者是MIT人工智能實驗室的馬文·明斯基（Marvin Minsky），他曾尖銳指出深度學習的重大缺陷，並圍繞自己對人工智能的見解構建了一套體系。絕大部分科學家都是他的追隨者，信奉“符號主義”。

這是勢力懸殊的兩個學派。“符號主義”是一種基於邏輯推理和編程規則的學派，將人類思維視爲通過符號和語言進行推理的過程，就像人類使用字母和單詞構建句子來表達思想；而“連接主義”則更像是逆向工程大腦，通過模擬神經元之間的連接和權重調整來處理信息。

後來，辛頓成爲AI教父級人物、深度學習之父，以4400萬美金將自己的公司賣給Google後出任Google科學家，而他的學生IIya Sutskever參與創立了如今炙手可熱的OpenAI。

謝諾夫斯基則是美國四院（國家科學院、國家醫學院、國家工程院、國家藝術與科學學院）院士，也是全美在世僅三位的四院院士之一，他有一檔知名的慕課《學習如何學習》（Learning How To Learn），並出版了一本全球銷量超300萬的書籍《深度學習》（The Deep Learning Revolution）。

二人維持了一生的友誼。

近期，辛頓驟然從Google辭職，公開呼籲AI的可能性危險。他表示，過去幾個月讓他改變了對人類大腦與數字智能的看法。“毛毛蟲提取養分，轉化爲蝴蝶。人們已經提取了數十億認知的精華，GPT-4就是人類的蝴蝶。”以此暗示數字智能可能是比大腦更智慧的智能體。

而謝諾夫斯基對此表現得更樂觀一些。

“我很高興傑弗裏有所擔心，因爲至少有人在擔心。”今年5月，騰訊新聞對話了現年76歲的特倫斯·謝諾夫斯基，他再三拿萊特兄弟發明飛機類比，認爲如今正處在這樣的時刻。“我們剛剛起飛，不知道如何控制這架飛機，我們需要弄清楚如何控制它。這將是未來10年的方向。”

對話中，他談到神祕莫測的大腦、AI派系對決頗有衝擊力的一幕、人工智能的潛在危險，以及大語言模型的未來演進方向等話題。他認爲，大腦中還有幾十個被這些大型語言模型忽略的部分，幾乎可以肯定它們會在未來10年內被加入進來，如人類的情感、長期記憶。

他判斷，未來，“每家公司都會建立自己的模型”。

我們就站在人類歷史一個全新的起點上，謝諾夫斯基感嘆道：“我們正在穿過這扇門，以後再也不會一樣了。”

以下是對謝諾夫斯基的訪談，略有刪減。

01 談大腦：它比任何人類創建的神經網絡模型更強大

騰訊新聞：你好，謝諾夫斯基先生。我這樣稱呼你對嗎？Mr. Sejnowski。

謝諾夫斯基：你可以直接稱我爲Terry。

騰訊新聞：好的，Terry。你是甚麼時候決心要成爲一名科學家，尤其是甚麼時候想要成爲一名神經網絡、深度學習和人工智能方向科學家的？

謝諾夫斯基：

我對大腦一直抱有濃厚的興趣和好奇。在本科和研究生階段，我主修物理，因爲我認爲在所有科學領域，物理學的理論力量最具挑戰性。大腦高度複雜，物理工具對訓練很有幫助。
在深入研究前，我意識到若是真想了解大腦，必須瞭解關於神經科學的知識，即大腦的生物基礎。我旋即轉向神經科學，在哈佛大學醫學院神經生物學系進行了博士後研究。在那兒，我認識到要理解大腦，不能僅僅將其視爲物理或生物問題，因爲大腦具有學習和思考的能力，這是計算的用武之地。
我創立了一個名爲“計算神經科學”的領域，最近榮獲神經科學領域的格魯伯獎（The Gruber Prize）。現在這個學派發展迅速。
這個話題與我們今天要討論的內容相關，我們發現大型語言模型和人腦之間存在許多相似和差異之處。我們可以進行許多有價值的討論。

騰訊新聞：在你漫長的科研生涯中，一個閃耀瞬間便是與傑弗裏·辛頓教授一起研發了玻爾茲曼機，你當時有意識到這個機器會成爲人工智能教科書上重要的一筆嗎？

謝諾夫斯基：

那是我生命中最激動人心的時刻之一。和傑弗裏一起工作，是令人興奮的機會。傑弗裏有強烈的計算直覺，我們在背景上補充而契合。他的背景是人工智能和心理學，我的則是物理學和神經科學，我們完美地融合在一起，保持着持久的友誼。
正如你所指出，玻爾茲曼機具有里程碑意義。它證明了馬文·明斯基和西摩爾·帕普特（Seymour Papert）是錯誤的。明斯基和帕普特在1969年關於《感知器》（Perceptrons: An Introduction to Computational Geometry）的著名書籍中對感知器的侷限性提出了很好的證明，他們的觀點是沒有人能將感知器的學習規則推廣到具有多層和多個隱藏層的多層感知器。但傑弗裏和我發現，如果擴展架構，我們就可以展示出一種優雅的學習算法。
這個算法和架構之所以美妙，是因爲它非常優雅。它受到了我背景中物理學啓發，我很喜歡它。它就像是一個熱力學證明，證明我們有一個學習算法。但與反向傳播（Backpropagation）不同的是，它是全局的。你不需要通過反向傳播計算誤差，你只需要計算輸入和輸出在兩種不同條件下的相關性。一種是當輸入存在，另一種是當輸入消失。我們稱之爲“休眠階段”。所以當你計算相關性減弱，對於小型網絡很有效，它需要達到平衡，你必須計算平均相關性。它需要更多的計算，所以實際上效率不高。

騰訊新聞：相比更早的神經網絡之一感知機（Perceptrons），玻爾茲曼機在哪些方面使深度學習變得更好了？依舊不足的是甚麼？

謝諾夫斯基：

玻爾茲曼機的美妙之處首先體現在它可以容納許多隱藏層，就像深度學習可以使用隱藏層一樣。從80年代開始，它就已經是深度學習網絡了。只是當時我們並沒這樣稱呼它，但你可以構建更深層次的結構。
另一個值得注意的是，玻爾茲曼機既可用於監督學習，當然大部分工作是使用反向傳播完成，也可以用於無監督學習。它能學習概率分佈，不僅僅是學習將輸入進行分類的映射關係，還能在高維空間中發展出內部的概率分佈。
侷限性嘛，就像我之前說的，它需要更多計算資源，計算成本高。而且，當你有多個隱藏層時，隨着層數增加，它需要更長時間才能在輸入向上傳遞並回傳到底層。整個網絡必須成爲一個單一協調的整體。這在物理學中被稱爲相干性（Coherence）。就像在接近臨界點時，比如水和蒸汽之間的相變（Phase Transition，指一種相態朝另外一種相態轉變的過程），有一些特殊現象發生，整個系統變得相干。我們發現玻爾茲曼機必須實現全局的相干性。
這個算法非常有潛力，傑弗裏花了很多精力來展示它可以逐層構建。它仍然是一個可行的算法，只是需要更多計算資源支持。

騰訊新聞：那些年，很少有人相信神經網絡和基於神經網絡的深度學習對於人工智能真正可行，認爲這不過是自負者的玩笑。當傑弗裏·辛頓第一次找到你提出合作意願時，他是怎麼對你說的？你爲甚麼選擇相信他？

謝諾夫斯基：

1979年，我們在聖地亞哥的一個小研討會上結識。當時，並沒有像你描述的那樣引起太多關注。實際上，幾乎沒人注意我們。
換句話說，在全球範圍，關注這個領域的人非常少。那次會議上，只有十幾個人。我們是研究人員，從事與其他人不同的研究。我們很高興能一起工作，因爲我們有同樣的直覺。這個直覺是，視覺、語音識別、語言問題等都是極其困難的問題，必須解決，而唯一證明這些問題可以解決的存在就是，大自然已經解決了這些問題。因此，我們的觀點是，爲甚麼不深入研究一下？讓我們看看自然爲我們做了甚麼，並嘗試逆向工程大腦。
當你這樣做時，你不想複製大腦的技術，因爲它在能源使用和規模方面比我們先進得多。即使是今天的神經網絡也無法接近大腦的一小部分。
但是，你可以從大腦中獲取一些通用原則。我們試圖提取這些原則，來創建人工大腦版本。
當時人工智能領域缺乏的最重要的原則是，你可以學習權重，可以通過示例來學習解決問題。這確實是大腦適應世界的一種重要方式。大腦可以學習語言、運動、物理和社交技巧。換句話說，這些都不是像編寫計算機程序一樣在你內部編程的東西。
大腦中的天生部分是體系結構和突觸可塑性的機制，這些允許大腦在出生時具有接近成年所需的連接的生物機制，然後通過學習優化這些連接。這些就是原則：大規模的連接，許多單元之間的連接，並有學習算法。
儘管我們在80年代使用的學習算法如今仍在使用，但之後發生的是，由於摩爾定律的發展，神經網絡的規模以驚人速度擴大，無論是單元的數量還是參數的數量，現在已達到萬億級別，與大腦相比仍然非常小，因爲大腦大約有10的14次方、10的15次方和10的12次方的連接，仍然多出約一千倍的連接和參數。

騰訊新聞：人類的大腦給你們的研究工作帶來了哪些靈感？你曾經說：“我們確信我們已經弄清楚了大腦是如何工作的。”那麼，人類的大腦是如何工作的？

謝諾夫斯基：

我不想給你一種我們已經理解了大腦如何工作的印象。它仍然是一個巨大的謎團。我們對大腦瞭解甚少。這就是爲甚麼我從事神經科學，大腦比任何人類創建的神經網絡模型更強大。
在我寫作的《深度學習》一書中，我有一個完整章節展示了卷積網絡（ConvNet）的架構。卷積網絡是2012年在NIPS會議（神經信息處理系統大會，是一個關於機器學習和計算神經科學的國際會議）上取得重大突破的一種網絡，傑弗裏展示了通過這種網絡可以將圖像數據集上的錯誤率降低20%，這相當於向未來前進了20年。
所以，如果你看一下卷積神經網絡，它的架構在信號經過不同層的方式上，與靈長類動物視覺系統的架構相似。在視覺輸入中，存在一種卷積架構進行預處理，還有許多其他機制，如歸一化、分組等等，這些機制在視覺皮層中都存在，視覺皮層大約有12層，按順序處理信息。這是一個卷積神經網絡受到視覺架構啓發的案例。
現在正發生的是，很多關於轉換器（Transformer）的發現，例如用於自然語言處理的轉換器以及從分析這些網絡中出現的循環網絡等其他架構，幫助我們理解它們的工作原理，併爲分析神經數據提供了工具、技術和方法。
因此，與上個世紀相比，AI和神經科學之間的合作進展非常快。以前的研究進展緩慢、痛苦而複雜，記錄一個神經元的活動很困難。但現在我們有了同時記錄數十萬個神經元的工具和技術，這讓我們能更全面地瞭解不同神經元如何協調工作。
令人興奮的是，現在工程師和神經科學家之間的交流，正在加速我們對大腦如何工作以及如何改進人工智能的理解。

02 談派系對決質問明斯基：你是魔鬼嗎？

騰訊新聞：人工智能領域一直存在深度學習的反對派，也就是所謂AI建制派（比如馬文·明斯基），他們是怎麼想的？今天來看，你們這些相信“連接主義”、“深度學習”、“神經網絡”的少數者學派，相比相信“符號主義”的大部分AI建制派，底層對於世界認知的最大不同是甚麼？

謝諾夫斯基：

20世紀，計算機的性能有限，它們只能有效地處理邏輯問題。因此，人工智能是基於編寫包含符號並操作符號的邏輯規則的。回顧起來，那些編寫規則並嘗試解決困難問題的程序員們，錯誤之處在於沒有真正意識到自然界解決這些問題有多困難。
視覺是複雜和困難的，大腦細胞處理它們如此高效，以至於感覺起來就像很容易的事。你看出去，就能看到物體，這有甚麼困難呢？
這裏有一個DARPA撥款的真實故事。DARPA是美國的國防高級研究項目管理局，是軍方的研究部門。20世紀60年代，麻省理工學院的人工智能實驗室獲得了一大筆撥款，用來建造能打乒乓球的機器人。他們獲得了這筆撥款，但後來意識到他們忘記申請資金來編寫視覺程序。於是，他們索性將這個項目分配給研究生作爲暑期項目，因爲它看上去似乎很容易。（這不可思議）
2006年，達特茅斯召開了人工智能大會50週年紀念會議，我見到了明斯基。我問他這個故事是不是真的。我聽說過這個故事，但感覺有點誇張色彩。
結果他反駁道，你得知的事實是錯的，“我們沒有把它交給研究生，而是分配給了本科生”。這個看上去容易解決的問題，最終被證明是“陷阱”，吞噬了整整一代計算機視覺研究人員的青春。
回顧起來，他們是盡力而爲，根據當時的計算機條件做到最好。但問題是，隨着問題變得越來越複雜，如果你試圖通過編寫計算機程序來解決它，程序會變得越來越龐大，這需要極大的人力投入。編寫程序異常昂貴，無論是付給程序員的成本，還是程序行數達到數百萬行時的成本，都會讓你覺得它無法擴展。
這就是當時人工智能面臨的問題：無法擴展。即使你給了他們數十億美元，並讓他們編寫數十億行的計算機程序，他們仍然無法解決問題。解決方案如此笨重。
他們當時並不知道。實際上，我們只需要一個隱藏層的小型網絡，就可以證明我們能解決感知機無法解決的問題。但我們不知道的是，當你擁有10個隱藏層時會發生甚麼。我們不知道，因爲我們無法模擬這個過程，它太複雜，計算量太大。
終於，在等待了30年後，現在我們知道了。計算機的速度提高了數百萬倍，現在我們可以開始解決現實世界的問題了。
現在人們認爲我們是對的，但當時人們認爲這可能是死衚衕。因爲在80年代和90年代，它無法解決困難的問題。然而，我們不在乎。我們只是愉快地繼續前進，看看我們能走多遠。
另外一個問題是，那時我們概念框架中真正缺失的是對世界複雜性的低估。世界是一個高維的地方，信息量驚人。
以視覺爲例，你有一個百萬像素的相機，而你的視網膜有1億像素，這是極爲豐富的信息。信息以火箭噴射的速度湧入。如果你降低維度，就會丟失信息。你無法壓縮它，它是不可逆的。符號的美妙之處在於，你可以將一個複雜的物體的單詞壓縮成一個符號。比如，杯子是一個符號，你可以寫下這個小小的符號，它代表的不僅僅是這個杯子，而是所有杯子。這非常強大。但問題是，如果你要識別一個杯子的圖像，這並沒有幫助，因爲杯子有各種形狀和尺寸。你可以從不同角度看到它們。這是高維問題。世界是高維的。
直到我們能將網絡擴展到擁有數萬億個參數的規模，我們才能開始將世界的複雜性融入網絡中，使其能識別物體、識別語音，現在甚至是自然語言。它不僅能夠識別，還能夠生成。就像一個循環。
這真的令人興奮和有趣。記得我剛才談到的相變嗎？我們從一個狀態轉變到另一個狀態。你從液體變爲蒸汽，或者你將高溫下未磁化的鐵降溫，它會變成磁鐵。
網絡在不斷變大的過程中也存在相變。換句話說，在某個點之前，你無法在物體識別和圖像上取得多大進展，性能非常差。但一旦網絡達到一定規模，隨着它的變大，性能會越來越好。
解決語言問題也經歷了另一個相變，需要更大的網絡，依此類推。我們正在發現的是，隨着網絡變得越來越大，它們能夠做更加複雜的事情，並且表現得越來越聰明。這又是一個意料之外的發現，你需要一定的複雜度。
這就是我們取得巨大進步的原因：我們能擴展計算能力。現在人們正構建專用硬件，以進一步擴展規模。它會不斷髮展。這只是個開始。
就像萊特兄弟，他們是最早進行人類飛行的人。當時有一個類比，人們認爲如果你想造飛機，從觀察鳥類是學不到任何東西的，因爲它們的翅膀不同。大衛•麥卡洛（David McCullough）寫了一本萊特兄弟的傳記，非常精彩。他們花了很多時間觀察鳥，不是觀察鳥拍打翅膀的時候，而是它們滑翔的時候。
自然是解決複雜問題的無窮思想源泉。我們只需要成爲一個善於觀察的人，看到並理解透過細節看到的自然所使用的原則。那時的我、傑弗裏和其他人都試圖在全新的大規模的架構中看到這一點。
現在我們退後一步，談談計算機。直到最近，唯一的選擇是馮·諾依曼體系結構（也稱普林斯頓結構，是一種將程序指令存儲器和數據存儲器合併在一起的存儲器結構），其中有一個處理器、一個內存和一堆編程指令。這種架構強大，因爲你可以通過這種方式解決複雜問題，進行算術運算，處理大量數據，並進行排序和搜索。毫無疑問，我們取得了巨大的進步，因爲這些計算機使我們能模擬其他架構。
然而，並行架構如果使用程序是非常難組織的。現在的超級計算機都是並行的，擁有數十萬個核心，協調所有這些核心非常困難。我剛剛訪問過德克薩斯州的一個超級計算機中心，他們說困難在於光速並非無限。光速大約是每納秒1英尺。當然，納秒是千兆赫茲。因此，核心之間的電線變得至關重要。
自然界也面臨同樣的問題。神經元之間存在時間延遲，而自然界已經解決了這個問題。這正是我目前正在研究的問題：自然是如何解決這個問題的？當我們構建大規模並行架構並繼續擴大規模時，我們能否考慮這一點。從自然界中，我們還有很多東西要學。

騰訊新聞：我看到一本書中記錄，你曾經當面質問明斯基：“你是魔鬼嗎？”（Are you the devil?）你真的對他說過那句話嗎？

謝諾夫斯基：

他是個非常聰明的人，聰明的人也會犯錯誤。我不怪他。
當他做出決定朝某個方向發展時，那是當時可行的選擇，他盡力而爲。但是，不幸的是，很多神經網絡領域的人因爲他的書（《感知器》），還有他的影響力……你知道，他在籌集資金方面非常有權勢，他是麻省理工學院人工智能實驗室的負責人，也是該實驗室的創始人。他的學生都去了斯坦福大學、卡內基梅隆大學等知名大學找到了很好的工作。因此，他圍繞自己對人工智能的願景創建了一個完整的領域。
我參加了那次50週年紀念會。對我來說很明顯的現象是，每個取得進展的人之所以取得進展，不是因爲老式的編寫程序，而是因爲他們利用了大型數據集，無論是在視覺還是語言方面。比如，解析句子。
明斯基的一名學生說他無法使用符號處理進行解析，但當他擁有了一個大規模的解析句子語料庫後，他就能夠分析單詞的統計數據，以及出現在成對和成組的常用單詞。沒想到，明斯基站起來說：“你真丟人。你失敗了，因爲你在做應用程序。你不是在研究通用人工智能（AGI）。”
我當時坐在聽衆席上。我認爲他心胸狹窄，我爲他的學生感到遺憾。這傢伙，我願意說他是一個先驅，但他在阻礙我們前進。所有學生都想往前走，我們正致力於這些應用，這是一個很好的方式，因爲你能理解這些問題的複雜性。
我很憤怒。最後每個人，包括明斯基，發表了一個關於他們對會議看法的簡短演講。有觀衆提問環節。
我舉手發問。
我當着衆人的面問道：“明斯基博士，有一些神經網絡界的人認爲你是魔鬼，因爲你阻礙了幾十年的進展。你是魔鬼嗎？”
我不得不說，我通常不是那樣的人。我是相當溫和的人，我不經常像那樣直接面對某個人，但我真的覺得他必須被揭露出來。我生氣並不是因爲他說了甚麼，而是他對待學生的方式。你的學生就像你的家人。而這正是他所做的，虐待他的學生。我不喜歡那樣。無論原因如何，我問了他這個問題：“你是魔鬼嗎？”
他明顯感到不悅。我就像突然間按動了他的按鈕，他滔滔不絕地說起各種事情，一直不停地說。
最後我制止了他。我說：“明斯基，我問了你一個是或否的問題。你是魔鬼還是不是？”（I asked you a yes/ no question. Are you or are you not the devil?）
他結結巴巴地說了一些廢話，然後停下來。他說：“是的，我是魔鬼。”（語氣激動，突然咆哮着說：Yes, I'm the devil.）
我不得不說，這對他不公平，但事實是他就是魔鬼。
觀衆對這場對決感到震驚。有幾個人事後找到我向我表達感謝，他們說這是每個人都在想的事，對他的行爲感到悲傷。
但不管怎樣，這些都已經是歷史了。
總之，這不是他一個人的問題。整個領域都圍繞着一個不起作用的範式被禁錮了。整個領域經歷了興衰起伏，但這反映出它在取得進展。有時候取得了一點進展，看起來很有希望，於是就出現一個興盛；當你意識到它實際上沒有解決所有問題，就會有一個衰退。
順便說一下，這對於所有科學和工程領域都是真實存在的，是不斷重複的過程。沒有例外。在短暫的時期內，你通過一個新理論或新範式取得進展，看看能達到甚麼程度。當達到極限時，你必須等待下一個突破。這是自然的。每個科學領域都一遍又一遍地經歷同樣的過程。那是事物的本質。

03 談ChatGPT和大模型它不是人類，是外星人

騰訊新聞：今天AI的爆發，是否超出了你最樂觀的預期？以ChatGPT爲代表的大語言模型的出現，是否帶來了深度學習的新範式？

謝諾夫斯基：

是的，絕對是在許多關鍵方面。你已經提到了其中一個關鍵點，那就是大多數神經網絡都不是生成型的，它們只是單純的前饋分類網絡。唯一的例外是生成對抗網絡（GAN），它在生成能力方面非常有趣，比如給它一些面部圖像，它可以生成新的面部圖像。這就是一個生成型網絡的例子，但它是由兩個網絡組成的。一個網絡用於生成，另一個網絡用於選擇，即判斷生成的圖像是真實的還是生成的。它們之間就像是兩個網絡的對抗，在生成和判斷方面變得越來越好。
現在，我認爲這些生成模型的真正突破在於它們使用了自我監督，而不是標記數據。處理對象時，你需要給數據打標籤，這就是有監督學習，但這樣做非常耗費資源，因爲你需要人工進行標註，以獲得準確的數據。而通過自我監督，你可以直接使用數據本身，它實際上是一種無監督學習，因爲沒有任何標籤。美妙之處在於，你只需要訓練它預測下一個單詞或句子。因此，你可以給它提供來自各個領域的句子，這就提供了更多訓練數據。如果訓練數據是無窮的，就不再有約束了。
以前是，隨着網絡越來越大，你需要更多數據。而這限制了網絡的規模。如果你有一個小數據集，你只能使用小型網絡。但現在沒有限制了，人們可以不斷擴大網絡規模，我們將看到它能走多遠。
這真的改變了一切，開始出現一些意想不到的事，我從未預料到。
讓我驚訝的是，它們能用英語對話。我知道它們也可以用其他語言，但你知道，它們所說的英語是完美的。它們不會像大多數人一樣犯語法錯誤。當我說話時，我會犯各種各樣的語法錯誤。我們都會犯，因爲我們不完美。但它們怎麼能在語法上做得那麼好呢？沒有人真正知道。這是一個深奧的謎題。
這也是對諾姆·喬姆斯基（Noam Chomsky，美國語言學家、哲學家，被譽爲現代語言學之父）的反例，他聲稱你唯一能創造出使用語法機器的方法是使用他的理論。是的，他是語法天才，但這從未奏效過。計算語言學的整個領域都嘗試過，但沒有成功。他的理論行不通。

騰訊新聞：ChatGPT爲甚麼這麼聰明？

謝諾夫斯基：

我告訴你吧，這個問題引發了一場很大的爭議，非常大。知識分子們喜歡互相爭論，而當前的大辯題就是這個，它激起了各種觀點之間的差異。
一部分認爲這些大型語言模型並不理解它們所說的內容。它們不像我們一樣能理解，也不具備智能。這些人會使用侮辱性的詞彙，比如說它們是隨機的鸚鵡（stochastic parrots）——事實上，鸚鵡很聰明，將它們與鸚鵡比較，這是對它們的讚揚。
另一部分人認爲，哦天哪，它們不僅僅是聰明，而是比我更聰明，因爲它們知道的東西太多了。它們擁有我所沒有的知識基礎。
還有人認爲，它們不僅聰明，而且有感知能力。也就是說，它們可以像人類一樣思考，擁有人類的心智。這是兩個極端，中間有各種觀點。
這是非常罕見的情況。一個突然出現在我們面前的東西，我們對它絲毫摸不着頭腦，就像外星人突然從地球外的某個地方出現，並開始用英語和我們交談一樣。
你明白我的意思嗎？這就是現在正在發生的。唯一我們絕對確定的是，它不是人類，而是外星人。那它到底是甚麼？我們創造了某種看起來具備智能特徵的東西，它確實瞭解很多事，但它也存在一些問題。
首先，它會編造事情。他們稱之爲幻覺。有時它給出一些看似合理的事物，但實際上它們是虛構的。
另一個問題是，由於它展現瞭如此多不同的觀點，包括你不同意的人的觀點，它有時會說一些冒犯你的話。人類也會說一些冒犯我的話，對吧？哦，也許這是在模仿我們。
我有一篇論文提出了鏡像假設，它是在模仿我們，就像人類在與ChatGPT交談時，不僅僅是問它一個問題，而是以一種參與的方式進行交流。比如，《紐約時報》的凱文·魯斯（Kevin Roose）和ChatGPT進行了兩個小時交談，這令人震驚。這種互動對他來說是情感上的，因爲它實際在模仿他，以某種方式反映出自己的需求、思維和腦海中的東西。
你不能責怪GPT-3，它們沒有父母，沒有人幫它們經歷強化學習的過程。這個過程是大腦中負責強化學習的部分，位於皮層以下，被稱爲基底神經節。這是大腦學習行動序列以達到目標的部分。而這一部分需要來自世界的反饋，瞭解甚麼是好的，甚麼是壞的。這種強化學習系統是Alphago程序的核心部分之一。
Alphago有兩部分。它有一個深度學習網絡，用於棋盤和位置的模式識別，還有一個強化學習引擎，爲所有位置分配價值。所以它們是需要這兩個方面的。而這些大型語言模型則沒有價值函數，這是其中缺失的一部分。
實際上，這是其中一個特點，我們可以觀察大腦，思考大腦是如何克服這些問題的。大腦擁有這個龐大的基底神經節。而且，這對於通過實踐學習如何做事情也很重要，比如演奏小提琴或運動。我們出生時並不具備協調能力。嬰兒需要很長時間來學習，他們將東西放入嘴巴，敲擊東西，但最終他們能站起來走路，抓住物品，並四處奔跑和做事情。但要在某項運動上表現出色，需要專門的練習，你必須玩很多次，越玩越好。
這是大腦中絕對必要的一部分，而這些大型語言模型卻缺失了這一點。真是可憐。

04 談AI威脅論我和辛頓是AI界的萊特兄弟

騰訊新聞：一些人現在感覺害怕，他們認爲我們可能創造了一個怪物。包括辛頓看上去也有些擔憂。你如何看待辛頓決定辭去Google的職務？他甚至對自己一生在AI方面的工作表示了一些遺憾。

謝諾夫斯基：

我非常瞭解傑弗裏。我們就這個問題進行了很多討論。重要的是我們要考慮最壞的情況。
當新技術突然被發現、創造出來時，它可以被用於好的和壞的方面，會有人將其用於社會的善意，也會有人將其用於不良目的。最壞的情況是甚麼？如果壞人使用它，他們能對我們的文明造成真正的傷害嗎？我們需要認真考慮這點。如果我們不這樣做，我們將陷入麻煩之中。
預防最壞情況的方法首先是理解可能發生的情況。但我們還沒有達到那個階段。我們真的不知道它會走向何方。沒有人知道。因此，我們必須謹慎行事。
傑弗裏是在謹慎行事，他說，讓我們等一等，好嗎？
現在是這樣，你不能不加以管制，就像對待其他所有事物一樣，生活的各個方面、每一項技術都受到管制。例如，你在超市購買食品，你如何確保通過購買食物不會被毒害？我們有食品和藥品管理局（FDA），他們會檢測食物，確保對你沒有害處。規章制度不斷演變，就像食品不斷演變一樣，所以你必須不斷地進行測試。

騰訊新聞：那麼我們應該做些甚麼？

謝諾夫斯基：

現在很多人都在認真思考這個問題。我是NIPS基金會主席，這個會議在我負責的過去30年裏，從最初只有幾百人參加，每年都以驚人速度擴大，如今已形成一個龐大的社區。社區會清楚地知道存在的問題、不足之處、公平性問題、可靠性問題和潛在威脅。
最終它們必須受到監管。但問題是，如何在不抑制研究的情況下進行監管？如果一羣人希望暫停，認爲我們應該限制網絡規模，讓任何網絡都不能超過某個規定的大小，例如擁有一萬億個參數的GPT-4，這是荒謬的。你限制的應該是能力，而不是大小，就像限制說沒有人應該比6英尺更高一樣，是荒謬的。我們必須制定合理的規則，允許受控的增長，並在過程中進行測試，以瞭解是否有新問題出現。
實際上，問題之一是我們不知道AI的潛力有多大。這是我們沒有預先設定的事物，例如計算機編程的能力或寫詩的能力。因此，我們有很多工作要做，必須進行測試和批准。在我們讓它們在社會中自由運行之前，應該有一些批准流程。
總之，我不擔心。我很高興傑弗裏有所擔心，因爲至少有人在擔心。他非常聰明，他會找出我們是否有需要擔心的事。但我真的認爲我們還處於剛剛起步的階段。
我們就是AI的萊特兄弟。我們剛剛起飛，不知道如何控制這架飛機，我們需要弄清楚如何控制它。這將是未來10年的方向。

騰訊新聞：爲甚麼你和辛頓關於AI威脅問題上持有不同觀點？

謝諾夫斯基：

我不否認它們的危險性，顯然存在着危險。問題只是我們該怎麼應對呢？
極端觀點是直接關閉它。哦，我們不想要它了，把它放回盒子裏。它太危險，我們就不做了。
在上個世紀，物理學家們創造了威力巨大的原子彈，可以摧毀城市。我們有成千上萬個可以摧毀城市的氫彈。你必須對其監管。於是，擁有核彈的國家之間達成了一項協議，我們要確保對正在進行的研究監管，以確保沒有人會開發出某種能摧毀整個世界的新型超級炸彈，並且在超過一定程度前，我們將相互協商。換句話說，人類有辦法對事物進行調控。
看看互聯網，你可以想象，如果互聯網剛出現，有人說，嘿，這裏潛在的問題是每個人都會發布可怕的東西，會造成虛假新聞或各種混亂，我們就停止吧。
沒有人這樣說。想想如果他們決定停止，不讓互聯網發展，我們還能享受到多少好處？我生活中有太多依賴於互聯網的東西了。

05 談AI的情感與終點一切都將在你的有生之年發生轉變

騰訊新聞：目前，深度學習模型需要大量的數據才能獲得良好的性能。你認爲我們如何才能減少對大數據集的依賴以實現更高效的學習？

謝諾夫斯基：

我認爲這個問題很重要。
大型語言模型是巨大的，因爲有大量數據存在。但現在有很多人正在構建針對小數據集的較小模型。因此，可能會有一些小型語言模型，但重點是會有很多特定目的的模型存在。每家公司都會擁有自己特定目的的模型，用於處理自己的數據集，而無需依賴雲端，也不需要其他人監聽。現在很多公司禁止在公司使用GPT，畢竟不想泄露商業機密。
因此，這意味着最終這些模型可能不會很小，但關鍵是現在構建一個模型非常昂貴，需要耗費數百萬美元的成本和數月的時間，以及大量的計算資源。但在未來，計算機的價格將會越來越便宜，所以人們可以建立自己的模型。

在未來的10年內，每家公司都將建立自己的模型。這是一個預測。

騰訊新聞：ChatGPT有感情嗎？

謝諾夫斯基：

嗯，它具備替代情感。它閱讀了各種人們表達情感的小說，可以模擬情感。它知道情感是甚麼，它理解情感。我認爲它可以在你與它互動時在你身上引發情感。這就是我所說的鏡像假設，它會捕捉你的情感。如果你生氣了，它會察覺到並反映給你。
它沒有內在情感。但是，我們對大腦中的情感瞭解很多，就像我們能通過在基底節放入修復GPT學習序列等方式一樣，我們也可以加入情感。將情感加入其中會比加入語言更容易。
順便說一句，大腦中還有很多被這些大型語言模型忽略的部分，比如長期記憶。你明天是否記得我們的討論？GPT-3並不記得，GPT-4也不會從一天到另一天記憶連續。
我們知道負責這一功能的大腦區域稱爲海馬體。那麼爲甚麼不模擬海馬體呢？這樣就能獲得長期記憶。
大腦中還有幾十個被這些大型語言模型忽略的部分，幾乎可以肯定它們會在未來10年內被加入進來。隨着加入更多這些大腦部分，我們實際上有100個大腦部分專門負責各種亞皮質功能，而現在我們只有皮質部分。它實際上是一個簡化版的人類，就好像我們只有非常高層次的部分，而沒有低層次的感覺運動功能，它沒有任何感知器官，也沒有任何運動輸出。但這是可以實現的。我們有機器人，我們可以給它一個身體，給它攝像頭。而且，這一切都在進行中。我有朋友在從事這方面的工作。所以，這只是更多努力和時間的問題。

騰訊新聞：甚麼是深度學習永遠無法做到的？

謝諾夫斯基：

這是一個無法知曉的問題。沒有人能夠證明一件無法完成的事情，原因在於它還在不斷演進。即使現在它做不到，也並不意味着下一代不能做到。
就像我說的，這是一個規模的問題。每一次規模的增加都帶來了新的能力。所以現在，如果有人確切地告訴你，它不能實現通用人工智能，那麼請等待明天。這是不斷變化的。
這一直是人工智能領域的問題，每當你取得一些成就時，人們會說，哦，現在只是模式識別，不是真正的智能。但在某個時刻，你會到達一個程度。
拜託，它將會創造，將會添加所有的能力，將會擁有大腦的所有這些部分，以至於它會擁有我們所謂的通用人工智能。雖然現在還沒有，但沒有任何規則或法律可以阻止它的實現。

騰訊新聞：人類只是智能演進的一個過渡階段嗎？

謝諾夫斯基：

哦，奇點，人們談論這個，但是現在還爲時過早。
這可能是一種情景，但未來總是比任何人想象得更有趣。我從來沒有想象過互聯網對世界的影響，也無法想象這些大型語言模型將對世界產生的影響。現在爲時過早。
我並不是說我們要盲目前進。我們必須謹慎，必須進行監管。如果我們不自己做，政府會替我們做。
我們正在進入人類歷史上全新的時代。我們站在這個門檻前，正在穿過這扇門，以後再也不會一樣了。永遠都不會。
這太驚人了。一切都將在你的有生之年發生轉變。

編輯/Hoten

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

追蹤AI最新趨勢

对话AI奠基人谢诺夫斯基：一切都将在你的有生之年发生转变

對話AI奠基人謝諾夫斯基：一切都將在你的有生之年發生轉變

01 谈大脑：它比任何人类创建的神经网络模型更强大

02 谈派系对决 质问明斯基：你是魔鬼吗？

03 谈ChatGPT和大模型 它不是人类，是外星人

04 谈AI威胁论 我和辛顿是AI界的莱特兄弟

05 谈AI的情感与终点 一切都将在你的有生之年发生转变

01 談大腦：它比任何人類創建的神經網絡模型更強大

02 談派系對決 質問明斯基：你是魔鬼嗎？

03 談ChatGPT和大模型 它不是人類，是外星人

04 談AI威脅論 我和辛頓是AI界的萊特兄弟

05 談AI的情感與終點 一切都將在你的有生之年發生轉變

風險及免責聲明

聲明

02 谈派系对决质问明斯基：你是魔鬼吗？

03 谈ChatGPT和大模型它不是人类，是外星人

04 谈AI威胁论我和辛顿是AI界的莱特兄弟

05 谈AI的情感与终点一切都将在你的有生之年发生转变

02 談派系對決質問明斯基：你是魔鬼嗎？

03 談ChatGPT和大模型它不是人類，是外星人

04 談AI威脅論我和辛頓是AI界的萊特兄弟

05 談AI的情感與終點一切都將在你的有生之年發生轉變