人工智能并不是我们通常所说的软件,而是一种模拟人类智能的技术。
是的,现在的AI是用软件写的,但今天的实现实际上是一个计算图形,计算虚拟神经元网络的行为。软件仅仅是模拟那个网络。
我来解释。
正如我之前所说,神经网络AI实际上是由相互连接的虚拟“神经元”组成。每个神经元基本上模仿了人类神经元的工作方式。图中以数学的方式展示了典型的AI“神经元”。
如果你学过数学,你大概能看懂这张图。但你只需要知道,就像图中所示的“神经元”一样,是AI系统的基本组成部分,正如神经元在大脑中起着构建模块的作用。
大脑并不完全像一个AI系统。大脑里有胶质细胞和各种化学物质,它们以复杂的方式滋养神经元。AI系统试图模拟被认为是认知所必需的元素,比如神经元及其连接方式。AI领域在这方面的研究还在不断进步。
然而,这样构建的人工智能系统在各种类型和层次的认知上取得了显著的成就。请参见下图所示的人工智能能力的增长情况。
真正的AI系统是这样的,有很多虚拟神经元互相连接。这是我八年前做出来的系统的图。
当我提到我建了这个时,我的意思是我用一个叫TensorFlow的数学工具建了一个它(的模型)。TensorFlow使你能够定义一个所谓的计算图。这就是为什么神经行为是通过模拟来计算的。下图显示我用TensorFlow定义的计算图如下。
这是矩阵运算(Matrix 数学)
这个计算图模型计算矩阵运算,这些运算模拟了我神经网络中虚拟“神经元”的激活函数和输入。
像ChatGPT这样的模型使用的神经网络非常庞大。ChatGPT 3.5 拥有数十亿个模拟神经元,彼此之间有约100亿个连接。结果发现,当他们将连接数增加到大约500亿个连接用于版本4时,出现了智能的涌现——系统变得指数级地更聪明。虽然仍然不如人类聪明,但以它自己的方式聪明:在某些方面比我们聪明,在其他方面则不如我们聪明。
不过,ChatGPT的架构还是很有限的。训练完成后无法继续学习,并且它使用了一种单一的架构——所谓的“变压器”模式。近几年来,已经开发出了更强大和更灵活的架构。
所有这些系统仍然是神经网络的仿真的。它们是在计算机上运行的仿真。它们不是真正的神经网络,就像电子游戏不是真实世界一样。然而,这些仿真给我们正确——有时是错误——的答案,就像真正的神经网络和大脑一样。
另外,这些模拟也非常耗电。因为是模拟,所以效率特别低。计算机的功耗比真正的神经元要高很多。
培训用于训练神经网络的另一种软件是专门用来训练这些网络的软件。有很多不同类型的神经网络,它们每一种都有自己独特的训练方式。下图展示了一种名为“受限玻尔兹曼机”网络的训练算法。这来自于我在2010年代中期学习该主题时读过的一本书。确实,这里面涉及了很多数学——线性代数(矩阵运算)和更高级的统计学。
像ChatGPT这样的网络训练方式不一样。它们采用了所谓的“强化学习”。然而,还是会使用计算机算法来训练它们,利用大量的数据。在这个过程中,AI往往会反复阅读相同的信息,最多四次——就像一个人在准备考试时反复复习一样。
训练过程有点像你从出生到18岁这段时间的成长过程,只不过大大加快了。一旦完成训练,你就可以准备面对世界——差不多就是这个意思。
AI已不再是2022年的样子很多人不知道,他们两年前尝试的AI系统现在都已经很落后了,技术进步得很快。
下图展示的是最近发布的DeepSeek V3架构。DeepSeek让世界为之惊叹,因为它的训练成本低得惊人——比OpenAI的模型低两个数量级。这主要是因为DeepSeek架构的学习效率更高,它更“聪明”。
参见https://epoch.ai/gradient-updates/how-has-deepseek-improved-the-transformer-architecture
另外,如果你使用了像ChatGPT这样的系统,并认为它不擅长推理,你的看法是对的。但仅仅两年内,已经开发出了擅长推理的模型——和人一样擅长推理。
2023年年末,当OpenAI开发了一个推理模型时,科学家们感到警觉,并且与OpenAI董事会会面,警告他们,这个新模型表明他们正朝着开发可能威胁人类的强大人工智能的方向前进。OpenAI的这个模型最初被命名为Q-star,后来改名为“Strawberry”,但现在被命名为“o1”。
所以如果你去年使用了ChatGPT,但没有试过新的推理模型,就把你对AI能做什么的想法先放一边,试一下这些新的推理模型。一年后再来试试看,因为这些模型很快就会取代今年的。
如果我们用了真实神经元会怎样?想想有趣的,如果神经网络想变得像大脑一样,我们用真正的神经元会怎样?
有些公司实际上正在尝试这样做,比如位于澳大利亚的Cortical Labs(这是一家位于澳大利亚的公司)。下面的数据来自他们的实验室。
这里有一些来自Cortical Labs的图。
他们使用由真实活体神经元组成的网络,用电极刺激并接收反应。他们声称这样的生物神经网络比计算机的神经网络表现更好。它们耗电量更小,实际上,它们使用的是化学能,而非电能。
探索神经形态芯片的世界但是人们也在创建非生物的神经网络,这些被称为神经形态系统。你知道吗?它们不仅更快,而且用电量只有生物神经网络的万分之一,体积也小得多。
再说一次,今天的AI之所以只在数据中心运行,是因为我们是在模仿神经网络。如果我们构建真正的神经网络,就不再需要数据中心了。
由于神经形态计算系统不是仿真的系统,所以它们不会运行任何软件程序。
让我再强调一遍:它们不运行任何软件。某种程度上来说,它们就像非生物的大脑。
为什么这些技术没有被大家广泛使用呢?目前最新的AI系统架构与现有神经形态芯片架构之间存在一些不匹配。但是,随着时间的推移,这种不匹配将逐渐解决,因为这种激励非常大:想象一下,使用少量电力就能运行的强大AI系统——使它们变得便携,不再依赖数据中心——像人一样自由移动。
数字化时代落幕了数字化时代已经结束。那是昨天的事了。人工智能不仅仅是一种软件。它现在就像被关在马厩里的赛马一样受限制于软件。但很快,人工智能将不再受限制,能够真正展现其潜力。
AI不是计算机的下一步进化,而是朝向更像大脑的方向发展。
AI时代开始了。