淘客熙熙

主题:对ChatGPT的几点思考 -- 唐家山

共:💬175 🌺1562 🌵7 新:
全看分页树展 · 主题 跟帖
家园 目前已经有学者开始填补人类思考和AI思考之间的gap

高维计算是一个可能的解答。

数学的强大超出你的想象——高维计算,让机器像人脑一样感知世界和类比推理

尽管像ChatGPT这样的大型语言模型取得了显著的成功,但支持这些系统的人工神经网络(ANN)可能存在问题。

首先,人工神经网络非常耗电。其次,它们缺乏透明度,意味着这些系统如此复杂,以至于我们无法真正理解它们是如何工作的,以及为什么它们能如此有效地工作。这种复杂性使得人工神经网络很难通过类比进行推理,而类比推理正是人类的一种思考方式——用符号表示对象、概念及其之间的关系。这表明,当前的人工神经网络可能需要在某些方面进行改进,以解决这些问题。

人工神经网络的不足之处可能主要源于它们的基本结构和构建模块:单个人工神经元(individual artificial neurons)。每个神经元负责接收输入、执行计算并产生输出。现代的ANN是由这些计算单元构成的复杂数字网络,经过训练后可以完成特定任务。

我们的大脑感知自然世界的方式不可能是通过单个神经元来表示不同的信息。例如,我们不会在大脑中有一个专门用来检测紫色大众汽车的神经元。相反,大脑中的信息是由许多神经元的活动共同表示的。这意味着,感知紫色大众汽车的概念不是由一个神经元的活动来表示的,而是由成千上万个神经元的活动共同表示的。当这些神经元以不同的方式激活时,它们可以表示完全不同的概念,例如粉红色的凯迪拉克汽车。这种观点强调了大脑对信息编码的复杂性和多样性。

这是一种高维计算(hyperdimensional computing)。在这种方法中,每个信息片段(例如汽车的概念、品牌、型号或颜色等)都被表示为一个单一实体:高维向量(hyperdimensional vector)。

向量是一个有序的数字数组。以三维向量为例,它包含三个数字:三维空间中一个点的x、y和z坐标。高维向量(也称为超向量)可以是包含10,000个数字的数组,表示在10,000维空间中的一个点。这种方法涉及的数学对象和代数操作非常灵活和强大,有助于现代计算突破当前的局限,并推动一种新的人工智能方法的发展。

这预示着一个全新的计算世界。在这个世界里,计算过程将变得更加高效和稳定,同时,机器所做的决策过程将是完全透明的,使人们能够更好地理解和控制这些决策。

高维计算的优势在于能够通过组合和分解高维向量进行推理。最近的一个例子是2022年3月,IBM苏黎世研究中心的Abbas Rahimi及其同事成功利用高维计算与神经网络解决了抽象视觉推理领域的一个经典问题。这个问题对于普通的人工神经网络,甚至对某些人来说都是一个极具挑战性的问题。这个问题被称为渐进矩阵测试(Raven's Progressive Matrices),其任务是在一个3×3的网格中展示一系列几何图形图像。网格中有一个空白位置。参与者需要从一组候选图像中选择一个最适合填入空白位置的图像。

高维计算的另一个优点是透明性:代数能清晰地解释系统为什么会选择某个答案。然而,传统的神经网络并没有这个特点。Olshausen、Rahimi等人正在开发一种混合系统,该系统中神经网络将物理世界中的事物映射到高维向量,接着高维代数就会接管处理。Olshausen表示,这种方式使得诸如类比推理这类问题变得容易解决。他认为,我们对任何AI系统的期望应该是能够像理解飞机或电视机一样去理解它。

还有一个方向是神经网络的可解释性。贴一篇综述文章吧。

卷积神经网络的可解释性研究综述

神经网络模型性能日益强大, 被广泛应用于解决各类计算机相关任务, 并表现出非常优秀的能力, 但人类对神经网络模型的运行机制却并不完全理解. 针对神经网络可解释性的研究进行了梳理和汇总, 就模型可解释性研究的定义、必要性、分类、评估等方面进行了详细的讨论. 从解释算法的关注点出发, 提出一种神经网络可解释算法的新型分类方法, 为理解神经网络提供一个全新的视角. 根据提出的新型分类方法对当前卷积神经网络的可解释方法进行梳理, 并对不同类别解释算法的特点进行分析和比较. 同时, 介绍了常见可解释算法的评估原则和评估方法. 对可解释神经网络的研究方向与应用进行概述. 就可解释神经网络面临的挑战进行阐述, 并针对这些挑战给出可能的解决方向.

通宝推:桥上,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河