神经网络无法实现可解释 重温三十年前对于 NN AI 的批判 (神经网络无法收敛)

美国东北大学体验式人工智能研究所的高级研究科学家 Walid S. Saba从组合语义的角度出发,提出一个观点:深度学习无法构造一个 可逆的 组合语义,所以它无法实现可解释AI。



可解释AI (XAI)

随着深度神经网络 (DNN) 用于决定贷款批准、工作申请、批准法院保释等与人们利益息息相关或者一些生死攸关的决定(例如在高速公路上突然停车),去解释这些决定,而不仅仅是产生一个预测分数,是至关重要的。

可解释人工智能 (XAI) 的研究最近集中在反事实(counterfactual)例子的概念上。这个想法很简单:首先制造一些有预期输出的反事实样例并输入到原来的网络中;然后,读取隐层单元解释为什么网络会产生一些其他输出。更正式地说:

“返回分数 p 是因为变量 V 具有与其关联的值 (v1, v2, ...)。如果 V 具有值 (v′1 , v′2 , ...),并且所有其他变量保持不变, 分数 p' 会被返回。”

下面则是更加具体的一个例子:

“你被拒绝贷款是因为你的年收入是 30,000 英镑。如果你的收入是 45,000 英镑,你就会获得贷款。”

然而,一篇由Browne 和 Swift提出的论文[1] (以下简称 B&W)最近表明,反事实示例只是稍微更有意义的对抗性示例,这些示例是通过对输入执行小的且不可观察的扰动而产生的,从而导致网络对它们进行错误分类具有很高的自信度。

此外,反事实的例子「解释」了一些特征应该是什么才能得到正确的预测,但「没有打开黑匣子」;也就是说,没有解释算法是如何工作的。文章继续争辩说,反事实的例子并没有为可解释性提供解决方案,并且「没有语义就没有解释」。

事实上,文章甚至提出了更强有力的建议:

1)我们要么找到一种方法来提取假定存在于网络隐藏层中的语义,要么

而Walid S. Saba本人则对(1)持悲观态度,换句话说他遗憾地承认我们的失败,以下是他的理由。




Fodor 和 Pylyshyn 的「鬼魂」

虽然大众完全同意B&W的观点,即“没有语义就没有解释”,但解释深度神经网络中隐藏层表示的语义为深度学习系统产生令人满意的解释的希望之所以不能够实现,作者认为,原因正是出自三十多年前Fodor 和 Pylyshyn [2]中概述的原因。

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

Walid S. Saba接着论证到:在解释问题出在哪里之前,我们需要注意到,纯粹的外延模型(例如神经网络)不能对系统性(systematicity)和组合性(compositionality)进行建模,因为它们不承认具有可再衍生的句法和相应语义的符号结构。

因此,神经网络中的表示并不是真正与任何可解释的事物相对应的“符号”——而是分布的、相关的和连续的数值,它们本身并不意味着任何可以在概念上解释的东西。

用更简单的术语来说,神经网络中的子符号表示本身并不指代人类在概念上可以理解的任何事物(隐藏单元本身不能代表任何形而上学意义的对象)。相反,它是一组隐藏单元,它们通常共同代表一些显着特征(例如,猫的胡须)。

但这正是神经网络无法实现可解释性的原因,即因为几个隐藏特征的组合是不可确定的——一旦组合完成(通过一些线性组合函数),单个单元就会丢失(我们将在下面展示)。




可解释性是“反向推理”

DNN无法逆向推理

作者讨论过为什么 Fodor 和 Pylyshyn 得出的结论是 NN 不能对系统性(因此是可解释的)推论进行建模[2]。

在符号系统中,有定义明确的组合语义函数,它们根据成分的意义计算复合词的意义。但是这种组合是可逆的——

也就是说,人们总是可以得到产生该输出的(输入)组件,并且正是因为在符号系统中,人们可以访问一种“句法结构”,这一结构含有如何组装组件的地图。而这在 NN 中都并非如此。一旦向量(张量)在 NN 中组合,它们的分解就无法确定(向量(包括标量)可以分解的方式是无限的!)

为了说明为什么这是问题的核心,让我们考虑一下 B&W 提出的在 DNN 中提取语义以实现可解释性的建议。B&W 的建议是遵循以下原则:

输入图像被标记为“建筑”,因为通常激活轮毂盖的隐藏神经元 41435 的激活值为 0.32。如果隐藏神经元 41435 的激活值为 0.87,则输入图像将被标记为“汽车”。

要了解为什么这不会导致可解释性,只需注意要求神经元 41435 的激活为 0.87 是不够的。为简单起见,假设神经元 41435 只有两个输入,x1 和 x2。我们现在所拥有的如下图 1 所示:

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

图注:拥有两个输入的单一神经元的输出为0.87

现在假设我们的激活函数 f 是流行的 ReLU 函数,那么可以产生 z = 0.87 的输出。这意味着对于下表中显示的 x1、x2、w1 和 w2 的值,可以得到 0.87 的输出。

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

表注:多种输入方式都可以产生0.87的数值

查看上表,很容易看出 x1、x2、w1 和 w2 的线性组合有无数个,它们会产生输出 0.87。这里的重点是 NN 中的组合性是不可逆的,因此无法从任何神经元或任何神经元集合中捕获有意义的语义。

为了与 B&W 的口号“没有语义就没有解释”保持一致,我们声明永远无法从 NN 获得任何解释。简而言之,没有组合性就没有语义,没有语义就没有解释,DNN 无法对组合性进行建模。这可以形式化如下:

1. 没有语义就没有解释[1]2. 没有可逆的组合性就没有语义[2]

3. DNN 中的组合性是不可逆的[2]

顺便说一句,DNN 中的组合性是不可逆的这一事实除了无法产生可解释的预测之外还有其他后果,尤其是在需要更高层次推理的领域,如自然语言理解 (NLU)。

特别是,这样的系统确实无法解释一个孩子如何仅从 ( ) 之类的模板中学习如何解释无限数量的句子,因为“约翰”、“邻居女孩”、 “总是穿着T恤来这里的男孩”等都是的可能实例化,还有“经典摇滚”、“成名”、“玛丽的奶奶”、“在海滩上跑步”、 等都是 的所有可能的实例。

因为这样的系统没有“记忆”,而且它们的组成不能颠倒,理论上它们需要无数个例子来学习这个简单的结构。【编者注:这一点正好是乔姆斯基对于结构主义语言学的质疑,并由此开启了影响语言学半个多世纪的转化生成语法。】

最后,作者强调,三十多年前Fodor 和 Pylyshyn [2]提出了对 NN 作为认知架构的批评——他们展示了为什么 NN 不能对系统性、生产力和组合性进行建模,所有这些都是谈论任何“语义”所必须的——而这一令人信服的批评从未得到完美的回答。

随着解决人工智能可解释性问题的需求变得至关重要,我们必须重新审视那篇经典论文,因为它显示了将统计模式识别等同于人工智能进步的局限性。

[1] Browne, Kieran, and Ben Swift. "Semantics and explanation: why counterfactual explanations produce adversarial examples in deep neural networks." arXiv preprint arXiv:2012.10076 (2020).
更多内容,点击下方关注:

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI 重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

版权文章,未经授权禁止转载。详情见 转载须知 。

重温三十年前对于 NN 的批判:神经网络无法实现可解释 AI

全局中部横幅
htpasswd在线生成器

站长工具提供htpasswd在线生成器,支持MD5、crypt、SHA、plain多种加密算法生成结果。

多股漆包线

绞合线,丝包线选择东莞市鑫和线材有限公司,我司是专注漆包线生产及销售的厂家,主要产品有漆包绞线,耐高温漆包线,铝漆包线及微细漆包线,麦拉线,uew漆包线,扁平漆包线,PEW漆包线等,多年专业经验,服务过上数十家知名客户,欢迎咨询

邮乐网

邮乐网由中国邮政与TOM集团携手呈现的创新网上购物平台!网购新西兰奶粉、土特产、鞋帽箱包、个人护理、数码、小家电、居家百货、母婴、手机充值全网最低,原产地直销原汁原味,尽在邮乐,为您提供愉悦的网上购物体验.

襄阳市一诺网络科技有限公司

枣阳网站建设,会员软件,异业联盟软件,枣阳小程序

巴氏杀菌机,洗箱机,果蔬清洗机,蔬菜清洗机,洗袋机

诸城市万利源机械科技有限公司拥有先进的机加工中心、全自动焊接中心以及全套的检验设备。主要产品有:全自动解冻流水线,蒸煮漂烫流水线,巴士杀菌冷却流水线等多种规格型号产品,可广泛应用于各种肉制品、水产品,馅料制品、豆制品、奶制品等的加工生产以及农副产品深加工、化工医药的生产等,公司以市场为导向,重视产品结构调整,不断更新和开发新产品。

PUR平贴机,覆膜机,正负压,开料机,PUR包覆机生产厂家

青岛齐力机械有限公司专业生产PUR平贴机,覆膜机,正负压,开料机,PUR包覆机等木工设备.欢迎来电:18661850377厂家直销规格全,质量可靠有保障.青岛齐力机械有限公司做踏实的木工机械生产商供应商.

重庆皮肤病医院

重庆专业皮肤科医院在哪里?重庆迪邦皮肤病医院是重庆白癜风/牛皮癣皮肤病治疗最好专科医院,集临床、诊疗、预防为一体的皮肤病专科医院.致力于治疗白癜风、银屑病等各类皮肤病疾病。咨询热线:400-698-8568

啤酒厂家

十谷啤酒是山东阳春啤酒有限公司旗下主营特色啤酒品牌之一,山东阳春啤酒有限公司是一家有35年酿酒历史的啤酒厂家、啤酒代工厂,也是国内知名精酿原浆啤酒厂家,从啤酒技术研发、原材物料采购、OEM生产加工、啤酒销售等为客户提供一整套的服务方案!

北京史密力维环保科技有限公司

该设备主要由糖化系统、发酵系统、过滤系统、灌装系统、CIP洗涤系统、配电及发酵恒温自控系统、制冷系统等组成。

色差仪

彩谱色差仪品牌是一家提供色彩色差仪,光泽度仪,分光测色仪,雾度仪,高光谱相机,配色软件等颜色检测设备的研发及销售一体的供应厂商,为油漆,涂料,塑料,纺织,油墨,食品等行业领域的行业提供专业的色彩检测设备.

开创手游

开创网是一个推荐分享免费手机游戏下载、热门手机游戏攻略、最新开好玩的手机游戏解读的专业手机游戏平台,每天实时更新手游排行榜。

平潭网

平潭网,平潭国际旅游岛官方新闻网站,全国唯一对台官方新闻网站,由平潭综合实验区党工委主办。作为平潭综合实验区唯一的新闻门户网站,是平潭对外宣传的最重要平台。

全局底部横幅