信息瓶颈再解读携手聚焦信息压缩 MIT 理论 IBM (信息瓶颈算法)

文章编号：45569 资讯动态 2024-12-09 信息压缩互信息聚类信息瓶颈理论

深度学习的发展带给人工智能领域的影响可谓是革命性的，然而该领域目前还存在很多未解决的问题，其中就包括不可解释性等问题。而希伯来大学计算机科学家和神经学家Naftali Tishby 等人提出的「信息瓶颈」理论，则尝试来解决神经网络的一系列问题，自提出以来便一直受到 AI 界的广泛关注。IBM 研究院也开展相关研究来分析这一理论，以期能够解决神经网络中的某些问题，相关成果发表在 IBM 研究院官网博客上，雷锋网 AI 科技评论编译如下。

虽然对于神经网络理论的研究工作日趋增多，但我们对于深度学习的宏观行为理解仍存在许多不足之处。例如，训练期间由哪些因素驱动内部表征的演变、学习到的表征属性以及如何充分训练神经网络去处理信息等方面存在的问题，一直都没有得到解决。此外，我们对于神经网络的了解大多数都源于揣测，而缺乏实证。

「信息瓶颈」理论试图解决上述这些问题。作为 MIT- IBM Watson AI 实验室双方密切合作的成果，我们在 2019 年国际机器学习大会（ICML）会议论文「深度神经网络中信息流的评估」（Estimating Information Flow in Deep Neural Networks），从数学和经验的角度对「信息瓶颈」理论进行了分析，其中更是特别聚焦于其预测的「信息压缩」现象。

「信息瓶颈」理论（Schwartz-Ziv & Tishby 2017 年论文等，见参考文献）试图解释涉及信息压缩的神经网络泛化问题，这个概念是指在神经网络学习对输入编码时，输入 X 和隐藏层 T（图 1）之间的互信息在训练过程中迅速上升，之后在神经网络学习丢弃与任务无关的非关联信息（图 2）时，该互信息缓慢下降（压缩）。每一个连续的层都被视为在不断压缩输入。最终证明，这种淘汰掉无关信息的方式，可以使分类器的泛化效果更好，因为这样的话，当被给定一种新的此前从未见过的输入，神经网络仅仅提取出相关信息，而不会受到无关信息的误导。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 1：深度神经网络的前馈（假设的）

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 2：信息瓶颈。图中显示了训练过程中 5 个隐藏层中互信息的轨迹

虽然某种程度上这是一个较为诱人的观点，但遗憾的是，当网络是确定性的时候，输入 X 和隐藏层 T 之间的互信息并不依赖于网络参数（而在实践中，几乎所有的神经网络都是确定性的）。为了解决这个问题，先前的工作通过对每个神经元进行分箱处理（量化）和互信息进行计算（成为分箱隐藏层的离散熵），得出互信息的估计值。图 3 表明该计算与分箱大小高度相关，从而证实它并没有对互信息进行计算。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 3：分箱估计的不连续性

噪声神经网络与互信息评估

当网络是确定性的时候，互信息是非信息性的，而当网络是随机性的时候，互信息是富信息性的。因此，我们通过在每个神经元输出中添加高斯噪声 Z 来定义形成的噪声神经网络（图 4）。这种噪声同时存在于神经网络的训练和测试中，从而使相关的互信息评估变得有意义。在这种情况下，我们提出了一种有效的互信息评估方式，它能以极大极小最优速度收敛为真实的互信息（且不依赖于分箱）。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

将聚类作为压缩的驱动因素

我们的论文通过将单神经元分类和噪声通道上的信息传输联系起来，能够开发出一个数学直觉，即信息压缩（在随机网络中严格观察或在确定性网络中使用分箱估计）通常都应该由内部表征聚类引起。具体来说就是，在隐藏表征 T 中，映射同一类 Y 的不同输入 X 的隐藏层与彼此越来越接近。

要从经验上评估这一点，可参考 Schwartz-Ziv、 Tishby 在其 2017 年一篇论文中提出的数据和模型，该模型使用具有双曲正切函数（tanh）激活的全连接 12-10-7-5-5-4-3-2 体系结构对 12 维输入进行二进制分类。图 5 显示了标准偏差 0.005（测试精度 97%）的加性噪声结果，说明了各训练期中互信息估计、训练/测试损失和不断演变的内部表征之间的关系。互信息的上升和下降对应着表征在每一层中的扩展或聚合程度。例如，当高斯函数开始沿着一条曲线彼此偏离时（参见顶部第 5 层隐藏表征的散点图），在 28 epoch 之前，互信息一直呈增长趋势；到 80 epoch 左右，它们开始聚合，互信息随之下降。随着训练的进行，饱和的双曲正切单元将高斯函数推到立方体的相反角落，进一步减少了互信息。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 5：训练过程中的 I(X;Y) 压缩。最上面一行显示的是在选定 epochs 中隐藏表征的最终层的散点图，按颜色进行类标签编码

如图 6 所示，我们使用权重的正交规范化规则（Cisse 等人 2017 年论文），不仅可以消除这种压缩，实际上也改进了泛化。隐藏表征不再聚合在一起，这与信息压缩的缺失是直接对应的。我们在这方面进行了更多的实验，从而有力地证实了信息压缩是由聚类引起的。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 6：使用正交规范化消除压缩

由聚类引起的「压缩」概念之所以重要，基于两个原因。首先，它揭开了「信息压缩」的神秘面纱，用一个更具体的公式取而代之。其次，它为直接研究聚类打开了大门，聚类可能不会遭遇源自与互信息估计相关的维数的极端「诅咒」（我们证明了样本复杂度在维数上呈指数级增长）。事实上，我们能够将聚类的若干（初步的）测量方法延展到针对 MNIST 扫描数字任务进行分类的全卷积神经网络上，从而在训练过程中观察到类似的「压缩」行为。

此外，与「信息瓶颈」理论相反，我们发现压缩对于泛化来说并不是必要的，不过，鼓励使用压缩（通过几何聚类）是否能够促进更好的泛化性能仍然是一个有待解决的问题。

参考文献：

[Shwartz-Ziv, R. and Tishby, N. Opening the black box of deep neural networks via information. arXiv:1703.00810, 2017]

[Cisse, M., Bojanowski, P., Grave, E., Dauphin, Y., and Usunier, N. Parseval networks: Improving robustness to adversarial examples. In Proceedings of the International Conference on Machine Learning (ICML), 2017]

via：

原创文章，未经授权禁止转载。详情见转载须知。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

谷普下载提醒您

本文链接：http://www.gpxz.com/article/b3f33ee7aa83bb1ff4a0.html

上一篇：不仅是白金赞助商2017的重量级参与者附59篇

下一篇：姚班天才少年鬲融凭非凸优化研究成果获得斯

百度移动统计

百度移动统计是一款专业的移动应用统计分析工具，支持android，ios平台。

网络应用 2024-11-13 10:55:25

- 旅游 - 旅游资讯网址大全--123网址之家

-旅游-旅游资讯网址

新闻资讯 2024-07-06 19:41:40

常见问题

常见的手机上网问题解答，包含苹果、安卓和java机。

手机软件 2024-07-11 13:25:15

数字党建

中库科技是一家专注空间数字化创新的互联网科技型企业，中库以数字党建作为品牌核心产品，专注于数字展陈、乡村振兴、智慧监管领域，立志成为一站式数字科技集成服务商，全国服务热线：4006139288

互联资讯 2024-08-17 17:34:01

梦宝床垫

家居床垫美梦

电影视频 2024-07-11 13:30:40

重庆电动环卫扫地车/扫地机公司「贝钠特」提供全自动驾驶洗地机

重庆贝钠特主要销售产品有:重庆扫地车,工业吸尘器,电动环卫扫地车,驾驶扫地车,全自动洗地机,电动环卫扫地及各种商业清洁设备。

商业服务 2024-07-11 13:39:26

粉煤灰球磨机

专业生产全套选矿设备,节能球磨机,连续式球磨机,大型球磨机,选矿球磨机,可根据用户不同需求,设计不同的选矿设备,球磨机,球磨机运转平稳,工作可靠,更可较大幅度的提高球磨机的产量,电话15903649888

设计美化 2024-08-12 18:35:56

短网址,短网址生成,短链接,飞天天网,网址缩短

www.ft12.com为您提供:,短网址程序,短网址服务,短网址转换,短网址API接口,短链接生成器,批量生成短链接,短网址生成,压缩所有网址包括图片、flash、mp3、rar等所有互联网地址,专业的网址缩短网站！。

图片摄影 2024-11-13 08:13:45

LIMS实验室管理系统

牵翼云LIMS实验室信息化管理系统，是采用新一代中台技术的实验室数字化平台。LIMS系统针对实验室人机料法环测等关键因素进行了深入的研究和定制化开发，满足检验检测行业针对业务、质量、信息管理、数据管理等方面的需求。

编程开发 2024-11-18 17:37:52

新西兰Merbycal咪贝康官网

新西兰Merbycal咪贝康官网深圳咪贝康生物科技有限公司

科技创新 2024-11-19 15:18:34

一门封装

一门封装(www.yimenapp.cn)云端一键网页封装APP平台,提供APP封装,苹果app封装,安卓app封装,IOS封装app,网页封装APP,网站封装APP,H5封装APP,H5混合APP开发服务。

手机软件 2024-12-01 22:26:59

03软件园

03软件园是一个专业的软件下载门户，提供丰富的安卓手机软件和游戏资源。无论是热门手游排行榜还是最新应用下载，我们为您提供安全、快速的软件下载体验。探索手机应用的无限可能，尽在03软件园！

游戏网游 2024-12-21 16:30:43

老头包子铺怎么加盟连锁店 (老头包子铺加盟费用多少条件)

包子是较受欢迎的项目，它被广泛的应用于早餐早点当中，是国人早餐中不可或缺的项目，需求量高，品牌也有很多，老头包子铺是很受欢迎的品牌项目，老子包子铺沿承的制造工艺，选用上等的食材进行包子的制作，使得老头包子铺的包子口感更好，并且它所有包子的品质都是相当不错的，所以老头包子铺是很不错的，那么现在老头包子铺怎么加盟连锁店，老头包子铺与传统的...。

2024-12-21 17:52:50

在近段时间又有哪些研究进展掀起热潮的Wasserstein GAN (近段时间又出现了阳)

前段时间，WassersteinGAN以其精巧的理论分析、简单至极的算法实现、出色的实验效果，在GAN研究圈内掀起了一阵热潮，对WGAN不熟悉的读者，可以参考我之前写的介绍文章，令人拍案叫绝的WassersteinGAN，知乎专栏，但是很多人，包括我们实验室的同学，到了上手跑实验的时候，却发现WGAN实际上没那么完美，反而存在着训练...。

2024-12-09 23:27:23

苹果与基因检测公司合作为硅谷员工提供免费基因筛查 (apple基因)

雷锋网消息，据CNBC消息，苹果正在与基因检测公司ColorGenology进行试点合作，为其硅谷的员工提供免费的疾病基因筛查，知情人士透露，苹果公司最近在总部附近为员工及其家属设立了专门的健康诊所，名为ACWellness，AC健康中心，，该公司已经与Color合作了几个月，这样做的目的是为了让对员工的医疗保健检查由被动转向主动，因...。

2024-12-03 23:08:44

腾讯系创业者张星亮做SaaS产品的三次蜕变 (腾讯出来的创业者)

图片来源，豆瓣所有者，电影剧照，EC创始人张星亮给人的感觉，思维异常活跃，逻辑能力很强，在SaaS圈一直属于颇有见解和洞察的一派，与张星亮见面当天，salesforce中国区解散缘由在圈内引发种种猜测和讨论，许多业内人士找到了张星亮，想听听他的看法，本土CRM盯着Salesforce竞争没有意义，2021年Salesforc...。

2024-12-03 17:05:33

沉浸式4K超高清画面体验分享当贝F6投影仪评测 (沉浸式画质)

发表在当贝投影仪2024，6，709，35当贝F6的发布打破了当贝F系列的清晰度上限，可提供4K分辨率画面，此外机身外观也有了不小的改变，那么当贝F6各方面的表现究竟如何呢，下面就为大家分享当贝F6的实际使用体验，看看当贝F6在外观、画面、系统方面的表现，01，当贝F6外观首先F6机器的外观做的就很令人满意，区别于上一代F5这次采用的...。

2024-11-28 22:18:02

爱普生ef15怎么读取u盘 (爱普生ef15w)

发表在专业问答2024，4，812，59展示机型信息，品牌型号，爱普生EF15B系统版本，腾讯极光TVOS爱普生ef15读取u盘需要在爱普生ef15的usb接口出接入U盘即可读取，总共可以分为三步，下面为爱普生ef15怎么读取u盘的详细步骤做具体说明，爱普生ef15怎么读取u盘1.找到U盘接口在爱普生ef15机身侧面找到USB接口；2...。

2024-11-28 17:21:22

天天拍车客户互换车辆性能涉嫌诈骗 (天天拍车客户端下载)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 14:16:28

x阅读器历史版本哪个最好 (extrachm阅读器)

该阅读器4.1.1版本比拟好，X阅读器是一款备受欢迎的手机阅读器，其历史版本中，4.1.1版本被宽泛以为是一个比拟好的版本，这个版本在配置和性能方面都有所改良，它驳回了全新的广告标识形式，可以更高效地阻拦广告，同时自动阅读器规划显示底部工具栏，使得阅读体验愈加方便，x阅读器经常使用油猴脚本的方法有哪些，x阅读器经常使用油猴脚本的方法要...。

2024-07-13 21:13:23

具体引见K5的性能和多少钱！西风起亚K5如今多少钱 (具体化引申)

作为西风起亚品牌旗下的中型车型，K5在生产者心目中不时享有很高的声誉，无论是从外观设计还是性能方面来看，都很容易惹起人们的兴味，那么，如今购置这款车型须要多少钱呢，本文将为大家引见最新的K5性能与多少钱，首先，咱们来看一下基础版的K5车型，这款车搭载的是1.5T发起机，最大功率124kW，最大扭矩253Nm，车身尺寸为4865×186...。

2024-07-07 17:49:39

顺丰快递春节停运吗2023顺丰快递春节停运吗2022 (顺丰快递春节停运吗)

顺丰快递春节停运吗2023答，不停运，春节时期，顺丰仍将据守服务承诺，自始自终的提供全年无休的优质寄递服务，全力保证您的快件收发需求，好受提示因过节时期资源分配受限、极其天气变动等起因影响，您寄往全国各地的快件时效或将受不同水平的影响，顺丰也已储藏关系预案，做好应急照应，全力保证服务质量，同时咱们将对快件和资源迷信正当调度婚配，灵活调...。

2024-07-07 05:53:36

gle350算大奔吗 (gle350奔驰)

算出口飞驰gle350，是由德国斯图加特拉斯塔特工厂消费的，出口飞驰不必定都产于德国，由于飞驰在世界有30个消费基地，其中欧洲就有9个，亚洲有10个，非洲有4个，澳大利亚有1个，南美洲和北美洲就各有3个，如，飞驰的G级是产自于奥天时的麦格纳斯太尔工厂的，而GL级和ML级的SUV是产自于美国的，奥天时和美国消费的工艺、工人的形态或许都不...。

2024-07-07 03:16:01

普里戈任被葬父亲墓旁，俄媒爆料：至少两名嫌疑人已“浮出水面”|瓦格纳|莫斯科|安德烈|俄罗斯|佩斯科夫

普里戈任被葬父亲墓旁，俄媒爆料：至少两名嫌疑人已“浮出水面”,普京,瓦格纳,莫斯科,安德烈,俄罗斯,佩斯科夫,普里戈任

2023-09-02 16:49:35

文章推荐

十大洗发水排行榜 (十大洗发水排名前十品牌)

对于洗发水来说，相信大家都不陌生，很多人几乎每天都用，因此这可以说是一个非常大的用户市场，正是考虑到这个商业机会，很多个人或者公司都有加盟品牌洗发水的想法，他们想在这样一个热门地行业分一杯羹喝，下面我们首先来看一下十大洗发水排行榜，PANTENE潘婷创建于1947年瑞士，全球修护损害洗发水知名品牌，汉高，我国，智慧之选有限公司，Sch...。

2024-12-02 23:54:55

创业加盟

室内除甲醛公司可以加盟吗室内除甲醛怎么做才 (室内除甲醛公司加盟)

住房永远是人们日常生活中的头号大事，有一间属于自己的房屋才可以在城市中找到自我的归属，随着购房热现象的出现，也出现了众多的室内装修公司，在众多的室内装潢中除甲醛公司更是以绿色、安全的服务，深受消费者喜爱，那室内除甲醛公司可以加盟吗，室内除甲醛怎么做才，室内除甲醛公司可以加盟吗，据小编了解由于室内装修行业的发展，现在市场上拥有众多的除甲...。

2024-12-02 21:58:38

创业加盟

台硕盒子 (台硕机顶盒官网)

准备工作，台硕盒子、U盘、电脑一、从电脑上下载好当贝市场apk，点击立即下载，并复制到U盘；二、将U盘插入盒子中，自动弹出选择框进入全部，找到当贝市场安装包安装即可，当贝市场安装好之后，就可以随意在里面安装你需要的第三方直播、点播、游戏等应用，例如，银河·奇异果、影视快搜等！以上就是，台硕盒子安装软件教程，如有疑问，欢迎加入当贝市场教...。

2024-11-25 18:00:51

技术教程

蛋糕坊加盟需要多少钱 (蛋糕坊加盟需要什么)

蛋糕店加盟已经成为许多创业者的热门选择，不同品牌的加盟费用差异较大，根据行业情况，小型蛋糕品牌费用约为5，10万，普通大众品牌预计需要10，20万，大型品牌则可能需要20，50万甚至更多，以下是对蛋糕店加盟费用的详细分析，以及如何降低这些费用，蛋糕店加盟费的一般范围蛋糕店加盟费受品牌、店面大小、地理位置等因素影响，普通店面加盟费约为5...。

2024-11-22 19:51:57

创业加盟

葛店化工厂倒闭了没有 (葛店化工厂倒闭了吗)

湖北省鄂城市葛店经济开发区高新化工厂，始建于1996年，拥有十多年的历史，该工厂位于武汉市东湖开发区创业街附近，交通便利，占地面积3000多平方米，配备了先进的生产检测设备，工厂主要生产三混甲酚，并对外求购石油级的粗酚，凭借优良的生产技术和工作质量，以及统一的经营理念，该工厂赢得了广大客商的好评，同时，借助开发区的优惠政策，工厂的发展...。

2024-11-18 23:13:56

资讯动态

信息瓶颈 再解读 携手 聚焦 信息压缩 MIT 理论 IBM (信息瓶颈算法)

噪声神经网络与互信息评估

将聚类作为压缩的驱动因素

相关文章

文章推荐

信息瓶颈再解读携手聚焦信息压缩 MIT 理论 IBM (信息瓶颈算法)