LeCun提出的 AI教父Yann 到底是个啥 Reddit热议 能量模型 研究了个寂寞 (Lecun提出卷积神经网络)

文章编号:45681 资讯动态 2024-12-09 LeCunAIYann

“能量自监督学习到底是什么鬼?”不少reddit网友评论说。

刚刚,深度学习教父Yann LeCu登上了Reddit热搜。一位不知名的开发者发表了一篇题为“Yann LeCun提出基于能量的自监督学习到底是什么”的帖子,引发众多网友讨论。

研究了个寂寞?Reddit热议:AI教父Yann 提出的『能量模型』到底是个啥?

讨论的焦点之一是,基于能量的自监督学习模型能做什么?有什么优势或意义?

这位开发者刚刚看完LeCun最新的主题演讲,他说,Yann LeCun似乎是在建议训练一个有条件的潜在变量模型,它可以根据输入和潜在变量预测输出(类似于pix2pix GAN或VAE);同时,它也可以处理图像、视频或者音频等不同类型。

但有关优化生成模型的方法有很多,比如OpenAI通过iGPT预训练预测缺失像素,采用“对比预测编码法”,通过对比损失来进行丢失信息预测。这些方法在实际应用中均取得不错的成果。

相比之下,基于能量的自监督学习好像并没有特别之处,也没有相关的成功应用案例。

Reddit上,超过95%的网友对这一观点表示了赞同。

另外,还有一位网友透露,最近3-4年很多专家都对它很着迷,他们认为基于能量的模型是深度学习的『未来』。

那么,代表ML未来的『能量模型』到底是什么?

AI的未来:『能量』SSL模型

Yann LeCun,是2018年图灵奖得主之一,与Geoffrey Hinton 和 Yoshua Bengio二人被合称为深度学习三巨头。同时,他自己也被称为“CNN之父”。

研究了个寂寞?Reddit热议:AI教父Yann 提出的『能量模型』到底是个啥?

LeCun在在业界和学术界颇具影响力。目前,他在Facebook公司担任人工智能研究院院长一职,同时也在纽约大学、Courant 数学科学研究所、神经科学中心和电气与计算机工程系等担任要职。

2019年11月,LeCun代表Facebook参加了《Using Physical Insights for Machine Learning》主题研讨会,并发表了名为《基于能量的自监督学习(Energy-Based Self-Supervised Learning)》的主题演讲。

在这篇演讲中,LeCun详细介绍了基于能量的学习方法在解决现有挑战方面的可能性。

近几年,深度学习在计算机感知、自然语言理解和控制方面取得了重大进展。但这些成功在很大程度上都依赖于监督学习或无模型强化学习。其中,监督学习是从标记的训练数据来推断一个功能的机器学习任务。强化学习分为有模型和无模型两种策略,前者区别与后者的特点是,有模型的方法主要学习前向状态转移模型p(st+1|st,at),而无模型方法则不是。

从现有研究来看,无论是监督学习,还是无模型强化学习都存在明显的局限性。前者需要人类提供大量数据标签,后者需要机器学习动作回报最大化。

也就是说,监督学习只适用于特定任务,即使是学习简单的任务;强化学习也需要与环境进行大量的交互。例如,它在游戏和仿真工作中十分有效,但在现实世界很难奏效。

但如果存在一款模型能够像人类或动物那样,只需要少量观察和互动就能学习大量与任务无关的知识,那么这些现实困境就可以被很好的解决。而这款模型必须依靠自监督学习(Self-Supervised Learning,简称SSL)方法。

LeCun认为,SSL是深度学习的『未来』,基于能量的SSL可以在回避概率的同时处理不确定性。以下是基于能量的SSL模型:

研究了个寂寞?Reddit热议:AI教父Yann 提出的『能量模型』到底是个啥?

标量值能量函数F(x,y)可以被测量,包括:

同时,它也有无条件的模型版本。

在训练方面,首先将能量函数参数化,在获取训练数据,最后计算出新Shape。这个过程通常有两种方法,一是对比法(Contrastive Methods),二是建构法(Architectural Methods)。

研究了个寂寞?Reddit热议:AI教父Yann 提出的『能量模型』到底是个啥?

其中对比法涉及三种策略:

C1:数据点能量下推,其它位置上推:最大似然(Max likelihood)。

C2:数据点能量下推,选择位置上推:最大似然和MC/MMC/HMC,对比散度,度量学习,噪声对比估计,比率匹配,噪声对比估计,最小概率流,对抗生成器GAN

C3:训练一个函数,将数据流形上的点映射到数据流形上的点:去噪自动编码器,屏蔽自动编码器(如BERT)

研究了个寂寞?Reddit热议:AI教父Yann 提出的『能量模型』到底是个啥?

建构法涉及三种策略:

A1:建立机器使低能量物质的体积有界:PCA,K-均值,高斯混合模型,平方ICA。

A2:使用正则化项来度量具有低能量的空间体积:稀疏编码、稀疏自动编码器、LISTA、变分自动编码器

A3:F(x,y)=C(y,G(x,y)),使G(x,y)相对于y尽可能“恒定”:收缩自动编码器,饱和自动编码器。

A4:最小化梯度,最大化数据点周围的曲率:分数匹配

在此基础上,LeCun还展示了关于视频预测的应用实例。他表示,无监督学习会成为未来的主流,能解决我们的学习系统难以处理的众多问题,研究无监督和预测性前向模型(predictive forward model)的建立,也会是接下来几年的挑战。

(文末获取LeCun完整PPT内容)

网友评论:『能量』的意义在哪??

实际上,LeCun的能量SSL理论还处在“ppt阶段”。

目前还未有大量的成功应用案例,而他在PPT中也仅展示了自动驾驶预测视频的结果。一位网友表示,他曾利用能量SSL模型做过一项测试。

如上文所述,在能量函数F(x,y)最小化上,LeCun提供了两种训练方法:对比法和和建构法。但在这个过程中,他认为有多个不合理之处。比如:自动编码器的潜在变量在哪里?按构造,有没有事先分配样本的潜在权利?

研究了个寂寞?Reddit热议:AI教父Yann 提出的『能量模型』到底是个啥?

如果训练的每一个SSL模型都可以解释为基于潜在变量的能量模型,这可能是不正确的。如果抛开潜在变量,认为每个模型都是基于能量的模型,可以勉强接受,但这还有什么意义呢?

它仅仅能够作为一种解释性理论,似乎并不具备应用的价值。

还有一位网友表示,LeCun所作的可能是一项“基础性研究”,就像Hinton研究胶囊网络(CapsulesNet)一样。基础性研究成功的可能性很低,通常是其他人在此研究之上开创应用。

另一位网友表示,Yann基于能量的学习方法确实启发了基于深层能量的强化学习(RL)研究,软演员-评论家(Soft Actor-Critic,SAC)模型已经在多个RL基准上实现了SOTA。

那么,你同意这位网友的看法吗?你认为『能量模型』的价值在哪里?

相关链接:

PPT文件:

演讲视频:

原创文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
要学汽修

杭州万通汽车是万通汽修教育旗下旗舰院校,开设汽车美容、汽车装潢、汽车检测维修等汽修技术。学汽修咨询电话:0571-56396999

网站PK

分析两个网站SEO数据竞争情况。

APP开发

【官网】起翌软件针对不同行业特点厂商及分销商、连锁店、零售商、本地生活服务、社区O2O、批发市场、百货商场、跨境电商等业态提供专业的场景化定制解决方案。主营业务:APP开发、微信定制开发、网站个性化定制、软件开发,为客户打造一站式解决方案。咨询热线:

沈阳

【星辉检测】电话:15330902886,辽宁省内及沈阳防雷装置检测公司,沈阳防雷检测,沈阳防静电检测公司,雷击风险评估机构,专业化的防雷检测团队,甲级资质,第一时间出报告,高效服务。

深圳市富迪银安科技有限公司

全自动保管箱,尾钞保管箱,指纹锁,管理软件,银行保管箱,金库门,金融机具

小暖彩妆网

彩妆主要是涂敷于脸面及指甲等部位,利用色彩的变化,赋予皮肤色彩,修整肤色或加强眼、鼻部位的阴影,以增强立体感,使之更具有魅力。同时,也可用于遮盖雀斑、伤痕和痣等皮肤的缺陷。

天津中盛恒智网络科技有限公司

天津中盛恒智网络科技有限公司,中盛恒智,中盛传媒,PR发稿公司,传媒公司,发稿公司

三江购物俱乐部股份有限公司

三江官网,系上市公司三江购物官方网站,三江超市,让老百姓“用较少的钱,过更好的生活。”

锐56攻略网

  锐56攻略网专注于为玩家提供最新、最全面的游戏攻略和资讯。我们致力于通过详尽的游戏指南、技巧分享和深度评测,帮助玩家在游戏中快速提升水平。无论是热门大作还是独立游戏,锐56攻略网都为您带来专业、实用的游戏解决方案,成为您征服游戏世界的最佳伙伴。

福州全屋定制厂家

福州全屋定制厂家-福州整体衣柜|橱柜订制厂家-福州金佰盛全屋定制,福州金佰盛是一家专业从事福州整体衣柜,福州整体衣柜定制,福州整体衣柜厂家,福州整体橱柜,福州整体橱柜定制,福州整体橱柜厂家,整体衣柜,整体衣柜定制,整体橱柜,整体橱柜定制,榻榻米定制,酒柜定制,橱柜定制,衣帽间定制,电视柜定制,书柜定制等家具定制的厂家,欢迎来电咨询:13799406237

天龙八部私服发布网,天龙八部SF,天龙私服

宝宝天龙八部发布网-汇聚最新资讯与精彩活动。精心策划各类玩法,打破传统枷锁,为玩家提供更多天龙八部SF创新体验。高度还原天龙私服游戏画面,让你沉浸于江湖世界。加入我们天龙八部私服发布网,感受热血战斗,争霸武林的刺激与激情。

全局底部横幅