刷arxiv有哪些技巧 5个问题快速理解机器学习论文

文章编号:36848 资讯动态 2024-11-30 论文arxiv

译者:AI研习社( 听风1996 )

双语原文链接: How to Understand ML Papers Quickly


我所指导的 ML学员 经常会问我一些不同的问题:"你如何从每天大量充斥在Arxiv网址上的出版资料中选择阅读哪些论文?"

阅读大多数ML论文的好处是,你只需提出五个简单的问题就能跨越(忽略)一些专业术语。当我浏览论文时,我会尽可能快地回答这些问题。

1)函数近似器的输入是什么? 如:一张224x224x3的RGB图像,其中单个物体大致位于视图中心。

2)函数近似器的输出是什么? 如:一个对应输入图像的类维度为1000的向量。

请借助与具体(论文中的)方法无关的方式考虑整个系统的输入和输出,可以让你从术语本身中脱身,并考虑其他领域是否已经开发出使用不同方法(算法)在这里可能会有效的方法。我发现这种方法在阅读 meta-Learning论文 时非常有用。

通过首先将ML问题视为一组输入和期望的输出,可以推断输入是否足以预测输出。如果没有这种推断练习,你可能会意外得到一个ML问题,其中 输出不可能由输入决定 。结果可能会是一个ML系统 进行预测的方式是社会所认为有问题的方式 (译者注:这里可能是想表达不符合人类常识与逻辑的执行方式)。

3)什么样的损失在监督输出预测(译者注:关注损失函数)?这个目标函数在什么样的背景假设下设立的? ML模型是通过组合和而形成的。有时 偏差很强 ,有时偏差 很弱 。为了使模型具有更好的泛化能力,你需要添加更多的偏差或添加更多的无偏数据。 天下没有免费的午餐 。举一个例子:许多最优控制都会假设一个固定的数据偶发过程,这个过程就是马尔科夫决策过程(MDP)。在MDP中,"状态 "和 "决策"通过环境的动态转换来确定映射到 "下一个状态、奖励以及事件是否结束"。这种结构虽然很笼统,但也是可以用来构造一个损失,让学习Q值遵循方程。

4)一旦模型被训练后,对于以前没见过的输入/输出对,模型能够泛化到什么程度? 归功于所捕获的数据信息或模型架构,ML系统可能会相当好地泛化到它以前从未见过的输入。近年来,我们 看到越来越多 和 更高等次的泛化能力 ,所以在阅读论文时,我注意观察那些在论文中惊人的泛化能力以及它的泛化能力来自哪里(数据、偏差或两者都有)。

对于这个领域来说,更好的归纳偏差意味着存在更多的噪音,例如因果推理或符号方法或以对象为中心的表示。这些是构建稳健可靠的ML系统的重要工具,我发现将结构化数据与模型偏差分开的界限可能是模糊的。话虽如此,但让我感到困惑的是,有许多的研究人员认为推动ML前进的方式是学习量(译者注:训练轮次)并编写硬编码的量。

我们之所以进行ML研究,恰恰是因为有些东西我们不知道如何编写硬编码。作为机器的研究者,我们应该把工作重点放在 改进学习方法 上,把编写硬编码和符号方法留给那些研究的研究者。

5)论文中的说法是否可以证伪?

那些声称不能证伪的论文是不属于科学范畴的。


AI研习社是AI学术青年和AI开发者技术交流的在线社区。我们与高校、学术机构和产业界合作,通过提供学习、实战和求职服务,为AI学术青年和开发者的交流互助和职业发展打造一站式平台,致力成为中国最大的科技创新人才聚集地。

如果,你也是位热爱分享的AI爱好者。欢迎与 译站 一起,学习新知,分享成长。

刷arxiv有哪些技巧?5个问题快速理解机器学习

版权文章,未经授权禁止转载。详情见 转载须知 。

刷arxiv有哪些技巧?5个问题快速理解机器学习

全局中部横幅
zhihu.com

站长之家Alexa排名查询工具提供zhihu.com网站alexa排名查询,特别是能够对网站预估收入以及网站价值进行评估的功能,帮助用户更好的提升alexa排名。

西安注册公司

西安注册公司-找联创财税-西安工商财税服务平台,专业代理公司注册、代理记账及税收筹划。采用团队对1服务模式,为中小企业提供优质的公司注册、西安代理记账报税、纳税筹划及西安公司注销等公司发展全周期服务。

武汉输送机

武汉中普瑞特工业有限公司产品:武汉输送机、武汉滚筒输送机、武汉食品输送机、武汉皮带输送机、武汉提升机、武汉升降输送机、武汉带式输送机、链板输送机、移动式输送机、滚筒线、皮带滚筒线、滚筒运输线、动力滚筒线、滚筒线链条等,输送设备行业从业多年。

电力科技网

电力科技网是电力行业资深门户网站,涵盖发电、电网、新能源等行业前沿技术及动态,最新电力行业研讨会及展会信息。

Memobird.cn

厦门盈趣科技股份有限公司,是一家聚焦于物联网技术、专业从事“工业互联网”和“民用物联网”产品、服务的高新技术企业,是信息化和工业自动化的领航者,是国内领先的软硬件系统集成服务商。现有员工1000多名,其中高素质的技术研发工程师、管理者600多名。公司拥有省级企业技术中心、研发实验室、机器人研究中心等多个研究研发中心,并积极与高校合作设立前沿技术研究有关的产学研孵化基地。盈趣科技已形成以工业机器人、智能家居、智能制造、车联网、第三方软件服务(UMS联合管理平台)为一体的完整产业链。在不断完善自身的同时,积极寻求全球范围内的合作,公司目前已和数十家全球知名企业建立起全方位、深层次的战略合作关系。

欢迎访问中国总会计师协会网站

中国总会计师协会是经民政部批准,成立于1990年的跨地区、跨部门、跨行业的全国非营利一级社团组织,业务指导单位是财政部。

真空泵

无锡市钱盛机泵厂建于1980年,地处风景秀丽的惠山之麓。是一家具有国家发明专利的专业生产各类真空泵的真空泵厂。主要生产往复式真空泵、W型真空泵系、水环式真空泵系列、旋片式真空泵、无介质(无油、无水)真空泵、移动式全自动真空泵、罗茨真空泵机组、玉和树脂产品专用真空泵的专业真空泵厂。该各类真空泵广泛用于冶金、化工、医药、轻纺、食品、航空、电子、科研等行业和部门。

温州市民卡

温州市民卡温州市民卡

.购物域名注册管理机构官网电商选域名

本站是工信部认证的.购物域名的注册管理机构官网。.购物是经ICANN批准的全球通用的国际顶级中文域名,中文域名符合中国人的书写习惯,更好的展示中国人在互联网上的身份认同和语言认同。电商选域名-就选.购物,中文辨识简单,品牌直观好记忆,资源丰富。

全局底部横幅