ASSIA (assiassion什么意思)

文章编号:46230 资讯动态 2024-12-10 ASSIA

雷锋网 AI 科技评论按:2018 年 5 月 31 日-6 月 1 日,中国自动化学会在中国科学院自动化研究所成功举办第 5 期智能自动化学科前沿讲习班,主题为「深度与宽度强化学习」。

如何赋予机器自主学习的能力,一直是人工智能领域的研究热点。在越来越多的复杂现实场景任务中,需要利用深度学习、宽度学习来自动学习大规模输入数据的抽象表征,并以此表征为依据进行自我激励的强化学习,优化解决问题的策略。深度与宽度强化学习技术在游戏、机器人控制、参数优化、机器视觉等领域中的成功应用,使其被认为是迈向通用人工智能的重要途径。

本期讲习班邀请有澳门大学讲座教授,中国自动化学会副理事长陈俊龙,清华大学教授宋士吉,北京交通大学教授侯忠生,国防科技大学教授徐昕,中国中车首席专家杨颖,中科院研究员赵冬斌,清华大学教授季向阳,西安交通大学教授陈霸东,浙江大学教授刘勇,清华大学副教授游科友等十位学者就深度与宽度强化学习技术在游戏、机器人控制、参数优化、机器视觉等领域中的成功应用进行报告。

雷锋网 AI 科技评论在本文中将对 6 月 1 日杨颖、赵冬斌、刘勇、游科友、徐昕的 5 场精彩报告进行介绍。

杨颖:轨道交通车辆预测与健康管理(PHM)技术应用

杨颖是中国中车首席专家,教授级高级工程师,中车株洲电力机车有限公司副总工程师。

本报告专注于相关内容,中国的轨道交通发展迅猛,列车数量在过去六年里几乎翻了两番。传统的定期保养模式现在问题重重,且这种模式花费不菲。在该背景下急需一个新的车辆保养方案。中国中车株洲和深圳铁路公司联合开发了一个轨道交通车辆预测与健康管理系统来降低车辆保养所需的人工费用以及其他费用。借助 PHM 系统,可以把定期保养模式转换为有条件保养模式,这样就可以延长检查保养周期,从而延长列车在安全健康状态下的运营时间。

赵冬斌:深度强化学习算法及应用

赵冬斌是中国科学院自动化研究所研究员、博导,中国科学院大学岗位教授。

本报告专注于深度强化学习算法的应用。将具有「决策」能力的强化学习 (RL: Reinforcement Learning) 和具有「感知」能力的深度学习 (DL: Deep Learning) 相结合,形成(DRL: Deep RL) 方法,成为人工智能 (AI: Artificial Intelligence) 的主要方法之一。2013 年,谷歌 DeepMind 团队提出了一类 DRL 方法,在视频游戏上的效果接近或超过人类游戏玩家,成果发表在 2015 年的《Nature》上。2016 年,相继发表了所开发的基于 DRL 的围棋算法 AlphaGo,以 5:0 战胜了欧洲围棋冠军和超一流围棋选手李世石,使围棋 AI 水平达到了一个前所未有的高度。2017 年初,AlphaGo 的升级程序 Master,与 60 名人类顶级围棋选手比赛获得不败的战绩。2017 年 10 月,DeepMind 团队提出了 AlphaGo Zero,完全不用人类围棋棋谱而完胜最高水平的 AlphaGo,再次刷新了人们的认识。并进一步形成通用的 Alpha Zero 算法,超过最顶级的国际象棋和日本将棋 AI。DRL 在视频游戏、棋类博弈、自动驾驶、医疗等领域的应用日益增多。本报告介绍了强化学习、深度学习和深度强化学习算法,以及在各个领域的典型应用。

刘勇:正则化深度学习及其在机器人环境感知中的应用

刘勇是浙江大学教授、博导,浙江大学求是青年学者。

本报告专注于正则化深度学习方法。近年来,随着人工智能技术的飞速发展,深度神经网络技术在图像分析、语音识别、自然语言理解等难点问题中都取得了十分显著的应用成果。然而该技术在机器人感知领域的应用相对而言仍然不够成熟,主要源于深度学习往往需要大量的训练样本来避免过拟合、提升泛化能力,从而降低其在测试样本上的泛化误差,而机器人环境感知中涉及的任务与环境具有多样化特性,且严重依赖于机器人硬件平台,因而难以针对机器人各感知任务提供大量标注样本;其次,对于解不唯一的病态问题,即使提供大量的训练数据,深度学习方法也难以在测试数据上提供理想的估计,而机器人感知任务中所涉及的距离估计、模型重构等问题就是典型的病态问题,其输入中没有包含对应到唯一输出的足够信息。针对上述问题,本报告以提升深度学习泛化能力为目标、以嵌入先验知识的正则化方法为手段、以机器人环境感知为应用背景进行了介绍。

总体上看目前刘勇教授研究内容共有四项,分别是:

就目前的研究结果来说,正则化统一框架下深度学习性能有明显的提升,在一系列机器人环境感知应用上取得当前领先表现。在接下来的工作中,刘勇教授团队将专注于无监督学习,定性与定量感知任务相结合,结合机器人声学、触觉等传感器等内容。

游科友:分布式优化算法与学习

游科友是清华大学副教授、博导,国家优青,国家青年千人。

本报告专注于分布式优化算法等问题,随着训练参数与样本规模的的急激增长,深度学习在实际应用系统中显示出了巨大的应用前景。分布式与并行优化是指通过多求解器起来协作求解的一类优化问题,其在大规模数值计算、机器学习、资源分配、传感器网络等有重要的研究意义和应用价值,并成为了大规模优化与学习中最具挑战性的问题之一。本报告首先讨论了分布式优化的几个典型难题;其次。以鲁棒性凸优化为例,提出了分布式原-对偶求解算法与分布式 Polyak 算法,并以严格证明了算法的有效性。

游科友老师团队的在本报告中提到的主要内容包括:

徐昕:自评价学习控制中的特征表示与滚动优化

徐昕是国防科技大学教授、博导,国防科技卓越青年人才。

本报告专注于强化学习的优化方法。以强化学习 (reinforcement learning) 为代表的自主学习技术对于提升各类机器人系统的优化决策与控制性能具有重要意义。在复杂不确定环境中机器人系统面临诸多优化决策与控制问题。面对这些问题,徐昕教授介绍了自评价学习在控制系统中的应用,自评价学习控制中的特征表示方法,以及滚动优化的方法。

以上是雷锋网 AI 科技评论全部报道,中国自动化学会第 5 期智能自动化学科前沿讲习班。两天时间,十位专家为大家带了十分精彩又干货十足的报告,对深度与宽度强化学习技术在游戏、机器人控制、参数优化、机器视觉等领域中的成功应用进行了深入介绍。

原创文章,未经授权禁止转载。详情见 转载须知 。

ASSIA | 中国自动化学会「深度与宽度强化学习」智能自动化学科前沿讲习班(二)

全局中部横幅
原色云室内设计

原色云室内设计[设计咨询:023-67712306]我们专注室内和商业空间,坚持做有温度,有情怀的独立全案设计!

智能分选设备

积塔科技是一家专注于高端智能分选设备及解决方案的提供商,主要针对分选场景有:再生资源、生活垃圾、建筑垃圾、工业垃圾、陈腐垃圾、农产品、建筑材料等等.

哈啰

国内专业的本地出行及生活服务平台,致力于应用数字技术的红利,为人们提供更便捷的出行以及更好的普惠生活服务。

建新赵氏科技有限公司

建新赵氏科技有限公司建新赵氏科技股份有限公司成立于2015年,隶属于建新赵氏集团。建新科技作为建新集团核心产业—汽车零部件板块的运营主体及重要上市平台

邮乐网

邮乐网由中国邮政与TOM集团携手呈现的创新网上购物平台!网购新西兰奶粉、土特产、鞋帽箱包、个人护理、数码、小家电、居家百货、母婴、手机充值全网最低,原产地直销原汁原味,尽在邮乐,为您提供愉悦的网上购物体验.

叉车电磁吸盘,挖掘机电磁吸盘,铲车电磁吸盘,废钢起重电磁吸盘,起重电磁吸盘,废钢电磁吸盘厂家

山东承祥工业科技有限公司【电话:189-6357-1399】主营叉车电磁吸盘,挖掘机电磁吸盘,铲车电磁吸盘,废钢起重电磁吸盘,起重电磁吸盘,废钢电磁吸盘厂家等,质量可靠,欢迎广大客户来人来电垂询!

高光谱相机

赛斯拜克(SINESPEC)是高光谱相机/高光谱成像仪国内知名厂家,成像光谱仪覆盖机载及地面应用,【免费提供】高光谱技术在教育科研/智慧农业/生态环保/智能制造/食品分析等领域应用解决方案,产品价格请来电咨询。

层流净化手术室装修

四川华锐净化工程有限公司(www.oppb.cn)具备设计施工总承包资质,总部位于成都市;主要业务有层流手术室装修、手术室净化工程、洁净手术室装修、无菌手术室施工、层流手术室净化、无尘车间装修,无尘车间净化、无尘车间施工、净化车间装修、净化车间施工、洁净车间装修、洁净车间施工、实验室装修、实验室工程、实验室净化工程、洁净实验室装修、洁净室工程、洁净室建设、洁净室装修;是专业的净化工程公司,拥有13年的设计施工经验!

智能门锁电机

温州劲力智能科技有限公司(www.wzjlth.com)从事对智能门锁电机、智能门锁离合器的研发与生产,并获得多项专利证书(专利号:ZL201721868542.6)。欢迎来电咨询:0577-8600757813858878307。

管管安全

面向各类有安全生产监管需求的中小企业,满足国家安全生产标准化三级标准及双重预防机制体系,帮助企业构建安全生产标准化体系,提供整套安全生产管理工具,包括:安全生产台账管理、安全知识库、在线安全教育培训、安全巡检管理、风险识别与隐患排查工具、隐患随手拍工具、进厂登记工具、应急预案小助手、应急演练小助手等

首页

小猫头智能交通云平台

全局底部横幅