自动化可解释性美国德州农工大学胡侠教授 AI落地开花如何翻过和两座大山丨CCF (自动化解释和造句)

文章编号：42136 资讯动态 2024-12-03 自动机器学习算法可解释性

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

雷锋网 AI 掘金志按：7 月 12 日-7 月 14 日，2019 第四届全球人工智能与机器人峰会（CCF-GAIR 2019）于深圳正式召开。峰会由中国计算机学会（CCF）主办，雷锋网、香港中文大学（深圳）承办，深圳市人工智能与机器人研究院协办。

在大会第三天的〖智能商业专场〗，阿里巴巴集团副总裁、CEO助理肖利华，京东零售首席科学家兼技术副总裁胡鲁辉，美国德州农工大学数据挖掘实验室主任胡侠，苏宁零售技术研究院院长王俊杰，TCL研究院（香港）研究所总经理俞大海，扩博智能CTO柯严先后登台发表精彩演讲，分享了各自对智能商业的理解与实践。

其中美国德州农工大学数据挖掘实验室主任胡侠教授以《增强人工？促进智能？？》为主题，分享了他在深度学习可解释性与自动机器学习方面的最新研究成果。

胡侠教授表示，AI要真正落地为人所用，必须要有另外一个“AI”的支撑，其中其中A代表Automation（自动化），I代表Interpreation（可解释性）。

他指出，深度学习的发展给各行各业带来了巨大的便利，但如果解决不了深度学习算法的可解释性问题，它的价值就会大大受限。

比如在用深度学习处理医保骗保问题时，光分析出哪一桩理赔可能存在问题还不够，还必须精准定位出上千页的理赔文件中究竟是哪一页出了问题，这样才能帮助专家快速符合，这就需要算法的可解释性。

同时，自动机器学习也是行业目前非常热门的方向。它主要有两重价值：一是帮助没有很强数据科学背景的用户更好地利用AI这一工具；二是帮助专业的数据科学家提高效率，毕竟现实生活中千变万化，光靠科学家应付不过来。

以下是胡侠教授的全部演讲内容，雷锋网做了不改变原意的整理与编辑：

深度学习算法的可解释性

报告开始前先给大家讲一个故事。两年前，一位叫Ali Rahimi的谷歌研究员在机器学习顶会NIPS上获得了“Test of Time”论文奖。“Test of Time”论文奖是NIPS为过去十年发表的论文中的最优者颁发的奖项，可以说分量十足。当时，Ali Rahimi在颁奖典礼上发表演讲，将深度学习比作炼金术，指出了这项技术的缺陷

在欧洲历史上，炼金术和占星术一样，都属于神学的范畴。所以Ali Rahimi把深度学习比作炼金术，是一种非常严厉的抨击。

Ali Rahimi抨击深度学习的主要论据是，深度学习算法缺乏可解释性。算法的可解释性为什么如此重要呢？我将用几个行业案例来说明。

先说保险行业。我们跟美国最大的一家保险公司合作，希望用人工智能技术做反欺诈。因为在美国保险业，一些小诊所的医生会联合病人骗保。我们的做法是用人工智能分析某个理赔案例跟其他案例在特征上是否有显著不同，如果有则说明它存在欺诈的风险，我们会将它移交给专家复核。

这件事的难点在于，理赔涉及的文档多达上千页，复核难度非常大。所以我们必须让算法精准定位出究竟是哪一页文档存在问题，这样算法才有意义。

再比如医院场景。假如人工智能系统预测病人得了糖尿病，却说不出依据是什么，病人肯定不会买单，医生也无法对症下药采取措施。

还有自动驾驶。前两年自动驾驶汽车出了不少事故，这是一件很严肃的事情。我们必须对自动驾驶系统进行检查，分析这个软件是怎么写成的，为什么它会在事故发生的瞬间做出错误判断。要回答这些问题，就必须依靠算法的可解释性。

深度学习算法的可解释性非常复杂。因为它的目标（分类、排序）、模型（CNN、RNN、CF）和数据类型（文本数据、图片数据）都很丰富。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

我们在深度学习算法的可解释性方面做了大量工作，总结出了三大解决方向：

一是从模型架构入手。传统的深度学习架构缺乏可解释性，但我们可以对它进行修改，增加可解释性的元素。基于这种方法，你可以根据自身业务灵活调整模型，但它对模型设计能力的要求也比较高，而且每来一个新任务，都需要重新设计模型。

二是重新设计一套验证模型。很多时候我已经有了一个模型，运行效果非常好，那么我就不需要去改动它，而是重新设计一个模型去对它进行验证。比如在医院场景中。医生诊断糖尿病的思路就相当于独立于算法外的验证模型。

三是去解释预测的对象本身。比如一个得了病，我们需要去定义的是他本身，而不是判定他得病的过程。大家有兴趣可以去搜索《Techniques for Interpretable Machine Learning》这篇论文。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

下面举例说明怎么做可解释的CNN模型。下面这张幻灯片的图片里有一头大象和一匹斑马，我们想知道CNN模型是如何运作的，它是根据图片中的哪些部分判断出谁是大象谁是斑马的。

解决这个问题主要有两项挑战：一是怎么找出图片中的重点（大象和斑马），我们很容易就能判断，但机器不是；二是图片中的哪些部分使系统识别了大象或办法。

为了解决这些问题，我们提出了遮罩的办法，即把图片中的某些部分去掉，分析它对系统输出结果产生了多大的影响。比如我们把关于大象部分的图片去掉，对结果影响巨大，这就说明它是图片中非常重要的部分。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

我们很快将推出一个叫做XDeep的软件包，里面包含了目前市场上比较重要的深度学习可解释性方案。我上面提到的三种方案，在里面都有开源代码供大家尝试。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

自动机器学习

前面介绍了“人工”的部分，即深度学习可解释性的重要性，下面再讲讲“智能”的部分，即自动机器学习。

自动机器学习是所有大厂都在密切关注的话题，比如谷歌就正在大力推广它的Automated系统。在座很多人都听说过自动机器学习的概念，我简单介绍下它在各个行业的应用。

自动机器学习在金融、医疗、零售等领域都有广泛的应用，它只需要少量数据就能迅速输出结果。虽然结果的准确性可能比不过专业人士，但至少在某些任务上是旗鼓相当的。

自动机器学习一是允许你在某个方向上进行快速尝试；二是可以让你在这个方向有比较好的基础，不必从头开始研究。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

比如在零售领域，商品推荐通常有两种做法：一是不分品类，把所有商品混在一起，做一个协同过滤系统；二是针对商品大类做更精细化的推荐。后者的效果显然优于前者，但工作量也更大，有了自动机器学习，问题便迎刃而解。

再比如我们跟LG合作的案例。LG的中央空调中有三个很重要的指标，控制着空调的运行状态，把它们设置在一个合适的值，就能提高空调的能效和使用寿命。但空调的安装位置不同，外界的环境也在不断变化，这三个指标对应的最佳数值也是变化的。我们不可能安排工程师一天到晚守着它，还好自动机器学习可以解决这个问题。现在LG的空调只需要安装好就行，不必人工再去管理了。

通过上面两个案例，我们可以总结出自动机器学习的两大优势：一是能让没有很强数据科学背景的用户更好地利用这一工具；二是可以帮助专业的数据科学家提高效率，毕竟现实生活中千变万化，光靠科学家应付不过来。

当然，如果你的业务提升0.1%的准确率就能带来上亿元收入，那么自动机器学习对你就没有那么重要，因为你完全可以雇全世界最优秀的人来做。

自动机器学习同样可以从类型（AuToFE、AutoMHL、AutoDL）、技术路线（BO、RL、EA）和框架（AutoKeras、AutoSklearn）几个维度来衡量。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

简单介绍下我们是如何实现AutoDL的，主要分三个步骤：

一是用训练中的历史数据更新替代模型。自动深度学习无外乎要解决两个问题：一是确定搜索空间，二是确定搜索方法；也就是在哪搜、怎么搜的问题。现有的方法主要有遗传算法和强化学习，但这两种算法都要多次搜索才能取得比较理想的效果。

二是生成新的架构用于评估。

三是评估新的架构，决定下一步搜哪里，如此循环，不断地去尝试。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

我们在这个过程中引入了一项叫做贝叶斯优化的技术，它只需要极少量数据就能取得很好的效果，在药物研发等诸多领域都具备显著优势。

另外，即使我们已经确定了用某个算法，训练的过程还是非常慢；如果能充分利用历史上训练好的模型就能加速这一进程。为此，我们开发了一个叫做Autokeras的自动深度学习系统。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

AutoKeras自去年七八月份发布以来广受欢迎，很多人在用。两个月前AutoKeras已经和谷歌Keras团队正式合并，目前正在做基于Keras的优化，很快就有新版本出来。

由于精力有限，我们的首要目标是基于现有的任务做好优化，真正把它应用到企业级的系统当中。同时我们也希望能和大公司合作，开发面向更多任务的应用。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

AutoKeras之外我们还做了一个叫做AutoKaggle的软件包。我们做这个软件包是因为Kaggle上有丰富的数据资源，代表了很多现实中的应用场景。

我们希望在AutoKeras的深度学习之外，也尝试做Automated的机器学习，覆盖不同类型和形态的数据。因为我们在实验中发现，深度学习并不是放之四海而皆准的工具，在很多任务中，传统的机器学习算法反而效率更高，效果也更好。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

最后我想用下图中的公式来结束今天的演讲。这里我提出了一个AI POW的概念，POW在科学计算中相当于乘方的概念，也就是说AI之上还有一个AI。人工智能要真正落地为人所用，就必须有另外一个AI支撑，其中A代表Automation（自动化），I代表Interpreation（可解释性）。希望在大家的共同努力下，人工智能能在各行各业落地开花。

美国德州农工大学胡侠：AI落地开花如何翻过“可解释性”和“自动化”两座大山丨CCF-GAIR 2019

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/7c6e264cb9b54c347a8d.html

上一篇：推特首席科学家MichaelBronstein加入牛津大

下一篇：提出了一种新的图神经网络计算结构MichaelB

指数词挖掘

星网大数据提供数千个行业精准行业词库，助力轻松扩展流量词。

行业信息 2024-07-13 15:17:58

3D坦克

【3D坦克】是一款基于网页3D对战游戏，游戏拥有与CS媲美的对战模式和3D的视觉体验。人与人之间可以组成战队，也可以加入混战地图进行对战。任何玩家将从“新兵”级别加入游戏，通过个人、团队配合不断升级，可以获得上尉、少校、中将、元帅等军衔。

游戏网游 2024-01-14 18:42:51

江苏维创散热器制造有限公司

江苏维创散热器制造有限公司主要产品包括散热器、中冷器、散热器配件、发电机组及配件制造、加工、销售，自营及技术的进出口业务。

电影视频 2024-07-11 23:03:00

极地旅行网：极地探险

提供最新旅游资讯信息,了解各地的民族习俗，旅游景点,旅游攻略,美食推荐，旅游文化。

新闻资讯 2024-07-11 13:33:08

桂工网

桂工网是广西壮族自治区总工会新闻门户网站，是广西唯一专业、全面传递工会声音、推动工会事业发展的综合性资讯平台，是维护职工群众权益的服务平台，是促进劳资关系和谐发展的互动平台，是展示我区工业发展风采风貌的展示平台，是团结全区广大职工，推动科学发展，共建美丽、和谐新广西的重要舆论阵地，也是我区全体工会干部和千万产业工人的网上精神家园。网站目前开设的栏目有要闻资讯、工会新闻、产经企业、数字报、桂工网视、公示公告、职工在线、榜样力量、职工文化、时评理论、专题聚焦等，每个版块下设若干子栏目，资讯全面、专业、集中，内容丰富多采。

新闻资讯 2024-07-11 13:40:59

尤物时尚网

不论性感或清纯,专业或业余,新人或老手,专职或兼职,这是创造和留住美的最佳平台.北京,上海,重庆,四川,新疆,黑龙江,吉林,辽宁,山东,江苏,浙江,湖南,湖北

招聘求职 2024-08-07 14:15:00

财气旺网

财气网,是国内最热门的站长信息平台,致力为广大站长和SEOER提供最全面的站长资讯、创业经验、建站源码等

新闻资讯 2024-07-15 20:38:50

重庆群优朋科技有限公司

重庆群优朋科技有限公司成立于2023年12月08日，注册地位于重庆市高新区曾家镇曾家大道301号附7号，法定代表人为李兴梅。经营范围包括一般项目：软件开发；网络与信息安全软件开发；信息技术咨询服务；信息系统运行维护服务；信息系统集成服务；技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广；网络技术服务；软件销售；软件外包服务；数字文化创意软件开发；人工智能理论与算法软件开发；人工智能应用软件开发；人工智能基础软件开发；区块链技术相关软件和服务；计算机软硬件及辅助设备批发；动漫游戏开发；数字内容制作服务（不含出版发行）；数字技术服务；数字文化创意内容应用服务；平面设计；广告设计、代理；广告制作；广告发布；数据处理和存储支持服务。（除依法须经批准的项目外，凭营业执照依法自主开展经营活动）

游戏网游 2024-11-13 12:23:14

遥感学报

《遥感学报》致力于报道遥感领域及其相关学科具有国际、中国国内先进水平的研究报告和阶段性研究简报以及高水平的述评；着重反映本领域的新概念、新成果、新进展。

网络应用 2024-12-02 20:18:15

斑驳蓝

斑驳蓝,全球创作者交易服务中心;网站交易、源码交易、课程交易、链接交易、广告买卖、解说文案、建站美工任务;安全快捷的站长交易、出售、求购、交流分享平台。

电影视频 2024-12-05 22:26:11

东莞劳务派遣,东莞临时工派遣,东莞毕业生安置,东莞劳务派遣公司

东莞市锐天人力资源有限公司专业提供东莞劳务派遣,东莞临时工派遣,东莞劳务分包,,毕业生安置,东莞劳务外包等东莞人力资源服务,是一家专业的东莞劳务派遣公司,东莞劳务派遣电话:0769-83559538

下载资源 2024-12-06 16:10:45

河南吉泰集团有限公司

河南吉泰集团有限公司经营范围：污水处理及其再生利用；自来水的生产和供应；市政公共设施管理；城市基础设施建设；城市绿化管理；投资与资产管理；土地整理；育种和育苗；房地产开发经营；工程管理服务。

编程开发 2024-12-06 16:45:11

tga年度最佳游戏大全2023 好玩的tga年度最佳游戏有什么 (Tga年度最佳独立游戏)

今天小编想给大家带来的tga年度最佳游戏的一些盘点，好玩的tga年度最佳游戏有什么，tga年度最佳游戏一直都非常备受关注，这些游戏大家可都要去体验体验，那么小编今天就想给大家带来几款tga年度最佳游戏的介绍，那么对tga年度最佳游戏有兴趣的各位可以和小编一起看下去，相信大家看完小编的介绍一定会迫不及待的去下载的，1、，原神，原神，是...。

2025-02-11 21:56:48

有趣的绳子游戏大全2023 好玩的绳子手游推荐 (有趣的绳子游戏教案)

绳子可以用来做什么呢，作为我们生活中常见的一种材料道具，在现实中经常用来捆住东西，固定是其最实用的功能，除此之外它还有多种功能，今天小编给大家介绍有趣的绳子游戏大全2023，这五款关于绳子的游戏大多属于休闲益智类，而且上手简单，玩法规则易懂还能打法无聊时间，一起来看看吧，1、，解绳子，解绳子，是一款超好玩的益智类手游，进入游戏后可选...。

2025-02-11 20:49:51

控光分区 MiniLED电视即将发布拥有2000 海信U8KL (控光分区有什么用)

ZNDS智能电视网获悉，海信ULEDXMiniLED新品发布会即将于9月26日在线上举办，届时，海信U8KLMiniLED电视即将正式发布，据电商详情页目前透露信息，海信电视U8KL涵盖65，75，85三个尺寸机型，采用信芯X画质芯片·大师版，搭载ULEDX技术平台，拥有2000，分区，支持全新XDR，PRO，色域值达2000%BT....。

2025-02-02 18:46:07

头条搜索上线搜索竞价广告 (头条搜索上线了吗)

正式上线不到2年，头条搜索也要开始搞竞价广告了，近日在头条系广告业务中除了信息流之外，还新增搜索竞价广告业务，这个变现速度够快的，赶超当年的百度，有关注头条搜索的站长都知道，头条搜索最开始露头是19年3月份，后续一路高歌猛进，低调放出爬虫遍地抓取内容，全面开放搜索，上线头条百科，建立站长平台，上线免费官网认证，算是在百度搜索，360搜...。

2025-02-01 22:54:25

百度二十年能否冲破搜索框 (百度20年)

从来没有哪家互联网公司像百度一样，同时身负盛名与骂名，它在中国互联网江湖搏杀二十年，见证了无数的一夜成名，也见证了将军迟暮，美人白首，尽管市值已经不足阿里或腾讯的十分之一，但仍在流传的，BAT，称谓证明了它还有那么一些江湖地位，然而，反过来看，无论在哪个中文互联网社区，，骂百度，似乎成为一种政治正确，，百度有难，八方点赞，百度是什么...。

2025-01-31 00:13:06

加盟昔乡记湖南米粉如何

生活节奏的逐渐加快，让大家对于餐饮的选择也是讲究快节奏，所以快餐行业也是受到了广泛的追捧，昔乡记湖南米粉所拥有名声也是遍布全国，中西方餐饮文化结合的美食，所带来的消费者群体广泛，门店所收获的广泛范围，也是引起了大家对于加盟的反响，那么昔乡记湖南米粉如何加盟，昔乡记湖南米粉选材方面所投入的心思是非常多，新鲜是必然的，同时颜色之间的搭配，...。

2025-01-16 00:41:40

蚂蚁集团发起 InTech科技奖支持计算机领域杰出青年学者发展 (蚂蚁集团发起商圈共建计划)

7月15日，蚂蚁集团宣布发起，蚂蚁InTech科技奖，暨首批候选人招募，作为一项科技公益奖项，，蚂蚁InTech科技奖，面向计算机领域理论探索、技术突破、工程实践方向的研究及实践者，每年评选出不超过10位在相关领域做出突出科研成果的青年学者，每人支持20万元人民币，以人工智能为代表的计算机科学的飞速进展极大拓展了技术的视野和想象，这些...。

2024-12-04 00:45:42

享受极简的娱乐爱奇艺电视果4K之体验 (享受极简的娱乐的句子)

不知不觉，4K时代仿佛已经正式到来，越来越多的4K电视乃至4K手机出现在了人们的身边，但单单有了硬件设备，其实还远远不够，搭建4K内容平台，同样也至关重要，那么笔者手上的爱奇艺电视果，便是支持手机4K投屏的智能硬件，不仅如此，该款电视果4K还支持百度DuerOS2.0人工智能，在使用方法上得到进一步的提升，那么体验如何呢，外观，足够简...。

2024-12-03 20:17:04

品牌篇汽车百科魏牌 (汽车百大品牌)

每天意识一个汽车品牌，魏牌WEY，一、基本消息品牌称号，魏牌，英文名，WEY，国别，中国，总部，中国河北省一保定市，品牌类型，华系，创立期间，2016年，开创人，魏建军，所属个人，长城汽车股份有限公司，二、品牌简介魏牌早期叫WEY，先改名魏派，后又改为魏牌，是中国长城汽车历时四年打造出的中国奢侈SUV品牌，成立于2016年，总部位于河...。

2024-07-07 12:19:10

普京访华！欢迎仪式有几个特意布置 (普京访华欢迎仪式视频全过程播放)

撰文丨余晖中俄相关开展迎来关键时辰，应国度主席习近平约请，5月16日至17日，俄罗斯总统普京对中国启动国事访问，普京在接受新华社采访时提到，，正是两国策略同伴相关史无前例的高水平，让我选择选用中国作为我正式就职俄罗斯联邦总统后第一个出访的国度，几个不凡布置中俄元首往年终次会晤，备受环球高度关注，往年是中俄建交75周年，访问时期，两国...。

2024-07-05 01:17:11

对话框，对话框如何，什么对话框，哪些对话框，怎么对话框

2023-11-07 19:31:24

新闻网站大全-重庆分类目录网

重庆分类目录网站收录新闻相关的优秀网站大全分类检索，为上网用户提供新闻网站排行榜与您分享、收藏！

2023-09-18 01:03:12

文章推荐

如何加盟晋级教育需要多大面积 (如何加盟晋级俱乐部)

大多的家庭都是处于双职工的现象，在孩子的教育上基本是力不从心，顺应这一需求，不少的托管教育均是取得了不错的发展，晋级教育依托十八年的托管教育，打造素质化的教育团队，保持和上万家的品质机构合作，资源互享，教学上的优势，给予孩子们的成长带来诸多的乐趣，真正做到了让孩子们开心，家长安心的教学机构，发展趋势趋于红火，并逐渐成为热门的创业项目之...。

2025-01-31 21:25:52

创业加盟

外骨骼从帮助截瘫病患行走到控制机器人 (外骨骼的原理)

据报道，年龄在15到64岁的人群中，有4400万有些基本的行动困难，包括举物、搬物、行走、曲体、坐下和站立等，欧洲每年有110万人中风，这常常带来上肢或者下肢的瘫痪，因此，考虑到后续的经济和社会影响，让这些年轻人和老年人重新获得自主移动的能力是当下的首要目标，外骨骼，正如其名，是在身体外部起到支撑作用的系统，首先，他们辅助康复中心的专...。

2024-12-03 23:47:49

资讯动态

奇安信发布Q (奇安信发布防勒索融合机)

8月25日，奇安信集团在京发布了Q，GPT，奇安信大模型，安全机器人和大模型卫士，Q，GPT安全机器人是基于奇安信大模型的，虚拟安全专家，，可以全天候工作，一台机器人等于60多位安全专家，可产生约2000万元的运营效益，极大提升了生产力，大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源、大模型应用分析等为一体，...。

2024-12-03 17:00:54

资讯动态

客厅装投影仪的利弊 (客厅装投影仪好还是电视好)

发表在专业问答2022，4，2611，30展示机型信息，品牌型号，当贝F5系统版本，当贝OS3.0客厅装投影仪优点是移动方便、画面尺寸灵活、保护眼睛、观影代入感强、玩法多样；缺点就是抗光性差、画面效果一般、后期维护繁琐、价格更贵，客厅装投影仪的利弊优点，客厅装投影仪相对来说画面尺寸是比较灵活的，可以投射大幅影视画面，也可以选择投小一点...。

2024-11-28 20:15:09

网络百科