微软人工智能公开课概览 (微软人工智能助手)

文章编号:36646 资讯动态 2024-11-30 人工智能API微软

人工智能无疑是当前最为热门的科技概念。作为科技界的领军企业,微软在人工智能领域耕耘已久。早在25年前微软研究院建立时,人工智能就已经成为整个微软的战略目标。微软为此倾注了许多精力和资源,并取得了亮眼的成绩,但它还有着更加宏伟的愿景:将人工智能带给每个人,从开发者到数据科学家,从技术爱好者到学生

本次公开课,雷锋网邀请到了微软亚洲研究院掌门人洪小文博士,为大家分享《微软人工智能公开课》第一章节——《微软人工智能概览》中的精彩内容,介绍微软在人工智能领域的最新研究成果以及微软的AI服务如何赋能开发者。

整套《微软人工智能公开课》已在微软虚拟学院全面上线,感兴趣的朋友可以点击链接()跳转学习。

据雷锋网了解,《微软人工智能公开课》分为三大块,呈金字塔结构,最底层针对所有的开发者,涵盖认知服务Cognitive Service以及Bot Framework。中间层针对数据科学家,包括Azure Machine Learning、HDInsight、Stream Analyst等。最顶层则瞄准需要开发自己算法的研究者,主要工具有 Microsoft Cognitive Toolkit、Azure> 微软人工智能公开课概览 | 雷锋网公开课

洪小文博士,现任微软全球资深副总裁,微软亚太研发集团主席,兼微软亚洲研究院院长,全面负责推动微软在亚太地区的科研及产品开发战略,加强微软与中国和亚太地区学术界的合作。

洪小文博士是电气电子工程师学会院士(IEEE Fellow),微软杰出首席科学家和国际公认的语音识别专家。洪博士在国际著名学术刊物及大会上发表过百余篇学术论文。

以下为雷锋网对嘉宾分享内容的实录精编。

人工智能概述

很多人都在问,我们研究人工智能的目的是什么。微软的答案是:让我们的应用和服务能够拥有像人类一样认识世界的能力,在视觉、语音、语言、知识等维度得到拓展,带来更好的用户体验。

还有很多人问,人工智能该如何分类,究竟哪几部分算人工智能。人工智能技术纷繁复杂,但微软认为可以归结为三大类:

以智能手机为例,我们与智能手机的交互是通过不断点击屏幕上的菜单来实现的;用户需要耗费很多时间学习菜单中每个选项代表的意义。认知服务可以让我们与机器的交互变得更加简单直接,机器也能更好地了解用户的意图,不必浪费太多的沟通时间。

微软AI的发展历程

微软在AI领域耕耘已久。1991年,微软AI基础研究院成立,致力于打造一个能够听懂、看懂和理解人类以及世间万物的电脑。2007年,微软语音部门从研究部门正式转为产品部门,开启了AI的产品化道路。到2014年,在天津的一个活动中,微软系统已经能够将英文演讲实时翻译为中文了。紧接着,2015年微软亚洲研究院的计算机视觉系统首次在ImageNet上打败了人类。这套计算机视觉系统对超过2000种物体进行辨认,失误率仅为3.5%,而人类的失误率为5.5%。当时这套神经网络共有152层,如今已经发展到了上千层。

微软人工智能公开课概览 | 雷锋网公开课

但对于微软来说,人类与人工智能的关系不是谁打败谁。事实上,AI将成为人类最好的工具,能够拓展人类的智能,让人类完成更多的事情。一般我们理解的AI是Artificial Intelligence(人工智能),但也可以将其阐释为AugmentedIntelligence(增强智能)。未来人类与机器密切合作,就能实现我们理想中的Superman。微软的愿景就是,通过API等方式让AI这项看似高大上的技术平民化。有了微软的认知服务API,开发者无需自己做人脸识别、年纪识别和物种识别,只要使用相应的API,就能轻松调用这些功能,在其熟悉的领域开发应用。

微软认知服务API

微软的认知服务API主要可以归结为5大类:

微软人工智能公开课概览 | 雷锋网公开课

微软此前和一个非营利组织达成合作,共同寻找失踪儿童,其中就用到了视觉服务中的人脸识别。利用算法和深度学习,系统可以了解一个人的外貌。虽然人类在成长过程中外貌会不断变化,但系统可以从数学的角度找到比例等不变的特征,从而将其辨认出来。

微软的人脸识别API,除了可以检测图片中的人脸,识别其属性;还能实现人脸验证、相似人脸搜索、人脸分组、人脸辨识等功能。此外,情绪识别也是人脸识别的重要应用之一。微软的情绪识别API并非简单反馈对象的情绪好坏,而是返回一个分值,供开发者进行判断。

微软的语音API目前已经具备了听和说的能力,支持多国语言以及多种方言。此外,声纹识别也是语音识别中非常重要的部分。通过声纹识别,系统可以辨认出说话人是谁,这对提升语音识别的准确率非常关键。尤其是在嘈杂的环境中,如果系统可以辨认出用户,那么就可以对背景声和其他人的语音进行屏蔽,实现更好的语音识别效果。

语言和语音的关系非常紧密,语音只解决了“听到”的问题,能够辨认出句子中的每一个字;但要“听懂”,了解这些句子背后的涵义,就需要用到语言能力。语言能力建立在语音的基础之上。以往很多所谓的自然交互都是通过关键字判断来实现的。比如,用户输入“帮我看看是否有违章”,系统自动检测到关键字“违章”,就能得知用户想要查询违章记录。而借助深度学习的语义理解,即使用户输入的信息中不包含关键字“违章”——比如输入“帮我看看是否有违法停车”“我昨天闯红灯了,怎么办”,系统也能理解用户的真实意图。

“知识”能力的应用场景很多,其中最具代表性的是学校,比如寻找论文等。此外,很多企业也运用到了“知识”的能力,比如利用用户产生的数据,通过深度学习,向用户提供个性化的产品和服务。

机器人写歌

将多个微软的人工智能API整合到一起,可以开发出非常有趣的应用。比如一个叫做songbot的应用,它可以识别图片中的内容,自动获取关键字进行歌词创作,并将作品唱给你听。

微软人工智能公开课概览 | 雷锋网公开课

以上图为例,系统扫描图片后自动获取到“小鸟”“飞翔”“自由”“梦想”和“天空”等关键词,这部分用到了视觉的能力。songbot通过学习多达20万首歌,基于自然语言能力,理解了歌词的结构和组织。因此获得关键词后,可以利用机器学习重新创作歌词,最后利用语音合成技术把它唱出来。

微软人工智能公开课概览 | 雷锋网公开课

微软人工智能公开课

为了让开发者、数据科学家、技术爱好者和学生能够充分利用微软的人工智能API,开发出更强大的应用,拓展全人类的智慧,微软特地推出了《微软人工智能公开课》,邀请各个领域的专家为不同知识程度的人工智能从业人员及爱好者提供针对性的专业辅导。 该课程可以通过登陆微软虚拟学院轻松获取。

原创文章,未经授权禁止转载。详情见 转载须知 。

微软人工智能公开课概览 | 雷锋网公开课

全局中部横幅
养成游戏,养成类游戏,养成小游戏,养成小游戏大全,4399小游戏

4399养成小游戏大全收录国内外养成游戏,养成类游戏,养成小游戏,恋爱养成小游戏,养成计划小游戏,明星养成小游戏,少女养成小游戏,皇帝养成计划小游戏。好玩就拉朋友们一起来玩吧!

云视觉

云视觉-文化传媒行业云平台。涵盖明星名人经纪、展览展示、活动策划执行、设备租赁及搭建、庆典演出支持、会议会务策划、会展设计搭建于一体的专业化传媒行业在线服务平台。为国内活动公司、庆典公司、会议公司、展览公司、演出公司、公关公司、会务公司、礼仪公司、婚庆公司、广告公司提供最有价值的大数据服务。

义乌市事营信息科技有限公司

千胜体育网每日分享体育锻炼计划,锻炼小常识,比赛赛事,运动员资料,足球世界杯,提供多种体育训练计划和训练方法。

圆桌冰壶竞技联盟

圆桌冰壶运动竞技联盟官网

华裕肥业

华裕农业科技有限公司下属的华裕肥业成立于2014年。

深圳办公室装修

富邦装饰是一家以办公室装修、厂房装修、店铺装修、展厅装修、家居装修等装修服务。服务范围:宝安,西乡,福永,沙井,松岗,石岩,翻身,观澜,公明,龙华,大浪,民治,观兰,横岗,坂田,龙岗,福田,南山,罗湖,西丽等

专注网站建设,竞价托管,网站优化,网络推广

德州网站建设选择诺来网络专注德州网站建设公司,专业从事网站建设、网站制作及网站维护,网站运营,网站外包,网站托管,网站推广,PC+手机+APP+微信建站推广一步到位,实现企业品牌/产品多终端展示,7年专业经验,上1000客户案例,欢迎咨询18654757623!

工具啦

工具啦,提供各类站长工具、实用查询、娱乐算命、在线图片处理、贷款计算器、在线手册等常用工具。

祁县快快查网络科技有限公司

主要从事互联网数据服务,大数据风险评估等服务.公司自成立以来,坚持以人为本的原则,拥有一支高素质专业化的服务团队,保证了我们为客户提供高水准的服务.公司建立了一套科学、严谨的组织架构和专业化、规范化的风险防控体系.希望我们的服务可以真实、有效的帮助到客户,期望与客户携手共进,共创美好灿烂的明天!

B2B网站大全

688B2B网址大全(192688.com)汇集多行业B2B网站,包含商贸、外贸、机械、五金、化工等知名网站,提供免费信息发布网信息站和行业网址大全、分类信息网站大全及免费黄页。

全局底部横幅