计算机视觉技术无处不在 六大亮点解读 (计算机视觉技术的应用)
一年一度的谷歌 I/O 开发者大会,今日凌晨(北京时间)再度于加州山景城召开。
自 2008 年至今,每届谷歌 I/O 不仅已成为全世界 IT 开发者的固定节日,更在科技互联网圈掀起周期性地震——谷歌往往选在此时,宣布旗下产品、软件、服务的重大更新,一并公开秘密研发的新项目。震撼一时的 Google Glass、Project Ara、Google Assistant 俱都问世于此。这些项目各有成败,但不可否认,它们在一定程度上代表了未来科技创新的风向标。
2017,风向又在哪里?
机器学习——这四个字囊括了本届 I/O 的主题。用谷歌 CEO Sundar Pichai 的话来讲,是从“Mobile First“转为“AI First”。 如果说,去年是 I/O 大会将重心从移动开发转向人工智能的第一年。今年雷锋网看到的,是以全面拥抱 AI 的姿态让开发者重新认识的 I/O;这也是本届大会的与众不同之处。
顺便说一句,今年 I/O 的保密工作做得相当好。尽管媒体圈风言风语,却仅仅停留在对大致方向的猜测,即“谷歌应该要做什么”;在“怎么做”上,却谁也说不出个所以然。比如,“白日梦” VR 平台下一步怎么走?Google Home 拿什么对标 Echo?Google Assistant 又要如何突围?
答案,便在凌晨的 I/O 主题演讲中揭晓。
作为揭幕演讲,Sundar Pichai 以及谷歌各项目负责人将 I/O 2017 的新发布消息浓缩于此,集中了本届大会的亮点。其中,谷歌发布了 Google Assistant、Google Home、Google Photos 与安卓的一系列升级,TPU 硬件也迎来了第二代。下面请看雷锋网记者在会场为您带回的报道。
Google Assistant
Sundar Pichai 表示,Google Assistant与搜索并列,是谷歌机器学习技术最重要的产品/服务载体。
AI 圈内的风评是,Google Assistant 的核心技术领先于亚马逊 Alexa、微软 Cortana 以及苹果 Siri。但这一脱胎于 Google Now、内功扎实的人工智能助理平台,却在消费端的应用上慢人一步。
从今日 Keynote 演讲来看,这一情况很可能将从此改变:谷歌对Google Assistant 摆出的全力投入、不遗余力支持的姿态令人印象深刻。那么,Google Assistant 将迎来哪些升级?
首先,是 整合语音、文字、图像三大沟通形式 。
此前,语音对话是使用 Google Assistant的唯一途径。而即日起,Google Assistant 不但将如 Facebook Messager 平台的聊天机器人那样支持文字对话,还将在视觉途径与用户互动。而后者,是基于一项名为 Google Lens 的技术。
-Google Lens
Google Lens 是谷歌全新计算机视觉服务的名称,也是本届 I/O 的重中之重。Google Assistant、谷歌照片(Google Photos)等产品将与之无缝整合。Google Lens 能够用户智能手机中的照片进行图像识别处理,随后,Google Assistant 可基于其反馈结果与用户讨论看到的东西。
其使用场景包括:识别旅游地标;提取照片中的文字信息、手机号码;与谷歌翻译整合的实时翻译;当然也少不了谷歌照片,请见下文。
另外,Google Assistant 将登陆iPhone;其开发工具包 Google Assistant SDK 也即将发布。
Google Home
在亚马逊 Echo 凭空创造出“智能音箱”这一全新产品品类之后,各巨头猛被提醒,纷纷涌入这一意义重大的细分市场——以抢占智能家居入口、树立 AI 智能助理品牌。微软、苹果的产品据传已在路上。而暂列第二的谷歌 Google Home,离 Echo 的市场占有率还差得很远。
此次,Google Home 迎来了四大更新:
在 I/O 2016 上推出后,Daydream 并未如同部分人预期的那样掀起移动端 VR 革命,也未能在市场份额上赶上该领域的领头羊——三星 Gear VR。虽然主流手机厂商均加入了该项目,但支持 Daydream 的终端设备,至今仍屈指可数。
今日,谷歌宣布,三星 S8 以及 LG 下代旗舰将加入对 Daydream 的支持。
另外,谷歌宣布将于 2017 下半年推出基于Daydream 的一体式 VR,它内置处理器、不需要外接 PC,提供一站式的完整VR 体验,将像游戏主机一样只为其唯一功能而优化。
Daydream 一体 VR 设备将配备谷歌 WorldSense位置追踪技术,提供更精确的 VR 环境移动体验。
HTC 将在 Vive 之外,推出 Daydream 一体 VR 设备。继 Vive、Oculus、PS VR 之后的又一款明星设备?我们拭目以待。已确认研发 Daydream 一体设备的还有联想。
-Project Tango
Project Tango 这方面,最有意思的消息莫过于视觉定位系统“VPS”,全称为 “Visual Positioning Serivce”。谷歌表示,GPS 提供的是室外的精确定位,而 VPS 将利用机器学习、计算机视觉技术以及 Google Lens 提供室内的精确定位,包括对室内物体的定位。该技术有望在将来与谷歌地图整合,协助有视觉障碍的残疾人。
另外,第二代 Tango 手机华硕 Zenfone 已在路上。谷歌还推出了 Expeditions 教育项目,把 Project Tango 的AR 体验带入中小学课堂。
Android O、Android Go 与编程语言 Kotlin
3 月,谷歌向开发者公布了下一代操作系统 Android O 的预览版本。
对于 Android O 的全名,此前媒体圈的一致猜测是“奥利奥”(Oreo)——大伙儿也实在想不出,还有哪家甜点是以字母 O 开头。那么,Android O 是否就是奥利奥呢?
遗憾的是,谷歌仍没有揭晓。
悬念留待下半年揭开,我们来看看Android O 的几项新特性。
在更流畅体验方面,提供了:
核心性能优化方面:
这是谷歌即将对发展中国家用户开放的轻量级安卓版本,号称 1GB 内存即可流畅运行。目的是照顾低价设备以及低带宽网落环境,并提升多语言支持,力求保证入门级安卓设备的使用体验。
Android Go 将在 OS、APP、Play 商店三个层面对 APP 进行优化。相比标准安卓,APP 本地空间以及网络带宽占用都将显著减少。谷歌表示,未来每个 APP 都会提供 Android Go 版本。
谷歌宣布,这门诞生于俄罗斯的年轻语言,即日起成为最新的 First-class 安卓编程语言。Android Studio 3.0 已加入对其的支持。
Google Photos
谷歌宣布了Google Photos 基于机器学习技术的全面升级,很可能是其诞生以来的最大升级。Google Photos 将利用机器学习技术自动为照片添加标签、进行分组、自动对照片效果进行调整(比如自动翻转)。它还将整合 Google Lens 的图像识别能力,提供一系列新特性,比如识别照片中的电话号码。
新版本 Google Photos 的三大新功能:
第二代 TPU
在去年的I/O 大会上,谷歌宣布了其第一代 TPU。而刚刚发布的 cloud TPU,便是第二代产品。与初代不同的是,Cloud TPU 同时为训练和推理优化,单卡运算性能达到 180 teraflops。
巧合的是,一个星期前隔壁城市圣何塞的 GTC 大会上,老黄刚刚宣布了基于新一代 Volta 架构的 Tesla V100 深度学习计算卡,同样为训练和推理优化——雷锋网小编似乎嗅到了浓浓的火药味。
Cloud TPU 将加入 Google Compute Engine,为 AI 公司与开发者提供服务。值得一提的是,谷歌将拿出一千块Cloud TPU 组建 Tensorflow Research Cloud,免费提供给高校研究人员。
其它
以上便是谷歌 IO 2017 Keynote 演讲的主要内容。除此之外,还有三个产品/服务的变动值得大家注意:
首先是 移动版本的Tensorflow,名为Tensorflow Lite ,让开发者们在智能手机上运行快速、小规模的神经网路模型。谷歌将在下半年发布其 API。谷歌将在明日的机器学习讲座公布Tensorflow Lite 的更多细节,敬请关注雷锋网的跟踪报道。
再者, 是谷歌设立的新网站 Google.ai 。谷歌最新的 AI 研究成果、工具与应用将汇集在此,供研究人员与开发者学习参考。
最后,是 Youtube 推出的两项新服务。一是360° 视频直播,而是与 Youtube 主播付费沟通的Super Chat 功能,帮主播们改善生活。
原创文章,未经授权禁止转载。详情见 转载须知 。