城市计算 智能城市破招之术 何为 (城市计算与人工智能)
智能城市已进入资本快速入局、巨头圈地暗战的阶段,尤其是随着全国两会的热议、《粤港澳大湾区规划纲要》等文件的发布,传达出政府对城市智能化的巨大需求以及民众对城市生态的呼唤,城市问题日益严峻、日益增多的政府订单使得智能城市拥有一片巨大的蓝海。据统计,国内争先上马智能城市项目的城市多达500+。
无独有偶,学术界对于智能城市也格外关注。今年年初,在国际人工智能领域最权威的会议AAAI 2019上,我们注意到“城市计算”成为争相热议的焦点。城市计算理念的提出者、京东集团副总裁郑宇更是成为首个受邀在AAAI大会上发表主题演讲的中国大陆学者。
到底什么技术模式才适合城市?
不可忽视的问题是,在行业野蛮生长的同时,到底需要怎样的技术和模式才能够真正支撑智能城市发展的这片蓝海?
在雷锋网看来,随着感知技术的成熟,各种大数据在城市里悄然而生。与此同时,人工智能技术的日趋成熟也使数据分析更为便利。如果使用得当,我们就可以利用这些城市大数据和智能算法来解决城市所面临的问题,如城市规划不合理、交通拥堵和能源消耗增加等。也就是说,对城市数据的处理和使用,必然将是IoT、云计算、大数据和AI等技术的互相融合。
在国内,做智能城市有以下几种模式:
互联网巨头智能城市的 技术逻辑 也均有所不同,比如在京东,行业首提打造城市计算平台,对特殊的时空数据进行感知、管理及分析,做城市操作系统的野心毕露无疑;在阿里,ET城市大脑的总体架构中有数据资源平台,视觉AI项目4箭齐发;在腾讯,超级大脑的背后是一套云智天枢的系统,数字广东也顺势搭建了公共服务平台......此外,这个领域还活跃着平安、百度等巨头和千寻位置、高德地图等主打定位导航的一批垂直公司。
可以说,智能城市不是一场营销套路的比拼,而是实打实的技术架构、技术实力的较量。从技术角度来看,AI+云+大数据是基本的能力,这一点目前市面上主要厂商基本具备。但我们有三点疑问:
所以,有必要就市面上出现的“城市大脑”、“城市计算”类的平台做重点技术剖析。
为什么是城市计算?
以京东城市的城市计算平台举例,我们注意到,城市计算平台针对城市数据的流动性设置了4个梯次,分别为 城市感知和数据获取层、数据管理层、数据分析层和服务提供层 。例如,在城市感知层面,通过车载 GPS 或用户的智能手机产生的轨迹数据来不断感知司机的驾驶状态。在数据管理层面,通过时空索引结构把感知到的数据组织起来,用于后续实时分析和挖掘。在数据分析层面,可以根据这些轨迹数据较为准确地确定城市的异常状况发生的时空范围。在服务提供层面,这些信息会被及时地传递到交管部门和周边通行的人群,以快速处理异常并避免更多人陷入混乱。
BATJ等专业的厂商在打造智能城市时,第一步必然是用传感器获取数据,但是不可避免会遇到同一类问题,比如有限传感器下如何最大化获取关键数据?如何部署和评估?怎么规避偏性样本问题?如何防止由于数据稀疏性带来的数据缺失?怎么应对数据丢失后的价值填补?这是行业必须跨过的第一个门槛。
以北京的空气质量检测和交通流量预测为例,即便35个空气质量监测子站已全面覆盖这座城市,但由于空气质量随着时间和地点的不同发生巨大的非线性变化,给空气质量检测带来难度。同样如果从出租车的GPS轨迹来预测城市交通流量,也会遭遇偏性样本的挑战,毕竟私家车和出租车属性不同,出租车的分布并不具有普遍的代表性。
这里就不得不引申出一个重要概念—— 时空大数据 。
为什么说它重要?因为时空数据能很好解决前面遇到的问题,并为后续的数据管理、分析和服务提供奠定基础。时空数据这个提法是计算机技术发展下的产物,因为人类获取信息的渠道不仅在局部地面、地球表面,甚至已经扩展到地球各圈层乃至外太空。时空数据不仅数据庞大,还具有非线性和时变等特征。
而城市计算平台正是融合了这一重要的技术。在业内,京东城市就曾提出著名的“ 时空数据6种模型 ”,为今后数据收集进行分类匹配,定义数据管理和机器学习的算法,使之具备可扩展性和重复利用属性。
具体来说,根据结构,城市计算平台把城市数据分为 2类 ,即基于点的数据、基于网络的数据;而根据相关性,把数据分为 3类 ,即时空静态数据、时间动态-空间静态数据和时空动态数据。
时空静态数据以POI数据(兴趣点数据)最为典型,比如位置固定的加油站、商场、地铁等,最大特点就是人流量的变化,其他属性不变;空间静态时间动态数据以IoT数据(物联网数据)最有代表性,传感器数据随时间推移在变动;时空动态数据最直观的就是Check in数据(打卡数据),滴滴与Uber上的请求就是不同人和车建立联系的调度过程。由于城市内部最为复杂的就是轨迹数据,集合了时间、空间、方向等信息,因此上图中第二行的基于网络的数据就以道路网数据集作为典型代表进行研究。
另外,由于现有机器学习和云计算处理能力达不到精确处理时空数据的要求,城市计算平台还加入了其他一些 “有意思的”设计 ,比如时空数据混合索引(与常用的关键词搜索方式不同,现在需要搜索过去某个时间段的某个事件的发生,挑战极大);比如对多样数据集的处理(以空气质量检测为例,城市计算可以对实时与历史的天气情况、气象学数据、交通流量、POI数据、道路网络数据等做精确分析);比如交互式视觉数据分析(用简单的算法得到初级的结果,反馈给该领域的专家,用专业知识来进行提炼和剔除无用环节,最后这个数据将返还给算法,让机器学习计算出最新一轮结果)。
数据的获取和管理层完成有效的归类、标准化之后,数据分析层就会变得更加高效。可以说,对时空数据思考地越深,技术复杂度就越高,其操作手法就越加精细。特殊的AI算法和机器学习算法让城市计算平台对这些数据都能进行处理,从而形成 “新的技术门槛”。
实际上,城市计算的四层架构虽然每一层都有挑战,但每一层都有代表性的技术,甚至相互间构成了一个循环,最上层的服务提供层就是它要走向的实际场景。智能商业、智能交通、城市规划、环境能耗、公共安全、智能政务等模块,是城市计算平台目前的重点领域。随着城市源源不断提供新的数据,迸发新的需求,这套城市计算的系统将被更多地区域采用(已经在北京、上海、南京、成都等地落地)。
智能交通解决方案的异同
交通行业是目前智能城市落地比较成熟的行业之一,目前也出现几种较为清晰的模式,例如阿里城市大脑、京东城市计算平台和千寻位置时空大脑,通过对比,或许能看出各自技术的异同点。
阿里的城市大脑 是将人、车、道路数据都接入系统,通过人工智能分析技术,把庞大的数据转化为科学合理的业务模式,就此形成城市交通实时大视图,以此来完成城市交通系统的调度和管理。阿里认为,互联网+信号灯比只用传感器的信号灯更具有预见性,其具体做法是在大脑平台上植入高德地图的定位导航能力,每辆用APP导航的车去哪一目了然。一旦拥堵,大脑在全局视角下经过计算,将这个方向的绿灯通过时间延长,同时缩短其他几个方向的绿灯时间。等这个方向的车辆变少了,大脑会自动重新规划,始终保证红绿灯时间与车流量的合理匹配。
而 千寻位置的时空大脑 更关注在底层基础设施上运用多样化的IoT寻求厘米级定位能力,以此来对交通疏导做出反应。其做法是把传统的路灯、摄像头、警示牌、道路边上其它设施通过传感器的方式升级为新的IoT设备,自动获取路况实时情况,最后这些信息传到司机的地图APP上指导出行。将数据可视化,是千寻位置打通物理世界和虚拟空间的逻辑。
京东城市计算平台 的做法则是一种新的技术途径。通过深度挖掘各交通行业系统的业务需求,整合各类动态交通数据,城市计算平台打造规划、管控及预测的全覆盖智能交通解决方案,比如利用共享单车轨迹规划自行车道建设、城市路网交通状态实时掌控、智能违章停车检测等,为城市管理部门和交管机构提供数据驱动的交通管控优化指导,实现城市科学安全运转效率最大化。
走向行业实践是共同的大考
值得一提的是,数据来源于生活,服务于生活,但最终城市计算平台会把涉及安全和隐私的数据留在数据源头。雷锋网此前做过调研,发现大多市面公司是以和政府签保密协议的方式来规避数据泄露的风险,实际上这种冒险做法被城市计算平台舍弃了。如何实现?即不同组织间的城市计算平台可以实现互联,只要通过一个数字网关的转换,数据将留在政府内部——实际上这种做法就是将原始数据的物理聚合找到了一条知识交换的新方法。
城市问题不是一个孤立的存在,也不是短期内立竿见影的领域。解决城市问题时,从业的数据科学家需要同时具备行业知识和专业技能,利用领域A的数据解决领域B的问题,实现跨域数据的融合。再者,还需要尽可能多地掌握数据科学各个分支的技术,包括数据管理、数据挖掘、机器学习和可视化等。最后,还需要懂得如何使用、修改以及增强云计算平台,站在可落地的角度来解决问题。
这个领域已经活跃着一批志在改变现状的科学家、学者和企业CEO们。比如中国工程院原常务副院长潘云鹤、中国工程院院士高文、京东数字科技首席数据科学家郑宇教授,比如阿里城市大脑负责人闵万里,比如数字广东CEO王景田等,比如平安智能城市董事长俞太尉,比如浪潮集团董事长孙丕恕...... 同样是在AAAI大会上,郑宇教授首次公布了《Urban Computing》这本新著作,由MIT麻省理工学院出版,在会上被抢购一空。这本全英文的深度学术研究和行业实践成果,填补了国际城市计算领域的空白。
综上,如果说2018年各家智能城市的商业模式基本确立,那么可以断定的是,2019年将必成关键之年。5G的商用、城市内部、城市之间的网络基础设施能力将进一步提升,云计算、大数据、AI、IoT的技术也将更加成熟,在其之上的各类大脑应用、城市计算平台将走过缓慢曲线,进入急速爬坡期。
当然,除了城市资源,人才争夺战也将在2019年迅速拉开。
一文看懂京东智能城市布局:城市计算的“方法论”
原创文章,未经授权禁止转载。详情见 转载须知 。