中日韩文搜索算法主要设计者吴军 Google 区块链可能是大数据安全解决之道 (中日韩文字对照表)
雷锋网 AI 科技评论按:2018 中国计算机大会(CNCC2018)于 10 月 25-27 日在杭州国际博览中心举办,会议由中国计算机学会(CCF)主办,杭州市萧山区人民政府、浙江大学承办,浙江工业大学、浙江工商大学、杭州电子科技大学协办。
今年的大会主题是「大数据推动数字经济(Big>
Google 中日韩文搜索算法主要设计者、博士吴军
这是一个学术会议,我发现在中国,冠以「中国」开头的会议都是最高的,冠以「世界」的会议我都不参加——因为可能没有什么收获。在座的各位都是专家、学者,我站在这里显得有些班门弄斧,而且有时候我发现学术界存在一个鄙视链,做理论研究的看不起做应用研究的,而我是在鄙视链的最底层。
今天我讲的题目跟人工智能有关,因为我发现本次会议,大概有三分之二的报告内容跟人工智能有点关系。如果在十年前我们开这个会议,一定不会出现这样的情况,那为什么今天会出现这种情况呢?很大的原因是,2016 年 AlphaGo 赢了李世石,这成为了人工智能技术的一个节点。
人工智能的发展趋势:「超级人工智能」
从 2016 年至今,我的感受是 人工智能的发展有这么一个趋势:它从类似于人的单一的智能单机或者说系统智能变成了网络智能,所以我把它叫做「超级人工智能」 。
很多人问我怎样判断一个人研究的课题是真是假?我说很简单,如果要造飞机,那些在研究鸟类飞行的就是骗子,因为他需要研究的,其实是空气动力学。如果我们能够找到他所做研究的一些科学基础,那他就是在真正做人工智能研究。
今天,人工智能有三个基础:
两年前,一位原来做深度学习的同事跟我说,他过去每次参加机器学习类会议,大概能够坐 100 人的会场只坐了 10 个人,这 10 个人还都是去做报告的。深度学习本身是一个数据模型,我们可能还会找到更好的数据模型,不过这是机器的特长,而不是我们人的特长。
除了人工智能,还有两件事发展得非常快,一个是 IoT,这使得我们跟踪东西变得不再那么困难;另一个是区块链。
最近有一个热门的话题叫做 5G,今天你的手机上网,哪怕是看 4K 电视,网速都是够的,那为什么还要 5G?在场有一千多位参会者,如果把我们的桌子、椅子都连接到一起,不管带宽多少,当我们同时上网时,网络都会变得非常阻塞,所以我们需要一个更好的上网方式。在 5G 时代,如果将所有的东西都连到网上,会怎么样?带来的第一个好处是我们可以跟踪很多事情。
讲两个很简单的真实例子。第一个例子,在教室装上摄像头来了解每一个学生是否有好好听课(这件事有没有侵犯隐私我们另说);另外一个是更现实的应用,如果你有孩子的话,当课后送他去补习班后,他可能在那边玩手机、橡皮,而在这样智能化的教室里,你就可以很好地监控孩子的动态。
在生活中我们还可以用这项技术来追踪更大的问题,比如说食品安全。阿里巴巴的人跟我说,中国的食品安全问题还很严重,这个问题也很难解决。后来我还通过一些做药品的人了解到,很多药店卖的是假药,一种情况是他不知道自己进的是假药,另一种情况是制药厂可能都不知道自己制造的是假药。还有反欺诈的问题,刚才黄教授讲了智能合约这个概念,如果我们将合约都变成这类智能合约,是可以解决违约、欺诈问题的。
此外,我们还可以进行健康跟踪。现在任何一架商用客机上都装有一千多个传感器,每天能产生超过 1 G 的数据,可以很好地监控里面的温度、湿度以及其他运行情况。但是人体内没有传感器,以至于今天很多人在得知自己得了癌症的时候,已经是晚期了。我们对自己身体的监控,做得远没有像对很多设备的监控那么好。今天特斯拉汽车里面装了几百个传感器以及计算功能强大的芯片,你买个非电动的汽车都有 200 个传感器。我们为什么不去做追踪人体健康这件事?一是因为有难度,二是因为存在隐私隐患。
今年 Facebook 出了一件大事,被曝卖掉了 5000 万客户的数据,而扎克伯格作证时则说他们卖了 8700 多万客户的数据。我们说云计算好,很大程度上是因为它安全,有专业的团队替你管理数据,不过有时候,专业团队的管理并没有我们想象中那么好。更重要的是,我们的信息安全需要建立在大公司的善意的基础上,一家大公司作为一个经济实体可以有这个善意,然而公司里面操作业务的人是否有这种善意,我们就不得而知了。 所以,我们需要从技术的角度来解决这个问题,因为有时候我们不能完全靠法律——法律总是滞后很多。
区块链可能是大数据隐私隐患的解决方案
对于网络连接带来的隐私隐患、风险和危害,区块链是一个可能的解决方案。 不过因为这个概念实在被炒得太热了,以至于现在大家都还在怀疑它是否是泡沫。
为什么说区块链可能是一个解决方案?因为它有一些很重要的特点:
然而,现实的情况其实不是这样的。
不过我认为, 任何一个问题都是一个机会,如果世界很完美,我们就都没有工作了,而恰恰就是因为世界不完美,才需要我们在座的计算机科学家去做一些事情 ,比如说刚才讲到的效率或者说延时问题。
第一代区块链协议是比特币,第二代是以太坊,以太坊是怎样提高效率的呢?打个比方,滴滴司机有两种方式接单:一是抢单,谁抢到就是谁的;二是由滴滴来进行订单分配。比特币的协议采用的就是抢单的方式,有很多交易需要验证真伪,最终会由第一个抢到的人进行验证,如果他验证出来了,这笔功劳就是他的,当他验证的足够多的时候,就会得到一个比特币的奖励。在大家一拥而上抢单的时候,整个验证过程的效率就变得很低,以至于每一次交易验证都需要花很多时间。
而以太坊的协议是,如果你想参与我们的验证工作,就要先买以太币,然后再根据你们手上所买的以太币数量,按比例进行分配。这样,区块链就从技术上解决了延时问题,从而提高了效率。
以太坊今天的价值为几百亿美元,虚拟货币市场是两千亿到三千亿美元。当到第三代区块链的时候,有可能把延时从以太坊的几分钟减少至几秒钟。
区块链到底有什么用?
一是能够保护跟踪我们的隐私。 斯坦福大学的一位教授发现,现在所谓的医疗病例数据共享在美国几乎是不可能实现的,病例数据共享在中国谈了这么多年,到目前为止也还没能实现,原因就是大家对隐私的担忧。有些人是坚决的反对者,他们认为一旦病人的数据泄露出去,比信用卡的数据泄露还要严重得多。
此外,还有两个严重的问题:一个是医院不愿意共享数据,另一个是病历的归属问题。 从现在的实际情况来说,无论中国还是美国,病历都属于医院,医院内部的信息系统是很难对外开放的。另外, 即使法律上将病历归属于病人,你也没有办法把它放到你家的计算机里。
如果有一个去中心化的地方存放病历呢?如果将一个病历开放给医院,每次访问收费十美元,医生都愿意支付查看。这就意味着如果你真有一个疑难杂症,一年收入可达十万美元,另外当一些研究者对这个病历感兴趣时,他们也会买来查看。而今天大家对 BAT 不满的是,他们卖你的数据,获利的却是他们。区块链则提供了一个可能性:将数据还给大家,让所有者从中获益,同时也让使用者从中获得更大的应用。
二是智能合约的应用。 中国过去在商业上有一个词——三角债,这个问题很难用现有的技术从根本上解决。为什么?比如在之前还欠别人的款的情况下,你再去向银行贷款建工厂,因为所贷的这笔款是可以很快被挪用的,经银行批准后,你就可能把钱挪做他用,最后就形成三角债,从而导致经济运行效率的下降。只要是由人来进行拨款,三角债问题就很难被解决。
人工智能发展到现在会进入一个新阶段,而人工智能和人的区别在于群体效应,比如无人驾驶汽车,将来会将整个城市的所有车都连成一张大网,从而带来极大的网络效应。
如果把人工智能想象为一个人,IoT 相当于是它的五官,计算机程序就是它的大脑,许多连接会带来大量安全隐患,在这种情况下,区块链有可能成为一个很好的解决办法。
虽然区块链现在还存在很多问题,跟它相关的项目可能 99% 都是骗人的,但是我们确确实实看到区块链可以用来做跟踪,来解决现有技术所解决不了的一些难题。
最后与大家分享我的观点: 任何时候当你碰到问题,倒过来看可能就是机会。这个世界上有各种各样的问题,当应用上出现困难的时候,可能就是在座每一位计算机科学家的机会 。
(完)
敬请关注雷锋网 AI 科技评论更多现场报告。
原创文章,未经授权禁止转载。详情见 转载须知 。