未来5 百度王海峰Quora精华整理 (百度一下未来)

文章编号:46396 资讯动态 2024-12-10 王海峰吴恩达百度百度NLP

百度王海峰Quora精华整理:未来5-10年,NLP领域将会有什么进展?

雷锋网按:近日吴恩达发文将在4月底离职百度。几乎在同一时间,百度也宣布进一步深度整合,将包括NLP、KG、IDL、Speech、Big target="_self">深度 | 百度副总裁王海峰:百度在NLP领域都做了什么?》。

王海峰博士出席的媒体活动不多,但在Quora上比较活跃。雷锋网根据王海峰博士在Quora上的五个精华问答整理成本文。

1、从一名科学家转变为一个IT公司的总裁,你如何看待这种职业变化?

我对技术感到着迷,并乐于沉浸在研究工作里。我始终相信,科技能够改变世界。百度为我提供了一个理想的平台,在这里我从事的技术工作可以快速直接地让用户受益。这就是我一开始加入百度的原因。在百度最初的几年时间里,我领导了NLP、语音、图像、数据挖掘、知识图谱、机器学习、深度学习等多个团队。后来,我意识到伟大的产品将会连接技术与广大用户,反过来也会更加促进技术进步。 伟大的产品,不仅需要先进的技术,还需要杰出的设计、优秀的营销和高效管理 。因此我渐渐改变了自身的角色,从一个单纯的研发团队负责人,转变为管理层的一员。我如今领导的团队有3000多人,包括技术、产品和营销成员,他们都很年轻、精力充沛、富有激情。我们拥有着一个共同目标:用技术和产品改变大众日常生活。

当掌管一个大型商业团队的时候,我需要首先制定策略和目标,然后建立一个合适的执行团队。对于一个大型团队来说,良好的规则和文化,开始成为支撑和保证业务运行的重要因素。与此同时,对于科技领域的重大突破、用户需求的演变,以及整个社会的发展趋势,我都保持极大的关注

2、未来5-10年,NLP领域将会有什么进展?

机器翻译、语义理解、问答和对话技术将会有重大突破。这些技术将会被广泛应用,并最终改变人与计算机、人与各种硬件设备、以及人与人之间的沟通方式。

这些技术的发展将得益于以下四个领域的发展:大数据、学习机制、知识图谱、推理和规划

大数据。随着互联网的繁荣,数据量和种类都在高速增长。即便是非常传统的商业领域,都在开始把数据放到网上。一切都在网上进行,一切都在互联。大数据的价值将继续在物联网领域增长。

学习机制。学习机制的发展将会持续进行,这使得我们能从大数据中学习更多的东西。

知识图谱。通过大数据和更多强大的学习机制,我们可以打造更大的知识图谱,来对整个世界进行建模。

推理和规划。通过大型知识图谱,我们可以在推理和规划领域取得突破。推理和规划的能力将会把更多智能注入NLP系统中。

3、在NLP领域,中文和英文的主要区别是什么?

从语言学上来说, 中文与英文有很大不同。中文书面文本单词之间是没有空间的,中文的语法关系是通过单词的顺序来表达的。这些因素增加了中文在词汇、语法和语义层次上的模糊性,因为现代语言概念和原则更适用于英文,而非中文。

目前,主流NLP方法都是语言无关性(language-independent)的。这些统计学或神经网络算法,根据不同的应用,都更进一步优化了特定语言 。

比如,在2015年5月,百度发布了第一个大型在线神经机器翻译系统。基础的NMT模型就是语言无关的,并输出了非常好的翻译结果。为了进一步改善翻译性能,我们使用特定语言特征优化了翻译系统。

4、NLP技术如何应用于百度产品里?

在百度,我们开发出很多NLP技术,包括知识图谱、语义理解、内容标注、情感分析、生成、摘要、问答、机器翻译和对话系统等等。这些技术已经应用于许多百度的产品里,比如搜索、新闻流(news feed)和智能助理,每天为数亿用户服务。我们将以上这些技术通通整合进一个名为NLP Cloud的平台中。

NLP Cloud提供20多种NLP模块和方案,服务于百度产品。我们的NLP Cloud服务每天被调用1千多亿次。

以搜索为例,典型的NLP模块,比如切词、命名实体识别、语法分析、释义都是基本特征。这些模块一直在持续优化并取得突破。另一个典型的NLP技术应用案例就是问答系统。一个高性能的问答系统需要对查询语句进行精准的语义分析,构建覆盖面广的知识图谱,同时对网页搜索结果进行全面分析。当用户在搜索框输入查询语句时,搜索引擎能够立马提供答案。很多用户也使用搜索引擎来查询相关性高的信息,帮助做决策。这种情况下,情感分析(也称观点挖掘)技术可以帮助提取多种备选观点,并将聚合的信息提供给用户。

另一个案例就是新闻流,这个领域文章质量是极其重要的。NLP技术可以帮助检测各种废品文章,比如谣言、抄袭等等;而文本分析技术可以帮助识别高质量文章,并生成最能够描述该文章的标签。此外,从不同维度描述用户偏好的“用户模型”也十分依赖于NLP技术。

总而言之,在所有跟自然语言相关的产品里,NLP技术都是不可或缺的

5、在未来10年,搜索引擎将会如何演变?

今天当我们谈及搜索引擎的时候,首先想到的就是搜索框和搜索结果。而未来的搜索引擎将会是什么样子呢?我们并没有确切答案。但是我们乐于拥有更强大的搜索引擎,让我们在不同的场景、不同的产品或不同的交互界面里,能够看见、听见和感受到。 搜索,将会无处不在

第一点,更深入理解用户的意图、更深入理解内容,并将两者更精准地进行匹配,这将会使搜索引擎更为强大 。用户的意图理解并不是依赖于单一查询语句,也还依赖于更广泛的搜索语境,包括查询session、时间、地点、设备以及用户性格特征。另一方面,内容理解涉及的范围也非常广,需要更好地理解每一部分内容的语义、语境、观点,以及从内容中提取的知识。意图与内容的匹配,将会涉及到以上提到的所有因素,使得在任何一个特定语境下,为每一个查询提供最好的结果。此外, 搜索引擎将会变得更像一个“回答引擎”和“执行引擎” 。大部分用户的查询,将会得到直接的回答或执行。

第二点,搜索交互界面将会发生很多新变化 。除了键盘以外,其它输入方式,比如声音和图像,将会越来越广泛地使用。伴随更实际的语音和图像等技术,用户会十分青睐高效和便利的多模式搜索。特别地,自然语言交互将会成为搜索引擎的主流交互方式。用户可以跟搜索引擎“对话”,告诉它自己想要什么,这绝对比现有的键盘输入文字查询要方便和自然的多。用户也可以跟搜索引擎进行多轮对话交互。百度搜索已经率先应用了这类新型交互方式,提升用户体验。

第三点,搜索将会超越现有的搜索引擎的范围 。搜索会嵌入各种产品当中。比如,搜索会是AI硬件产品的基本特征之一。未来,搜索将会包围在我们身边,无处无在。相应地, 我们也将重新定义什么是可以被搜索的。除了现有的被索引的内容,在未来,服务、物品、设备和数据都可以被索引,变得可搜索。

很长时间以来,搜索引擎在人们日常生活中扮演至关重要的角色。人们的需求决定了搜索引擎演变的方向,而技术进步则决定了这种演变将走向多远。

版权文章,未经授权禁止转载。详情见 转载须知 。

百度王海峰Quora精华整理:未来5-10年,NLP领域将会有什么进展?

全局中部横幅
百度云搜索,百度云盘资源下载,网盘搜索引擎导航

搜BaiDu盘是基于云搜索,最大的百度云网盘资源搜索中心,千万级数据量,让您一网打尽所有的网盘资源.

考试网站导航大全

LOL网址导航网是专业的上网导航网站,精心收录各类优质热门网站信息,同时提供天气、快递、违章等各种生活便民查询工具网址,为您提供安全便捷的上网导航服务,现已被众多网友设为上网主页,网址导航大全首选LOL网址导航.

IIS7站长之家

IIS7站长之家创建于2018年6月3日。我们致力于研发各种类站长、安全运维需求的工具程序,及转发各种行业相关的最新资讯,还有我们认为的重要的相关技术文章,工具收藏等。。。

宫保鸡丁怎么做

宫保鸡丁的做法,宫保鸡丁怎么做请看步骤:1.鸡腿剔骨后,保留鸡皮,切成鸡丁,用盐、料酒、生姜、淀粉腌制一个小时(我看了场电影回来,腌了将近3个小时…)。花生用热水浸泡2.花生用热水浸泡5-10分钟以后,皮会比较好剥,一搓就掉了,但是这么多的花生还是比较费时间的,请准备好耐心…...

天眼查

天眼查专注服务于个人与企业信息查询,都在用的商业查询平台,为您提供公司查询,工商信息查询,企业查询,工商查询,企业信用信息查询等相关信息,帮您快速了解企业信息,企业工商信息,企业信用信息等企业经营和人员投资状况,查询更多企业信息就到天眼查官网!

江西华昊化工有限公司

江西华昊化工有限公司主要产品有:羟基硅油、二甲基硅油、低含氢硅油、聚醚改性硅油、107胶。

美丽100F

美丽100F-【克丽缇娜产品正品促销,价格有折扣】,17年专营,资深克丽缇娜美容院老师为您专业护肤咨询,让克丽缇娜护肤品更针对您的肌肤特点!美丽热线:4000403160;上海直接发货,用我们多年的克缇美容院化妆品护肤经验,帮您的肌肤再更美好一点。精准护肤就用克丽缇娜,克丽缇娜您的肌肤护理专家!

IT教程

威凡网打造国内最大最专业的教程网。本网主要涵盖PHP教程、JSP教程、python教程、html5教程、ASP教程、SEO教程等,威凡网发布的教程都经过实战总结的,学IT编程就上威凡网!

喷印云

为喷印行业提供社区论坛服务,资讯服务,用户自行发布产品广告,行业知识,专业技能等行业相关信息.

葆婴

【葆婴】优莎娜葆婴如何加入、如何购买葆婴产品等问题咨询,电话:19535286731(同微信)

保定燕赵制香有限公司

保定燕赵制香有限公司筹建于1996年,拥有现代化厂房、智能化设备、数字化管理、主要产品有杀虫系列产品、日化产品、空气清新剂及卫生香系列产品等。

奇绘馆

新一代AI视频创作平台

全局底部横幅