追寻大师的脚步 (追寻大师的足迹)

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang

编者按:美东时间2020 年 4 月 25 日夜间,计算机视觉之父,华人视觉一代宗师 Thomas S.Huang(黄煦涛)去世,享年 84 岁。

黄煦涛先生一生成果颇丰,且终其一生严谨为学、宽厚为师、谦逊为人,培养和影响了无数后辈学者。

著名学者,ACM/IEEE Fellow, 腾讯AI Lab和腾讯Robotics X实验室主任张正友博士,也正是其中一位。虽不为黄门弟子,其学术生涯却仍受到极大影响,由此也可见一斑。

下面我们转发一篇张正友博士于 2016 年庆祝Thomas S. Huang 八十大寿的发言稿,以示纪念。

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang


追寻大师的脚步

第一次认识Thomas S.Huang和他太太Margaret是1988年,他们来我所在的法国INRIA实验室访问。Tom在计算机视觉和信号处理领域已经是上帝一样的存在,而我刚开始读博士还不到一年,但Tom平易近人,睿智儒雅,三十多年来一直是我生命中高山仰止的丰碑。现重发2016年庆祝Tom八十大寿的发言稿,回顾了Tom对我学术生涯的影响,以此纪念。

感恩Tom家人的大爱,昨天在Tom去世前给我们机会和Tom视频话别。Tom,你追随Margaret而去,你们肯定会在天国相会,携手永伴。Tom,一路走好!R.I.P. ???

2016年10月1日,伊利诺大学Beckman Institute和电机与计算机工程系联合举办Dr. Thomas S.Huang黄煦涛教授八十寿辰学术研讨会,我很荣幸列席。我和Tom自1988年相识并开始学术交集,他作为计算机视觉界和信号处理界的先驱智者,以他独有的洞见和卓越的学术成就,给了我不计其数的启发,鼓励和支持。Tom学术家族树已经数代,根深叶茂,毕业的博士生迄今已有一百多位,其中不乏我的实习生,而他们的学生也有不少还是我的实习生,真可谓薪火相传,不知其尽也。

研讨会当天,我被安排做一个简短的发言,目光所触,看见Tom和济济一堂他带出的学生,想起Tom尽管誉满天下,参加任何会议仍及其认真严肃,从不放松专业水准,想起Tom和他太太Margaret多年来对我的支持,不禁触动了感情,有点哽咽。

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang

28年前我是法国国家计算机自动化研究院(INRIA)的一名博士生,和Tom缘起他的一次访法学术交流,彼时Tom已是国际上计算机视觉界和信号处理界的泰斗。那个时候觉得他赫赫有名却非常平易近人,对他能把枯燥的学术报告讲解的幽默风趣的本领十分敬佩。从那以后,我不时向Tom请教和咨询学术问题,得他指点迷津和无私提携。Tom是非常乐意助人的。

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang

Tom对我个人学术生涯影响至深,可以溯源到我的博士论文: 那时我为了机器人导航在做三眼立体视觉的运动估计。Tom在从事从二维到二维特征对应估计运动和从运动中决定三维结构(Structure fromMotion)的研究工作,现在在机器人领域叫SLAM(Simultaneous Localization AndMapping),Tom可谓是SLAM的先驱。特别值得指出的是,Tom和他的学生R. Y.Tsai在1981年发表的文章“Estimating3-D Motion Parameters of a Rigid PlanarPatch”是Structure fromMotion领域的开山之作。当时我有个想法,就是把Tom做的东西实现一下来解决我的问题。为此我开始读Tom的一篇论文,题目是“SomeProperties of the E Matrix in Two-View MotionEstimation”。这是Tom在1989年发表于IEEE Transactions on Pattern Recognition andMachine Intelligence上的一篇经典的很有影响力的文章。

我很快发现我理解不了Tom的文章 :-),太多的公式让我脑袋爆炸了。我因而将我的博士论文转向解决一个更简单的问题:从三维到三维特征对应来估计运动。三维特征可以用我们的三眼立体视觉系统里提取出来,我的博士论文的问题可以描述如下:

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang

这是一个带六个约束条件的线性方程。但我也清楚,这个问题太简单,不足于写成一篇博士论文。我于是试图从多方面探讨研究这个领域,包括:数据不定性;参数估计鲁棒性;运动分割;短序列匹配;长序列跟踪;等等。写成了320页的长篇博士论文。

我博士论文答辩还有一个小插曲:答辩委员会里一个很有名的教授指责我说不诚实,所有人都大吃一惊,包括我的博士导师。追问原因,他拿着我厚厚的论文说:“你没有指明哪些部分是你的工作。”原来他不相信论文里的工作都是我自己完成的。我认为这是对我博士论文的褒奖。

恰在此时,我注意到Tom正在编辑“Springer Series in InformationSciences”从书。我冒昧去信问Tom:我的博士论文值不值得作为一本专著在他编辑的丛书上发表?结果就是我的博士论文被修编成了我的第一本书《3D Dynamic Scene Analysis》。

直到多年以后我终于读懂了Tom的文章,把那些公式理清楚了。根据这些基本原理,我推而广之,将之应用到未标定的摄像机,将算法鲁棒化,开发了图像自动匹配技术,发明了摄像机标定新算法,也据此发表了我的第二部专著《Epipolar Geometry in Stereo, Motion, and Object Recognition: A UnifiedApproach》。

感谢从Tom那里得到的灵感,我因此发表了一系列相关论文,其中包括发表在1999年ICCV上关于摄像机标定法的文章。2005年,我庆幸当选 IEEE Fellow。在北京举行的 ICCV 2005 晚宴上,Tom 亲手颁证书给我,真的没有比他更加合适的颁奖人啦!

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang

在经历了个人学术研究的一个小“巅峰”之后,我开始寻找下一步的研究方向。Tom是我长久以来的学术导航灯,很自然的我开始集中阅读Tom实验室发表的论文。我发现了他已经在人脸建模、人脸表情识别和视频会议三方面发表了许多前瞻性的文章,立刻决定开始进行这三方面的研究。

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang

人脸建模。

Tom在3D人脸建模方面早在90年代初就有很多先驱的研究,比如用样条曲面来表达3D人脸,来进行人脸非刚性运动的估计,和Facial action units的提取,以及voice-driven avatar的研究。

我从1999年开始做用WebCam视频对人脸三维建模,通过基于几何和外观模型拟合的方法进行多方位的研究,使得即使在低分别率和弱光照下也能鲁棒建模。多次的实时展示中,我和我的团队成功给很多人包括Bill Gates 和 Andy Grove 建模,其中部分技术在微软的产品Xbox落地。这些在我的专著里均有详细介绍(Z. Liu and Z.Zhang,Face Geometry and Appearance Modeling,剑桥大学出版社2011年出版)。

人脸表情识别。

Tom是人脸表情识别的先驱,早在90年代初就开始表情识别的研究。当时他的工作除了基于单幅图像的appearance-based方法以外,更有基于连续图像序列motion-based的方法。这些研究都是后世研究的基础。

1996年底我在日本国际电气通讯基础技术研究所(ATR)学术休假时开始做的。那时我已经在几何领域做了10年的研究,很希望能在机器学习方面有所拓宽,最终将几何和机器学习结合起来。在ATR有不少人做人脸表情识别,而且有些现成的标记好的数据,但主要侧重从心理学和认知科学角度研究。我认真的读了Chris Bishop 的《Neural Networks for PatternRecognition》,编了一些神经网络的算法,将它应用到人脸表情识别,说起来在这领域起步也是相当早的。最近两年和微软同事一起利用大数据和深度神经网络开发了自动的表情识别技术,已经用在微软的Cognitive Services上了。

视频会议。

这是个多学科综合性多媒体系统工程。Tom在视频会议上的研究早在80年就已经是这个领域的带头人了。他在图像视频压缩的贡献是无以伦比的。他在90年代开始了very low bit-rate communicationsystem的研究,基本思想就是从视频中计算物体的刚性和非刚性的运动,以及物体的3D建模,只用在通信系统中传输编码的运动参数,然后在接收端用运动参数驱动3D模型,这样能实现超低比特率的视频通信。

我的研究方向自2001年起有很大转变,开始做语音处理,麦克风阵列,多声道声学回声消除,自然人机交互,全息三维重建,沉浸式远程临场系统等研究工作。有些技术已经授权给Polycom的CX5500 Unified Conference Station 和微软的Skype RoomSystem。这是一个很令人激动的领域,能够释放人的潜力,大大增强社会的生产力,期待更多的技术革新和产品创新。

2014年,因为对计算机视觉和多媒体的贡献,我很荣幸的当选ACM Fellow。回想自己的职业成长和学术进步,我十分感激Tom对我的帮助和支持!从一个对电子和计算机深感兴趣的年轻人到算是略有建树的研究者,我因循着Tom的足迹一路走来。现代医药学之父,古希腊医者 Hippocrates 曾经说过:Life is short. The art is long. 这句话用来形容Tom一点不错。他为人师为人友,桃李满天下,学术精神永存!

这是我送给Tom的贺卡,感谢Tom和Margaret二十八年来对我的支持,祝愿Tom身体健康,阖家幸福!

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang

作者简介:

Zhengyou Zhang received the B.S. degree in electronic Engineering from ZhejiangUniversity, Hangzhou, China, in 1985, the M.S. degree in computerscience from the University of Nancy, Nancy, France, in 1987, and thePh.D. degree in computer science in 1990 and the Doctorate of Science(Habilitation à diriger des recherches) in 1994 from the UniversityofParis XI, Paris, France.

He is a Principal Researcher and Research Manager with Microsoft Research, Redmond, WA,USA. He was a SeniorResearch Scientist with INRIA (French National Institutefor Research inComputer Science and Control), France, and spent a one-year sabbaticalas an Invited Researcher with the Advanced Telecommunications ResearchInstitute International (ATR), Kyoto, Japan. He has published over 250papers in refereed international journals and conferences, and hascoauthored five books. He is an inventor of more than 130 issuedpatents, and has received 8 Ship-It Awards at Microsoft.

Dr.Zhang is an IEEE Fellow, an ACM Fellow, the Founding Editor-in-Chief ofthe IEEE Transactions on Autonomous Mental Development, and an AreaEditor of the Journal of Computer Science and Technology. He served asAssociate Editor for the IEEE Transactions on Pattern Analysis andMachine Intelligence, the IEEETransactions on Multimedia, theIEEETransactions on Circuits and Systems for Video Technology, theInternational Journal of Computer Vision, the Machine Vision andApplications journal, and the International Journal of PatternRecognition and Artificial Intelligence. He is on the Honorary Board ofthe International Journal of Computer Vision, and on the SteeringCommittee of the Machine Vision and Applications. He is serving as aGeneral Chair of IEEE Conference on Computer Vision and PatternRecognition (CVPR) 2017. He received the IEEE Helmholtz Test of TimeAward at ICCV 2013 for his paper published in 1999 on cameracalibration, now known as Zhang’s method.

版权文章,未经授权禁止转载。详情见 转载须知 。

追寻大师的脚步 | 张正友忆华人计算机视觉宗师 Thomas S. Huang

全局中部横幅
在线调色板

可以快速查找出相应颜色的编码是多少

上海上贤阀门制造有限公司专业提供电动球阀

上海上贤阀门制造有限公司专业销售电动球阀_气动球阀_电动调节阀_气动蝶阀_气动法兰蝶阀_电动调节球阀等系列阀门,拥有多项质量检测证书,品质保证【价格实惠,欢迎致电】

雁工云

雁工云专注企业转型的灵活用工平台,助您开启合规的灵活用工模式和业务。快来免费试用雁工云灵活用工综合服务SaaS平台,注重结合大数据和人工智能等前沿技术赋能企业,实现工资个人所得税筹划。运用企业变平台、全职变兼职、聘用变外包等多种灵活用工模式,进行客户管理,灵活用工平台帮助企业一键管理客户劳务关系、实现个人所得税筹划;进行灵活用工任务总包,合规保障三流合一;进行创客管理,可在线将其注册个体户,完成企

违章查询,交通违章查询

搜狐汽车为您提供全面的汽车违章查询,机动车违章查询,交通违章查询,违章车辆查询,违法查询服务.范围覆盖北京,上海,广州,深圳,成都等全国各地大中型城市.

硝酸铈

山东德盛新材料有限公司专业从事硝酸铈,氯化铈以及硫酸铈的生产和销售,欢迎来电咨询:18905372677

中庸环境技术(江苏南京)有限公司

中庸环境技术(江苏南京)有限公司始终致力于研发先进的环保技术以解决各类工业污染问题。公司主要业务范围广泛,涵盖了低温干湿法非甲烷总烃治理、低温湿法脱氨、双碱法脱硫脱硝等核心环保技术。此外,公司还提供水治理服务,以及环保管家、碳补集、碳计算及碳资产管理等一系列综合性服务。

贺兰山东麓葡萄酒

宁夏青铜峡市维加妮酒庄有限公司集科研、葡萄种植与生产销售为一体。公司人员队伍配备合理,且趋于年轻化、打造出了维加妮酒庄特有的风格。酒庄选用优良的酿造和温控设备,同时采用法国橡木桶对葡萄酒进行陈酿。

上海保洁公司

上海军威清洗保洁有限公司是一家专业的上海浦东保洁公司,一直致力于上海浦东办公楼保洁、上海浦东厂房保洁、上海浦东家庭保洁等保洁业务

全球黄页网

全球黄页网是一个免费发布信息的B2B电子商务平台,提供供求、展会信息,欢迎企业免费加入,免费发布供求信息,宣传你的企业和产品,我们将为企业打造一个诚信专业的B2B电子商务平台。

正野排气扇,正野换气扇,安静的换气扇第一品牌,正野电器,正野排气扇,正野换气扇,正野排风扇,正野办事处

正野电器超静音排气扇产品设计咨询服务,正野换气扇价格,正野排风扇型号,正野排气扇报价:13601886499林先生

闻世手抄报

闻世手抄报提供素材范文、手抄报、简笔画、黑板报、折纸等图片大全以及各种文库资料等,希望能够帮助大家解决碰到的问题。

台州LED显示屏

浙江兆磊电子设备有限公司是国内领先的是一家集研发、生产、销售和服务于一体的LED显示屏与LED照明产品应用与方案供应商,致力于全球低碳、节能、环保事业。

全局底部横幅