pick 高通量媒体内容理解论坛抖音快手齐上阵 谁 你 (高通quickcharge)

pick量媒体内容理解论坛抖音快手齐上阵谁你 今日头条人工智能实验室 AI影响因子 活动字节跳动主题演讲 pick量媒体内容理解论坛抖音快手齐上阵谁你 快手 AI影响因子 活动快手主题演讲

雷锋网 AI 科技评论按,2018 中国计算机大会(CNCC2018)于 10 月 25-27 日在杭州国际博览中心举办,会议由中国计算机学会(CCF)主办,杭州市萧山区人民政府、浙江大学承办,浙江工业大学、浙江工商大学、杭州电子科技大学协办。今年的大会主题是「大数据推动数字经济(Big> 量媒体内容理解论坛抖音快手齐上阵,你 pick 谁 | CNCC

中国科学技术大学张勇东教授

大数据处理系统可分为批量计算和流式计算,他形象地介绍了这两种计算并探讨了其差别。流式计算是指利用分布式并行化的思想和方法,对海量流式数据进行实时处理。批量计算的特点是时效性、持续性、鲁棒性、高发性。

目前面临的问题是,视频网站产生的数据非常多,表现出强动态、大流量、高并发的特点,传统的计算方法难以解决现有问题。他讲解了视频流式计算研究框架,主要应用有互联网视频内容安全(实时发现与阻断视频流有害内容),互联网视频信息服务(视频流在线转播、检索等)。

随后,他剖析了技术发展现状:

针对前面的问题,相关研究如下:

演讲最后,张勇东教授对视频流式编解码、视频流式相似性计算、视频流式语义计算、视频流式计算平台方面的下一步的工作进行了展望。

第二位演讲嘉宾是字节跳动人工智能实验室总监王长虎博士。开场伊始,他用一段简短视频对抖音进行了介绍。他总结道,抖音里的内容非常丰富和精彩,也进一步分析了抖音影响力如此大的三个因素:算法力、运营力、产品力。

量媒体内容理解论坛抖音快手齐上阵,你 pick 谁 | CNCC

字节跳动人工智能实验室总监王长虎博士

他此次带来的内容是抖音背后一系列的计算机视觉技术,包括 AI Camera 技术、人脸检测和标定技术、人体关键点检测技术、分割技术。他分别分析了抖音在这些技术上的优势和目前面临的挑战。对于人脸检测和标定技术,他们的优势有关键毫秒级定位,在侧脸、暗光等复杂环境下算法鲁棒,这一技术的应用场景非常多,例如人脸美化,贴纸、人脸特效,眉形、美瞳、口红等的在线试妆。

随后,他谈到视频推荐以及视频理解。在视频推荐算法中,如何优化打分函数,让用户获得更好的体验,这是值得研究的重点。视频理解包括对视频分类、打标签等,面临的挑战有很多,如投稿量巨大、视频持续快速增长、覆盖范围广、产品影响大、算法要求高、问题种类多、样本极不均衡、问题区域小,解决方式也有很多,如人机耦合、多重审核机制、定制化模型。

随后他还提到大规模视频分类和标签,他举出了一些需要用技术解决的例子,如筛选出一些无意义视频、黑屏视频等。对于视频中的 OCR 技术,他表示,有些问题很难,需要能精细检测和分割。

最后,王长虎博士总结,计算机视觉技术除了在抖音上有广泛应用,还支撑着今日头条、火山小视频、西瓜视频。他表示,计算机视觉是抖音和今日头条很多产品的重要基石,希望更多老师和同学加入字节跳动公司。

快手多媒体内容理解部负责人李岩是第三位上台嘉宾,他的演讲内容是《多模态内容生成与理解》。在演讲中,他为大家介绍了快手是一家怎样的公司,以及他们为什么要研究多模态内容生成与理解技术。

量媒体内容理解论坛抖音快手齐上阵,你 pick 谁 | CNCC

快手多媒体内容理解部负责人李岩

「即使你处在偏远的山村,也有希望通过快手的作品获得更多粉丝,消除孤独感,获得更多的连接。」李岩如是说道,他举了几个典型的快手视频案例来说明。

快手有海量多模态数据,超过 70 亿条短视频数据,超过 150 亿条视频播放数据。他强调,多模态技术有两大应用,一是会改变人机交互方式,二是使得信息分发更加高效。但现在研究这样的问题还非常难,存在三大挑战,一是语义鸿沟,二是异构鸿沟(数据种类比较多),三是数据缺失(多模态数据非常难以构建)。

他表示,快手也在一直努力,希望大家能更好地记录,让每个人成为自己生活的导演,希望记录的过程能便捷、个性化、有趣、普惠。他如下几个例子:

最后他总结到,未来会有两个非常重要的方向:多模态特征对齐和多模态特征表示。他表达了如下三点展望:一是多模态会带来新的人机交互方式,二是多模态会带来新的内容形式,三是多模态急需新的算法和大型数据集。

最后一位演讲嘉宾是北航计算机学院长江学者特聘教授李波,他的演讲主题为《面向公共安全的天空地网大数据一体化处理》。

量媒体内容理解论坛抖音快手齐上阵,你 pick 谁 | CNCC

北航计算机学院长江学者特聘教授李波

网络世界中新型犯罪活动层出不穷,比如电信或网络诈骗、跨境网络攻击等。外国军机非法侵入我国海域,仅利用航天成像无法获取目标的全面画像,可以将天空地网协同应用,利用互联网得到目标的更完整信息。

李波教授提到利用天空网信息结合挖掘目标完整画像的案例,也谈到遥感图像与社交媒体融合以及美国在公共安全领域的研究与应用。

随后,他提出了几项关键科技问题:

解决思路如下:

在地面上,可以利用时空结合的场景语义分割;还可以通过天空地相互引导,实现立体感知。

这里涉及到基于关键要素的敏感内容检测。在检测的基础上,可以进一步基于相似语义和时空关联的知识学习进行知识抽取,随后基于概念属性的跨网身份关联,实现跨网知识融合。

实是指物理世界,虚是指网络世界。可以生成实体-动作元事件模型,结合警务知识指导的事件分析,进行公共安全事件研判。

李波教授的演讲结束之后迎来精彩的圆桌讨论环节,快手多媒体内容理解部负责人李岩、北航计算机学院长江学者特聘教授李波、字节跳动人工智能实验室总监王长虎、国家互联网应急中心张冬明纷纷上台,展开了更多对高通量媒体内容理解的探讨,现场观众也发表踊跃提问。随后,李波教授对今天的论坛做出总结,对在场观众表达了感谢。精彩的论坛就此结束,但对多媒体内容的探讨还在继续。

量媒体内容理解论坛抖音快手齐上阵,你 pick 谁 | CNCC

图:洪日昌、李岩、李波、王长虎、张冬明(从左至右)

雷锋网 AI 科技评论后续也将带来关于 CNCC 的一系列新闻,敬请关注。

原创文章,未经授权禁止转载。详情见 转载须知 。

量媒体内容理解论坛抖音快手齐上阵,你 pick 谁 | CNCC

全局中部横幅
【微顶跑腿APP】顾客APP应用免费下载

微顶跑腿本地人气送餐平台,提供同城外卖订餐、同城跑腿帮送!汇聚周边美食!足不出户美食到家为您提供省心省事的帮取取送服务!微顶跑腿点外卖找跑腿帮送帮买寻帮助一个APP高效生活!

好看视频

好看视频是百度短视频旗舰品牌,拥有超百万的短视频创作者。全面覆盖知识、美食、生活、健康、文化、游戏、影视等海量视频,致力于为用户提供优质的视频内容与观看体验,让用户轻松有收获。

国家林业和草原局政府网

国家林业和草原局政府网(www.forestry.gov.cn)是国家林业和草原局官方网站,2000年建成,具备政务信息公开、网上在线办事、公众互动交流和综合信息服务功能,具有简体版和英文版2种版本,是具有权威性和广泛影响的中国林草行业门户网站。

阿衰第八季动画

阿衰,原名阿帅,是怕踢中学学生,为人张扬轻浮,缺少稳重,学习不佳,总考倒数第一,留过两年级。但其实他是一个乐于助人并且有同情心的初中生。

武汉东新电子技工学校报名网

欢迎您访问武汉东新电子职业技术学校官方网站,武汉东新电子技工学校是经武汉市人力资源与社会保障局批准成立的一所具有学历教育资格的全日制技工学校,是武汉首家拥有自有校区、且按学校标准建设的民办技工学校。如果选择武汉中专学校,高职高专电子专业,这里是你的理想学府!

新乡市华亿通用机械有限公司

新乡市华亿通用机械有限公司是一家专业生产振动筛,给料机,输送机,电磁除铁器,给煤机,激振器,减振弹簧等产品的公司,服务热线:13937399851

美缝配色

彩谱科技,致力于光学仪器设备的研发、生产和销售,主要有配咖乐、美缝配色仪、环氧彩砂配色、瓷砖家装配色等行业和科研机构得到广泛应用。

大健康养生连锁品牌

公众平台自助引擎,是一款免费开源的微信公众平台管理系统,是国内最完善移动网站及移动互联网技术解决方案。

Sky陪玩网页版

Sky游戏陪玩网页版,这里可以找到lol陪玩、绝地求生陪玩、和平精英陪玩、王者荣耀陪玩等一系列游戏陪玩。还有群聊、唱歌、连麦、情感指导等语音社交玩法,带给你不一样的游戏社交体验

奇峰网

奇峰网,专注为创业者提供学习交流的创业网站,提供全方位的媒体资讯,分析各类成功商业模式,让你在创业中快速找到成功的方向。

便民查询网

便民查询网(原51240便民查询网)一直致力于为网民提供方便、快捷的在线查询服务。

全局底部横幅