抖音/旷视背后的那些技术

时  间:5月24日(周五) 15:10-17:00

地  点:三教205

演讲者:王长虎博士(字节跳动人工智能实验室总监)、俞刚博士(旷视科技研发总监)

题目-1:抖音背后的那些技术

摘要:在过去的一年中,抖音短视频保持了令人震惊的增长态势,成为整个互联网行业最引人瞩目的产品。计算机视觉技术在抖音的飞速发展中起到了至关重要的作用。一方面,通过对视频内容的自动深入地理解,我们可以快速地在每天上传的海量视频中,精确筛选出不适合分发的问题视频,确保产品的内容安全。另一方面,计算机视觉技术带来的各种酷炫玩法,成为了抖音能够持续走高的重要推手。我将简要介绍抖音背后的那些黑科技。

讲者简介:王长虎博士目前任字节跳动人工智能实验室总监。原微软亚洲研究院主管研究员,曾在新加坡国立大学担任研究工程师。王长虎博士的主要研究方向包括计算机视觉、视频理解、多媒体创作和机器学习等,他和他的团队将相关技术广泛应用到字节跳动全线产品中,包括今日头条、抖音、西瓜视频、火山小视频等,为公司内容安全、视频理解和推荐、多媒体创作、视觉平台建设等起到重要作用。

题目-2:视觉目标检测技术的新进展

摘要:物体检测是计算机视觉中一个非常重要但同时也是很基础的技术环节。在RetinaNet以及Mask RCNN出现之后,物体检测领域在框架上面已经比较成熟,但是从技术落地角度来考虑,还有很多细节问题需要攻克。本报告将从六个维度分别来展开目标检测领域的一些新的问题以及方向。具体来讲,这六个方向是Backbone, Head, Scale variation, Batch size, Crowd,pretraining。这些技术点的攻破以及成果,会对物体检测领域的实际落地会有很大推动作用。

讲者简介:俞刚博士现为旷视科技研发总监、Detection 组负责人,2014 年毕业于新加坡南洋理工大学。博士毕业后在南洋理工大学从事 research fellow 的研发工作。2014 年底加入旷视科技公司。其主要研究方向主要集中在计算机视觉以及机器学习方面,包括物体检测,语义分割,行人姿态估计以及行人动作行为分析。自 2010 年以来,已经在顶级会议如 CVPR, AAAI, ECCV 以及顶级期刊如 IEEE Transaction on Image Processing, IEEE Transaction on Multimedia 等上面发表学术论文二十余篇。同时著有书籍一本。俞刚博士带队参加 2017 COCO+Places挑战赛获得检测第一名,人体姿态估计第一名;接着,带队参加 2018 COCO+Mapillary 挑战赛,获四项第一。

CLOSE

上一篇 下一篇