首页

王勇涛

北京大学王选计算机研究所副研究员，博士/硕士研究生导师。2009年毕业于华中科技大学图像所，获博士学位。2010年在新加坡南洋理工大学淡马锡实验室从事博士后研究工作，2011年加入北京大学王选计算机研究所。近五年来，一直从事计算机视觉、模式识别及自动驾驶等相关应用方向的研究，先后提出了M2Det、CBNet、BEVFusion、RCBEVDet、HENet、VL-SAM等2D/3D视觉感知方向代表性工作以及DrivingGaussian、GALA3D等复杂3D场景重建生成方向代表性工作。作为负责人先后承担了十余项科研项目经费逾1800万元，包括科技创新2030“新一代人工智能”重大项目课题、国家自然科学基金等纵向项目以及与海信、阿里巴巴、蚂蚁金服、长安汽车等知名企业的横向合作项目。已发表IJCV、TIP、ICCV、CVPR、ECCV、NeurIPS、ICML、AAAI、MM等重要期刊/会议论文80余篇，申请发明专利30余项获授权11项，多个技术成果落地应用到阿里巴巴、蚂蚁金服、海信等相应产品或者原型中，并指导学生多次在无人车/无人机场景目标检测国内外顶级评测竞赛上取得佳绩。担任了人工智能领域顶刊IEEE Trans. on Image Processing、权威期刊Pattern Recognition编委、顶会ICCV 2025、ICML 2025、ICLR 2025领域主席（Area Chair）。曾获新加坡南洋理工大学“Tan Chin Tuan Fellow”（2019年）称号和奖励、北京大学王选计算机研究所“王选青年教师奖”（2020年）、北京大学“杨芙清-王阳元院士奖教金优等奖”（2024年）。

研究方向

通用视觉感知
三维场景重建与生成
深度学习模型压缩与加速
AI安全
自动驾驶

代表性论文（∗通讯作者）

[1]. Zhiwei Lin, Tingting Liang, Taihong Xiao, Yongtao Wang*, Ming-Hsuan Yang, “FlowNAS: Neural Architecture Search for Optical Flow Estimation”, International Journal of Computer Vision, 132, pp. 1055-1074, 2024.

[2]. Zhiwei Lin, Zhe Liu, Zhongyu Xia, Xinhao Wang, Yongtao Wang*, Shengxiang Qi, Yang Dong, Nan Dong, Le Zhang, Ce Zhu, “RCBEVDet: Radar-camera Fusion in Bird’s Eye View for 3D Object Detection”, CVPR, 2024.

[3]. Xiaoyu Zhou, Zhiwei Lin, Xiaojun Shan, Yongtao Wang*, Deqing Sun, Ming-Hsuan Yang, “Drivinggaussian: Composite gaussian splatting for surrounding dynamic autonomous driving scenes”, CVPR, 2024.

[4]. Zhiwei Lin, Yongtao Wang*, Shengxiang Qi, Nan Dong, Ming-Hsuan Yang, “BEV-MAE: Bird's Eye View Masked Autoencoders for Outdoor Point Cloud Pre-training”, AAAI, 2024.

[5]. Zhiwei Lin, Yongtao Wang∗, Zhi Tang, “Training-Free Open-Ended Object Detection and Segmentation via Attention as Prompts”, NeurIPS, 2024.

[6]. Xiaoyu Zhou, Xingjian Ran, Yajiao Xiong, Jinlin He, Zhiwei Lin, Yongtao Wang*, Deqing Sun, Ming-Hsuan Yang, “GALA3D: Towards Text-to-3D Complex Scene Generation via Layout-guided Generative Gaussian Splatting”, ICML, 2024.

[7]. Zhongyu Xia, ZhiWei Lin, Xinhao Wang, Yongtao Wang*, Yun Xing, Shengxiang Qi, Nan Dong, Ming-Hsuan Yang, “HENet: Hybrid Encoding for End-to-end Multi-task 3D Perception from Multi-view Cameras”, ECCV, 2024.

[8]. Zhihao Lin, Yongtao Wang*, Jinhe Zhang, Xiaojie Chu, “DynamicDet: A Unified Dynamic Architecture for Object Detection”, CVPR, 2023.

[9]. Hao Huang, Ziyan Chen, Huanran Chen, Yongtao Wang*, Kevin Zhang,“T-SEA: Transfer-based Self-Ensemble Attack on Object Detection”, CVPR, 2023.

[10]. Xiaoyu Zhou, Zhiwei Lin, Xiaojun Shan, Yongtao Wang*, Deqing Sun, Ming-Hsuan Yang, “SAMPLING: Scene-adaptive Hierarchical Multiplane Images Representation for Novel View Synthesis from a Single Image”, ICCV, 2023.

[11]. Xuanyang Zhang, Yonggang Li, Xiangyu Zhang, Yongtao Wang, Jian Sun, “Differentiable Architecture Search with Random Features”, CVPR, 2023.

[12]. Tingting Liang, Hongwei Xie, Kaicheng Yu, Zhongyu Xia, Zhiwei Lin, Yongtao Wang*, Tao Tang, Bing Wang, Zhi Tang, “BEVFusion: A Simple and Robust LiDAR-Camera Fusion Framework”, NeurIPS, 2022.

[13]. Hao Huang, Yongtao Wang*, Zhaoyu Chen, Yuze Zhang, Yuheng Li, Zhi Tang, Wei Chu, Jingdong Chen, Weisi Lin, Kai-Kuang Ma, “CMUA-Watermark: A Cross-Model Universal Adversarial Watermark for Combating Deepfakes”, AAAI, 2022.

[14]. Tingting Liang, Xiaojie Chu, Yudong Liu, Yongtao Wang*, Zhi Tang, Wei Chu, Jingdong Chen, and Haibin Ling, “CBNet: A Composite Backbone Network Architecture for Object Detection”, IEEE Transaction on Image Processing, 31, pp. 6893-6906, 2022.

[15]. Huanqiang Zeng, Hailiang Huang, Junhui Hou, Jiuwen Cao, Yongtao Wang, Kai-Kuang Ma, “Screen Content Video Quality Assessment Model Using Hybrid Spatiotemporal Features”, IEEE Trans. on Image Processing, 31, pp. 6175-6187, 2022.

[16]. Tingting Liang, Yongtao Wang*, Zhi Tang, Guosheng Hu, Haibin Ling, “OPANAS: One-Shot Path Aggregation Network Architecture Search for Object Detection”, CVPR, 2021.

[17]. Yonggang Li, Guosheng Hu, Yongtao Wang*, Timothy Hospedales,Neil M. Robertson, and Yongxin Yang, “DADA: Differentiable Automatic Data Augmentation”, ECCV, 2020.

[18]. Jianwei Li, Yongtao Wang*, Haihua Xie, and Kai-Kuang Ma, “Learning a Single Model With a Wide Range of Quality Factors for JPEG Image Artifacts Removal”, IEEE Trans. on Image Processing, 29, pp. 8842-8854, 2020.

[19]. Siwei Wang, Yudong Liu, Zheqi He, Yongtao Wang*, and Zhi Tang, “A quadrilateral scene text detector with two-stage network architecture”, Pattern Recognition, 102, pp. 1-9, 2020.

[20]. Yudong Liu, Yongtao Wang*, Siwei Wang, Tingting Liang, Qijie Zhao, Zhi Tang, and Haibin Ling, “CBNet: A Novel Composite Backbone Network Architecture for Object Detection”, AAAI, 2020.

[21]. Sheng Yang, Qiuping Jiang, Weisi Lin and Yongtao Wang, “SGDNet: An End-to-End Saliency-Guided Deep Neural Network for No-Reference Image Quality Assessment”, ACM Multimedia (MM), 2019.

[22]. Yang Yi, Feng Ni, Yuexin Ma, Xinge Zhu, Yuankai Qi, Riming Qiu, Shijie Zhao, Feng Li and Yongtao Wang, “High Performance Gesture Recognition via Effective and Efficient Temporal Modeling”, IJCAI, 2019.

[23]. Qijie Zhao, Tao Sheng, Yongtao Wang*, Zhi Tang, Ying Chen, Ling Cai and Haibin Ling, “M2Det: A Single-Shot Object detector based on Multi-Level Feature Pyramid Network”, AAAI, 2019.

[24]. Zheqi He, Yafeng Zhou, Yongtao Wang*, Siwei Wang, Xiaoqing Lu, Zhi Tang, and Ling Cai, “An End-to-End Quadrilateral Regression Network for Comic Panel Extraction,” ACM Multimedia (MM), 2018.

[25]. Yuan Liao, Xiaoqing Lu, Chengcui Zhang, Yongtao Wang, and Zhi Tang, “Mutual Enhancement for Detection of Multiple Logos in Sports Videos”, ICCV, 2017.

[26]. Zheqi He, Yafeng Zhou, Yongtao Wang, and Zhi Tang, “SReN: Shape Regression Network for Comic Storyboard Extraction”, AAAI, 2017.

[27]. Jinxin Zheng, Yongtao Wang*, and Zhi Tang, “Context-aware Geometric Object Reconstruction for Mobile Education”, ACM Multimedia (MM), 2016.

[28]. Luyuan Li, Yongtao Wang*, Ching Y. Suen, Zhi Tang, and Dong Liu, “A Tree Conditional Random Field Model for Panel Detection in Comic Images”, Pattern Recognition, 2015.

[29]. Chenqiang Gao, Deyu Meng, Yi Yang, Yongtao Wang, Xiaofang Zhou, and Alexander G. Hauptmann, “Infrared Patch-Image Model for Small Target Detection in a Single Image”, IEEE Trans. on Image Processing, 22(12), pp. 4996-5009, 2013.

[30]. Yongtao Wang, Junbin Gong, Dazhi Zhang, Chenqiang Gao, Jinwen Tian, and Huanqiang Zeng, “Large Disparity Motion Layer Extraction via Topological Clustering”, IEEE Trans. on Image Processing, 20(1), pp. 43-52, 2011.

荣誉和奖励

杨芙清-王阳元院士奖教金优等奖，北京大学，2024
蚂蚁学术合作优秀项目，蚂蚁金服，2021
王选青年学者奖，北京大学王选所，2020
Tan Chin Tuan Fellow, Nanyang Technological University, Singapore, 2018
CCF优秀指导老师奖，CCF大数据与计算智能大赛，2016

国际竞赛获奖

ECCV 2018: Vision Meets Drone Challenge (Task 2: Object Detection in Videos) 冠军
CVPR 2018 Workshop: Autonomous Driving (Task 2: Road Object Detection) 亚军
ICDAR 2017: Robust Reading Challenge on COCO-Text (Task 1: Text Localization) 冠军
ICDAR 2017: Reading Chinese Text in the Wild (Task 1: Text Localization) 冠军
ICDAR 2017: Robust Reading Challenge on COCO-Text (Task 3: End-to-End) 亚军

部分科研项目

[1] 面向通用视觉的机器学习重点应用，科技创新2030“新一代人工智能”重大项目课题，2023.01-2025.12，项目负责人
[2] 基于神经网络架构搜索的目标检测方法研究，国家自然科学基金面上项目, 2022.01-2025.12，项目负责人
[3] 知识化加工与版权服务技术，国家重点研发计划项目子课题，2019.12-2022.11，项目负责人
[4] 基于多模态数据融合的环境三维感知技术，长安汽车横向合作项目，2024.01-2024.12,项目负责人
[5] 基于端到端网络的多摄融合周视三维场景感知算法研究，长安汽车横向合作项目，2022.12-2023.12,项目负责人
[6] 车路协同场景下的目标检测与分割算法研究，阿里巴巴横向合作项目，2019.03-2020.03，项目负责人

学术服务

模式识别国际权威期刊Pattern Recognition编委（Associate Editor）
人工智能顶会ICLR 2025领域主席（Area Chair）、IJCAI 2021、AAAI 2023/2024 程序委员会资深委员（Senior Program Committee Member）
CCF YOCSEF委员、中国图象图形学学会“机器视觉”、“文档图像分析与识别”专委会委员
AFAC2023、2024金融智能创新大赛，评审委员会专家评委

联系方式：

电话：010-62760690
传真：010-62754532
E-mail： wyt@pku.edu.cn