计算机所师生参加ICDAR2017

2017年11月9日至15日,国际文档分析与识别会议(International Conference on Document Analysis and Recognition, ICDAR2017)在日本京都召开,计算机所汤帜老师、高良才老师、研究生易晓涵、何哲琪、郭婷、张晓德、秦晓冉参加了此次会议。

会场合影(左起:张晓德,郭婷,汤帜,高良才,易晓涵,秦晓冉,何哲琪)

两年一次的ICDAR是文档图像领域的重要国际会议,本届会议吸引了来自学术界、工业界的500多人参加,投稿409篇,Oral论文录取率13%,Poster论文录取率39%。会议包括了12个口头报告分会和3个海报展示环节、3个特邀报告、10个研讨会和3个学术课程,内容涵盖了文字检测识别、图识别、文档版面理解、古籍文档理解、三维线条图重建、漫画内容理解等文档图像任务。同期进行的ICDAR技术竞赛在模式识别、计算机视觉领域具有很重要的影响力,受到了科研院校、科技公司的广泛参与和关注。

高良才老师小组举办了页面对象定位竞赛ICDAR2017 Competition on Page Object Detection(http://www.icst.pku.edu.cn/cpdp/ICDAR2017_PODCompetition/index.html),吸引了来自不同国家和地区的八支队伍报名参赛,其中竞赛数据集来自从网上爬取的超过1300个文档和超过11000个文档页面。研究生何哲琪参加了ICDAR2017的2个竞赛,分别获得了中文场景文字检测识别(Reading Chinese Text in the Wild)定位任务第一名,和COCO文字检测识别(Robust Reading Challenge on COCO)定位任务第一名的突出成绩。

中文场景文字检测识别竞赛获奖证书

计算所师生在ICDAR2017上共发表5篇论文,包括1篇口头报告论文和4篇张贴论文。论文的具体信息如下:

[1] Liangcai Gao, Xiaohan Yi, Yuan Liao, Zhuoren Jiang, Zuoyu Yan, Zhi Tang. A Deep Learning-Based Formula Detection Method for PDF Documents.

本文提出一种在PDF文档中检测数学公式的方法,基于文档图像和公式自身的文字和视觉特征,使用了结合CNN和RNN的双通道网络对公式进行特征提取,在多个数据集上获得了state-of-the-art的效果。该工作在ICDAR2017上进行了口头报告。

[2] Xiaohan Yi, Liangcai Gao, Yuan Liao, Xiaode Zhang, Runtao Liu, Zhuoren Jiang. CNN Based Page Object Detection in Document Images.

自然场景下的目标检测问题吸引了很多学者的关注和研究。本文试图在文档图像领域定义目标检测问题,针对一些特有的文档对象(文本,表格,公式,图像)进行检测,并研究了目标检测中的常用框架在文档图像上的效果和优缺点,并针对其中的一些问题进行了改进和研究。

[3] Ting Guo, Yongtao Wang, Yafeng Zhou, Zheqi He, Zhi Tang. Geometric Object 3D Reconstruction from Single Line Drawing Image with Bottom-Up and Top-Down Classification and Sketch Generation.

本文的立体几何线条图3D重建项目旨在帮助中小学生理解立体几何线条图的空间结构,即对2D立体几何线条图片,重建出几何物体顶点的3D坐标,并以3D形式展现。通过预处理,几何特征提取,基于bottom-up/top-down策略分类并生成骨架;优化误差函数等步骤,实现3D重建。

[4] Xiaode Zhang, Liangcai Gao, Ke Yuan, Runtao Liu, Zhuoren Jiang, Zhi Tang. A Symbol Dominance Based Formulae Recognition Approach for PDF Documents.

本文提出了一种基于公式符号作用域的结构分析方法,符号作用域综合考虑了数学公式的书写习惯和符号的布局信息,能够较为准确地恢复出公式的结构信息,该方法在实验中也取得了不错的效果。

[5] Xiaoran Qin, Yafeng Zhou, Zheqi He, Yongtao Wang, Zhi Tang. A Faster R-CNN Based Method for Comic Characters Face Detection. 


本文提出了一种基于Faster R-CNN的漫画人物脸部识别方法,验证了深度学习用于漫画人脸检测的可行性,同时针对二分类问题,分析了sigmoid分类器相比softmax分类器的优势,另外,构建了两个用于漫画人脸检测的数据集。该方法在几个数据集上均取得很好的效果。


CLOSE

上一篇 下一篇