计算机所师生参加ICDAR2017

2017年11月9日至15日，国际文档分析与识别会议（International Conference on Document Analysis and Recognition, ICDAR2017）在日本京都召开，计算机所汤帜老师、高良才老师、研究生易晓涵、何哲琪、郭婷、张晓德、秦晓冉参加了此次会议。

会场合影（左起：张晓德，郭婷，汤帜，高良才，易晓涵，秦晓冉，何哲琪）

两年一次的ICDAR是文档图像领域的重要国际会议，本届会议吸引了来自学术界、工业界的500多人参加，投稿409篇，Oral论文录取率13%，Poster论文录取率39%。会议包括了12个口头报告分会和3个海报展示环节、3个特邀报告、10个研讨会和3个学术课程，内容涵盖了文字检测识别、图识别、文档版面理解、古籍文档理解、三维线条图重建、漫画内容理解等文档图像任务。同期进行的ICDAR技术竞赛在模式识别、计算机视觉领域具有很重要的影响力，受到了科研院校、科技公司的广泛参与和关注。

高良才老师小组举办了页面对象定位竞赛ICDAR2017 Competition on Page Object Detection（http://www.icst.pku.edu.cn/cpdp/ICDAR2017_PODCompetition/index.html），吸引了来自不同国家和地区的八支队伍报名参赛，其中竞赛数据集来自从网上爬取的超过1300个文档和超过11000个文档页面。研究生何哲琪参加了ICDAR2017的2个竞赛，分别获得了中文场景文字检测识别（Reading Chinese Text in the Wild）定位任务第一名，和COCO文字检测识别（Robust Reading Challenge on COCO）定位任务第一名的突出成绩。

中文场景文字检测识别竞赛获奖证书

计算所师生在ICDAR2017上共发表5篇论文，包括1篇口头报告论文和4篇张贴论文。论文的具体信息如下：

[1] Liangcai Gao, Xiaohan Yi, Yuan Liao, Zhuoren Jiang, Zuoyu Yan, Zhi Tang. A Deep Learning-Based Formula Detection Method for PDF Documents.

本文提出一种在PDF文档中检测数学公式的方法，基于文档图像和公式自身的文字和视觉特征，使用了结合CNN和RNN的双通道网络对公式进行特征提取，在多个数据集上获得了state-of-the-art的效果。该工作在ICDAR2017上进行了口头报告。

[2] Xiaohan Yi, Liangcai Gao, Yuan Liao, Xiaode Zhang, Runtao Liu, Zhuoren Jiang. CNN Based Page Object Detection in Document Images.

自然场景下的目标检测问题吸引了很多学者的关注和研究。本文试图在文档图像领域定义目标检测问题，针对一些特有的文档对象(文本，表格，公式，图像)进行检测，并研究了目标检测中的常用框架在文档图像上的效果和优缺点，并针对其中的一些问题进行了改进和研究。

[3] Ting Guo, Yongtao Wang, Yafeng Zhou, Zheqi He, Zhi Tang. Geometric Object 3D Reconstruction from Single Line Drawing Image with Bottom-Up and Top-Down Classification and Sketch Generation.

本文的立体几何线条图3D重建项目旨在帮助中小学生理解立体几何线条图的空间结构，即对2D立体几何线条图片，重建出几何物体顶点的3D坐标，并以3D形式展现。通过预处理，几何特征提取，基于bottom-up/top-down策略分类并生成骨架；优化误差函数等步骤，实现3D重建。

[4] Xiaode Zhang, Liangcai Gao, Ke Yuan, Runtao Liu, Zhuoren Jiang, Zhi Tang. A Symbol Dominance Based Formulae Recognition Approach for PDF Documents.

本文提出了一种基于公式符号作用域的结构分析方法，符号作用域综合考虑了数学公式的书写习惯和符号的布局信息，能够较为准确地恢复出公式的结构信息，该方法在实验中也取得了不错的效果。

[5] Xiaoran Qin, Yafeng Zhou, Zheqi He, Yongtao Wang, Zhi Tang. A Faster R-CNN Based Method for Comic Characters Face Detection.  

本文提出了一种基于Faster R-CNN的漫画人物脸部识别方法，验证了深度学习用于漫画人脸检测的可行性，同时针对二分类问题，分析了sigmoid分类器相比softmax分类器的优势，另外，构建了两个用于漫画人脸检测的数据集。该方法在几个数据集上均取得很好的效果。

上一篇没有了