科研基地

新闻出版智能媒体技术重点实验室

中心简介

新闻出版智能媒体技术重点实验室于2016年底成立,是依托国家新闻出版业“十三五”科技发展规划,在国家新闻出版广电总局的支持与批准下,成立的跨领域综合性实验室,重点研究知识挖掘与服务、数据管理与运营、版权保护与应用、高新技术跟踪与应用等新闻出版关键技术,切合新闻出版领域的未来发展方向。

新闻出版智能媒体技术重点实验室目前共有科研人员38人,其中正高技术职称的7人,博导4人,副高技术职称的7人,具有博士学位的14人。人员年龄、知识结构及技术职称分布合理。研发团队长期从事新闻出版领域的技术研究与开发,部分骨干成员在该领域已经有20多年的研究积累,具有很强的科研实力和创新能力,拥有应用实现与推广的优秀技术团队,具有承担国家重大科研任务和参与国际竞争的能力。

实验室研究特色

实验室的研究特色包括:

(1)知识服务:研究互联网知识挖掘方法,丰富知识库构建的渠道,改进知识库构建方法和质量,改进知识库更新机制,大幅度增加知识库的数据量,显著改进数据管理的性能(数据存储量和检索效率)。研发具备推理能力的智能服务,并将知识库应用于新闻出版业,构建行业知识库,探索和研发新型的知识服务模式,在知识服务方面探索建立相关技术标准。

(2)版权保护:研究多种媒体格式、多种服务模式、多种终端设备等多模式应用下的版权保护关键技术、轻量级版权保护技术和信息隐藏技术,提高版权保护技术的有效性、通用性、易用性,解决“互联网+”应用环境下的新闻出版版权保护、侵权追踪或版权认证问题,为数字出版保驾护航。

(3)计算机辅助自动写稿:构建大规模的汉语语义标注语料和数据集,重点研究从意义到文本的生成、基于深度学习的句子压缩及融合等核心技术。

(4)文档版面对象与结构信息的智能化抽取:研究文档版面智能识别技术、复合内容自动生成方法、半结构对象检索技术等,包括版面分割、段落、标题、阅读顺序、目录层次等文档结构信息提取,公式、表格、插图等复杂版面对象的自动定位与结构分析以及公式、表格等半结构化数据的检索等内容。

(5)字形计算技术:研究基于笔画部件拼接的中文字库快速制作与智能化辅助设计方法,基于深度学习的汉字书写风格描述与建模方法,大规模汉字字体流形的构建及其应用等相关基础理论与关键技术。

(6)AR在新闻出版中的应用技术:研究从平面内容恢复立体对象的智能识别技术,包括从几何教材插图图像、识图卡片图像、绘本页面图像恢复所包含的立体对象等,提供通用的AR对象识别方法。

(7)漫画内容的分析与理解:研究漫画页面图像版面理解(版面对象识别及其阅读顺序辨识)和内容语义理解(人物场景识别等)等技术。

(8)跨领域综合性应用开发:研发文档转换与加工、版权保护、内容运营服务等软件系统,以及数据管理与运营的应用集成技术,重点开发集成多渠道来源的专业知识库及知识发现等服务系统。