计算机所师生参加MMM 2018

2018年2月5日至7日,计算机所彭宇新教授,研究生赵俊杰、袁玉鑫和王逸之赴泰国参加了第24届国际多媒体模型会议(The 24th International Conference on Multimedia Modeling,简称MMM)。

MMM从1993年开始,每年举办一次,是多媒体模型领域的国际会议。本届会议包含3个大会主题报告、16个常规小分会和1个特别分会。参会者们介绍了自己在多媒体分析、视频和图像处理、多媒体索引和分类、跨媒体检索等领域的最新成果。

计算机所师生在会场合影(左起:袁玉鑫、赵俊杰、彭宇新教授、王逸之)

计算机所师生在本次会议上共发表了5篇论文,并分别做了口头报告和海报展示,具体信息如下:

[1] Junjie Zhao and Yuxin Peng, Cost-sensitive Deep Metric Learning for Fine-Grained Image Classification.

细粒度图像分类指对属于相同类别下的不同子类别的目标进行分类。本文的研究内容是利用不同子类别间的混淆度并借助深度度量学习得到图像更加具有辨识性的特征,从而取得更好的细分类效果。

[2] Yuxin Yuan and Yuxin Peng, Recursive Pyramid Network with Joint Attention for Cross-media Retrieval.

本文提出了一种基于多尺度联合注意力的跨媒体检索方法,通过学习不同尺度的局部信息之间的关联来增强图像文本整体表征的能力,从而提高跨媒体检索的准确性。

[3] Yizhi Wang, Zhouhui Lian, Yingmin Tang and Jianguo Xiao, Font Recognition in Natural Images via Transfer Learning.

本文提出了一种基于迁移学习的字体识别方法。通过将各种字体的文本自然地嵌入真实场景图片中来合成大量训练数据,再应用一种新的迁移学习方法来解决合成图片与真实图片的域不匹配问题,并构建了一个公开的中文字体自然场景图片数据集来验证所提出方法的有效性。

[4] Xiaoyu Qi, Deshun Yang and Xiaoou Chen, Triplet Convolutional Network for Music Version Identification.

音乐版本鉴别指给定查询音乐片段,在音乐数据库中检索出该查询歌曲的翻唱版本歌曲。本文提出了利用三元组和二元组卷积神经网络,在音乐段级别上进行版本鉴别,提高了版本鉴别的准确度。

[5] Xiaoshuo Xu, Yao Cheng, Xiaoou Chen and Deshun Yang, Efficient Two-layer Model towards Cover Song Identification.

音乐版本鉴别指给定查询音乐片段,在音乐数据库中检索出该查询歌曲的翻唱版本歌曲。本文提出两层的检索系统:第一层使用最近邻搜索算法进行匹配,第二层使用序列对齐算法进行匹配,提高了音乐检索的效率和准确度。

CLOSE

上一篇 下一篇