王选所网络信息实验室参加WSDM 2025
第18届国际互联网搜索与数据挖掘会议(The 18th ACM International Conference on Web Search and Data Mining, WSDM2025)于2025年3月10日至14日在德国汉诺威举行。WSDM是信息检索与数据挖掘领域的国际顶级会议,在互联网搜索、数据挖掘领域享有较高学术声誉。
王选所博士生李臻同学以第一作者身份发表1篇论文:
RetriEVAL: Evaluating Text Generation with Contextualized Lexical Match
Zhen Li, Xinchi Li, Chongyang Tao, Jiazhan Feng, Tao Shen, Can Xu, Hao Wang, Dongyan Zhao, Shuai Ma.
文本评估是数据质量评测的重要方面。在自动文本评测方法中,基于预训练模型的无监督评估方法由于其高效性和普适性被广泛使用。现有常用的无监督评测方法是BERTSCORE,但由于其对文本中所有token都进行匹配评估,从而容易引入噪声。为此本文提出了一套动静态匹配的评估方法,只对文本中对语义有贡献的词进行匹配评估。具体来说,在比较待评估文本和标准文本时,本文首先对二者之间相同词的词向量进行静态匹配,然后对于不同的词,本文计算它们的相关词,如果两文本中有相关词的重叠,则对其进行动态匹配。最终,该评测方法在Meta-evaluation benchmark中实现了较高的人类相关性,在SummEval、topical-Chat上的system-level、turn-level的肯德尔和斯皮尔曼相关系数分别达到了0.640和0.320,证明了该评测方法能有效地评估文本的质量。
网络信息实验室李臻同学参加 WSDM2025 学术会议
上一篇 下一篇