我院本科生研究成果被ACM SIGIR录用

2021-04-20

日前,第44届国际计算机学会信息检索领域会议(ACM Special Interest Group on Information Retrieval,ACM SIGIR2021)官方发布了论文录用结果。我院2017级本科生田雨以第一作者撰写的论文被录用,成为我校首篇以本科生作为第一作者在SIGIR上录用的长文论文。

论文题目为“Joint Knowledge Pruning and Recurrent Graph Convolution for News Recommendation”(联合知识剪枝和递归图卷积的新闻推荐算法),指导老师为我院副教授李晨亮(通讯作者)和教授王骞,与微软亚洲研究院吴方照博士和北京邮电大学副教授王鹏飞合作完成。

论文“Joint Knowledge Pruning and Recurrent Graph Convolution for News Recommendation”针对新闻推荐服务,设计了一种利用知识图谱来识别用户阅读兴趣的深度学习算法。该算法结合新闻的文章内容,从中抽取重要的实体作为节点,结合用户的历史新闻浏览记录,建立用户兴趣图,并提出一种新的图卷积网络,即“递归图卷积”,用于从知识图谱中(Knowledge Graph)中识别与用户兴趣相关的实体来进一步丰富和修正用户兴趣图,最终实现用户阅读兴趣的精准识别。该项工作解决了现有方法在结合知识图谱的环节会引入无关噪声的缺陷,以及无法捕捉不同用户对于同一新闻的不同兴趣点等关键问题。

image.png

1

与现有基于知识图谱的推荐方法相比,该项研究主要解决了图1所示的问题:对于新闻中的实体“Kevin Spacey”,存在较广的语义信息(如图1右侧所示);而根据用户的点击历史可以看到User1User2的兴趣对应在“Kevin Spacey”的不同语义空间(如图1左侧所示),也就是说,当学习用户的兴趣表示时,我们需要删减知识图谱中所关联的部分知识,以便用户的兴趣得到很好的匹配。本文设计了一种递归图卷积(RGC如图2所示),利用从知识图谱中提取的相关上下文实体,对用户兴趣图进行递归补充。作者在两个大型新闻数据集(英语和挪威语)上对该项研究做了大量实验,实验结果充分验证了该工作的有效性。

image.png

2

近年来,研究者们针对新闻推荐相继提出了各种解决方案。早期的研究主要集中在利用文本信息来提取新闻的表示。与商品和电影相比,新闻文章的语义空间要广泛得多。近期最新研究试图利用知识图谱中的外部知识来增强新闻的表示学习,并且取得了比较明显的收益。然而外部知识图谱的使用、新闻数据集的实体对齐和算法的验证非常耗费时间和精力。本研究在提出先进新闻推荐算法的同时,也公开发布了基于实验数据集的知识图谱对齐语料,以进一步促进学术界深入研究和相关产业界发展。

据悉,本届SIGIR会议共收到有效投稿720篇,长文录用仅151篇,录用率21%,被录用的稿件反映了信息检索领域国际最前沿的研究水平。