(通讯员 网轩)近日,第46届国际计算机学会信息检索领域会议(ACM Special Interest Group on Information Retrieval,ACM SIGIR2023)官方公布了论文录用结果。我院三篇科研论文被长文录用。ACM SIGIR是人工智能领域智能信息检索( Information Retrieval,IR)方向最权威的国际会议。会议专注于互联网搜索、推荐系统和社交媒体等各个方面,是CCF A类会议。
论文”Multi-Scenario Ranking with Adaptive Feature Learning”主要由我院2021级硕士研究生田雨,在我院教授李晨亮(通讯作者)、王骞与阿里妈妈搜索广告算法团队联合指导下完成。这篇工作提出了面向多场景融合统一的排序模型,针对【推荐和搜索任务】提出了统一的框架。不同于现有工作着眼于网络层结构的优化和探索,我们认为在模型底层开展场景感知的特征学习对于多场景统一解决方案具有重要价值。通过引入场景自适应的特征重构机制,避免了复杂且昂贵的网络层结构优化,论文中仅结合简单的MoE结构就能明显提高多场景排序性能,同时在实际业务中取得了显著收益。
论文“Towards Multi-Interest Pre-training with Sparse Capsule Network”主要由我院2021级硕士研究生唐作立,在我院教授李晨亮(通讯作者)、我院副教授邹立新(通讯作者)与蚂蚁集团CTO线机器智能团队联合指导下完成。这篇工作提出了面向商品推荐的多兴趣预训练模型,通过利用文本信息作为语义基石,该模型在多个其他推荐场景进行预训练,然后迁移到目标场景提升推荐性能。不同于一般预训练工作中采用掩码语言模型作为预训练目标,该工作认为推荐系统预训练模型需要根据推荐系统中存在用户多兴趣的特点,建立与用户兴趣相关的学习目标,同时针对以往基于胶囊网络的多兴趣学习模型中需要预定义用户兴趣的限制,动态学习用户兴趣数目。最终实验证明了方法的有效性,在多个公开数据集上取得了较明显的性能收益。
论文“Poisoning Self-supervised Learning Based Sequential Recommendations”主要由我院2019级博士研究生王妍灵,硕士研究生刘昱忱,在我院教授王骞(通讯作者)、香港城市大学教授王聪,与我院教授李晨亮的联合指导下完成。这篇工作首次证明基于自监督学习的推荐系统易受到投毒攻击,并提出一种具有普适性的投毒攻击方案。攻击者在黑盒模型背景与无API访问的情况下,生成极少量的恶意用户来影响自监督学习的预训练模块,从而操纵下游推荐模型的推荐结果。该研究在基于自监督学习的主流推荐系统和商业数据集上进行了验证,证明了自监督推荐系统为攻击者提供了新的攻击面。
据悉,本届SIGIR会议共收到有效投稿822篇,长文录用仅165篇,录用率20.1%,被录用的稿件反映了信息检索领域国际最前沿的研究水平。