10月8日,我校计算机科学学院硕士研究生麻斌豪以第一作者在人工智能顶刊Neural Networks发表论文Multi-domain Active Defense: Detecting Multi-domain backdoor poisoned samples via ALL to ALL Decoupling Training without clean datasets (2023, 168:350-362;https://www.sciencedirect.com/science/article/pii/S0893608023005324?via%3Dihub)。孟博教授为唯一通讯作者,我校为唯一署名单位。
多域主动防御方法框架。 计科学院供图
深度学习容易受到后门攻击,在这种攻击中,攻击者可以通过向训练集中注入中毒样本,轻松地将隐藏的后门嵌入到训练好的模型中。许多用于检测后门中毒攻击的先进技术都是基于潜在可分性假设。然而,目前的自适应中毒策略会大大降低“可区分行为”,从而使大多数先前的先进技术有效性降低。此外,现有的检测方法对于多域数据集来说并不实用,且可能会泄露用户隐私,因其需要并收集干净的样本。
为解决上述问题,该篇论文提出了一种不使用干净数据集的多域主动防御方法。此种方法可以生成不同域的干净样本,并利用干净样本逐轮解耦神经网络,从而解除特征和标签之间的关联,使后门中毒样本更容易被检测。
据悉,Neural Networks 是专注于神经网络和深度学习研究的学术期刊。该期刊发布关于神经网络、深度学习、机器学习和相关领域的原创研究论文、综述文章和技术报告,在人工智能领域具有较高的国际影响力,是中科院SCI一区TOP期刊。