【NDSS 2019论文解读】阿里巴巴李进峰:针对现实应用的文本对抗攻击研究

2020年8月13日, 在网络空间安全国际学术成果分享(下)活动中 ,来自阿里巴巴的算法工程师李进峰以《针对现实应用的文本对抗攻击研究 》 为题带来一场精彩报告。

演讲主题:针对现实应用的文本对抗攻击研究(本文发表于NDSS 2019)

内容摘要:

随着深度学习技术的发展,基于深度学习的文本理解技术被广泛地应用于许多风险敏感型任务中,如情感分析、有害文本内容检测等。然而,图像领域最新研究表明,深度神经网络容易受到对抗样例攻击。那么,自然语言处理领域是否也存在对抗样例呢?实际部署应用自然语言处理系统能否抵御文本对抗样例攻击呢?在本文中,我们首先揭示了深度文本理解系统针对对抗文本的脆弱性。接着,我们提出了一个通用的对抗文本生成框架TextBugger,该框架可以针对现实应用有效地、高效地生成具有高可用性的对抗文本。最后,我们利用TextBugger评估了15个业界领先的深度文本理解系统的安全性,同时向相关公司报告了我们发现的模型安全风险并收到了积极反馈。

嘉宾介绍:

李进锋 阿里巴巴

李进锋,阿里巴巴集团算法工程师,2020年获得浙江大学计算机技术硕士学位,研究兴趣包括人工智能安全、数据驱动安全、神经网络可解释性等。

Bookmark the permalink.

Comments are closed.