Hanxiao Wu1, Shengwu Xiong2, Dong Yi3
1School of Computer Science and Artificial Intelligence, Wuhan University of Technology, Wuhan, 430070, Hubei, China; Institute of Automation, Chinese Academy of Sciences, Beijing, 100190, China; School of Artificial Intelligence, University of Chinese Academy of Sciences, Beijing, 101408, China; Wuhan AI Research, Wuhan, 430000, Hubei, China.
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
一种新的攻击方法,即对抗性歧视性攻击 (ADAtk),有效地绕过了概念删除扩散模型中的安全机制. ADAtk以超过90%的成功率生成被归类为"不安全用于工作" (NSFW) 的图像,揭示了当前AI安全技术的漏洞.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: