Hanxiao Wu1, Shengwu Xiong2, Dong Yi3
1School of Computer Science and Artificial Intelligence, Wuhan University of Technology, Wuhan, 430070, Hubei, China; Institute of Automation, Chinese Academy of Sciences, Beijing, 100190, China; School of Artificial Intelligence, University of Chinese Academy of Sciences, Beijing, 101408, China; Wuhan AI Research, Wuhan, 430000, Hubei, China.
こちらも読む
共著者、ジャーナル、引用グラフによってこの研究に関連する記事。
新しい攻撃方法であるAdversarial Discriminant Attack (ADAtk) は,コンセプトを消去した拡散モデルにおける安全メカニズムを効果的に回避しています. ADAtkは,90%以上の成功率で,Not-Safe-For-Work (NSFW) として分類された画像を生成し,現在のAI安全技術における脆弱性を明らかにします.
科学分野:
背景:
研究 の 目的:
主な方法:
主要な成果:
結論: