Woodward–Hoffmann Selection Rules and Microscopic Reversibility
Enhanced Elimination of Poison
Masking and Demasking Agents
Randomized Experiments
Hindsight Biases
Types of Errors: Detection and Minimization
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Tianrong Zhang1, Zhaohan Xi1, Ting Wang2
1School of Information Science & Technology, Pennsylvania State University.
在自然语言处理 (NLP) 模型中,PromptFix提供了对后门的新防御. 这种方法使用对抗性提示调整来中和恶意触发令牌,而不会改变模型参数,从而提高了少量学习场景的安全性.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: