1.威斯康星大学麦迪逊分校的研究团队发现,强化学习可用于有效攻击机器学习模型,称为黑盒逃避攻击。
2.该团队提出了基于强化学习生成对抗样本的攻击方法,包括RL Max Loss和RL Min Norm。
3.实验结果显示,强化学习攻击方法能提高对抗样本的有效性和效率,平均生成速度提升19.4%。
4.然而,研究还发现奖励和转换超参数ε和c的选择会影响强化学习攻击的性能。
5.该团队建议,防御者需要关注强化学习攻击方法,并考虑在攻击前对其进行评估。
以上内容由腾讯混元大模型生成,仅供参考
机器之心报道
论文标题:Adversarial Agents: Black-Box Evasion Attacks with Reinforcement Learning 论文地址:https://arxiv.org/pdf/2503.01734