标签：越狱

如何评估您的LLM应用对各种经典越狱策略（如DAN）的抵抗力？

2025-12-31andy阅读(409)评论(0)

引言：为什么必须测试越狱抵抗力在将大型语言模型（LLM）投入生产环境时，模型的安全性是AI基础设施工程师必须解决的首要问题。即使是经过严格对齐（Alignment）训练的模型，也可能被特定的输入序列（即“越狱”或“Jailbreak”）绕...

2025-12-29andy阅读(358)评论(0)

深入理解自动化越狱提示生成（SAPG）在将大型语言模型（LLM）部署到生产环境之前，进行严格的安全性和鲁棒性测试是至关重要的。传统的红队测试往往依赖人工构造提示，效率低下且覆盖面不足。为了系统性地评估和增强模型的防御能力，我们需要一个结构...