标签：对抗性

如何利用对抗性去偏见（Adversarial Debiasing）技术提高模型公平性？

2026-01-27andy阅读(122)评论(0)

在AI模型部署到实际环境之前，确保其公平性是AI基础设施工程师面临的关键挑战。模型常常会无意中吸收训练数据中固有的社会偏差（例如，基于性别或种族的偏见），导致对特定群体产生系统性的不利影响。对抗性去偏见（Adversarial Debias...

2026-01-18andy阅读(93)评论(0)

多模态大型语言模型（MLLM），例如GPT-4V或开源的LLaVA，结合了强大的视觉理解和语言生成能力。然而，正如传统的计算机视觉模型一样，MLLM也容易受到“对抗性攻击”的影响。这些攻击通过向图片添加人眼难以察觉的微小扰动（即对抗性像素）...

2026-01-01andy阅读(233)评论(0)

如何通过通用对抗性后缀（GCG）分析与防御大型语言模型的越狱攻击大型语言模型（LLMs）的安全对齐是一个核心挑战。尽管开发者投入了大量精力来对模型进行安全训练和红队测试（Red Teaming），恶意用户仍能通过构造精巧的“输入扰动”来诱...

2025-12-11andy阅读(220)评论(0)

简介：AI基础设施中的安全漏洞随着语音识别（ASR）模型，如Wav2Vec2和DeepSpeech，在云端和边缘设备上的广泛部署，它们的安全性和鲁棒性变得至关重要。对抗性攻击是AI模型部署中一个被忽视但极其危险的漏洞。攻击者通过向原始音频...

2025-12-10andy阅读(193)评论(0)

深入理解AI模型的“软肋”：对抗性攻击实战随着BERT、RoBERTa等大型预训练模型在NLP任务中取得SOTA表现，模型部署已成为AI基础设施的关键环节。然而，这些模型并非无懈可击，它们对对抗性扰动（Adversarial Pertur...

2025-12-09andy阅读(198)评论(0)

深入理解AI防御：如何使用FGSM生成对抗性补丁随着AI模型，特别是计算机视觉模型（如YOLO、Mask R-CNN）在自动驾驶和监控系统中的广泛应用，评估它们的鲁棒性变得至关重要。对抗性攻击（Adversarial Attacks）揭示...