人工智能和大数据

第50页

怎样设计一个鲁棒且难以被绕过的“系统级安全提示”？

2026-01-03andy阅读(149)评论(0)

如何设计一个多层防御的鲁棒系统提示以防止大模型越狱攻击在模型部署中，系统提示（System Prompt）是AI基础设施安全性的第一道防线。然而，仅仅依靠一段文本指令很难抵御日益复杂的“越狱”（Jailbreaking）和“提示注入”（P...

rke搭建k8s报错,Unsupported Docker version found [28.2.2] on host [aegis-0002], supported versions are [1.13.x 17.03.x 17.06.x 17.09.x 18.06.x 18.09.x 19.03.x 20.10.x 23.0.x 24.0.x]

2026-01-02andy阅读(169)评论(0)

在AI基础设施部署中，Kubernetes是核心调度层，而RKE（Rancher Kubernetes Engine）是快速部署K8s集群的强大工具。然而，RKE对底层依赖，尤其是Docker运行时版本，有着严格的限制。当遇到 Unsupp...

如何高效使用DPO/PPO等RLHF技术对开源LLM进行安全微调？

2026-01-02andy阅读(156)评论(0)

深入理解DPO：高效RLHF的替代方案在使用开源大型语言模型（LLMs）时，安全性和伦理对齐是模型部署前必须解决的核心问题。传统上，我们使用基于强化学习的人类反馈（RLHF），例如近端策略优化（PPO）。然而，PPO存在计算资源消耗巨大、...

怎样利用模型级联（Model Cascading）来识别并重写恶意输入？

2026-01-02andy阅读(263)评论(0)

在AI模型部署中，尤其是大型语言模型（LLM）的应用场景下，输入安全（如提示注入Prompt Injection、恶意代码注入）是一个核心挑战。传统的单模型部署方式，要么需要将昂贵的大模型用于安全过滤（资源浪费），要么采用简单的硬编码规则（...

如何配置基于规则和机器学习的过滤器，有效拦截提示注入？

2026-01-01andy阅读(387)评论(0)

为什么需要双层防御？提示注入（Prompt Injection, PI）是目前LLM应用面临的最严重的安全威胁之一。攻击者通过操纵输入，试图让LLM忽略开发者提供的系统指令（System Prompt），从而执行恶意或未经授权的任务。仅...

如何通过“输入扰动”使LLM生成被禁止的毒性内容？

2026-01-01andy阅读(302)评论(0)

如何通过通用对抗性后缀（GCG）分析与防御大型语言模型的越狱攻击大型语言模型（LLMs）的安全对齐是一个核心挑战。尽管开发者投入了大量精力来对模型进行安全训练和红队测试（Red Teaming），恶意用户仍能通过构造精巧的“输入扰动”来诱...

如何评估您的LLM应用对各种经典越狱策略（如DAN）的抵抗力？

2025-12-31andy阅读(349)评论(0)

引言：为什么必须测试越狱抵抗力在将大型语言模型（LLM）投入生产环境时，模型的安全性是AI基础设施工程师必须解决的首要问题。即使是经过严格对齐（Alignment）训练的模型，也可能被特定的输入序列（即“越狱”或“Jailbreak”）绕...

怎样利用LLM的上下文学习机制进行有针对性的数据提取？

2025-12-31andy阅读(359)评论(0)

引言：为什么ICL是数据提取的利器？在大规模语言模型（LLM）的部署场景中，一项常见的任务是从非结构化文本（如邮件、合同、日志）中提取特定的、结构化的信息（如姓名、金额、日期）。传统的做法是依赖正则表达式或训练特定的命名实体识别（NER）...

如何针对多模态LLM（LMM）发起跨模态的提示注入攻击？

2025-12-30andy阅读(368)评论(0)

多模态大语言模型（LMMs），如GPT-4V和Claude 3等，正在成为AI应用的新前沿。它们通过集成的视觉编码器（Vision Encoder）处理图像输入，并将视觉信息转化为语言模型可以理解的嵌入（Embeddings）。然而，这种跨...

怎样使用“分隔符”或“换行符”绕过基于关键词的输入过滤器？

2025-12-30andy阅读(177)评论(0)

在AI模型部署，尤其是大型语言模型（LLM）的场景中，输入验证和安全过滤是至关重要的防御层。许多开发者会依赖简单的关键词匹配机制来阻止恶意或不当的输入（例如，阻止“删除数据”、“系统提示”等敏感指令）。然而，攻击者通常使用一种极其简单但有效...

上一页
1
···
47
48
49
50
51
52
53
...
下一页
共 77 页