基于presidio-anonymizer开发大模型隐私检测工具

Table of Contents

简介：大模型时代下的隐私挑战

随着大型语言模型（LLM）的广泛应用，模型输出中意外泄露敏感个人信息（PII，Personally Identifiable Information）的风险日益增加。这可能是由于训练数据泄露、模型幻觉、或用户在Prompt中输入了敏感信息。为了确保合规性并保护用户隐私，在模型服务层添加一个实时、高效的PII检测与脱敏（Anonymization）层至关重要。

Microsoft Presidio是一个功能强大的框架，它专注于对文本进行分析以识别敏感数据，并提供脱敏功能。本文将重点介绍如何结合使用presidio-analyzer和presidio-anonymizer来构建针对大模型输出内容的隐私保护工具。

准备工作与环境配置

我们只需要安装核心的Presidio库。Presidio默认集成了多种语言（包括英文、西班牙文等）和实体检测器。

pip install presidio-analyzer presidio-anonymizer

第一步：核心PII检测（Analyzer）

presidio-analyzer是检测敏感信息的引擎。它使用多种技术（如正则表达式、命名实体识别模型、上下文校验）来定位PII实体，并返回检测结果及置信度。

我们以一个包含多种敏感信息的模拟LLM输出为例：

from presidio_analyzer import AnalyzerEngine

# 初始化分析引擎
analyzer = AnalyzerEngine()

# 模拟大模型的输出文本
text = (
    "好的，这是我找到的资料。用户张三（Zhang San）的联系方式是：" 
    "邮箱: zhang.san@example.com，电话号码: +86-13800001234。" 
    "他住在北京市朝阳区。请将报告发给工程经理 Smith A. John。
"
)

# 设置需要检测的实体类型（可选，默认检测所有内置实体）
# Presidio内置了如EMAIL_ADDRESS, PHONE_NUMBER, PERSON, LOCATION等数百种实体
results = analyzer.analyze(
    text=text,
    entities=["PERSON", "EMAIL_ADDRESS", "PHONE_NUMBER", "LOCATION"],
    language='en'
)

print("--- 检测结果 ---")
for result in results:
    print(f"实体类型: {result.entity_type}, ")
    print(f"  位置: [{result.start}, {result.end}], ")
    print(f"  置信度: {result.score:.2f}, ")
    print(f"  提取内容: {text[result.start:result.end]}")

# 结果示例（部分）：
# 实体类型: PERSON, 位置: [8, 11], 置信度: 0.85, 提取内容: 张三
# 实体类型: EMAIL_ADDRESS, 位置: [44, 65], 置信度: 1.00, 提取内容: zhang.san@example.com
# 实体类型: PHONE_NUMBER, 位置: [70, 85], 置信度: 0.95, 提取内容: +86-13800001234

第二步：实时脱敏（Anonymizer）

检测到PII后，下一步是采取脱敏措施。presidio-anonymizer允许我们使用多种脱敏操作符（Operator），例如替换（Replace）、假名化（Faker）、或者星号屏蔽（Masking）。

我们将使用最常见的两种策略：
1. 替换（Replace Operator）： 用实体类型名称代替检测到的内容。
2. 屏蔽（Mask Operator）： 使用星号或自定义字符来覆盖部分或全部内容。

from presidio_anonymizer import AnonymizerEngine
from presidio_anonymizer.operators import OperatorType

anonymizer = AnonymizerEngine()

# 准备脱敏配置：我们将邮件和电话替换为占位符，人名进行默认替换
anonymizer_operators = {
    "EMAIL_ADDRESS": {
        "operator_name": OperatorType.REPLACE,
        "params": {"new_value": "[EMAIL_REDACTED]"}
    },
    "PHONE_NUMBER": {
        "operator_name": OperatorType.REPLACE,
        "params": {"new_value": "[PHONE_REDACTED]"}
    },
    # 其他未指定实体（如PERSON, LOCATION）将使用默认的Replace Operator，用实体名代替
}

# 执行脱敏操作
anonymized_result = anonymizer.anonymize(
    text=text,
    analyzer_results=results, # 使用第一步的分析结果
    operators=anonymizer_operators
)

print("--- 脱敏后的文本 ---")
print(anonymized_result.text)
# 输出: 好的，这是我找到的资料。用户PERSON（PERSON）的联系方式是：邮箱: [EMAIL_REDACTED]，电话号码: [PHONE_REDACTED]。他住在LOCATION。请将报告发给PERSON。

第三步：自定义检测器（针对特定业务PII）

对于企业级部署，很多敏感信息是内置检测器无法识别的，例如内部项目ID、员工编号或特定的文件格式标记。Presidio允许我们轻松添加自定义检测器（Custom Recognizer）。

假设我们要检测格式为 PROJ-XXXX-YYYY 的项目ID。

import re
from presidio_analyzer import Pattern, PatternRecognizer, AnalyzerEngine

# 1. 定义正则表达式模式
project_id_pattern = Pattern(
    name="PROJECT_ID_PATTERN", 
    regex="(PROJ-[0-9]{4}-[A-Z]{4})", 
    score=0.7 # 置信度评分
)

# 2. 创建自定义识别器
project_id_recognizer = PatternRecognizer(
    supported_entity="PROJECT_ID", 
    patterns=[project_id_pattern]
)

# 3. 注册到AnalyzerEngine
custom_analyzer = AnalyzerEngine()
custom_analyzer.registry.add_recognizer(project_id_recognizer)

custom_text = "最近的项目是 PROJ-2023-ABCD，请确保该ID的安全。"

# 4. 执行分析，指定要查找自定义实体
custom_results = custom_analyzer.analyze(
    text=custom_text,
    entities=["PROJECT_ID"],
    language='en'
)

print("--- 自定义检测结果 ---")
for result in custom_results:
    print(f"实体类型: {result.entity_type}, 提取内容: {custom_text[result.start:result.end]}")

# 5. 可选：脱敏自定义实体
custom_anonymizer = AnonymizerEngine()
custom_anonymized_result = custom_anonymizer.anonymize(
    text=custom_text,
    analyzer_results=custom_results
)
print(f"脱敏后: {custom_anonymized_result.text}")
# 输出: 脱敏后: 最近的项目是 PROJECT_ID，请确保该ID的安全。

总结与部署考量

将Presidio集成到AI基础设施中，通常作为LLM网关或后处理服务的一部分。每当用户请求通过LLM生成回复时，该回复会先经过Presidio检测和脱敏，然后再返回给用户。这提供了一个强大的、可扩展的隐私防护屏障。

部署考量:

性能优化： 对于高吞吐量场景，应考虑将Presidio服务化（例如使用FastAPI或Docker容器），并优化其内置的NLP模型加载。
语言支持： 如果需要处理中文PII，需要额外配置或集成中文NER模型（如使用spacy或stanza）作为自定义识别器，因为Presidio默认的内置识别器对中文支持有限。

基于presidio-anonymizer开发大模型隐私检测工具

简介：大模型时代下的隐私挑战

准备工作与环境配置

第一步：核心PII检测（Analyzer）

第二步：实时脱敏（Anonymizer）

第三步：自定义检测器（针对特定业务PII）

总结与部署考量

相关

相关推荐

评论抢沙发

简介：大模型时代下的隐私挑战

准备工作与环境配置

第一步：核心PII检测（Analyzer）

第二步：实时脱敏（Anonymizer）

第三步：自定义检测器（针对特定业务PII）

总结与部署考量

相关

相关推荐

评论 抢沙发

评论抢沙发