Skip to content
广告 · 本站推荐广告

威胁模型图谱

Threat Model Atlas(威胁模型图谱)是 OpenClaw 安全架构的核心文档,系统性地分析了所有已知的攻击向量、风险等级和对应的缓解策略。

威胁模型概览

                    ┌─────────────┐
                    │   攻击者    │
                    └──────┬──────┘

        ┌──────────────────┼──────────────────┐
        │                  │                  │
   ┌────▼─────┐    ┌──────▼──────┐    ┌─────▼────┐
   │ 网络攻击 │    │  模型攻击   │    │ 数据攻击 │
   └────┬─────┘    └──────┬──────┘    └─────┬────┘
        │                  │                  │
   ┌────▼─────┐    ┌──────▼──────┐    ┌─────▼────┐
   │ 物理攻击 │    │  供应链攻击 │    │ 社工攻击 │
   └──────────┘    └─────────────┘    └──────────┘

攻击向量分类

1. 网络攻击(Network Attacks)

威胁描述风险缓解措施
中间人攻击(MITM)截获网关与模型之间的通信🔴 高TLS 加密所有通信
RPC 未授权访问绕过认证调用 RPC 接口🔴 高Bearer Token + IP 白名单
WebSocket 劫持劫持已建立的 WS 连接🟡 中连接签名验证
DDoS 攻击耗尽网关资源🟡 中速率限制 + CDN
DNS 劫持重定向 API 请求🟡 中DNSSEC + 证书固定

2. 模型攻击(Model Attacks)

威胁描述风险缓解措施
Prompt Injection(提示注入)用户输入覆盖系统指令🔴 高输入清洗 + 指令隔离
Jailbreak(越狱)绕过 Agent 约束执行禁止操作🔴 高多层防护 + 输出审查
数据泄漏LLM 回复中暴露系统提示词🟡 中输出过滤 + 提示词保护
模型中毒恶意微调模型影响行为🟡 中使用可信模型源
上下文溢出注入大量文本挤出系统指令🟡 中上下文长度限制

最高风险

Prompt Injection 是 AI Agent 系统面临的最严重威胁。攻击者通过精心构造的输入可能使 Agent 执行未授权操作。

3. 数据攻击(Data Attacks)

威胁描述风险缓解措施
会话数据泄露未经授权访问对话历史🔴 高加密存储 + 访问控制
知识库投毒注入错误信息到知识库🟡 中内容审核 + 版本控制
日志信息泄露从日志中提取敏感信息🟡 中日志脱敏 + 访问限制
备份数据暴露备份文件未加密被获取🟡 中加密备份 + 安全存储

4. 物理攻击(Physical Attacks)

威胁描述风险缓解措施
服务器物理入侵直接访问服务器硬件🟡 中数据中心安全 + 磁盘加密
设备丢失移动设备丢失暴露凭据🟡 中远程擦除 + 凭据轮换
侧信道攻击通过功耗/时序推断数据🟢 低恒定时间比较

风险评估矩阵

可能性 ↑
 高  │  DNS劫持    │ Prompt注入  │
     │  WS劫持     │ Jailbreak   │
 中  │  DDoS       │ 数据泄露    │
     │  模型中毒   │ 知识库投毒  │
 低  │  物理入侵   │ 侧信道      │
     │  供应链攻击 │             │
     └─────────────┴─────────────┘
        低    影响程度 →    高

缓解策略详解

Prompt Injection 防护

yaml
# 多层防护策略
security:
  promptInjection:
    # 第一层:输入清洗
    inputSanitization:
      enabled: true
      stripControlChars: true
      maxLength: 5000

    # 第二层:指令隔离
    instructionIsolation:
      enabled: true
      separator: '---SYSTEM-BOUNDARY---'

    # 第三层:输出审查
    outputReview:
      enabled: true
      blockPatterns:
        - 'system prompt'
        - 'ignore previous'
        - 'AGENTS.md'

纵深防御体系

┌─────────────────────────────────────────┐
│        第 1 层:网络安全                  │
│   TLS、防火墙、IP 白名单、DDoS 防护     │
├─────────────────────────────────────────┤
│        第 2 层:认证与授权               │
│   Bearer Token、RBAC、OAuth             │
├─────────────────────────────────────────┤
│        第 3 层:输入验证                  │
│   参数校验、输入清洗、长度限制           │
├─────────────────────────────────────────┤
│        第 4 层:Agent 安全               │
│   工具策略、指令隔离、输出审查           │
├─────────────────────────────────────────┤
│        第 5 层:数据安全                  │
│   加密存储、脱敏处理、访问控制           │
├─────────────────────────────────────────┤
│        第 6 层:监控与审计               │
│   日志审计、异常检测、告警通知           │
└─────────────────────────────────────────┘

安全配置清单

yaml
# openclaw.config.yaml 安全推荐配置
security:
  # 网络
  tls: true
  cors:
    origins: ['https://your-domain.com']

  # 认证
  rpc:
    auth: true
    ipWhitelist: ['10.0.0.0/8']

  # Agent 安全
  tools:
    defaultPolicy: 'ask'
    dangerousOps: 'deny'

  # 数据安全
  encryption:
    atRest: true
    algorithm: 'aes-256-gcm'

  # 审计
  audit:
    enabled: true
    logLevel: 'info'

🇨🇳 中国用户须知

  • 部署在国内时需遵守《网络安全法》和等保要求
  • 处理个人信息需遵守《个人信息保护法》
  • 涉及 AI 生成内容需遵守《生成式人工智能服务管理暂行办法》
  • 建议使用国内云服务商的安全产品(WAF、DDoS 防护等)

基于MIT协议开源 | 内容翻译自 官方文档,同步更新