功能总览
OpenClaw 是一个全渠道 AI Agent 网关,将大语言模型(LLM)的能力无缝连接到您日常使用的消息平台。以下是核心功能概览。
多渠道接入(Multi-Channel)
OpenClaw 支持同时连接多个消息平台:
| 渠道 | 状态 | 特性 |
|---|---|---|
| ✅ 稳定 | 文本、图片、语音、文档 | |
| Telegram | ✅ 稳定 | 文本、图片、语音、Markdown |
| Discord | ✅ 稳定 | 文本、图片、嵌入、斜杠命令 |
| iMessage | ✅ 稳定 | 文本、图片(需 macOS) |
| Web UI | ✅ 稳定 | 全功能、流式输出 |
| Slack | 🔄 Beta | 文本、线程、反应 |
| Matrix | 🔄 Beta | 端对端加密、文本 |
一个 Agent,多个渠道
同一个 Agent 可以同时服务于 WhatsApp、Telegram 和 Discord 上的用户,会话状态独立管理。
多 Agent 路由(Multi-Agent Routing)
在单个 Gateway 上运行多个专业化 Agent:
yaml
agents:
- name: general
description: 通用助手
model: openai/gpt-4o
- name: coder
description: 编程专家
model: anthropic/claude-3-5-sonnet
- name: writer
description: 写作助手
model: deepseek/deepseek-chat- 按渠道、用户、群组配置路由规则
- Agent 之间会话完全隔离
- 支持 Agent 间消息转发
媒体处理(Media Handling)
Agent 能够理解和处理多种媒体类型:
- 图片(Images) — 自动发送给支持视觉的模型分析
- 语音(Voice) — 自动转录为文本(Speech-to-Text)
- 视频(Video) — 提取关键帧进行分析
- 文档(Documents) — 提取文本内容注入上下文
模型能力匹配
媒体处理会自动匹配模型能力。如当前模型不支持视觉,图片会先经过 OCR 或描述模型处理。
移动端节点(Mobile Nodes)
iOS 和 Android 设备可作为 OpenClaw 节点连接:
- 设备配对 — 扫码或 Token 配对
- 语音对话 — 实时语音输入/输出
- 聊天界面 — 原生 UI 体验
- 设备命令 — 远程触发设备功能(如拍照、读取传感器)
bash
# 生成设备配对码
openclaw device pair --generate自动化(Automation)
Cron 定时任务
yaml
cron:
- schedule: "0 9 * * *" # 每天上午 9 点
action: daily-summary
agent: general
- schedule: "*/30 * * * *" # 每 30 分钟
action: health-check
agent: monitorHooks 生命周期钩子
在特定事件触发时执行自定义脚本:
bash
# hooks/on-message.sh
#!/bin/bash
echo "New message from: $OPENCLAW_SENDER"Webhooks
通过 HTTP 端点触发 Agent 行为:
bash
curl -X POST http://localhost:18789/webhook/agent/general \
-H "Authorization: Bearer $TOKEN" \
-d '{"message": "Run daily report"}'记忆系统(Memory)
双层记忆架构确保 Agent 具有持久化认知:
| 层级 | 文件 | 说明 |
|---|---|---|
| 每日日志 | memory/YYYY-MM-DD.md | 每日追加记录,启动时读取今天+昨天 |
| 长期记忆 | MEMORY.md | 精选重要事实,仅私聊更新 |
- 支持语义搜索(Semantic Search)回忆历史
- 向量索引 + BM25 混合搜索
- 自动去重与时间衰减
技能系统(Skills)
可插拔的功能扩展模块:
skills/
├── web-search/ # 网页搜索
├── code-exec/ # 代码执行
├── image-gen/ # 图片生成
└── data-analysis/ # 数据分析沙箱执行(Sandboxing)
工具执行在隔离的沙箱环境中运行:
- 文件系统隔离
- 网络访问控制
- 执行时间限制
- 资源用量限制
安全边界
沙箱提供额外的安全层,但不应作为唯一的安全措施。敏感环境中建议结合 Tool Policies 使用。
模型故障转移(Model Failover)
自动切换备用模型确保服务连续性:
yaml
model: openai/gpt-4o
failover:
- anthropic/claude-3-5-sonnet
- deepseek/deepseek-chat
- google/gemini-2.0-flash当主模型不可用时,自动按序尝试备用模型。
会话管理(Session Management)
- 每个用户-Agent 组合独立会话
- 自动会话重置(每日凌晨 4 点或空闲超时)
- 会话历史持久化为 JSONL
- 支持手动重置与导出
🇨🇳 中国用户须知
- 推荐使用 DeepSeek、智谱 GLM、通义千问等国产模型作为主模型或 Failover 备选
- 微信渠道支持正在开发中
- Cron 定时任务请注意配置正确的时区(参考 时区配置)
