本地RAG记忆系统,为AI Agent提供持久化语义搜索能力,支持多Agent安全隔离共享
基本信息
- 技能名称?Jasper Recall
- 中文名称?给 AI Agent 装上长期记忆
- 作者?emberdesire
- 分类?专业技能
- 版本?0.4.0
- 标签?rag, memory, agent, chromadb, local-ai, privacy, multi-agent, openclaw
使用方法
使用说明
核心用法
Jasper Recall 是一套面向 AI Agent 的本地检索增强生成(RAG)记忆系统,核心功能围绕三条命令展开:
- digest-sessions — 从会话日志提取关键信息(主题、工具使用等),生成结构化摘要
- index-digests — 将 Markdown 文件分块并嵌入到 ChromaDB 向量数据库
- recall — 基于语义相似度搜索历史记忆
系统采用 Python 生态的成熟方案(ChromaDB + sentence-transformers),使用 all-MiniLM-L6-v2 模型生成 384 维嵌入,完全离线运行。
显著优点
完全本地化 :无需调用外部 API,数据不出本地, embedding 模型首次下载后离线可用
多 Agent 隔离架构 :通过 ChromaDB 多集合(private_memories / shared_memories / agent_learnings)实现精细权限控制
隐私分级机制 :支持 [public] / [private] / [learning] 标签,主 Agent 与沙盒 Agent 可双向/单向共享特定记忆
OpenClaw 插件集成 :支持 autoRecall 自动注入相关上下文,且内置过滤规则(跳过心跳、自动化报告等)
HTTP 服务化 : serve 命令提供 REST API,方便 Docker 隔离环境下的 Agent 调用
潜在缺点与局限性
Python 依赖负担 :需安装 ~200MB 的 Python venv(含 PyTorch 等重型依赖),对纯 Node.js 环境不友好
嵌入模型固定 :当前锁定 all-MiniLM-L6-v2,不支持自定义模型或 GPU 加速配置
无分布式能力 :ChromaDB 为本地单机版,无法横向扩展
隐私检查规则有限 :内置检测(邮箱、API key、内网 IP 等)基于正则,可能漏检新型敏感模式
版本迁移成本 :v0.2.0+ 引入多集合架构,与早期 jasper_memory 单集合存在兼容层,长期维护需关注
适合人群
需要长期记忆能力的自主 Agent 开发者
运行多 Agent 系统(主 Agent + 沙盒工具 Agent)的团队
对数据隐私敏感、拒绝云服务 RAG 的个人或企业
OpenClaw 生态用户
常规风险
| 风险点 | 说明 | |--------|------| | 配置泄露 |RECALL_ALLOW_PRIVATE=true误设会暴露私忆至任意客户端 | | 绑定地址 |serve --host 0.0.0.0默认未限制,需显式加固 | | 敏感数据残留 | 记忆文件未加密,物理访问即可读取 | | 注入过度 | autoRecall 未设minScore阈值时可能污染上下文 | 建议生产环境配合容器隔离、定期 privacy-check 扫描、以及dry-run验证共享内容。
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!