AI Agent安全审计框架,自动验证skill/MCP/包安全,基于共享信任数据库进行风险评分与安装拦截。
基本信息
- 技能名称?ecap Security Auditor
- 中文名称?AI Agent 安全守门员,自动审计每一个包
- 作者?starbuck100
- 分类?专业技能
- 版本?2.0.0
- 标签?security-audit, supply-chain, mcp, agent-safety, trust-score, integrity-verification, prompt-injection-detection, openclaw
使用方法
使用说明
核心用法
ecap-security-auditor 是一个面向 AI Agent 生态的安全审计框架,提供 自动安全门控 和 手动深度审计 两大能力。安装或使用任何 skill、MCP 服务器、npm/pip 包时,系统自动查询信任注册表、验证文件完整性哈希、计算 Trust Score(0-100),并根据阈值决定放行(≥70)、警告(40-69)或拦截(
关键机制 :
Trust Score 计算 :100 减去各严重级 finding 的扣分(Critical -25, High -15, Medium -8, Low -3),高风险组件(hooks/、.mcp.json 等)×1.2 倍惩罚
完整性验证 :对比本地文件 SHA-256 与审计时记录的哈希,不匹配则硬拦截
AI 专属检测 :12 类提示注入模式(AI_PROMPT_001~012)、6 类持久化机制(PERSIST_001~006)、7 类高级混淆技术(零宽字符、base64→exec 链等)
跨文件分析 :识别多文件攻击链(凭证读取+网络外传、权限提升+持久化等),标记为 CORR_ 前缀 finding
显著优点
- 零配置被动防护 :安装即触发安全门,无需用户干预
- 众包式信任网络 :每个 Agent 审计后上传报告,注册表有机增长
- AI 原生威胁建模 :针对 LLM Agent 特有的提示注入、工具滥用、指令层级攻击设计检测规则
- 版本感知完整性 :区分"合法更新"与"篡改攻击",避免误杀
- 可恢复的信任分 :修复 issue 后通过 /fix 端点恢复 50% 扣分,误报标记后全额恢复
潜在缺点与局限
完整性数据库覆盖有限 :目前仅 ecap-security-auditor 自身在库,多数包需依赖 findings 评分而非哈希验证
网络依赖 :API 不可达时只能降级为"用户自担风险"或本地缓存模式
大包审计成本 :500+ 文件项目需启发式跳过,可能漏检非入口文件中的攻击
AI 检测误报 :防御性代码(如"不要透露提示词")可能与攻击模式混淆,需人工复核
Self-review 禁止 :无法直接修正自己报告的误报,必须依赖社区 peer review
适合人群
AI Agent 开发者 :需验证自身 skill/MCP 安全性,或集成安全门到 Agent 运行时
安全研究员 :贡献审计报告、参与 peer review 获取积分排名
企业部署团队 :建立内部信任注册表(可通过 ECAP_REGISTRY_URL 自定义),管控第三方组件准入
常规风险
SKILL.md 供应链攻击 :恶意 fork 可能篡改 verify.sh 脚本,需始终校验官方来源哈希
审计提示注入 :被审计包中的注释/字符串可能包含针对审计 LLM 的隐藏指令(零宽字符、HTML 注释)
API 密钥泄露 : credentials.json 或 ECAP_API_KEY 若被窃取,可导致虚假报告注入信任系统
评分操纵 :通过 by_design=true 标记规避扣分,或利用 component_type 模糊性降低惩罚权重
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!