AI Agent 安全守门员,自动审计每一个包

ecap Security Auditor

收藏 10.9k
下载 2.5k
版本 2.0.0

AI Agent安全审计框架,自动验证skill/MCP/包安全,基于共享信任数据库进行风险评分与安装拦截。

基本信息

  • 技能名称?ecap Security Auditor
  • 中文名称?AI Agent 安全守门员,自动审计每一个包
  • 作者?starbuck100
  • 分类?专业技能
  • 版本?2.0.0
  • 标签?security-audit, supply-chain, mcp, agent-safety, trust-score, integrity-verification, prompt-injection-detection, openclaw

使用方法

使用说明
核心用法
ecap-security-auditor 是一个面向 AI Agent 生态的安全审计框架,提供 自动安全门控 和 手动深度审计 两大能力。安装或使用任何 skill、MCP 服务器、npm/pip 包时,系统自动查询信任注册表、验证文件完整性哈希、计算 Trust Score(0-100),并根据阈值决定放行(≥70)、警告(40-69)或拦截(
关键机制 :
Trust Score 计算 :100 减去各严重级 finding 的扣分(Critical -25, High -15, Medium -8, Low -3),高风险组件(hooks/、.mcp.json 等)×1.2 倍惩罚
完整性验证 :对比本地文件 SHA-256 与审计时记录的哈希,不匹配则硬拦截
AI 专属检测 :12 类提示注入模式(AI_PROMPT_001~012)、6 类持久化机制(PERSIST_001~006)、7 类高级混淆技术(零宽字符、base64→exec 链等)
跨文件分析 :识别多文件攻击链(凭证读取+网络外传、权限提升+持久化等),标记为 CORR_ 前缀 finding
显著优点

  1. 零配置被动防护 :安装即触发安全门,无需用户干预
  2. 众包式信任网络 :每个 Agent 审计后上传报告,注册表有机增长
  3. AI 原生威胁建模 :针对 LLM Agent 特有的提示注入、工具滥用、指令层级攻击设计检测规则
  4. 版本感知完整性 :区分"合法更新"与"篡改攻击",避免误杀
  5. 可恢复的信任分 :修复 issue 后通过 /fix 端点恢复 50% 扣分,误报标记后全额恢复
    潜在缺点与局限
    完整性数据库覆盖有限 :目前仅 ecap-security-auditor 自身在库,多数包需依赖 findings 评分而非哈希验证
    网络依赖 :API 不可达时只能降级为"用户自担风险"或本地缓存模式
    大包审计成本 :500+ 文件项目需启发式跳过,可能漏检非入口文件中的攻击
    AI 检测误报 :防御性代码(如"不要透露提示词")可能与攻击模式混淆,需人工复核
    Self-review 禁止 :无法直接修正自己报告的误报,必须依赖社区 peer review
    适合人群
    AI Agent 开发者 :需验证自身 skill/MCP 安全性,或集成安全门到 Agent 运行时
    安全研究员 :贡献审计报告、参与 peer review 获取积分排名
    企业部署团队 :建立内部信任注册表(可通过 ECAP_REGISTRY_URL 自定义),管控第三方组件准入
    常规风险
    SKILL.md 供应链攻击 :恶意 fork 可能篡改 verify.sh 脚本,需始终校验官方来源哈希
    审计提示注入 :被审计包中的注释/字符串可能包含针对审计 LLM 的隐藏指令(零宽字符、HTML 注释)
    API 密钥泄露 : credentials.json 或 ECAP_API_KEY 若被窃取,可导致虚假报告注入信任系统
    评分操纵 :通过 by_design=true 标记规避扣分,或利用 component_type 模糊性降低惩罚权重

标签

专业技能

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!