通过视觉感知和 GUI 自动化实现微信消息自动发送,支持搜索/列表双模式联系人查找,需依赖外部屏幕捕获服务。
基本信息
- 技能名称?Wechat Sender
- 中文名称?视觉驱动的微信自动化发送
- 作者?noir-hedgehog
- 分类?其他
- 版本?1.0.1
- 标签?automation, gui-automation, wechat, messaging, visual-perception, screen-capture, productivity
使用方法
使用说明
核心用法
WeChat Sender 是一套基于视觉理解的微信自动化发送方案,通过组合 peekaboo 窗口操作工具与 Agent-Eye 屏幕捕获服务,实现对微信客户端的 GUI 自动化控制。
关键能力组合 :
窗口操控 :聚焦微信窗口并调整至 1200×900 分辨率,绕过防录屏限制
视觉感知 :Agent-Eye 提供实时截图(100px 网格+鼠标准星),结合内置 image 工具进行界面理解
联系人查找 :双模式策略——推荐 Cmd+F 搜索(高效),备选 Shift+方向键列表滑动
消息发送 :剪贴板粘贴文本 + Cmd+Return 快捷键触发发送
典型执行流 :聚焦窗口 → 调整大小 → 搜索/定位联系人 → 截图确认 → 粘贴消息 → 发送 → 二次截图验证气泡出现。
显著优点
- 非侵入式架构 :不依赖微信 API 或协议破解,纯 GUI 层模拟,降低账号风控概率
- 视觉反馈闭环 :每次关键操作后截图确认,避免盲目执行导致的误发
- 灵活策略选择 :搜索模式适合已知姓名场景,列表滑动适合顺序固定的批量场景
- 网格坐标辅助 :100px 网格叠加降低定位误差,便于精确点击
潜在缺点与局限性
外部依赖重 :必须同时启动 eye-server + Python Agent 两个服务,部署门槛较高
延迟敏感 :截图-分析-决策链条长,单次发送耗时数秒至数十秒,不适合高并发
UI 脆弱性 :微信版本更新可能导致界面元素位置偏移,需维护坐标映射
平台锁定 :当前方案基于 macOS( screencapture 、 cmd 键),跨平台需适配
适合人群
需要低频、个性化微信触达的自动化场景(如定时问候、状态通知)
具备本地服务部署能力的技术用户
无法接受 API 方案封号风险,愿牺牲效率换取稳定性的场景
常规风险
隐私泄露 :屏幕捕获服务截取完整桌面内容,需确保运行环境隔离敏感信息
误发风险 :视觉理解错误可能导致消息发送至错误联系人,建议关键操作前人工复核
服务可用性 :Agent-Eye 服务崩溃将导致整个链路中断,缺乏降级机制
微信风控 :频繁自动化操作仍可能触发客户端行为检测,建议控制发送频率
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!