AI驱动的双模式屏幕协作

Screen Monitor

收藏 14.9k
下载 5k
版本 1.0.1

双模式屏幕共享分析工具,支持WebRTC快速分享与浏览器深度控制,兼容Gemini/Claude/Qwen3-VL等多模态模型。

基本信息

  • 技能名称?Screen Monitor
  • 中文名称?AI驱动的双模式屏幕协作
  • 作者?emasoudy
  • 分类?专业技能
  • 版本?1.0.1
  • 标签?screen-sharing, webrtc, browser-automation, vision-model, remote-debugging, ui-testing

使用方法

使用说明
核心用法
Screen Monitor 提供两种互补的屏幕交互模式:
快速分享模式(WebRTC)
生成本地WebRTC门户URL,无需安装浏览器扩展
适合快速视觉检查、受限浏览器环境或非技术场景
通过 screen_share_link 获取链接, screen_analyze 捕获当前帧并调用视觉模型分析
完全控制模式(Browser Relay)
需安装Clawdbot浏览器扩展并附加到Chrome标签页
支持精确截图( browser action:snapshot )、点击/输入等UI自动化操作
适合深度调试、复杂网页交互场景
显著优点
模型无关性 :兼容Gemini、Claude、Qwen3-VL等主流视觉模型
双模式灵活 :轻量快速分享 vs 深度控制,覆盖不同使用场景
本地优先 :WebRTC后端运行在本地端口18795,减少数据外泄风险
潜在局限
Browser Relay模式依赖Chrome扩展,配置步骤较多
WebRTC模式在复杂网络环境(如企业防火墙)下可能连接受限
未明确提及录屏存储加密、访问鉴权机制
适合人群
前端开发者、UI/UX设计师、远程协作团队、需要AI辅助屏幕分析的技术用户
常规风险
屏幕内容可能包含敏感信息,分享时需确认可见范围
WebRTC信令服务若配置不当,存在端口暴露风险
浏览器扩展需从非商店渠道加载(unpacked),存在供应链信任问题

标签

专业技能

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!