提供绕过反爬虫保护的浏览器自动化会话,原生支持 CDP 协议,适合企业级网页数据采集与测试场景。
基本信息
- 技能名称?Browser Cash
- 中文名称?绕过反爬的真实浏览器自动化
- 作者?alexander-spring
- 分类?专业技能
- 版本?1.0.0
- 标签?browser-automation, web-scraping, cdp, playwright, puppeteer, anti-detection, cloudflare-bypass, session-management
使用方法
使用说明
核心用法
browser-cash 是一项基于 Browser.cash 的 Web 自动化技能,通过 API 创建真实浏览器会话并返回 WebSocket CDP(Chrome DevTools Protocol)端点,可直接接入 Playwright、Puppeteer 或原生 CDP 工具执行自动化任务。
创建会话流程 :配置 API Key → POST /v1/browser/session 创建会话 → 提取 cdpUrl → 使用 Playwright/Puppeteer 通过 connectOverCDP() 连接 → 执行页面操作 → DELETE 终止会话。支持地理位置指定( country )、窗口尺寸自定义( windowSize )、持久化浏览器配置( profile.persist )及 SOCKS5 代理注入。
显著优点
- 反检测能力强 :会话内置真实浏览器指纹,自动绕过 Cloudflare、DataDome、PerimeterX 等主流反爬机制
- 原生 CDP 支持 :直接输出 WebSocket CDP URL,无需额外适配层,兼容所有标准 CDP 客户端
- 状态持久化 :通过命名 profile 保存 cookies、localStorage 及登录态,支持跨会话状态延续
- 弹性地理分布 :可按需启动特定国家节点,满足区域化内容采集或合规要求
潜在缺点与局限性
仅支持 SOCKS5 代理 :HTTP/HTTPS 代理需外部转换
会话自动回收 :长时间闲置会导致强制终止,需合理设计任务时长与心跳机制
npm 依赖前置 :Playwright/Puppeteer 需在 ~/clawd/ 目录预装,首次使用存在初始化成本
计费模式限制 :按会话时长或请求量计费,高频短时任务成本需精细核算
适合人群
企业级数据采集团队需稳定绕过反爬保护
QA 工程师进行跨地域浏览器兼容性测试
安全研究人员验证 bot 检测绕过机制
需维持长期登录态的自动化工作流开发者
常规风险
中等风险等级(A) :需妥善保管 API Key(存储于 clawdbot 配置),避免泄露导致资源盗刷;会话终止操作必须显式调用,否则可能产生额外费用;自动化操作需遵守目标网站 ToS 及 robots.txt,违规采集可能触发法律或账号封禁风险。
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!