一键抓取亚马逊商品数据

Amazon Product Search Api Skill

收藏 8.6k
下载 3k
版本 0.1.2

通过 BrowserAct API 自动化抓取亚马逊搜索结果,提取结构化商品数据(价格、评分、销量等),支持多语言与品牌过滤,无验证码、无 IP 限制。

基本信息

  • 技能名称?Amazon Product Search Api Skill
  • 中文名称?一键抓取亚马逊商品数据
  • 作者?phheng
  • 分类?专业技能
  • 版本?0.1.2
  • 标签?e-commerce, web-scraping, amazon, market-research, price-monitoring, api-integration, browser-automation, competitive-analysis, data-extraction, multi-language

使用方法

使用说明
核心用法
Amazon Product Search API Skill 是一款基于 BrowserAct 的自动化数据采集工具,专为亚马逊商品搜索场景设计。用户只需提供关键词、品牌筛选条件和抓取数量,即可一键获取结构化的商品列表数据。该技能采用预置浏览器工作流,绕过传统爬虫面临的验证码拦截和 IP 封禁问题。
典型调用方式 :
python -u ./scripts/amazon_product_search_api.py "wireless earbuds" "Sony" 50 "en" 参数配置灵活:支持 8 种语言区域(en/de/fr/it/es/ja/zh-CN/zh-TW),可设定最大抓取数量(默认 50 条),并允许按品牌名精准过滤。
显著优点

  1. 抗干扰能力强 :内置机制规避 reCAPTCHA 验证和地理 IP 限制,无需代理池或人工介入
  2. 输出稳定可靠 :基于预设 DOM 解析规则,杜绝 LLM 生成式幻觉,数据字段固定可追溯
  3. 成本效益突出 :相比纯 AI 驱动的浏览器自动化方案,token 消耗显著降低
  4. 字段覆盖全面 :返回 10+ 核心字段,涵盖标题、URL、评分、评论数、预估月销量、现价/原价、配送信息、Best Seller 标识及库存状态
  5. 执行状态可视 :实时输出带时间戳的运行日志,便于监控长时任务进度
    潜在局限
    依赖外部 API :需配置 BROWSERACT_API_KEY ,服务可用性受 BrowserAct 平台稳定性制约
    数据源单一 :仅覆盖亚马逊公开列表页信息,无法获取详情页深度数据(如完整图文描述、QA 问答)
    反爬策略风险 :亚马逊页面结构变更可能导致解析规则失效,需技能维护方及时更新
    速率与配额限制 :未明确披露 API 调用频次上限,大规模并发采集可能触发限流
    地域覆盖有限 :语言选项虽多,但实际抓取结果仍受亚马逊站点库存和配送策略影响
    适合人群
    电商运营与竞品分析师(监控价格、销量、Best Seller 动态)
    市场研究机构(快速构建品类数据集)
    跨境卖家(多站点选品与本地化需求分析)
    产品经理与数据科学家(验证市场假设、训练预测模型)
    常规风险
    授权失效风险 :API Key 过期或配置错误将直接导致任务中断,需人工重新授权
    数据时效性 :抓取结果为某一时刻快照,价格波动和库存变化存在滞后
    合规边界 :需确保采集行为符合亚马逊 robots.txt 及目标站点法律法规,大规模商用建议咨询法务
    隐私披露 :预估销量等字段为平台算法推算值,非官方披露,分析时需注意置信度标注

标签

专业技能

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!