人刷机记的中文策展助手

x-manual-surf-notes

收藏 4k
下载 1.1k
版本 v1.0.0

基于 Chrome Extension Relay 的手动浏览器操控方案,将 X For You 流推文中文转述、去重并追加至本地笔记,适合人工策展式信息收集。

基本信息

  • 技能名称?x-manual-surf-notes
  • 中文名称?人刷机记的中文策展助手
  • 作者?kaima2022
  • 分类?效率
  • 版本?v1.0.0
  • 标签?content-media, productivity, automation, docs, education-research

使用方法

使用说明
核心用法
x-manual-surf-notes 是一套 人工驱动的浏览器自动化工作流 ,通过 Chrome Extension Relay 操控本地 Chrome 浏览器,在 X(Twitter)首页 For You 推荐流中模拟真人浏览行为:下滑加载内容、逐条点击进入帖子详情页、抓取作者与时间信息、将英文推文转述为中文摘要,最终按固定格式追加到本地 Markdown 笔记文档。整个流程强调"手动感"——用户需预先在目标标签页激活扩展、保持登录状态,Agent 则负责执行重复性的滚动、点击、提取与格式化工作。
工作流采用 低 Token 设计 ,默认测试批次 5 条,正式运行建议每批 50-80 条。核心步骤包括:聚焦 x.com/home 标签页、滚动 1-3 次加载内容、从视窗抽取 status 链接并归一化 URL、逐条导航至详情页抓取信息(含展开"Show more")、生成中文转述(保留关键信息而非硬翻)、基于 URL 唯一键去重、追加写入指定路径的笔记文件。输出格式固定为"时间|内容|链接|评论"四栏结构,评论强制单句三选一(值得跟/待核验/噪音),以控制上下文长度。
显著优点
合规性与可持续性 是最大亮点。相比 API 爬取可能触发的平台风控,纯浏览器模拟+人工前置确认的模式显著降低账号封禁风险,适合长期跟踪信息源。 去重机制严谨 ,以 status ID 为唯一键,跨批次持久去重,同一事件的多人转发会被标记为"二手",避免信息冗余。 中文转述策略实用 ,不追求逐字翻译而是提取核心信息,保留产品名、数字、链接等关键要素,输出可直接用于后续阅读或分享。 输出结构化 ,固定格式的 Markdown 区块便于后续用脚本二次处理或导入知识库工具。
潜在缺点与局限性
效率天花板明显 。逐条点击详情页、等待加载、返回的流程无法与批量 API 请求相比,单批次 50-80 条已是较优平衡点,大规模数据采集不现实。 环境依赖苛刻 ,必须同时满足:Chrome 浏览器、已安装 OpenClaw 官方扩展、扩展徽标 ON、用户已登录 X,任一条件缺失即无法运行。 上下文脆弱性 ,X 页面频繁导航可能导致 evaluate 上下文丢失,需依赖 navigate + wait 的保守策略,增加单条处理耗时。 内容完整性受限 ,仅抓取主帖+明显的第一条自回复,thread 长帖会丢失后续内容;图片、视频等多媒体仅保留链接,无法本地存档。 固定路径风险 ,默认输出路径写死为 /home/makai/... ,跨平台或权限不足时可能写入失败。
适合的目标群体
AI/产品前沿跟踪者 :需要每日浏览 X For You 获取一手产品发布、论文开源、工具更新信号,但希望减少手动复制粘贴的重复劳动
信息策展人 :追求"人刷+机记"的混合模式,对内容有质量判断需求(通过强制评论环节),而非全自动化抓取
合规敏感型用户 :担心 API 爬取导致账号风险,愿意牺牲效率换取可持续性
中文内容创作者 :需要将英文推文快速转述为中文素材,用于 Newsletter、博客或内部知识库
使用风险
性能层面 :单批次处理时间与网络状况、X 页面加载速度强相关,高峰期可能出现超时或元素定位失败。 依赖项风险 :Chrome Extension Relay 为 OpenClaw 官方组件但需独立安装,版本不匹配可能导致控制失效。 数据持久化 :去重状态依赖本地笔记文件的历史内容,若文件被手动修改或迁移,去重逻辑可能失效。 平台变化风险 :X 前端结构频繁调整,DOM 查询选择器可能突然失效,需关注 skill 维护更新。 隐私注意 :虽无数据上传远程服务器,但操作过程需保持 X 登录态,建议在个人设备而非共享环境使用。

标签

效率

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!