一键剪藏网页到 Notion

notion-clipper-skill

收藏 0
下载 0
版本 1.0.0

基于 Chrome CDP 的网页剪藏工具,可将任意网页完整渲染后转换为 Notion 结构化内容,解决知识管理中的信息归档痛点。

基本信息

  • 技能名称?notion-clipper-skill
  • 中文名称?一键剪藏网页到 Notion
  • 作者?EwingYangs
  • 分类?其他
  • 版本?未标注
  • 标签?productivity, content-media, docs, automation, api

使用方法

使用说明
核心用法
Notion Clipper 是一款命令行网页剪藏工具,通过 Chrome DevTools Protocol (CDP) 启动本地浏览器,完整渲染目标网页(包括 JavaScript 动态内容),提取正文后转换为 Notion Block 格式,最终保存至用户指定的 Notion 数据库或页面。支持两种主要工作模式:自动模式(网络空闲即捕获)适用于公开静态页面;等待模式( --wait )允许用户先登录或完成页面交互后再触发捕获,适用于需要身份验证或懒加载内容的场景。
显著优点

  1. 完整渲染能力 :不同于传统爬虫仅获取静态 HTML,CDP 方案能执行页面 JavaScript、触发懒加载,确保剪藏内容与浏览器中看到的完全一致。
  2. 智能内容提取 :内置清理脚本自动移除广告、导航栏等干扰元素,精准提取正文内容。
  3. 灵活的存储目标 :支持按名称搜索数据库、直接指定数据库 ID、或追加到现有页面三种方式,适应不同知识管理 workflow。
  4. 鲁棒的网络处理 :实现 6 次指数退避重试机制,针对代理冲突、DNS 污染等常见问题提供明确的故障排除指南。
  5. 零配置依赖管理 :首次运行时自动安装 npm 依赖,降低使用门槛。
    潜在缺点与局限性
  6. 本地环境依赖 :必须安装 Chrome/Chromium 和 Node.js,对纯云端环境不友好。
  7. 网络环境敏感 :代理配置不当会导致 ECONNREFUSED 或空响应错误,需要用户理解并调整网络设置。
  8. 链接丢失问题 :为避免 Notion API 校验失败,脚本默认移除所有 Markdown 链接,仅保留纯文本内容,可能损失部分信息价值。
  9. Notion 结构限制 :复杂网页的排版(如多栏布局、特殊交互组件)在转换为 Notion Block 后可能丢失格式。
  10. T3 来源可信度 :作为个人开发者项目,长期维护稳定性和安全更新频率存在不确定性。
    适合的目标群体
    知识管理重度用户 :使用 Notion 作为第二大脑,需要系统化归档网络文章、教程、参考资料。
    研究人员与内容策展人 :需要保存可能失效的网页原文,建立个人可检索的资料库。
    自动化工作流构建者 :希望将网页剪藏集成到更大的自动化 pipeline 中(配合 cron、IFTTT 等)。
    跨平台阅读需求者 :将网页内容转入 Notion 后利用其移动端、离线访问能力进行后续阅读。
    使用风险
  11. 性能开销 :每次剪藏需启动 Chrome 进程,内存占用较高(约 100-300MB),频繁操作可能影响系统响应。
  12. API 速率限制 :Notion API 存在请求频率限制,批量剪藏大量页面时可能触发限流。
  13. 内容隐私 :网页内容需经过本地处理后经 HTTPS 发送至 Notion 服务器,敏感信息存在云端暴露风险。
  14. 依赖项漂移 :尽管存在 package-lock.json,但 @tryfabric/martian 等依赖的更新可能引入不兼容变更。
  15. Chrome 版本兼容性 :CDP 协议版本与本地 Chrome 版本不匹配时可能导致连接失败。

标签

其他

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!