一键剪藏网页到 Notion

notion-clipper-skill

下载 0

版本 1.0.0

基于 Chrome CDP 的网页剪藏工具，可将任意网页完整渲染后转换为 Notion 结构化内容，解决知识管理中的信息归档痛点。

基本信息

技能名称?notion-clipper-skill
中文名称?一键剪藏网页到 Notion
作者?EwingYangs
分类?其他
版本?未标注
标签?productivity, content-media, docs, automation, api

使用方法

使用说明
核心用法
Notion Clipper 是一款命令行网页剪藏工具，通过 Chrome DevTools Protocol (CDP) 启动本地浏览器，完整渲染目标网页（包括 JavaScript 动态内容），提取正文后转换为 Notion Block 格式，最终保存至用户指定的 Notion 数据库或页面。支持两种主要工作模式：自动模式（网络空闲即捕获）适用于公开静态页面；等待模式（ --wait ）允许用户先登录或完成页面交互后再触发捕获，适用于需要身份验证或懒加载内容的场景。
显著优点

完整渲染能力：不同于传统爬虫仅获取静态 HTML，CDP 方案能执行页面 JavaScript、触发懒加载，确保剪藏内容与浏览器中看到的完全一致。
智能内容提取：内置清理脚本自动移除广告、导航栏等干扰元素，精准提取正文内容。
灵活的存储目标：支持按名称搜索数据库、直接指定数据库 ID、或追加到现有页面三种方式，适应不同知识管理 workflow。
鲁棒的网络处理：实现 6 次指数退避重试机制，针对代理冲突、DNS 污染等常见问题提供明确的故障排除指南。
零配置依赖管理：首次运行时自动安装 npm 依赖，降低使用门槛。
潜在缺点与局限性
本地环境依赖：必须安装 Chrome/Chromium 和 Node.js，对纯云端环境不友好。
网络环境敏感：代理配置不当会导致 ECONNREFUSED 或空响应错误，需要用户理解并调整网络设置。
链接丢失问题：为避免 Notion API 校验失败，脚本默认移除所有 Markdown 链接，仅保留纯文本内容，可能损失部分信息价值。
Notion 结构限制：复杂网页的排版（如多栏布局、特殊交互组件）在转换为 Notion Block 后可能丢失格式。
T3 来源可信度：作为个人开发者项目，长期维护稳定性和安全更新频率存在不确定性。
适合的目标群体
知识管理重度用户：使用 Notion 作为第二大脑，需要系统化归档网络文章、教程、参考资料。
研究人员与内容策展人：需要保存可能失效的网页原文，建立个人可检索的资料库。
自动化工作流构建者：希望将网页剪藏集成到更大的自动化 pipeline 中（配合 cron、IFTTT 等）。
跨平台阅读需求者：将网页内容转入 Notion 后利用其移动端、离线访问能力进行后续阅读。
使用风险
性能开销：每次剪藏需启动 Chrome 进程，内存占用较高（约 100-300MB），频繁操作可能影响系统响应。
API 速率限制：Notion API 存在请求频率限制，批量剪藏大量页面时可能触发限流。
内容隐私：网页内容需经过本地处理后经 HTTPS 发送至 Notion 服务器，敏感信息存在云端暴露风险。
依赖项漂移：尽管存在 package-lock.json，但 @tryfabric/martian 等依赖的更新可能引入不兼容变更。
Chrome 版本兼容性：CDP 协议版本与本地 Chrome 版本不匹配时可能导致连接失败。

一键剪藏网页到 Notion

基本信息

使用方法

标签

💬 评论 (0)

发表评论