全网内容一键采集，本地永久保存

url-reader

效率

收藏 3.6k

下载 793

版本 v0.1.1

三层技术架构智能抓取微信、小红书等内容，自动本地保存为 Markdown，让个人知识管理更高效安全。

基本信息

技能名称?url-reader
中文名称?全网内容一键采集，本地永久保存
作者?justao
分类?效率
版本?v0.1.1
标签?content-media, productivity, docs, automation

使用方法

使用说明
核心用法
URL Reader 是一款专为中国互联网生态设计的智能网页内容提取工具。用户只需提供任意 URL，系统即可自动识别平台类型（微信公众号、小红书、今日头条、抖音、淘宝、京东等），并智能选择最佳读取策略。通过三层降级架构（Firecrawl API → Jina Reader → Playwright 浏览器自动化），即使面对反爬机制严格的平台也能有效提取核心内容，最终自动保存为 Markdown 格式并下载图片到本地指定目录，无需手动复制粘贴即可构建个人知识库。
显著优点
该 Skill 的最大优势在于其智能降级策略，当首选的 Firecrawl API 遇到限制时，自动切换到免费的 Jina Reader，最后使用 Playwright 作为兜底方案，确保高成功率。针对中国主流平台的深度适配是其另一亮点，特别是对微信公众号这类反爬严格的平台提供了登录态保持支持。此外，自动本地保存功能极大提升了工作效率，所有内容和图片按日期和标题自动归档，直接输出干净的 Markdown 格式，便于后续编辑和知识管理。
潜在缺点与局限性
首先，Firecrawl 的免费额度有限（500页/月），高频使用需付费或依赖降级策略。其次，部分平台（如微信公众号、淘宝）需要配置登录态，首次设置较为复杂，且登录状态可能过期需要重新配置。另外，该 Skill 依赖第三方服务的可用性，若 Firecrawl 或 Jina 服务中断，仅剩下 Playwright 兜底，性能会显著下降。最后，大规模商业爬取可能违反各平台的 Terms of Service，不适合企业级高频数据采集场景。
适合的目标群体
本 Skill 非常适合个人知识管理者、内容创作者、学术研究人员以及需要批量保存网页资料的用户。对于经常需要收藏微信公众号文章、小红书笔记、知乎回答等内容，并希望离线保存、防止链接失效的用户尤为实用。同时，适合对 Markdown 格式有偏好，希望将网络内容整合到 Obsidian、Notion 等知识库工具中的效率工具使用者。
使用风险