将博客内容抓取并编译为 Kindle 友好的 EPUB 电子书,支持 AI 生成封面,支持 Paul Graham、Wait But Why 等知名博客站点。
基本信息
- 技能名称?Blog to Kindle
- 中文名称?博客抓取·EPUB 编译·Kindle 推送
- 作者?ainekomacx
- 分类?专业技能
- 版本?1.0.0
- 标签?ebook, kindle, web-scraping, epub, reading, automation, content-curation
使用方法
使用说明
核心用法
Blog to Kindle 是一套完整的博客内容抓取与 Kindle 电子书生成工具链。用户通过命令行脚本完成四步工作流:首先使用 fetch_blog.py 从支持的站点(如 Paul Graham、Kevin Kelly、Derek Sivers、Wait But Why、Astral Codex Ten 等)或自定义 URL 抓取文章;其次调用 Nano Banana Pro 生成专业风格的书籍封面;然后使用 compile_epub.py 将内容与封面合成为标准 EPUB 格式;最后通过 send_to_kindle.py 经由 AppleScript 调用 Mail.app 发送至 Kindle 邮箱。
显著优点
自动化程度高 :从抓取到送达全流程脚本化,支持增量更新(通过 ~/.clawdbot/state/ 状态文件追踪已发送文章)
知名站点预设 :内置对顶级科技/思想博客的支持,减少配置成本
AI 封面生成 :集成 Nano Banana Pro 生成专业文学风格封面,提升阅读体验
格式兼容性 :输出标准 EPUB,经 Kindle 原生支持,含目录结构
潜在缺点与局限性
平台依赖 :邮件发送功能深度绑定 macOS Mail.app 与 AppleScript,跨平台迁移困难
网络抓取风险 :依赖目标站点的 HTML 结构稳定性,站点改版可能导致解析失败
版权灰色地带 :批量下载受版权保护的文章用于个人阅读,法律边界因司法管辖区而异
单点故障 :工作流中任一步骤失败(如封面生成服务不可用)将阻断完整交付
邮箱白名单限制 :需预先配置 Kindle 认可的发件人地址
适合人群
重度博客读者、离线阅读偏好者、希望将分散的在线文章归档为个人电子图书馆的用户,特别是 macOS 生态的深度使用者。
常规风险
内容合规 :抓取内容可能包含受版权保护材料,用户需自行确保符合当地法律及网站 ToS
服务稳定性 :依赖外部 AI 图像生成服务(Nano Banana Pro)的可用性与计费状态
数据持久化 :状态文件存储于本地路径,跨设备同步需手动处理
邮件安全 :AppleScript 自动化可能触发邮件客户端的安全提示或权限变更
ebook kindle web-scraping epub reading automation content-curation
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!