Fast CLI tool to summarize web pages, PDFs, images, audio, and YouTube videos using multiple LLM providers. Supports customizable output length, JSON output, and fallback extraction for blocked sites.
基本信息
- 技能名称?Summarize 1.0.0
- 中文名称?一键摘要网页、文件与视频
- 作者?garrisongg
- 分类?专业技能
- 版本?1.0.0
- 标签?cli, summarization, llm, pdf, youtube, automation, productivity
使用方法
使用说明
核心用法
summarize 是一个命令行工具,专为快速生成内容摘要而设计。支持输入 URL、本地文件(PDF/图片/音频)以及 YouTube 链接,通过调用 OpenAI、Anthropic、xAI 或 Google 的大模型 API 生成摘要。
安装方式 :
brew install steipete/tap/summarize 基础命令 :
网页摘要
summarize "https://example.com" --model google/gemini-3-flash-preview
本地文件
summarize "/path/to/file.pdf"
YouTube 视频
summarize "https://youtu.be/xxx" --youtube auto 核心参数 :
--length short|medium|long|xl|xxl| :控制摘要长度
--extract-only :仅提取正文,不生成摘要
--json :机器可读格式输出
--firecrawl auto|off|always :处理被屏蔽网站
--max-output-tokens :限制输出 token 数
支持通过环境变量配置 API 密钥( OPENAI_API_KEY 、 ANTHROPIC_API_KEY 、 XAI_API_KEY 、 GEMINI_API_KEY ),以及可选的 ~/.summarize/config.json 配置文件。
显著优点
- 多模态支持 :覆盖网页、PDF、图片、音频、YouTube 五种内容形态
- 多模型兼容 :支持主流 LLM 提供商,默认使用 Google Gemini Flash(免费/低成本)
- 灵活的输出控制 :五级预设长度 + 自定义字符数,满足从速读到深度分析的需求
- 鲁棒的提取能力 :集成 Firecrawl 作为回退方案,解决反爬机制导致的提取失败
- 开发者友好 :JSON 输出模式便于集成到自动化工作流
潜在缺点与局限性 - 依赖外部 API :需自行申请并管理多个 LLM 服务的 API 密钥,存在密钥泄露风险
- YouTube 限制 :视频摘要依赖 yt-dlp 或 Apify 回退,部分版权内容可能无法提取
- 无本地模型支持 :必须联网调用云端模型,无法离线使用
- 长文档分段 :超长文档的分段策略未明确说明,可能导致上下文断裂
- 成本累积 :高频使用时,多模型调用可能产生不可忽略的 API 费用
适合人群
研究人员和信息工作者:需要批量处理论文、报告、网页资料
内容创作者:快速理解参考素材,提取 YouTube 视频要点
开发者:通过 JSON 输出构建自动化摘要管道
命令行爱好者:偏好 CLI 工具而非 Web 界面的效率用户
常规风险
API 密钥安全 :密钥以环境变量存储,需避免泄露到 shell 历史或日志
隐私合规 :敏感文档需通过第三方 API 处理,存在数据外泄风险
提取服务依赖 :Firecrawl/Apify 的可用性影响功能完整性
摘要幻觉 :LLM 生成的摘要可能存在事实偏差,关键信息需人工核实
服务条款限制 :部分网站和 YouTube 内容可能违反平台 TOS
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!