一键摘要网页、文件与视频

Summarize 1.0.0

收藏 25k
下载 6k
版本 1.0.0

Fast CLI tool to summarize web pages, PDFs, images, audio, and YouTube videos using multiple LLM providers. Supports customizable output length, JSON output, and fallback extraction for blocked sites.

基本信息

  • 技能名称?Summarize 1.0.0
  • 中文名称?一键摘要网页、文件与视频
  • 作者?garrisongg
  • 分类?专业技能
  • 版本?1.0.0
  • 标签?cli, summarization, llm, pdf, youtube, automation, productivity

使用方法

使用说明
核心用法
summarize 是一个命令行工具,专为快速生成内容摘要而设计。支持输入 URL、本地文件(PDF/图片/音频)以及 YouTube 链接,通过调用 OpenAI、Anthropic、xAI 或 Google 的大模型 API 生成摘要。
安装方式 :
brew install steipete/tap/summarize 基础命令 :

网页摘要

summarize "https://example.com" --model google/gemini-3-flash-preview

本地文件

summarize "/path/to/file.pdf"

YouTube 视频

summarize "https://youtu.be/xxx" --youtube auto 核心参数 :
--length short|medium|long|xl|xxl| :控制摘要长度
--extract-only :仅提取正文,不生成摘要
--json :机器可读格式输出
--firecrawl auto|off|always :处理被屏蔽网站
--max-output-tokens :限制输出 token 数
支持通过环境变量配置 API 密钥( OPENAI_API_KEY 、 ANTHROPIC_API_KEY 、 XAI_API_KEY 、 GEMINI_API_KEY ),以及可选的 ~/.summarize/config.json 配置文件。
显著优点

  1. 多模态支持 :覆盖网页、PDF、图片、音频、YouTube 五种内容形态
  2. 多模型兼容 :支持主流 LLM 提供商,默认使用 Google Gemini Flash(免费/低成本)
  3. 灵活的输出控制 :五级预设长度 + 自定义字符数,满足从速读到深度分析的需求
  4. 鲁棒的提取能力 :集成 Firecrawl 作为回退方案,解决反爬机制导致的提取失败
  5. 开发者友好 :JSON 输出模式便于集成到自动化工作流
    潜在缺点与局限性
  6. 依赖外部 API :需自行申请并管理多个 LLM 服务的 API 密钥,存在密钥泄露风险
  7. YouTube 限制 :视频摘要依赖 yt-dlp 或 Apify 回退,部分版权内容可能无法提取
  8. 无本地模型支持 :必须联网调用云端模型,无法离线使用
  9. 长文档分段 :超长文档的分段策略未明确说明,可能导致上下文断裂
  10. 成本累积 :高频使用时,多模型调用可能产生不可忽略的 API 费用
    适合人群
    研究人员和信息工作者:需要批量处理论文、报告、网页资料
    内容创作者:快速理解参考素材,提取 YouTube 视频要点
    开发者:通过 JSON 输出构建自动化摘要管道
    命令行爱好者:偏好 CLI 工具而非 Web 界面的效率用户
    常规风险
    API 密钥安全 :密钥以环境变量存储,需避免泄露到 shell 历史或日志
    隐私合规 :敏感文档需通过第三方 API 处理,存在数据外泄风险
    提取服务依赖 :Firecrawl/Apify 的可用性影响功能完整性
    摘要幻觉 :LLM 生成的摘要可能存在事实偏差,关键信息需人工核实
    服务条款限制 :部分网站和 YouTube 内容可能违反平台 TOS

标签

专业技能

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!