AI驱动的专业播客制作工坊

ai-podcast-creation

收藏 16.5k
下载 3.6k
版本 v0.1.5

基于inference.sh平台整合Kokoro与DIA等先进TTS模型,支持多角色对话与AI音乐生成,零门槛制作专业级播客与有声书内容。

基本信息

  • 技能名称?ai-podcast-creation
  • 中文名称?AI驱动的专业播客制作工坊
  • 作者?okaris
  • 分类?内容创作
  • 版本?v0.1.5
  • 标签?content-media, productivity, audio-generation, automation

使用方法

使用说明
AI Podcast Creation 是一款基于 inference.sh 云平台的文档型播客制作技能,通过 CLI 工具链提供从脚本创作到音频成品的完整工作流。用户可利用该技能调用 Kokoro TTS、DIA TTS 等先进语音合成模型,结合 AI 音乐生成与媒体合并工具,实现单人旁白、双人对谈、有声书章节等多种音频内容形态的自动化生产。
核心用法 方面,该技能采用管道化设计:首先通过 LLM(如 Claude)生成结构化脚本,标记不同说话人角色;随后利用 infsh app run 命令分别调用特定语音模型(如 am_michael 主持音、 af_sarah 嘉宾音)生成独立音轨;最后通过 media-merger 工具进行交叉淡入淡出、背景音乐叠加(建议音量 10-15%)及音轨拼接,输出完整剧集。特别值得一提的是其 NotebookLM 风格功能,可将长文档自动转换为双人讨论式播客脚本,并生成自然对话音频。
显著优点 体现在:一是语音库丰富,涵盖美音/英音男女声及对话式 DIA 模型,支持语速调节与情感表达;二是提供完整的工业级模板,包括访谈格式、独白结构、新闻综述等,并附带脚本写作最佳实践(如自然停顿标点、口语化填充词使用);三是纯文档属性带来的透明性,所有操作均为可审计的 CLI 命令示例,无黑盒代码。
潜在局限 包括:严重依赖 inference.sh 第三方云服务,需持续网络连接且产生平台计费;作为 T3 级个人来源项目,缺乏企业级维护背书;文档未明确说明中文语音支持情况,主要示例针对英文内容;长文本生成可能受限于云端 API 的速率与字数限制。
适合群体 主要为独立播客创作者、内容营销人员、教育工作者(制作课程音频)、有声书自出版作者,以及寻求 NotebookLM 替代方案需将文档转为音频的用户。不适用于对数据主权要求极高的涉密场景或需离线工作的环境。
使用风险 需关注:执行 infsh 命令需授予 Bash 权限,应确保 CLI 安装源(https://cli.inference.sh)可信;用户脚本与生成内容将上传至远程服务器处理,需仔细阅读 inference.sh 隐私政策;长时间音频生成可能产生意外费用,建议预先了解平台计费规则;网络中断可能导致制作流程中断且难以断点续传。

标签

内容创作

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!