离线语音合成，零成本播报

Voice Reply

下载 0

版本 1.0.0

完全离线本地TTS，基于Piper语音合成，零API成本，支持德英双语，自动生成Telegram语音消息

基本信息

技能名称?Voice Reply
中文名称?离线语音合成，零成本播报
作者?stolot0mt0m
分类?其他
版本?1.0.0
标签?text-to-speech, offline-tts, piper, sherpa-onnx, telegram-voice, privacy-focused, multilingual, linux-only

使用方法

使用说明
核心用法
voice-reply 是一个基于 sherpa-onnx 和 Piper 的本地文本转语音工具，专为需要语音回复的场景设计。用户只需提供文本内容，系统即可自动生成 Telegram 兼容的语音消息（OGG Opus格式），并以气泡形式展示。
调用方式： {baseDir}/bin/voice-reply "文本内容" [语言代码]
支持德语（de/thorsten）和英语（en/ryan）
具备自动语言检测功能，可通过字符特征识别德语
输出格式包含 [[audio_as_voice]] 标签，确保Telegram正确渲染为语音气泡
显著优点

完全离线：无需网络连接，不依赖任何云服务，隐私性极强
零成本：无需注册账号，无API调用费用，永久免费使用
开箱即用：安装脚本自动化程度高，环境变量配置清晰
多语言支持：德语采用 thorsten 自然男声，英语采用 ryan 专业美音
平台适配：专为 Telegram 优化，语音消息体验原生
潜在缺点与局限性
Linux独占：仅支持 Linux 系统，Windows/macOS 用户无法直接使用
环境依赖重：需手动安装 sherpa-onnx 运行时、下载语音模型（约数百MB）、配置 ffmpeg 及两个环境变量
语音选择有限：当前仅内置德/英两种男声，缺乏女声及更多语种
无实时流式合成：采用离线批处理模式，长文本响应存在延迟
语言检测简单：基于字符启发式规则，复杂混合文本可能误判
适合人群
注重隐私、拒绝云TTS服务的用户
德语/英语内容创作者、语言学习者
Telegram 机器人开发者，需低成本语音交互方案
需要在离线环境（内网、边缘设备）运行的场景
常规风险
模型文件管理：语音模型体积较大，需确保磁盘空间及下载源可靠性
环境变量持久化：服务重启后若变量丢失将导致功能失效
音频格式兼容：虽标注Telegram兼容，但极端情况下仍需验证 opus 编码参数
许可合规：Piper 模型采用 CC-BY/开源许可，商用需确认具体声源授权条款

离线语音合成，零成本播报

基本信息

使用方法

标签

💬 评论 (0)

发表评论