基于 Microsoft Playwright CLI 的 YouTube 音乐播放自动化工具,支持语音纠错搜索与播放控制,实现可见浏览器环境下的安全音乐播放体验。
基本信息
- 技能名称?my-play-music-from-yt
- 中文名称?可见浏览器驱动的智能音乐播放
- 作者?whodidthese
- 分类?效率
- 版本?v0.0.9
- 标签?content-media, productivity, automation, api
使用方法
使用说明
核心用法
my-play-music-from-yt 是一款通过浏览器自动化实现 YouTube 音乐播放的 Skill。它采用 snapshot → ref → action 的精确交互模式,使用 playwright-cli 控制可见浏览器完成搜索、播放、控制全流程。用户可通过自然语言指令播放特定歌曲、艺术家歌单、流派音乐或情绪歌单,同时支持播放控制(暂停、继续、下一首、跳过广告等)。该 Skill 特别设计了语音转录纠错机制,无需用户确认即可自动处理可能的听写错误。
显著优点
- 交互可靠性高 :摒弃脆弱的 CSS/XPath 选择器,采用基于快照的 ref 定位,大幅降低页面结构变化导致的失效风险
- 透明可控 :默认使用 --headed 可见模式,所有浏览器操作对用户可见,配合 --persistent 持久化配置实现登录状态保留
- 完善的容错机制 :涵盖 session 冻结恢复、广告处理循环(最多4次迭代)、视频不可用回退、页面空白重载等 10 余种边缘场景
- 智能搜索策略 :根据用户意图(特定歌曲/艺术家/流派/年代)自动构建最优查询,优先选择 Mix、长时长歌单等连续播放内容
- 语音纠错能力 :利用 YouTube 内置自动纠错处理 ASR 转录错误,减少交互摩擦
潜在缺点与局限性 - 平台依赖限制 :需安装 playwright-cli 外部依赖,且 MacOS 需手动授权屏幕录制、自动化、辅助功能三项系统权限
- GUI 环境要求 :必须运行在带图形界面的环境,无法部署于无头服务器
- 服务条款风险 :浏览器自动化可能触及 YouTube 服务条款边界,不适合高频批量操作
- 广告处理延迟 :非跳过广告需等待 5 秒轮询,连续广告场景下用户体验存在中断
- 区域内容差异 :YouTube 地区限制可能导致部分搜索结果不可用
适合的目标群体
桌面端用户寻求语音/文本驱动的便捷音乐播放体验
需要跨会话保留 YouTube 登录状态(Premium 免广告等)的个人用户
对浏览器自动化透明度有要求、希望看到操作过程的安全敏感型用户
中文/多语言音乐爱好者(支持原语言搜索优化)
使用风险
性能风险 :浏览器进程占用内存较高,长时后台运行可能影响系统资源
依赖风险 :playwright-cli 版本更新可能引入行为变更,建议锁定版本
数据残留风险 :持久化 profile 存储登录凭证,共享设备需定期执行 delete-data 清理
合规风险 :需自行评估与 YouTube ToS 的兼容性,避免商业或高频自动化场景
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!