ElevenLabs 音频生成
技能 活跃使用 ElevenLabs API 生成 AI 配音、音效和音乐。用于创建视频、播客或游戏的音频内容。触发器包括生成配音、旁白、对话、根据描述生成音效、背景音乐、配乐生成、语音克隆或任何音频合成任务。
通过 AI 赋能用户为视频、播客和游戏创建专业级音频内容,从而简化从脚本到最终渲染的过程。
功能
- 从文本生成 AI 配音
- 执行语音克隆以创建自定义语音
- 创建音效和音乐
- 将音频生成集成到 Remotion 视频项目中
- 使用详细示例利用 ElevenLabs API
使用场景
- 为解说视频创建旁白
- 为游戏角色生成对话
- 为播客制作背景音乐
- 为视频项目添加音效
非目标
- 复杂的视频编辑(超出音频集成范围)
- 直接控制云 GPU 实例管理(由其他技能处理)
- 提供 ElevenLabs 平台本身的替代方案
工作流
- 阅读脚本或描述
- 调用 ElevenLabs API 进行音频生成
- 保存生成的音频文件
- 将音频集成到视频项目(例如,Remotion)
实践
- API 集成
- 音频合成
- 视频制作工作流程
先决条件
- ELEVENLABS_API_KEY 环境变量
- 建议使用 Python 3.9+
- 用于 Remotion 集成的 Node.js 18+
Security
- warning:Secret Management该技能需要 `ELEVENLABS_API_KEY` 环境变量,但文档(`.claude/skills/elevenlabs/SKILL.md`)没有明确说明如何安全地管理或轮换此密钥,如果处理不当,可能会带来风险。
安装
npx skills add digitalsamba/claude-code-video-toolkit通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。
质量评分
类似扩展
Elevenlabs Tts
99ElevenLabs text-to-speech with 22+ premium voices, multilingual support, and voice tuning via inference.sh CLI. Models: eleven_multilingual_v2 (highest quality), eleven_turbo_v2_5 (low latency), eleven_flash_v2_5 (ultra-fast). Capabilities: text-to-speech, voice selection, stability/style control, 32 languages. Use for: voiceovers, audiobooks, video narration, podcasts, accessibility, IVR. Triggers: elevenlabs, eleven labs, elevenlabs tts, premium tts, professional voice, ai voice, high quality tts, multilingual tts, eleven labs voice, voice generation, natural speech, realistic voice, voice over, speech synthesis
Google Tts
100Convert documents and text to audio using Google Cloud Text-to-Speech. Use this skill when the user wants to: narrate a document, read aloud text, generate audio from a file, convert text to speech, create a recording of documentation or analysis, create a podcast from a document, or use Google TTS/text-to-speech. Trigger phrases: "read this aloud", "narrate this", "create a recording", "text to speech", "TTS", "convert to audio", "audio from document", "listen to this", "generate audio", "google tts", "create a podcast".
Speech Generation Skill
100Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.
Sherpa Onnx Tts
99Local text-to-speech via sherpa-onnx (offline, no cloud)
Audio Editing Fundamentals
99Master the essential audio post-production techniques—normalization, compression, EQ, and noise reduction—using the correct processing order to achieve professional-quality audio. Use when: Editing podcast episodes or video soundtracks; Cleaning up recorded voiceovers; Improving audio quality for marketing content; Preparing audio files for distribution; Troubleshooting common audio issues
Ffmpeg
99使用 FFmpeg 进行视频和音频处理。用于格式转换、调整大小、压缩、音频提取以及为 Remotion 准备素材。触发器包括将 GIF 转换为 MP4、调整视频大小、提取音频、压缩文件或任何媒体转换任务。