跳转到主要内容

ElevenLabs 音频生成

技能 活跃

使用 ElevenLabs API 生成 AI 配音、音效和音乐。用于创建视频、播客或游戏的音频内容。触发器包括生成配音、旁白、对话、根据描述生成音效、背景音乐、配乐生成、语音克隆或任何音频合成任务。

目的

通过 AI 赋能用户为视频、播客和游戏创建专业级音频内容,从而简化从脚本到最终渲染的过程。

功能

  • 从文本生成 AI 配音
  • 执行语音克隆以创建自定义语音
  • 创建音效和音乐
  • 将音频生成集成到 Remotion 视频项目中
  • 使用详细示例利用 ElevenLabs API

使用场景

  • 为解说视频创建旁白
  • 为游戏角色生成对话
  • 为播客制作背景音乐
  • 为视频项目添加音效

非目标

  • 复杂的视频编辑(超出音频集成范围)
  • 直接控制云 GPU 实例管理(由其他技能处理)
  • 提供 ElevenLabs 平台本身的替代方案

工作流

  1. 阅读脚本或描述
  2. 调用 ElevenLabs API 进行音频生成
  3. 保存生成的音频文件
  4. 将音频集成到视频项目(例如,Remotion)

实践

  • API 集成
  • 音频合成
  • 视频制作工作流程

先决条件

  • ELEVENLABS_API_KEY 环境变量
  • 建议使用 Python 3.9+
  • 用于 Remotion 集成的 Node.js 18+

Security

  • warning:Secret Management该技能需要 `ELEVENLABS_API_KEY` 环境变量,但文档(`.claude/skills/elevenlabs/SKILL.md`)没有明确说明如何安全地管理或轮换此密钥,如果处理不当,可能会带来风险。

安装

npx skills add digitalsamba/claude-code-video-toolkit

通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。

质量评分

95 /100
13 days ago 分析

信任信号

最近提交15 days ago
星标1.1k
许可证MIT
状态
查看源代码

类似扩展

Elevenlabs Tts

99

ElevenLabs text-to-speech with 22+ premium voices, multilingual support, and voice tuning via inference.sh CLI. Models: eleven_multilingual_v2 (highest quality), eleven_turbo_v2_5 (low latency), eleven_flash_v2_5 (ultra-fast). Capabilities: text-to-speech, voice selection, stability/style control, 32 languages. Use for: voiceovers, audiobooks, video narration, podcasts, accessibility, IVR. Triggers: elevenlabs, eleven labs, elevenlabs tts, premium tts, professional voice, ai voice, high quality tts, multilingual tts, eleven labs voice, voice generation, natural speech, realistic voice, voice over, speech synthesis

技能
inferen-sh

Google Tts

100

Convert documents and text to audio using Google Cloud Text-to-Speech. Use this skill when the user wants to: narrate a document, read aloud text, generate audio from a file, convert text to speech, create a recording of documentation or analysis, create a podcast from a document, or use Google TTS/text-to-speech. Trigger phrases: "read this aloud", "narrate this", "create a recording", "text to speech", "TTS", "convert to audio", "audio from document", "listen to this", "generate audio", "google tts", "create a podcast".

技能
sanjay3290

Speech Generation Skill

100

Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.

技能
openai

Sherpa Onnx Tts

99

Local text-to-speech via sherpa-onnx (offline, no cloud)

技能
steipete

Audio Editing Fundamentals

99

Master the essential audio post-production techniques—normalization, compression, EQ, and noise reduction—using the correct processing order to achieve professional-quality audio. Use when: Editing podcast episodes or video soundtracks; Cleaning up recorded voiceovers; Improving audio quality for marketing content; Preparing audio files for distribution; Troubleshooting common audio issues

技能
guia-matthieu

Ffmpeg

99

使用 FFmpeg 进行视频和音频处理。用于格式转换、调整大小、压缩、音频提取以及为 Remotion 准备素材。触发器包括将 GIF 转换为 MP4、调整视频大小、提取音频、压缩文件或任何媒体转换任务。

技能
digitalsamba