ElevenLabs 音频生成

技能活跃

使用 ElevenLabs API 生成 AI 配音、音效和音乐。用于创建视频、播客或游戏的音频内容。触发器包括生成配音、旁白、对话、根据描述生成音效、背景音乐、配乐生成、语音克隆或任何音频合成任务。

目的

通过 AI 赋能用户为视频、播客和游戏创建专业级音频内容，从而简化从脚本到最终渲染的过程。

功能

从文本生成 AI 配音
执行语音克隆以创建自定义语音
创建音效和音乐
将音频生成集成到 Remotion 视频项目中
使用详细示例利用 ElevenLabs API

使用场景

为解说视频创建旁白
为游戏角色生成对话
为播客制作背景音乐
为视频项目添加音效

非目标

复杂的视频编辑（超出音频集成范围）
直接控制云 GPU 实例管理（由其他技能处理）
提供 ElevenLabs 平台本身的替代方案

工作流

阅读脚本或描述
调用 ElevenLabs API 进行音频生成
保存生成的音频文件
将音频集成到视频项目（例如，Remotion）

实践

API 集成
音频合成
视频制作工作流程

先决条件

ELEVENLABS_API_KEY 环境变量
建议使用 Python 3.9+
用于 Remotion 集成的 Node.js 18+

Security

warning:Secret Management该技能需要 `ELEVENLABS_API_KEY` 环境变量，但文档（`.claude/skills/elevenlabs/SKILL.md`）没有明确说明如何安全地管理或轮换此密钥，如果处理不当，可能会带来风险。

安装

npx skills add digitalsamba/claude-code-video-toolkit

通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。

质量评分

95 /100

13 days ago 分析

信任信号

最近提交15 days ago

GitHub 所有者 digitalsamba

星标1.1k

许可证MIT

状态

查看源代码

类似扩展

Elevenlabs Tts

ElevenLabs text-to-speech with 22+ premium voices, multilingual support, and voice tuning via inference.sh CLI. Models: eleven_multilingual_v2 (highest quality), eleven_turbo_v2_5 (low latency), eleven_flash_v2_5 (ultra-fast). Capabilities: text-to-speech, voice selection, stability/style control, 32 languages. Use for: voiceovers, audiobooks, video narration, podcasts, accessibility, IVR. Triggers: elevenlabs, eleven labs, elevenlabs tts, premium tts, professional voice, ai voice, high quality tts, multilingual tts, eleven labs voice, voice generation, natural speech, realistic voice, voice over, speech synthesis

技能

inferen-sh

Google Tts

100

Convert documents and text to audio using Google Cloud Text-to-Speech. Use this skill when the user wants to: narrate a document, read aloud text, generate audio from a file, convert text to speech, create a recording of documentation or analysis, create a podcast from a document, or use Google TTS/text-to-speech. Trigger phrases: "read this aloud", "narrate this", "create a recording", "text to speech", "TTS", "convert to audio", "audio from document", "listen to this", "generate audio", "google tts", "create a podcast".

技能

sanjay3290

Speech Generation Skill

100

Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.

技能

openai

Sherpa Onnx Tts

Local text-to-speech via sherpa-onnx (offline, no cloud)

技能

steipete

Audio Editing Fundamentals

Master the essential audio post-production techniques—normalization, compression, EQ, and noise reduction—using the correct processing order to achieve professional-quality audio. Use when: Editing podcast episodes or video soundtracks; Cleaning up recorded voiceovers; Improving audio quality for marketing content; Preparing audio files for distribution; Troubleshooting common audio issues

技能

guia-matthieu

Ffmpeg

使用 FFmpeg 进行视频和音频处理。用于格式转换、调整大小、压缩、音频提取以及为 Remotion 准备素材。触发器包括将 GIF 转换为 MP4、调整视频大小、提取音频、压缩文件或任何媒体转换任务。

技能

digitalsamba