ElevenLabs Audio Generation
Skill AktivGenerieren Sie KI-Voiceovers, Soundeffekte und Musik mit ElevenLabs-APIs. Verwenden Sie dies bei der Erstellung von Audioinhalten für Videos, Podcasts oder Spiele. Trigger umfassen die Generierung von Voiceovers, Erzählungen, Dialogen, Soundeffekten aus Beschreibungen, Hintergrundmusik, Musikgenerierung, Stimmenklonung oder jede Aufgabe zur Audiosynthese.
Benutzer in die Lage versetzen, professionelle Audioinhalte für Videos, Podcasts und Spiele mithilfe von KI zu erstellen und den Prozess vom Skript bis zum finalen Rendering zu optimieren.
Funktionen
- KI-Voiceovers aus Text generieren
- Stimmenklonung für benutzerdefinierte Stimmen durchführen
- Soundeffekte und Musik erstellen
- Audio-Generierung in Remotion-Videoprojekte integrieren
- ElevenLabs API mit detaillierten Beispielen nutzen
Anwendungsfälle
- Erzählungen für Erklärvideos erstellen
- Dialoge für Spielfiguren generieren
- Hintergrundmusik für Podcasts produzieren
- Soundeffekte zu Videoprojekten hinzufügen
Nicht-Ziele
- Komplexe Videobearbeitung über Audiointegration hinaus
- Direkte Steuerung der Verwaltung von Cloud-GPU-Instanzen (wird von anderen Fähigkeiten gehandhabt)
- Bereitstellung einer Alternative zur ElevenLabs-Plattform selbst
Workflow
- Skript oder Beschreibung lesen
- ElevenLabs API für Audiogenerierung aufrufen
- Generierte Audiodatei speichern
- Audio in Videoprojekt integrieren (z.B. Remotion)
Praktiken
- API-Integration
- Audiosynthese
- Videoproduktions-Workflow
Voraussetzungen
- ELEVENLABS_API_KEY Umgebungsvariable
- Python 3.9+ empfohlen
- Node.js 18+ für Remotion-Integration
Sicherheit
- warning:GeheimnisverwaltungDie Fähigkeit erfordert eine Umgebungsvariable `ELEVENLABS_API_KEY`, aber die Dokumentation (`.claude/skills/elevenlabs/SKILL.md`) beschreibt nicht explizit, wie dieses Geheimnis sicher verwaltet oder rotiert werden sollte, was ein potenzielles Risiko darstellt, wenn es nicht richtig gehandhabt wird.
Installation
npx skills add digitalsamba/claude-code-video-toolkitFührt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.
Qualitätspunktzahl
Vertrauenssignale
Ähnliche Erweiterungen
Elevenlabs Tts
99ElevenLabs text-to-speech with 22+ premium voices, multilingual support, and voice tuning via inference.sh CLI. Models: eleven_multilingual_v2 (highest quality), eleven_turbo_v2_5 (low latency), eleven_flash_v2_5 (ultra-fast). Capabilities: text-to-speech, voice selection, stability/style control, 32 languages. Use for: voiceovers, audiobooks, video narration, podcasts, accessibility, IVR. Triggers: elevenlabs, eleven labs, elevenlabs tts, premium tts, professional voice, ai voice, high quality tts, multilingual tts, eleven labs voice, voice generation, natural speech, realistic voice, voice over, speech synthesis
Google Tts
100Convert documents and text to audio using Google Cloud Text-to-Speech. Use this skill when the user wants to: narrate a document, read aloud text, generate audio from a file, convert text to speech, create a recording of documentation or analysis, create a podcast from a document, or use Google TTS/text-to-speech. Trigger phrases: "read this aloud", "narrate this", "create a recording", "text to speech", "TTS", "convert to audio", "audio from document", "listen to this", "generate audio", "google tts", "create a podcast".
Speech Generation Skill
100Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.
Sherpa Onnx Tts
99Local text-to-speech via sherpa-onnx (offline, no cloud)
Audio Editing Fundamentals
99Master the essential audio post-production techniques—normalization, compression, EQ, and noise reduction—using the correct processing order to achieve professional-quality audio. Use when: Editing podcast episodes or video soundtracks; Cleaning up recorded voiceovers; Improving audio quality for marketing content; Preparing audio files for distribution; Troubleshooting common audio issues
Ffmpeg
99Videobearbeitung und -verarbeitung mit FFmpeg. Verwenden Sie es für Formatkonvertierung, Größenänderung, Komprimierung, Audioextraktion und die Vorbereitung von Assets für Remotion. Trigger umfassen die Konvertierung von GIF in MP4, die Größenänderung von Videos, die Extraktion von Audio, die Komprimierung von Dateien oder jede Medien transformations aufgabe.