Zum Hauptinhalt springen

ElevenLabs Audio Generation

Skill Aktiv

Generieren Sie KI-Voiceovers, Soundeffekte und Musik mit ElevenLabs-APIs. Verwenden Sie dies bei der Erstellung von Audioinhalten für Videos, Podcasts oder Spiele. Trigger umfassen die Generierung von Voiceovers, Erzählungen, Dialogen, Soundeffekten aus Beschreibungen, Hintergrundmusik, Musikgenerierung, Stimmenklonung oder jede Aufgabe zur Audiosynthese.

Zweck

Benutzer in die Lage versetzen, professionelle Audioinhalte für Videos, Podcasts und Spiele mithilfe von KI zu erstellen und den Prozess vom Skript bis zum finalen Rendering zu optimieren.

Funktionen

  • KI-Voiceovers aus Text generieren
  • Stimmenklonung für benutzerdefinierte Stimmen durchführen
  • Soundeffekte und Musik erstellen
  • Audio-Generierung in Remotion-Videoprojekte integrieren
  • ElevenLabs API mit detaillierten Beispielen nutzen

Anwendungsfälle

  • Erzählungen für Erklärvideos erstellen
  • Dialoge für Spielfiguren generieren
  • Hintergrundmusik für Podcasts produzieren
  • Soundeffekte zu Videoprojekten hinzufügen

Nicht-Ziele

  • Komplexe Videobearbeitung über Audiointegration hinaus
  • Direkte Steuerung der Verwaltung von Cloud-GPU-Instanzen (wird von anderen Fähigkeiten gehandhabt)
  • Bereitstellung einer Alternative zur ElevenLabs-Plattform selbst

Workflow

  1. Skript oder Beschreibung lesen
  2. ElevenLabs API für Audiogenerierung aufrufen
  3. Generierte Audiodatei speichern
  4. Audio in Videoprojekt integrieren (z.B. Remotion)

Praktiken

  • API-Integration
  • Audiosynthese
  • Videoproduktions-Workflow

Voraussetzungen

  • ELEVENLABS_API_KEY Umgebungsvariable
  • Python 3.9+ empfohlen
  • Node.js 18+ für Remotion-Integration

Sicherheit

  • warning:GeheimnisverwaltungDie Fähigkeit erfordert eine Umgebungsvariable `ELEVENLABS_API_KEY`, aber die Dokumentation (`.claude/skills/elevenlabs/SKILL.md`) beschreibt nicht explizit, wie dieses Geheimnis sicher verwaltet oder rotiert werden sollte, was ein potenzielles Risiko darstellt, wenn es nicht richtig gehandhabt wird.

Installation

npx skills add digitalsamba/claude-code-video-toolkit

Führt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.

Qualitätspunktzahl

95 /100
Analysiert 3 days ago

Vertrauenssignale

Letzter Commit5 days ago
Sterne1.1k
LizenzMIT
Status
Quellcode ansehen

Ähnliche Erweiterungen

Elevenlabs Tts

99

ElevenLabs text-to-speech with 22+ premium voices, multilingual support, and voice tuning via inference.sh CLI. Models: eleven_multilingual_v2 (highest quality), eleven_turbo_v2_5 (low latency), eleven_flash_v2_5 (ultra-fast). Capabilities: text-to-speech, voice selection, stability/style control, 32 languages. Use for: voiceovers, audiobooks, video narration, podcasts, accessibility, IVR. Triggers: elevenlabs, eleven labs, elevenlabs tts, premium tts, professional voice, ai voice, high quality tts, multilingual tts, eleven labs voice, voice generation, natural speech, realistic voice, voice over, speech synthesis

Skill
inferen-sh

Google Tts

100

Convert documents and text to audio using Google Cloud Text-to-Speech. Use this skill when the user wants to: narrate a document, read aloud text, generate audio from a file, convert text to speech, create a recording of documentation or analysis, create a podcast from a document, or use Google TTS/text-to-speech. Trigger phrases: "read this aloud", "narrate this", "create a recording", "text to speech", "TTS", "convert to audio", "audio from document", "listen to this", "generate audio", "google tts", "create a podcast".

Skill
sanjay3290

Speech Generation Skill

100

Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.

Skill
openai

Sherpa Onnx Tts

99

Local text-to-speech via sherpa-onnx (offline, no cloud)

Skill
steipete

Audio Editing Fundamentals

99

Master the essential audio post-production techniques—normalization, compression, EQ, and noise reduction—using the correct processing order to achieve professional-quality audio. Use when: Editing podcast episodes or video soundtracks; Cleaning up recorded voiceovers; Improving audio quality for marketing content; Preparing audio files for distribution; Troubleshooting common audio issues

Skill
guia-matthieu

Ffmpeg

99

Videobearbeitung und -verarbeitung mit FFmpeg. Verwenden Sie es für Formatkonvertierung, Größenänderung, Komprimierung, Audioextraktion und die Vorbereitung von Assets für Remotion. Trigger umfassen die Konvertierung von GIF in MP4, die Größenänderung von Videos, die Extraktion von Audio, die Komprimierung von Dateien oder jede Medien transformations aufgabe.

Skill
digitalsamba