Zum Hauptinhalt springen

VideoAgent Audio Studio

Skill Verifiziert Aktiv

Müde vom Jonglieren mit mehreren Audio-APIs? Diese Skill bietet Ihnen einen Ein-Befehl-Zugriff auf TTS, Musikgenerierung, Soundeffekte und Stimmklonen. Verwenden Sie sie, wenn Sie beliebige Audiodaten generieren möchten, ohne mehrere API-Schlüssel verwalten zu müssen.

Zweck

Bereitstellung einer Ein-Befehl-Lösung zur Generierung jeglicher Art von Audioinhalten, die die Komplexität der Verwaltung mehrerer Audio-APIs und Anmeldeinformationen abstrahiert.

Funktionen

  • Einheitlicher Zugriff auf TTS, Musik, SFX und Stimmklonen
  • Intelligente Weiterleitung an die am besten geeigneten KI-Modelle
  • Vereinfachte Verwaltung von API-Schlüsseln
  • Unterstützung für mehrere Anbieter von Audio-Generierung

Anwendungsfälle

  • Generieren von Sprache oder Voice-Overs aus Text
  • Komponieren von Hintergrundmusik für Podcasts oder Videos
  • Erstellen spezifischer Soundeffekte nach Bedarf
  • Klonen einer Stimme aus einem Audiobeispiel

Nicht-Ziele

  • Verwaltung individueller Audio-API-Anmeldeinformationen
  • Komplexe Audiobearbeitung oder -mischung
  • Echtzeit-Audiostreaming über die generierte Ausgabe hinaus

Workflow

  1. Starten des AudioMind-Servers.
  2. Analysieren der Benutzeranfrage nach der Art der Audio-Generierung.
  3. Weiterleiten der Anfrage an das entsprechende MCP-Tool und Modell.
  4. Generieren von Audio und Zurückgeben einer URL.
  5. Benutzer überprüft oder verwendet das generierte Audio.

Praktiken

  • Audio-Generierung
  • API-Integration
  • Prompt-Engineering

Voraussetzungen

  • Umgebungsvariable ELEVENLABS_API_KEY
  • Umgebungsvariable FAL_KEY (optional für Musik/SFX)

Installation

npx skills add pexoai/pexo-skills

Führt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.

Qualitätspunktzahl

Verifiziert
98 /100
Analysiert about 21 hours ago

Vertrauenssignale

Letzter Commitabout 1 month ago
Sterne851
LizenzMIT
Status
Quellcode ansehen

Ähnliche Erweiterungen

Elevenlabs Tts

99

ElevenLabs text-to-speech with 22+ premium voices, multilingual support, and voice tuning via inference.sh CLI. Models: eleven_multilingual_v2 (highest quality), eleven_turbo_v2_5 (low latency), eleven_flash_v2_5 (ultra-fast). Capabilities: text-to-speech, voice selection, stability/style control, 32 languages. Use for: voiceovers, audiobooks, video narration, podcasts, accessibility, IVR. Triggers: elevenlabs, eleven labs, elevenlabs tts, premium tts, professional voice, ai voice, high quality tts, multilingual tts, eleven labs voice, voice generation, natural speech, realistic voice, voice over, speech synthesis

Skill
inferen-sh

Google Tts

100

Convert documents and text to audio using Google Cloud Text-to-Speech. Use this skill when the user wants to: narrate a document, read aloud text, generate audio from a file, convert text to speech, create a recording of documentation or analysis, create a podcast from a document, or use Google TTS/text-to-speech. Trigger phrases: "read this aloud", "narrate this", "create a recording", "text to speech", "TTS", "convert to audio", "audio from document", "listen to this", "generate audio", "google tts", "create a podcast".

Skill
sanjay3290

Speech Generation Skill

100

Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.

Skill
openai

Validate Album

100

Validates album directory structure, file locations, and content integrity. Use before release or whenever the user wants to check an album's structural health.

Skill
bitwize-music-studio

Sherpa Onnx Tts

99

Local text-to-speech via sherpa-onnx (offline, no cloud)

Skill
steipete

Sheet Music Publisher

99

Converts mastered audio to sheet music and creates printable songbooks. Use after mastering when the user wants sheet music or a songbook for their album.

Skill
bitwize-music-studio