Tts

Skill Aktiv

Verwenden Sie diese Fähigkeit, wann immer der Benutzer Text in Sprache umwandeln, Audio aus Text generieren oder Voiceovers erstellen möchte. Auslöser sind: jede Erwähnung von 'TTS', 'Text to Speech', 'sprechen', 'sagen', 'Stimme', 'laut vorlesen', 'Audio-Narration', 'Voiceover', 'Synchronisation' oder Anfragen, geschriebene Inhalte in gesprochene Audios umzuwandeln. Verwenden Sie es auch, wenn Sie EPUB/PDF/SRT/Artikel in Audio konvertieren, Stimmen aus Referenz-Audios klonen, Emotionen oder Geschwindigkeit in der Sprache steuern, Sprache an Zeitpläne von Untertiteln anpassen oder sprach-zugeordnete Audio pro Segment produzieren.

Zweck

Bereitstellung eines vielseitigen und hochwertigen Werkzeugs zur Generierung von Sprachaudio aus Text, das eine breite Palette von Bedürfnissen von einfachen Voiceovers bis hin zu komplexen Synchronisationen abdeckt.

Funktionen

Text-zu-Sprache-Konvertierung
Stimmklonen aus Referenz-Audio
Emotions- und Geschwindigkeitskontrolle
Zeitplan-genaues Audio-Rendering aus SRT
Unterstützung für Noiz Cloud API und lokales Kokoro-Backend
Gastmodus für Noiz API ohne Authentifizierung

Anwendungsfälle

Erstellung von Voiceovers für Videos oder Präsentationen
Erstellung von Hörbüchern aus Textdateien oder Artikeln
Erzeugung synthetisierter Sprache für Chatbots oder virtuelle Assistenten
Synchronisation von Videoinhalten mit zeitlich abgestimmten Voiceovers
Klonen einer bestimmten Stimme für personalisierte Audiobotschaften

Nicht-Ziele

Echtzeit-konversationelle Sprachinteraktion
Audiobearbeitung über einfache Synthese und Ausrichtung hinaus
Direkte Integration mit Chat-Plattformen (obwohl die Ausgabe dafür verwendet werden kann)

Maintenance

warning:Dependency ManagementDie Fähigkeit erfordert das Paket 'requests' für das Noiz-Backend, aber es gibt keine explizite Erwähnung von Lockfiles oder automatisierten Abhängigkeitsaktualisierungen dafür.

Trust

info:Issues AttentionEs wurden 2 Issues in den letzten 90 Tagen geöffnet und 0 geschlossen, was auf eine geringe Aktivität bei Issues hindeutet.

Execution

warning:Pinned dependenciesDas Skript listet erforderliche Pakete wie 'requests' auf, enthält aber keine expliziten Versions-Pinning oder Lockfiles, was potenziell zu Kompatibilitätsproblemen führen kann.

Installation

npx skills add NoizAI/skills

Führt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.

Qualitätspunktzahl

96 /100

Analysiert 1 day ago

Vertrauenssignale

Letzter Commit8 days ago

GitHub-Inhaber NoizAI

Sterne497

Status

Quellcode ansehen

Ähnliche Erweiterungen

Speech Generation Skill

100

Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.

Skill

openai

Google Tts

100

Convert documents and text to audio using Google Cloud Text-to-Speech. Use this skill when the user wants to: narrate a document, read aloud text, generate audio from a file, convert text to speech, create a recording of documentation or analysis, create a podcast from a document, or use Google TTS/text-to-speech. Trigger phrases: "read this aloud", "narrate this", "create a recording", "text to speech", "TTS", "convert to audio", "audio from document", "listen to this", "generate audio", "google tts", "create a podcast".

Skill

sanjay3290

Characteristic Voice

Verwenden Sie diese Fähigkeit immer dann, wenn der Benutzer möchte, dass die Sprache menschlicher, begleitender oder emotional ausdrucksstärker klingt. Auslöser sind: jegliche Erwähnung von 'sprechen wie', 'reden wie', 'begleitende Stimme', 'tröste mich', 'muntere mich auf', 'klingt menschlicher', 'Guten-Nacht-Stimme', 'Guten-Morgen-Stimme' oder Aufforderungen, Füllgeräusche, Emotionen oder Persönlichkeit hinzuzufügen. Verwenden Sie dies auch, wenn der Benutzer die Stimme eines bestimmten Charakters nachahmen, Sprechstil-Voreinstellungen anwenden (Gutenacht, Morgen, Komfort, Feier, Chatten), emotionale Parameter wie Wärme oder Zärtlichkeit abstimmen oder die TTS-Ausgabe wie eine echte Person klingen lassen möchte. Wenn der Benutzer nach einer 'Sprachnachricht', 'Begleit-Audio' oder 'Charakterstimme' fragt oder eine Sprache wünscht, die seufzt, lacht, zögert oder aufrichtig warm klingt, verwenden Sie diese Fähigkeit. Verwenden Sie dies NICHT für einfache Text-zu-Sprache ohne Persönlichkeit, Musikgenerierung, Soundeffekte oder allgemeine Codierungsaufgaben, die nichts mit ausdrucksstarker Sprache zu tun haben.

Skill

NoizAI

Sherpa Onnx Tts

Local text-to-speech via sherpa-onnx (offline, no cloud)

Skill

steipete

Elevenlabs Tts

ElevenLabs text-to-speech with 22+ premium voices, multilingual support, and voice tuning via inference.sh CLI. Models: eleven_multilingual_v2 (highest quality), eleven_turbo_v2_5 (low latency), eleven_flash_v2_5 (ultra-fast). Capabilities: text-to-speech, voice selection, stability/style control, 32 languages. Use for: voiceovers, audiobooks, video narration, podcasts, accessibility, IVR. Triggers: elevenlabs, eleven labs, elevenlabs tts, premium tts, professional voice, ai voice, high quality tts, multilingual tts, eleven labs voice, voice generation, natural speech, realistic voice, voice over, speech synthesis

Skill

inferen-sh

AlterLab FC AI Audio Producer

This skill should be used when the user asks about "audio production", "ElevenLabs", "voice isolator", "audio post-production", "AI narration", "text to speech production", "voiceover studio", "audio native", "transcription", "Scribe", "multi-track audio", "audio assembly", "batch audio processing", "audio export", "act as an audio producer", "audio producer mode", "TTS production", "podcast audio", "audiobook production", "narration workflow", "content series audio", "multi-tool audio chain", "ElevenLabs Projects", or needs expertise in end-to-end audio production pipelines using ElevenLabs tools. Part of the AlterLab FC Skills collection (GenAI pack).

Skill

AlterLab-IEU