Zum Hauptinhalt springen
Dieser Inhalt ist noch nicht in Ihrer Sprache verfügbar und wird auf Englisch angezeigt.

Google Tts

Skill Verifiziert Aktiv
Teil von:Ai Skills

Convert documents and text to audio using Google Cloud Text-to-Speech. Use this skill when the user wants to: narrate a document, read aloud text, generate audio from a file, convert text to speech, create a recording of documentation or analysis, create a podcast from a document, or use Google TTS/text-to-speech. Trigger phrases: "read this aloud", "narrate this", "create a recording", "text to speech", "TTS", "convert to audio", "audio from document", "listen to this", "generate audio", "google tts", "create a podcast".

Zweck

To easily convert documents and text into audio using Google Cloud's advanced text-to-speech capabilities, enabling narration, audio generation, and podcast creation.

Funktionen

  • Convert text and documents (PDF, DOCX, MD, TXT) to audio
  • Generate podcast-style audio with multiple speakers/voices
  • Support for various Google Cloud TTS voices (Neural2, WaveNet, Studio)
  • Configurable speaking rate, pitch, and audio encoding
  • Automatic text chunking for long documents

Anwendungsfälle

  • Narrate a document or analysis for easier consumption.
  • Create audio recordings of documentation or articles.
  • Generate podcast episodes from a conversational script.
  • Convert written content into speech for accessibility purposes.

Nicht-Ziele

  • Performing real-time voice transcription.
  • Providing voice modification effects beyond pitch and rate.
  • Hosting or distributing generated audio files.

Installation

Zuerst Marketplace hinzufügen

/plugin marketplace add sanjay3290/ai-skills
/plugin install ai-skills@ai-skills

Qualitätspunktzahl

Verifiziert
100 /100
Analysiert about 15 hours ago

Vertrauenssignale

Letzter Commit7 days ago
Sterne272
LizenzApache-2.0
Status
Quellcode ansehen

Ähnliche Erweiterungen

Speech Generation Skill

100

Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.

Skill
openai

Sherpa Onnx Tts

99

Local text-to-speech via sherpa-onnx (offline, no cloud)

Skill
steipete

Elevenlabs Tts

99

ElevenLabs text-to-speech with 22+ premium voices, multilingual support, and voice tuning via inference.sh CLI. Models: eleven_multilingual_v2 (highest quality), eleven_turbo_v2_5 (low latency), eleven_flash_v2_5 (ultra-fast). Capabilities: text-to-speech, voice selection, stability/style control, 32 languages. Use for: voiceovers, audiobooks, video narration, podcasts, accessibility, IVR. Triggers: elevenlabs, eleven labs, elevenlabs tts, premium tts, professional voice, ai voice, high quality tts, multilingual tts, eleven labs voice, voice generation, natural speech, realistic voice, voice over, speech synthesis

Skill
inferen-sh

Tts

96

Verwenden Sie diese Fähigkeit, wann immer der Benutzer Text in Sprache umwandeln, Audio aus Text generieren oder Voiceovers erstellen möchte. Auslöser sind: jede Erwähnung von 'TTS', 'Text to Speech', 'sprechen', 'sagen', 'Stimme', 'laut vorlesen', 'Audio-Narration', 'Voiceover', 'Synchronisation' oder Anfragen, geschriebene Inhalte in gesprochene Audios umzuwandeln. Verwenden Sie es auch, wenn Sie EPUB/PDF/SRT/Artikel in Audio konvertieren, Stimmen aus Referenz-Audios klonen, Emotionen oder Geschwindigkeit in der Sprache steuern, Sprache an Zeitpläne von Untertiteln anpassen oder sprach-zugeordnete Audio pro Segment produzieren.

Skill
NoizAI

Characteristic Voice

95

Verwenden Sie diese Fähigkeit immer dann, wenn der Benutzer möchte, dass die Sprache menschlicher, begleitender oder emotional ausdrucksstärker klingt. Auslöser sind: jegliche Erwähnung von 'sprechen wie', 'reden wie', 'begleitende Stimme', 'tröste mich', 'muntere mich auf', 'klingt menschlicher', 'Guten-Nacht-Stimme', 'Guten-Morgen-Stimme' oder Aufforderungen, Füllgeräusche, Emotionen oder Persönlichkeit hinzuzufügen. Verwenden Sie dies auch, wenn der Benutzer die Stimme eines bestimmten Charakters nachahmen, Sprechstil-Voreinstellungen anwenden (Gutenacht, Morgen, Komfort, Feier, Chatten), emotionale Parameter wie Wärme oder Zärtlichkeit abstimmen oder die TTS-Ausgabe wie eine echte Person klingen lassen möchte. Wenn der Benutzer nach einer 'Sprachnachricht', 'Begleit-Audio' oder 'Charakterstimme' fragt oder eine Sprache wünscht, die seufzt, lacht, zögert oder aufrichtig warm klingt, verwenden Sie diese Fähigkeit. Verwenden Sie dies NICHT für einfache Text-zu-Sprache ohne Persönlichkeit, Musikgenerierung, Soundeffekte oder allgemeine Codierungsaufgaben, die nichts mit ausdrucksstarker Sprache zu tun haben.

Skill
NoizAI

Podcast Generation

100

Generate AI-powered podcast-style audio narratives using Azure OpenAI's GPT Realtime Mini model via WebSocket. Use when building text-to-speech features, audio narrative generation, podcast creation from content, or integrating with Azure OpenAI Realtime API for real audio output. Covers full-stack implementation from React frontend to Python FastAPI backend with WebSocket streaming.

Skill
microsoft