Zum Hauptinhalt springen
Dieser Inhalt ist noch nicht in Ihrer Sprache verfügbar und wird auf Englisch angezeigt.

Video to Text (Groq)

Skill Aktiv

Transcribe video/audio URL or local file to text + SRT using yt-dlp + Groq Whisper API (free tier). Preferred default for v2 transcription. Returns raw text and segments; summary is caller's responsibility.

Zweck

Transcribe video or audio content from various sources into text and SRT subtitles for further processing or analysis.

Funktionen

  • Transcribes video/audio URLs and local files.
  • Generates raw text output.
  • Generates SRT subtitle files.
  • Uses yt-dlp for audio extraction.
  • Leverages Groq Whisper API for transcription.

Anwendungsfälle

  • Extracting text from video lectures or presentations.
  • Generating subtitles for video content.
  • Transcribing podcast audio for searchability.
  • Converting audio recordings into searchable text documents.

Nicht-Ziele

  • Producing a summary of the transcribed content.
  • Handling transcription for unsupported audio/video formats.
  • Providing transcription without a valid Groq API key.

Workflow

  1. Extract audio from the provided URL or local file using yt-dlp.
  2. Prepare the extracted audio file (e.g., conversion if needed via ffmpeg).
  3. Send the audio file to the Groq Whisper API for transcription.
  4. Receive transcription results (raw text and SRT segments) from the API.
  5. Return structured JSON output containing text, SRT, and metadata.

Praktiken

  • Transcription
  • Content extraction
  • API integration

Voraussetzungen

  • GROQ_API_KEY environment variable set
  • yt-dlp installed
  • ffmpeg installed

Trust

  • warning:Issues AttentionThere are 17 open issues and 3 closed issues in the last 90 days, indicating a low closure rate and potentially slow maintainer response.

Installation

npx skills add 0xmariowu/Autosearch

Führt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.

Qualitätspunktzahl

95 /100
Analysiert 1 day ago

Vertrauenssignale

Letzter Commit3 days ago
Sterne18
LizenzMIT
Status
Quellcode ansehen

Ähnliche Erweiterungen

YouTube Downloader

100

Download and process YouTube content for research. Use when: downloading competitor videos for analysis; extracting audio for podcasts; getting transcripts for content repurposing; archiving webinars; research content curation

Skill
guia-matthieu

Transcribe Video

98

Generieren Sie Untertitel (SRT/VTT) und reine Texttranskripte aus Video- oder Audiodateien mit AWS Transcribe. Verwenden Sie dies, wenn Sie Beschriftungen erstellen, gesprochene Inhalte extrahieren, Transkripte für Notizen erstellen oder Videoinhalte durchsuchbar machen.

Skill
rameerez

Ffmpeg

99

Videobearbeitung und -verarbeitung mit FFmpeg. Verwenden Sie es für Formatkonvertierung, Größenänderung, Komprimierung, Audioextraktion und die Vorbereitung von Assets für Remotion. Trigger umfassen die Konvertierung von GIF in MP4, die Größenänderung von Videos, die Extraktion von Audio, die Komprimierung von Dateien oder jede Medien transformations aufgabe.

Skill
digitalsamba

Sheet Music Publisher

99

Converts mastered audio to sheet music and creates printable songbooks. Use after mastering when the user wants sheet music or a songbook for their album.

Skill
bitwize-music-studio

Summarize

99

Summarize or transcribe URLs, YouTube/videos, podcasts, articles, transcripts, PDFs, and local files.

Skill
steipete

Cli Anything Videocaptioner

99

AI-powered video captioning — transcribe speech, optimize/translate subtitles, and burn them into video via the stable VideoCaptioner backend. Free ASR and translation included.

Skill
hkuds