PDF Processing Skill

Skill Verifiziert Aktiv

Textextraktion aus PDFs, Formulare ausfüllen und Dokumente zusammenführen

Zweck

Um einem Agenten die Fähigkeit zu geben, programmgesteuert mit PDF-Dokumenten für Aufgaben wie Datenextraktion, Formularausfüllung und Dokumentenmontage zu interagieren.

Funktionen

Textinhalt aus PDFs extrahieren
Formularfelder in PDF-Dokumenten ausfüllen
Mehrere PDFs zu einem einzigen Dokument zusammenführen
PDFs in einzelne Seiten aufteilen

Anwendungsfälle

Automatisierung der Datenextraktion aus gescannten oder formularbasierten PDFs.
Generierung ausgefüllter PDF-Formulare basierend auf bereitgestellten Daten.
Zusammenfassung mehrerer PDF-Berichte oder Kapitel zu einer einzigen Datei.
Trennung eines mehrseitigen PDFs in einzelne Dokumente zur einfacheren Verteilung.

Nicht-Ziele

Ausführung von optischer Zeichenerkennung (OCR) auf bildbasierten PDFs (über das hinaus, was pypdf bietet).
Bearbeitung oder Erstellung komplexer PDF-Layouts von Grund auf.
Umgang mit verschlüsselten oder passwortgeschützten PDFs ohne das Passwort.

Workflow

Identifizieren Sie die spezifische erforderliche PDF-Verarbeitungsaufgabe (Extraktion, Formularausfüllung, Zusammenführung, Aufteilung).
Stellen Sie die relevanten PDF-Dateien und alle notwendigen Daten (z. B. Formularfeldwerte) bereit.
Führen Sie die Funktionalität der Fähigkeit aus, die die pypdf-Bibliothek verwendet, um die angeforderte Operation durchzuführen.
Erhalten Sie die verarbeitete PDF-Datei oder den extrahierten Text als Ausgabe.

Installation

npx skills add jlowin/fastmcp

Führt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.

Qualitätspunktzahl

Verifiziert

99 /100

Analysiert 1 day ago

Vertrauenssignale

Letzter Commit1 day ago

GitHub-Inhaber jlowin

Sterne25.1k

LizenzApache-2.0

Websitegofastmcp.com

Status

Quellcode ansehen

Ähnliche Erweiterungen

Nutrient Document Processing

Verarbeiten Sie Dokumente mit Nutrient DWS. Verwenden Sie dies, wenn der Benutzer PDFs aus HTML oder URLs generieren, Office/Bilder/PDFs konvertieren, Pakete zusammenstellen oder aufteilen, Scans OCRen, Text/Tabellen/Schlüssel-Wert-Paare extrahieren, personenbezogene Daten redigieren, Wasserzeichen hinzufügen, signieren, Formulare ausfüllen, PDFs optimieren oder Compliance-Ausgaben wie PDF/A oder PDF/UA erstellen möchte. Auslöser sind: In PDF konvertieren, diese PDFs zusammenführen, diesen Scan OCRen, Tabellen extrahieren, personenbezogene Daten redigieren, dieses PDF signieren, dieses PDF/A erstellen oder zur Webbereitstellung linearisieren.

Skill

PSPDFKit-labs

Azure AI Document Intelligence SDK for Java

Azure AI Document Intelligence SDK for Java (com.azure:azure-ai-documentintelligence). Use for extracting text, tables, key-value pairs from documents, receipts, invoices, IDs, or building custom document models. Triggers: "document intelligence java", "form recognizer java", "extract text from PDF java", "OCR document java", "analyze invoice receipt java", "custom document model java", "document classification java".

Skill

microsoft

Generate Restaurant Menu

100

Generate a branded restaurant menu PDF with sections, items, prices, and descriptions.

Skill

iterationlayer

Extract Fleet Vehicle Registration

100

Extract vehicle identification, owner details, registration dates, and technical specifications from vehicle registration documents.

Skill

iterationlayer

Convert Resume to Markdown

100

Convert a resume PDF to clean markdown for LLM parsing or candidate pipelines.

Skill

iterationlayer

Eyeball

100

Document analysis with inline source screenshots. When you ask Copilot to analyze a document, Eyeball generates a Word doc where every factual claim includes a highlighted screenshot from the source material so you can verify it with your own eyes.

Skill

github