PDF Processing Skill
Skill Verifiziert AktivTextextraktion aus PDFs, Formulare ausfüllen und Dokumente zusammenführen
Um einem Agenten die Fähigkeit zu geben, programmgesteuert mit PDF-Dokumenten für Aufgaben wie Datenextraktion, Formularausfüllung und Dokumentenmontage zu interagieren.
Funktionen
- Textinhalt aus PDFs extrahieren
- Formularfelder in PDF-Dokumenten ausfüllen
- Mehrere PDFs zu einem einzigen Dokument zusammenführen
- PDFs in einzelne Seiten aufteilen
Anwendungsfälle
- Automatisierung der Datenextraktion aus gescannten oder formularbasierten PDFs.
- Generierung ausgefüllter PDF-Formulare basierend auf bereitgestellten Daten.
- Zusammenfassung mehrerer PDF-Berichte oder Kapitel zu einer einzigen Datei.
- Trennung eines mehrseitigen PDFs in einzelne Dokumente zur einfacheren Verteilung.
Nicht-Ziele
- Ausführung von optischer Zeichenerkennung (OCR) auf bildbasierten PDFs (über das hinaus, was pypdf bietet).
- Bearbeitung oder Erstellung komplexer PDF-Layouts von Grund auf.
- Umgang mit verschlüsselten oder passwortgeschützten PDFs ohne das Passwort.
Workflow
- Identifizieren Sie die spezifische erforderliche PDF-Verarbeitungsaufgabe (Extraktion, Formularausfüllung, Zusammenführung, Aufteilung).
- Stellen Sie die relevanten PDF-Dateien und alle notwendigen Daten (z. B. Formularfeldwerte) bereit.
- Führen Sie die Funktionalität der Fähigkeit aus, die die pypdf-Bibliothek verwendet, um die angeforderte Operation durchzuführen.
- Erhalten Sie die verarbeitete PDF-Datei oder den extrahierten Text als Ausgabe.
Installation
npx skills add jlowin/fastmcpFührt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.
Qualitätspunktzahl
VerifiziertVertrauenssignale
Ähnliche Erweiterungen
Nutrient Document Processing
98Verarbeiten Sie Dokumente mit Nutrient DWS. Verwenden Sie dies, wenn der Benutzer PDFs aus HTML oder URLs generieren, Office/Bilder/PDFs konvertieren, Pakete zusammenstellen oder aufteilen, Scans OCRen, Text/Tabellen/Schlüssel-Wert-Paare extrahieren, personenbezogene Daten redigieren, Wasserzeichen hinzufügen, signieren, Formulare ausfüllen, PDFs optimieren oder Compliance-Ausgaben wie PDF/A oder PDF/UA erstellen möchte. Auslöser sind: In PDF konvertieren, diese PDFs zusammenführen, diesen Scan OCRen, Tabellen extrahieren, personenbezogene Daten redigieren, dieses PDF signieren, dieses PDF/A erstellen oder zur Webbereitstellung linearisieren.
Azure AI Document Intelligence SDK for Java
98Azure AI Document Intelligence SDK for Java (com.azure:azure-ai-documentintelligence). Use for extracting text, tables, key-value pairs from documents, receipts, invoices, IDs, or building custom document models. Triggers: "document intelligence java", "form recognizer java", "extract text from PDF java", "OCR document java", "analyze invoice receipt java", "custom document model java", "document classification java".
Generate Restaurant Menu
100Generate a branded restaurant menu PDF with sections, items, prices, and descriptions.
Extract Fleet Vehicle Registration
100Extract vehicle identification, owner details, registration dates, and technical specifications from vehicle registration documents.
Convert Resume to Markdown
100Convert a resume PDF to clean markdown for LLM parsing or candidate pipelines.
Eyeball
100Document analysis with inline source screenshots. When you ask Copilot to analyze a document, Eyeball generates a Word doc where every factual claim includes a highlighted screenshot from the source material so you can verify it with your own eyes.