Zum Hauptinhalt springen

PDF Processing Skill

Skill Verifiziert Aktiv

Textextraktion aus PDFs, Formulare ausfüllen und Dokumente zusammenführen

Zweck

Um einem Agenten die Fähigkeit zu geben, programmgesteuert mit PDF-Dokumenten für Aufgaben wie Datenextraktion, Formularausfüllung und Dokumentenmontage zu interagieren.

Funktionen

  • Textinhalt aus PDFs extrahieren
  • Formularfelder in PDF-Dokumenten ausfüllen
  • Mehrere PDFs zu einem einzigen Dokument zusammenführen
  • PDFs in einzelne Seiten aufteilen

Anwendungsfälle

  • Automatisierung der Datenextraktion aus gescannten oder formularbasierten PDFs.
  • Generierung ausgefüllter PDF-Formulare basierend auf bereitgestellten Daten.
  • Zusammenfassung mehrerer PDF-Berichte oder Kapitel zu einer einzigen Datei.
  • Trennung eines mehrseitigen PDFs in einzelne Dokumente zur einfacheren Verteilung.

Nicht-Ziele

  • Ausführung von optischer Zeichenerkennung (OCR) auf bildbasierten PDFs (über das hinaus, was pypdf bietet).
  • Bearbeitung oder Erstellung komplexer PDF-Layouts von Grund auf.
  • Umgang mit verschlüsselten oder passwortgeschützten PDFs ohne das Passwort.

Workflow

  1. Identifizieren Sie die spezifische erforderliche PDF-Verarbeitungsaufgabe (Extraktion, Formularausfüllung, Zusammenführung, Aufteilung).
  2. Stellen Sie die relevanten PDF-Dateien und alle notwendigen Daten (z. B. Formularfeldwerte) bereit.
  3. Führen Sie die Funktionalität der Fähigkeit aus, die die pypdf-Bibliothek verwendet, um die angeforderte Operation durchzuführen.
  4. Erhalten Sie die verarbeitete PDF-Datei oder den extrahierten Text als Ausgabe.

Installation

npx skills add jlowin/fastmcp

Führt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.

Qualitätspunktzahl

Verifiziert
99 /100
Analysiert 1 day ago

Vertrauenssignale

Letzter Commit1 day ago
Sterne25.1k
LizenzApache-2.0
Status
Quellcode ansehen

Ähnliche Erweiterungen

Nutrient Document Processing

98

Verarbeiten Sie Dokumente mit Nutrient DWS. Verwenden Sie dies, wenn der Benutzer PDFs aus HTML oder URLs generieren, Office/Bilder/PDFs konvertieren, Pakete zusammenstellen oder aufteilen, Scans OCRen, Text/Tabellen/Schlüssel-Wert-Paare extrahieren, personenbezogene Daten redigieren, Wasserzeichen hinzufügen, signieren, Formulare ausfüllen, PDFs optimieren oder Compliance-Ausgaben wie PDF/A oder PDF/UA erstellen möchte. Auslöser sind: In PDF konvertieren, diese PDFs zusammenführen, diesen Scan OCRen, Tabellen extrahieren, personenbezogene Daten redigieren, dieses PDF signieren, dieses PDF/A erstellen oder zur Webbereitstellung linearisieren.

Skill
PSPDFKit-labs

Azure AI Document Intelligence SDK for Java

98

Azure AI Document Intelligence SDK for Java (com.azure:azure-ai-documentintelligence). Use for extracting text, tables, key-value pairs from documents, receipts, invoices, IDs, or building custom document models. Triggers: "document intelligence java", "form recognizer java", "extract text from PDF java", "OCR document java", "analyze invoice receipt java", "custom document model java", "document classification java".

Skill
microsoft

Generate Restaurant Menu

100

Generate a branded restaurant menu PDF with sections, items, prices, and descriptions.

Skill
iterationlayer

Extract Fleet Vehicle Registration

100

Extract vehicle identification, owner details, registration dates, and technical specifications from vehicle registration documents.

Skill
iterationlayer

Convert Resume to Markdown

100

Convert a resume PDF to clean markdown for LLM parsing or candidate pipelines.

Skill
iterationlayer

Eyeball

100

Document analysis with inline source screenshots. When you ask Copilot to analyze a document, Eyeball generates a Word doc where every factual claim includes a highlighted screenshot from the source material so you can verify it with your own eyes.

Skill
github