Zum Hauptinhalt springen

Paddleocr Text Recognition

Skill Verifiziert Aktiv

Verwenden Sie diese Fähigkeit, wenn der Benutzer Text aus Bildern, Fotos, Scans, Screenshots oder gescannten PDFs extrahieren möchte. Gibt exakte maschinenlesbare Zeichenfolgen mit Text auf Zeilenebene und optionalen Bounding-Box-Koordinaten zurück. Hohe Genauigkeit für CJK, Kleingedrucktes und handschriftlichen Text. Auslöserbegriffe: OCR, 文字识别, 图片转文字, 截图识字, 提取图中文字, 扫描识字, 识字, 纯文字, plain text extraction, 坐标, 检测框, bbox, bounding box, image to text, screenshot, photo scan, recognize text.

Zweck

Extrahieren Sie Text aus Bildern, Fotos, Scans, Screenshots oder gescannten PDFs mit hoher Genauigkeit und stellen Sie maschinenlesbare Zeichenfolgen und optionale Koordinatendaten für die nachgelagerte Verarbeitung bereit.

Funktionen

  • Text aus Bildern und PDFs extrahieren
  • Unterstützung für CJK, Kleingedrucktes und handschriftlichen Text
  • Text auf Zeilenebene und optionale Bounding-Box-Koordinaten
  • Verarbeitet lokale Dateien und URLs
  • Gibt strukturierte JSON-Ausgabe mit Fehlerdetails zurück

Anwendungsfälle

  • Extrahieren von Text aus gescannten Dokumenten für die Dateneingabe.
  • Abrufen von Text aus Screenshots zur Analyse.
  • Digitalisieren von Text aus Fotos von Schildern oder Dokumenten.
  • Verarbeiten von gescannten PDFs, um ihren Text durchsuchbar zu machen.

Nicht-Ziele

  • Direktes Extrahieren von Text aus einfachen Text-, Code- oder Markdown-Dateien.
  • Parsen komplexer Dokumentenlayouts wie Tabellen, Formeln oder Diagramme.
  • Ersetzen von direkten Textdatei-Lese capabilities.

Installation

npx skills add PaddlePaddle/PaddleOCR

Führt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.

Qualitätspunktzahl

Verifiziert
99 /100
Analysiert about 22 hours ago

Vertrauenssignale

Letzter Commit1 day ago
Sterne77.8k
LizenzApache-2.0
Status
Quellcode ansehen

Ähnliche Erweiterungen

PaddleOCR Document Parsing

99

Verwenden Sie diese Fähigkeit, um strukturierte Markdown/JSON aus PDFs und Dokumentbildern zu extrahieren – Tabellen mit präziser Zellendefinition, Formeln als LaTeX, Abbildungen, Siegel, Diagramme, Kopf-/Fußzeilen, mehrspaltiges Layout und korrekte Lesereihenfolge. Trigger-Begriffe: 文档解析, 版面分析, 版面还原, 表格提取, 公式识别, 多栏排版, 扫描件结构化, 发票, 财报, 复杂 PDF, PDF转Markdown, 图表, 阅读顺序; reading order, formula, LaTeX, layout parsing, structure extraction, PP-StructureV3, PaddleOCR-VL.

Skill
PaddlePaddle

Firecrawl Parse

99

Efficiently extract and convert the contents of any local file—such as PDF, DOCX, DOC, ODT, RTF, XLSX, XLS, or HTML—into clean, well-formatted markdown saved to disk. Use this skill whenever the user requests to parse, read, or extract information from a file on their computer, including phrases like “parse this PDF”, “convert this document”, “read this file”, “extract text from”, or when a local file path (not a URL) is provided. This skill offers advanced options like generating AI-powered summaries and answering questions based on the file's content. Prefer this tool over `scrape` when handling local files to deliver precise, structured outputs for downstream tasks.

Skill
firecrawl

Document Extraction API

99

Extract structured data from documents using AI-powered field extraction.

Skill
iterationlayer

Nutrient Document Processing

98

Verarbeiten Sie Dokumente mit Nutrient DWS. Verwenden Sie dies, wenn der Benutzer PDFs aus HTML oder URLs generieren, Office/Bilder/PDFs konvertieren, Pakete zusammenstellen oder aufteilen, Scans OCRen, Text/Tabellen/Schlüssel-Wert-Paare extrahieren, personenbezogene Daten redigieren, Wasserzeichen hinzufügen, signieren, Formulare ausfüllen, PDFs optimieren oder Compliance-Ausgaben wie PDF/A oder PDF/UA erstellen möchte. Auslöser sind: In PDF konvertieren, diese PDFs zusammenführen, diesen Scan OCRen, Tabellen extrahieren, personenbezogene Daten redigieren, dieses PDF signieren, dieses PDF/A erstellen oder zur Webbereitstellung linearisieren.

Skill
PSPDFKit-labs

Generate Restaurant Menu

100

Generate a branded restaurant menu PDF with sections, items, prices, and descriptions.

Skill
iterationlayer

Extract Fleet Vehicle Registration

100

Extract vehicle identification, owner details, registration dates, and technical specifications from vehicle registration documents.

Skill
iterationlayer