[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"extension-skill-PaddlePaddle-paddleocr-doc-parsing-de":3,"guides-for-PaddlePaddle-paddleocr-doc-parsing":375,"similar-k172bvcwpn894y5cgcnrg7hv0x86n7x2-de":376},{"_creationTime":4,"_id":5,"children":6,"community":7,"display":9,"evaluation":15,"identity":260,"isFallback":251,"parentExtension":266,"providers":267,"relations":273,"repo":276,"tags":371,"workflow":372},1778695294715.4707,"k172bvcwpn894y5cgcnrg7hv0x86n7x2",[],{"reviewCount":8},0,{"description":10,"installMethods":11,"name":13,"sourceUrl":14},"Verwenden Sie diese Fähigkeit, um strukturierte Markdown/JSON aus PDFs und Dokumentbildern zu extrahieren – Tabellen mit präziser Zellendefinition, Formeln als LaTeX, Abbildungen, Siegel, Diagramme, Kopf-/Fußzeilen, mehrspaltiges Layout und korrekte Lesereihenfolge. Trigger-Begriffe: 文档解析, 版面分析, 版面还原, 表格提取, 公式识别, 多栏排版, 扫描件结构化, 发票, 财报, 复杂 PDF, PDF转Markdown, 图表, 阅读顺序; reading order, formula, LaTeX, layout parsing, structure extraction, PP-StructureV3, PaddleOCR-VL.",{"claudeCode":12},"PaddlePaddle/PaddleOCR","PaddleOCR Document Parsing","https://github.com/PaddlePaddle/PaddleOCR",{"_creationTime":16,"_id":17,"extensionId":5,"locale":18,"result":19,"trustSignals":241,"workflow":258},1778695294715.471,"kn79qzdgbf6r471gxd8g2jkw2186nxh5","de",{"checks":20,"evaluatedAt":195,"extensionSummary":196,"features":197,"nonGoals":203,"practices":207,"prerequisites":208,"promptVersionExtension":214,"promptVersionScoring":215,"purpose":216,"rationale":217,"score":218,"summary":219,"tags":220,"tier":229,"useCases":230,"workflow":235},[21,26,29,32,36,39,44,48,51,54,58,62,65,69,72,75,78,81,84,87,91,95,99,103,107,110,114,117,121,124,127,130,133,136,139,143,147,150,153,157,160,163,166,169,173,176,179,182,185,188,192],{"category":22,"check":23,"severity":24,"summary":25},"Practical Utility","Problem relevance","pass","Die Beschreibung gibt klar das Problem der Extraktion strukturierter Daten aus PDFs und Dokumentbildern an und hebt spezifische Elemente wie Tabellen, Formeln und Layout hervor.",{"category":22,"check":27,"severity":24,"summary":28},"Unique selling proposition","Die Fähigkeit nutzt fortschrittliche Modelle wie PaddleOCR-VL und PP-StructureV3 für eine hochgenaue Dokumentenanalyse, die über einfaches OCR hinausgeht und sie von einfachen Wrappern unterscheidet.",{"category":22,"check":30,"severity":24,"summary":31},"Production readiness","Die Fähigkeit bietet einen vollständigen Workflow von der Eingabeverarbeitung bis zur strukturierten Ausgabe, einschließlich Fehlerbehandlung und Anleitungen für große Dateien, was sie einsatzbereit macht.",{"category":33,"check":34,"severity":24,"summary":35},"Scope","Single responsibility principle","Die Fähigkeit konzentriert sich auf die Dokumentenanalyse aus PDFs und Bildern, mit einem klaren Umfang, der keine irrelevanten Domänen umfasst.",{"category":33,"check":37,"severity":24,"summary":38},"Description quality","Die Beschreibung spiegelt die Fähigkeiten der Fähigkeit zur Extraktion strukturierter Daten aus PDFs und Bildern genau wider, einschließlich spezifischer Elemente und Trigger-Begriffe.",{"category":40,"check":41,"severity":42,"summary":43},"Invocation","Scoped tools","not_applicable","Dies ist eine Fähigkeit und keine toolbasierte Erweiterung, daher verfügt sie nicht über Scoped Tools im herkömmlichen Sinne.",{"category":45,"check":46,"severity":24,"summary":47},"Documentation","Configuration & parameter reference","Die SKILL.md-Dokumentation beschreibt klar Umgebungsvariablen für die API-Konfiguration und optionale Parameter wie Dateityp, mit Erläuterung ihrer Zwecke.",{"category":33,"check":49,"severity":42,"summary":50},"Tool naming","Dies ist eine Fähigkeit und keine toolbasierte Erweiterung, daher verfügt sie nicht über herkömmliche Tool-Namen.",{"category":33,"check":52,"severity":24,"summary":53},"Minimal I/O surface","Die CLI-Schnittstelle und die Skriptparameter sind gut definiert, akzeptieren spezifische Eingaben wie Dateipfade/URLs und optionale Parameter, und die Ausgabe ist strukturiertes JSON.",{"category":55,"check":56,"severity":24,"summary":57},"License","License usability","Die Lizenz ist Apache-2.0, klar angegeben in der LICENSE-Datei und SKILL.md, was eine permissive Open-Source-Lizenz ist.",{"category":59,"check":60,"severity":24,"summary":61},"Maintenance","Commit recency","Das Repository zeigt aktuelle Commits vom 13.05.2026, was auf aktive Wartung hindeutet.",{"category":59,"check":63,"severity":24,"summary":64},"Dependency Management","Das Projekt verwendet uv für die Abhängigkeitsverwaltung, wodurch Abhängigkeiten effektiv aufgelöst und verwaltet werden.",{"category":66,"check":67,"severity":24,"summary":68},"Security","Secret Management","Geheimnisse werden über Umgebungsvariablen (PADDLEOCR_ACCESS_TOKEN) gehandhabt, nicht hartkodiert, und die Fähigkeit leitet Benutzer zur sicheren Konfiguration an.",{"category":66,"check":70,"severity":24,"summary":71},"Injection","Das Skript verarbeitet Dateipfade und URLs als Eingabedaten, und es gibt keine Hinweise darauf, Anweisungen aus geladenen Daten von Drittanbietern auszuführen.",{"category":66,"check":73,"severity":24,"summary":74},"Transitive Supply-Chain Grenades","Abhängigkeiten werden über uv verwaltet, und der Code scheint zur Laufzeit keinen externen Code oder Daten zur Ausführung abzurufen.",{"category":66,"check":76,"severity":24,"summary":77},"Sandbox Isolation","Das Skript arbeitet mit bereitgestellten Dateipfaden und URLs und scheint keine Dateien außerhalb des dafür vorgesehenen Ausgabeverzeichnisses oder Umfangs zu ändern.",{"category":66,"check":79,"severity":24,"summary":80},"Sandbox escape primitives","Das Skript scheint keine Muster wie getrennte Prozesse oder Wiederholungsversuche bei verweigerten Operationen zu enthalten.",{"category":66,"check":82,"severity":24,"summary":83},"Data Exfiltration","Die Fähigkeit behandelt API-Aufrufe mit Anmeldeinformationen über Umgebungsvariablen und weist keine Muster auf, vertrauliche Daten zu lesen oder an undokumentierte Dritte zu übermitteln.",{"category":66,"check":85,"severity":24,"summary":86},"Hidden Text Tricks","Bundled-Dateien scheinen frei von versteckten Texttricks oder bösartigen Unicode-Zeichen zu sein; Beschreibungen sind sauber.",{"category":88,"check":89,"severity":24,"summary":90},"Hooks","Opaque code execution","Die Python-Skripte sind in klarem, lesbarem Code ohne Verschleierungstechniken wie Base64-Kodierung oder eval geschrieben.",{"category":92,"check":93,"severity":24,"summary":94},"Portability","Structural Assumption","Die Skripte behandeln Dateipfade und URLs als Eingaben und treffen keine Annahmen über benutzerspezifische Projektorganisationen außerhalb der bereitgestellten Eingaben.",{"category":96,"check":97,"severity":24,"summary":98},"Trust","Issues Attention","Mit 58 offenen und 60 geschlossenen Issues in den letzten 90 Tagen ist die Abschlussrate hoch, was auf eine aktive Beteiligung der Maintainer hindeutet.",{"category":100,"check":101,"severity":24,"summary":102},"Versioning","Release Management","Das Projekt hat eine klare Versionierungsstrategie mit häufigen Veröffentlichungen und Updates, wie durch aktuelle Commit-Daten und Changelog-Einträge angezeigt.",{"category":104,"check":105,"severity":24,"summary":106},"Execution","Validation","Eingabeparameter wie Dateipfade, URLs und Typen werden durch die Argumentenanalyse des Skripts und die interne Logik validiert, bevor sie an die Bibliothek übergeben werden.",{"category":66,"check":108,"severity":24,"summary":109},"Unguarded Destructive Operations","Die Fähigkeit ist hauptsächlich Lese-basiert und konzentriert sich auf Analyse und Extraktion, und führt keine zerstörerischen Operationen durch.",{"category":111,"check":112,"severity":24,"summary":113},"Code Execution","Error Handling","Das Modul `lib.py` gibt durchweg strukturierte Fehlerwörterbücher mit Codes und Nachrichten zurück, und das CLI-Skript behandelt diese Fehler ordnungsgemäß.",{"category":111,"check":115,"severity":24,"summary":116},"Logging","Das Skript verwendet das Python-Logging-Modul für interne Operationen, und die Benutzeroberflächenausgabe wird entsprechend über stdout/stderr verwaltet.",{"category":118,"check":119,"severity":24,"summary":120},"Compliance","GDPR","Die Fähigkeit verarbeitet vom Benutzer bereitgestellte Dokumenteninhalte und verarbeitet nicht von sich aus personenbezogene Daten ohne Benutzereingabe oder explizite Verarbeitung von Dokumenteninhalten.",{"category":118,"check":122,"severity":24,"summary":123},"Target market","Die Fähigkeit verarbeitet Dokumente und scheint keine regionalen oder gerichtlichen Einschränkungen zu haben, was sie global anwendbar macht.",{"category":92,"check":125,"severity":24,"summary":126},"Runtime stability","Die Fähigkeit stützt sich auf Standardbibliotheken von Python und `uv` zur Abhängigkeitsverwaltung, was die plattformübergreifende Kompatibilität gewährleistet.",{"category":45,"check":128,"severity":24,"summary":129},"README","Das README bietet einen umfassenden Überblick, Funktionen, Installations- und Anwendungsbeispiele und beschreibt klar den Zweck der Erweiterung.",{"category":33,"check":131,"severity":42,"summary":132},"Tool surface size","Dies ist eine Fähigkeit mit einem einzigen Eintrittspunkt, keine Sammlung von Tools.",{"category":40,"check":134,"severity":42,"summary":135},"Overlapping near-synonym tools","Dies ist eine Fähigkeit mit einem einzigen Eintrittspunkt, keine Sammlung von Tools mit überlappenden Synonymen.",{"category":45,"check":137,"severity":24,"summary":138},"Phantom features","Alle beworbenen Funktionen, wie Dokumentenanalyse und Ausgabeformate, werden direkt von den bereitgestellten Skripten und der Dokumentation unterstützt.",{"category":140,"check":141,"severity":24,"summary":142},"Install","Installation instruction","Die SKILL.md bietet klare Installationsanweisungen mit `uv` und kopierbaren Anwendungsbeispielen für verschiedene Szenarien.",{"category":144,"check":145,"severity":24,"summary":146},"Errors","Actionable error messages","Fehler werden mit Codes und lesbaren Meldungen gemeldet, die den Benutzer bei Konfigurations-, Eingabe- oder API-Problemen anleiten.",{"category":104,"check":148,"severity":24,"summary":149},"Pinned dependencies","Abhängigkeiten werden über `uv` verwaltet und mit spezifischen Versionen deklariert, was reproduzierbare Builds gewährleistet.",{"category":33,"check":151,"severity":42,"summary":152},"Dry-run preview","Die Fähigkeit dient hauptsächlich der Datenextraktion und führt keine zustandsverändernden Operationen durch, die normalerweise einen Dry-Run-Modus erfordern würden.",{"category":154,"check":155,"severity":24,"summary":156},"Protocol","Idempotent retry & timeouts","Der API-Client verfügt über eine konfigurierbare Timeout-Einstellung, und Operationen sind nicht zustandsverändernd, was Probleme bei Wiederholungsversuchen verursachen würde.",{"category":118,"check":158,"severity":24,"summary":159},"Telemetry opt-in","Die Fähigkeit scheint standardmäßig keine Telemetriedaten zu senden, und es werden keine Opt-out-Mechanismen erwähnt, was den Opt-in-Prinzipien entspricht.",{"category":40,"check":161,"severity":24,"summary":162},"Precise Purpose","Die Beschreibung definiert klar das Artefakt (PDFs, Dokumentbilder) und die Aufgabe (strukturierte Markdown/JSON extrahieren) mit spezifischen Trigger-Begriffen.",{"category":40,"check":164,"severity":24,"summary":165},"Concise Frontmatter","Das Frontmatter ist prägnant und fasst die Kernfunktionalität effektiv zusammen und listet relevante Trigger-Begriffe auf.",{"category":45,"check":167,"severity":24,"summary":168},"Concise Body","Die SKILL.md ist gut strukturiert, mit Hauptanleitungen und Verweisen auf separate Dokumentationsdateien wie `output_schema.md`.",{"category":170,"check":171,"severity":24,"summary":172},"Context","Progressive Disclosure","Detaillierte Schemainformationen werden in einer separaten Datei (`references/output_schema.md`) bereitgestellt, was eine progressive Offenlegung zeigt.",{"category":170,"check":174,"severity":42,"summary":175},"Forked exploration","Die Fähigkeit ist ein direktes Verarbeitungswerkzeug und beinhaltet keine tiefgreifende Exploration, die einen verzweigten Kontext erfordern würde.",{"category":22,"check":177,"severity":24,"summary":178},"Usage examples","Mehrere klare, End-to-End-Anwendungsbeispiele sind in der SKILL.md enthalten, die verschiedene Eingabemethoden und Ausgabeoptionen demonstrieren.",{"category":22,"check":180,"severity":24,"summary":181},"Edge cases","Die Dokumentation behandelt potenzielle Probleme wie nicht unterstützte Formate, API-Fehler und die Verarbeitung großer Dateien mit Wiederherstellungsschritten.",{"category":111,"check":183,"severity":42,"summary":184},"Tool Fallback","Diese Fähigkeit stützt sich nicht auf externe Tools wie MCP-Server und verwendet ihre eigene Bibliothek, sodass Fallbacks nicht zutreffen.",{"category":92,"check":186,"severity":24,"summary":187},"Stack assumptions","Die SKILL.md gibt Python 3.9+ als Anforderung an und verwendet Standardbibliotheken, die von `uv` verwaltet werden, was die Portabilität gewährleistet.",{"category":189,"check":190,"severity":24,"summary":191},"Safety","Halt on unexpected state","Das Skript enthält Überprüfungen auf gültige Eingaben und behandelt API-Fehler ordnungsgemäß, indem es sie meldet, und stoppt effektiv bei unerwarteten Zuständen.",{"category":92,"check":193,"severity":24,"summary":194},"Cross-skill coupling","Die Fähigkeit arbeitet eigenständig und ist nicht implizit von anderen Fähigkeiten abhängig; ihre Funktionalität ist in sich abgeschlossen.",1778695206661,"Diese Fähigkeit nutzt die fortschrittlichen Modelle von PaddleOCR (PaddleOCR-VL, PP-StructureV3), um strukturierte Markdown/JSON aus PDFs und Dokumentbildern zu extrahieren, einschließlich Tabellen, Formeln, Abbildungen und Layoutinformationen. Sie unterstützt verschiedene Eingabemethoden (URL, lokaler Pfad), optionale Angabe des Dateityps und konfigurierbare Ausgabeverarbeitung (Speichern in Datei, Standardausgabe). Fehlerbehandlung und Anleitungen zur API-Konfiguration werden bereitgestellt.",[198,199,200,201,202],"Tabellen mit präziser Zellendefinition extrahieren","Formeln als LaTeX erkennen","Mehrspaltige Layouts und Lesereihenfolge analysieren","Strukturierte Markdown- oder JSON-Ausgabe","Unterstützung für PDFs und Dokumentenbilder",[204,205,206],"Einfache textbasierte OCR-Aufgaben","Geschwindigkeitskritische OCR auf einfachen Bildern","Verarbeitung von Screenshots oder einfachen Bildern mit klarem Text",[],[209,210,211,212,213],"Python 3.9+","uv Paketmanager","Internetzugang für API-Aufrufe","Umgebungsvariable PADDLEOCR_DOC_PARSING_API_URL","Umgebungsvariable PADDLEOCR_ACCESS_TOKEN","3.0.0","4.4.0","Um strukturierte Informationen aus komplexen Dokumenten und Bildern genau zu extrahieren und die Inhalte für LLMs und nachfolgende Verarbeitungen leicht nutzbar zu machen.","Die Erweiterung ist außergewöhnlich gut dokumentiert und implementiert, mit umfassenden Anwendungsbeispielen, klarer Fehlerbehandlung und robuster Abhängigkeitsverwaltung. Sie adressiert effektiv spezifische Benutzerbedürfnisse und hält Best Practices in Bezug auf Sicherheit, Portabilität und Wartung ein.",99,"Eine äußerst robuste und gut dokumentierte Fähigkeit zur Extraktion strukturierter Daten aus PDFs und Dokumentbildern.",[221,222,223,224,225,226,227,228],"ocr","document-parsing","pdf","image-processing","layout-analysis","structure-extraction","markdown","json","verified",[231,232,233,234],"Verarbeitung von Rechnungen und Finanzberichten","Extrahieren von Inhalten aus wissenschaftlichen Arbeiten","Strukturieren von Daten aus gescannten Dokumenten","Analysieren komplexer Dokumentenlayouts",[236,237,238,239,240],"Eingabequelle identifizieren (URL oder lokale Datei)","Skript zur Dokumentenanalyse mit entsprechenden Parametern ausführen","Die JSON-Antwort parsen (Status `ok` und `error`-Felder prüfen)","Relevante Daten (Text, Tabellen, Formeln) aus der strukturierten Ausgabe extrahieren","Ergebnisse dem Benutzer präsentieren oder zur weiteren Verarbeitung verwenden",{"codeQuality":242,"collectedAt":244,"documentation":245,"maintenance":248,"security":255,"testCoverage":257},{"hasLockfile":243},true,1778695190156,{"descriptionLength":246,"readmeSize":247},419,23379,{"closedIssues90d":249,"forks":250,"hasChangelog":251,"openIssues90d":252,"pushedAt":253,"stars":254},60,10426,false,58,1778674559000,77756,{"hasNpmPackage":251,"license":256,"smitheryVerified":251},"Apache-2.0",{"hasCi":243,"hasTests":243},{"updatedAt":259},1778695294715,{"basePath":261,"githubOwner":262,"githubRepo":263,"locale":18,"slug":264,"type":265},"skills/paddleocr-doc-parsing","PaddlePaddle","PaddleOCR","paddleocr-doc-parsing","skill",null,{"evaluate":268,"extract":271},{"promptVersionExtension":214,"promptVersionScoring":215,"score":218,"tags":269,"targetMarket":270,"tier":229},[221,222,223,224,225,226,227,228],"global",{"commitSha":272,"license":256},"HEAD",{"repoId":274,"translatedFrom":275},"kd77seqrqsfst3qefpyp2ape5h86mhqy","k17f6kj5nsqfvjy2vj7tyj9kz186mpgh",{"_creationTime":277,"_id":274,"identity":278,"providers":279,"workflow":367},1778695167335.008,{"githubOwner":262,"githubRepo":263,"sourceUrl":14},{"classify":280,"discover":349,"github":352},{"commitSha":272,"extensions":281},[282,306,319,337],{"basePath":261,"description":283,"displayName":264,"installMethods":284,"rationale":285,"selectedPaths":286,"source":304,"sourceLanguage":305,"type":265},"Use this skill to extract structured Markdown/JSON from PDFs and document images—tables with cell-level precision, formulas as LaTeX, figures, seals, charts, headers/footers, multi-column layout and correct reading order. Trigger terms: 文档解析, 版面分析, 版面还原, 表格提取, 公式识别, 多栏排版, 扫描件结构化, 发票, 财报, 复杂 PDF, PDF转Markdown, 图表, 阅读顺序; reading order, formula, LaTeX, layout parsing, structure extraction, PP-StructureV3, PaddleOCR-VL.",{"claudeCode":12},"SKILL.md frontmatter at skills/paddleocr-doc-parsing/SKILL.md",[287,290,293,296,298,300,302],{"path":288,"priority":289},"SKILL.md","mandatory",{"path":291,"priority":292},"references/output_schema.md","medium",{"path":294,"priority":295},"scripts/layout_caller.py","low",{"path":297,"priority":295},"scripts/lib.py",{"path":299,"priority":295},"scripts/optimize_file.py",{"path":301,"priority":295},"scripts/smoke_test.py",{"path":303,"priority":295},"scripts/split_pdf.py","rule","en",{"basePath":307,"description":308,"displayName":309,"installMethods":310,"rationale":311,"selectedPaths":312,"source":304,"sourceLanguage":305,"type":265},"skills/paddleocr-text-recognition","Use this skill whenever the user wants text extracted from images, photos, scans, screenshots, or scanned PDFs. Returns exact machine-readable strings with line-level text and optional bbox coordinates. Strong accuracy for CJK, small print, and handwritten text. Trigger terms: OCR, 文字识别, 图片转文字, 截图识字, 提取图中文字, 扫描识字, 识字, 纯文字, plain text extraction, 坐标, 检测框, bbox, bounding box, image to text, screenshot, photo scan, recognize text.","paddleocr-text-recognition",{"claudeCode":12},"SKILL.md frontmatter at skills/paddleocr-text-recognition/SKILL.md",[313,314,315,316,318],{"path":288,"priority":289},{"path":291,"priority":292},{"path":297,"priority":295},{"path":317,"priority":295},"scripts/ocr_caller.py",{"path":301,"priority":295},{"basePath":320,"installMethods":321,"rationale":323,"selectedPaths":324,"source":304,"sourceLanguage":305,"type":336},"",{"pypi":322},"paddleocr","cli ecosystem detected at /",[325,327,329,331,334],{"path":326,"priority":289},"pyproject.toml",{"path":328,"priority":289},"setup.py",{"path":330,"priority":289},"README.md",{"path":332,"priority":333},"LICENSE","high",{"path":335,"priority":292},"paddleocr/__main__.py","cli",{"basePath":338,"displayName":339,"installMethods":340,"rationale":341,"selectedPaths":342,"source":304,"sourceLanguage":347,"type":348},"mcp_server","paddleocr_mcp",{"pypi":339},"pyproject.toml with mcp/fastmcp dependency + scripts at mcp_server/pyproject.toml",[343,344,345],{"path":326,"priority":289},{"path":330,"priority":289},{"path":346,"priority":292},"paddleocr_mcp/__main__.py","fr","mcp",{"sources":350},[351],"manual",{"closedIssues90d":249,"description":353,"forks":250,"homepage":354,"license":256,"openIssues90d":252,"pushedAt":253,"readmeSize":247,"stars":254,"topics":355},"Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.","https://www.paddleocr.com",[221,356,357,358,359,222,360,361,362,363,364,365,366],"chineseocr","pdf2markdown","pp-ocr","pp-structure","document-translation","kie","ai4science","pdf-extractor-rag","pdf-parser","rag","paddleocr-vl",{"classifiedAt":368,"discoverAt":369,"extractAt":370,"githubAt":370,"updatedAt":368},1778695188896,1778695167335,1778695186352,[222,224,228,225,227,221,223,226],{"evaluatedAt":373,"extractAt":374,"updatedAt":259},1778695207150,1778695189192,[],[377,398,430,456,478,500],{"_creationTime":378,"_id":379,"community":380,"display":381,"identity":384,"providers":385,"relations":392,"tags":394,"workflow":395},1778695287109.4705,"k172a1btbpmmw11ztty9d4aj7d86m8dk",{"reviewCount":8},{"description":382,"installMethods":383,"name":309,"sourceUrl":14},"Verwenden Sie diese Fähigkeit, wenn der Benutzer Text aus Bildern, Fotos, Scans, Screenshots oder gescannten PDFs extrahieren möchte. Gibt exakte maschinenlesbare Zeichenfolgen mit Text auf Zeilenebene und optionalen Bounding-Box-Koordinaten zurück. Hohe Genauigkeit für CJK, Kleingedrucktes und handschriftlichen Text. Auslöserbegriffe: OCR, 文字识别, 图片转文字, 截图识字, 提取图中文字, 扫描识字, 识字, 纯文字, plain text extraction, 坐标, 检测框, bbox, bounding box, image to text, screenshot, photo scan, recognize text.",{"claudeCode":12},{"basePath":307,"githubOwner":262,"githubRepo":263,"locale":18,"slug":309,"type":265},{"evaluate":386,"extract":391},{"promptVersionExtension":214,"promptVersionScoring":215,"score":218,"tags":387,"targetMarket":270,"tier":229},[221,388,389,222,223,390],"text-extraction","image-to-text","python",{"commitSha":272},{"repoId":274,"translatedFrom":393},"k17a43s5382jae1sgtne8ngfg586m9f0",[222,389,221,223,390,388],{"evaluatedAt":396,"extractAt":374,"updatedAt":397},1778695224039,1778695287109,{"_creationTime":399,"_id":400,"community":401,"display":402,"identity":408,"providers":413,"relations":423,"tags":426,"workflow":427},1778691104675.98,"k17a012kzjtmn6vm9xf7k1q3d986n6me",{"reviewCount":8},{"description":403,"installMethods":404,"name":406,"sourceUrl":407},"Convert a resume PDF to clean markdown for LLM parsing or candidate pipelines.",{"claudeCode":405},"iterationlayer/skills","Convert Resume to Markdown","https://github.com/iterationlayer/skills",{"basePath":409,"githubOwner":410,"githubRepo":411,"locale":305,"slug":412,"type":265},"skills/convert-resume-to-markdown","iterationlayer","skills","convert-resume-to-markdown",{"evaluate":414,"extract":421},{"promptVersionExtension":214,"promptVersionScoring":215,"score":415,"tags":416,"targetMarket":270,"tier":229},100,[417,223,227,418,419,420],"document-processing","resume","hiring","nlp",{"commitSha":272,"license":422},"MIT",{"parentExtensionId":424,"repoId":425},"k1721s0xmp59902ybtpakrrffn86n10s","kd76p4g2qmtrkgx99cnab3683d86n4g8",[417,419,227,420,223,418],{"evaluatedAt":428,"extractAt":429,"updatedAt":428},1778691474825,1778691104676,{"_creationTime":431,"_id":432,"community":433,"display":434,"identity":440,"providers":443,"relations":449,"tags":452,"workflow":453},1778686940775.5723,"k17d40zvn2sfy64zvq7rzpzksh86mndd",{"reviewCount":8},{"description":435,"installMethods":436,"name":438,"sourceUrl":439},"Efficiently extract and convert the contents of any local file—such as PDF, DOCX, DOC, ODT, RTF, XLSX, XLS, or HTML—into clean, well-formatted markdown saved to disk. Use this skill whenever the user requests to parse, read, or extract information from a file on their computer, including phrases like “parse this PDF”, “convert this document”, “read this file”, “extract text from”, or when a local file path (not a URL) is provided. This skill offers advanced options like generating AI-powered summaries and answering questions based on the file's content. Prefer this tool over `scrape` when handling local files to deliver precise, structured outputs for downstream tasks.\n",{"claudeCode":437},"firecrawl/cli","firecrawl-parse","https://github.com/firecrawl/cli",{"basePath":441,"githubOwner":442,"githubRepo":336,"locale":305,"slug":438,"type":265},"skills/firecrawl-parse","firecrawl",{"evaluate":444,"extract":448},{"promptVersionExtension":214,"promptVersionScoring":215,"score":218,"tags":445,"targetMarket":270,"tier":229},[446,222,227,223,447,336],"file-conversion","docx",{"commitSha":272},{"parentExtensionId":450,"repoId":451},"k17axfavjpz72cd3qqzn86shb186ncqt","kd7csd1wb06dg9c1jfy5063f2586ne60",[336,222,447,446,227,223],{"evaluatedAt":454,"extractAt":455,"updatedAt":454},1778687175227,1778686940775,{"_creationTime":457,"_id":458,"community":459,"display":460,"identity":464,"providers":467,"relations":474,"tags":475,"workflow":476},1778691104676.005,"k17b3rrsy570h6ysqbn0p324f186mzxv",{"reviewCount":8},{"description":461,"installMethods":462,"name":463,"sourceUrl":407},"Generate a professionally styled PDF document from Markdown content with custom fonts, headers, and page numbers.",{"claudeCode":405},"Markdown to Styled PDF",{"basePath":465,"githubOwner":410,"githubRepo":411,"locale":305,"slug":466,"type":265},"skills/markdown-to-styled-pdf","markdown-to-styled-pdf",{"evaluate":468,"extract":473},{"promptVersionExtension":214,"promptVersionScoring":215,"score":218,"tags":469,"targetMarket":270,"tier":229},[223,227,470,471,472],"document-generation","content-creation","styling",{"commitSha":272,"license":422},{"parentExtensionId":424,"repoId":425},[471,470,227,223,472],{"evaluatedAt":477,"extractAt":429,"updatedAt":477},1778693710276,{"_creationTime":479,"_id":480,"community":481,"display":482,"identity":486,"providers":489,"relations":496,"tags":497,"workflow":498},1778691104675.9805,"k173dwe2djyydbkrp6qr8dbrfs86nk8d",{"reviewCount":8},{"description":483,"installMethods":484,"name":485,"sourceUrl":407},"Extract structured data from documents using AI-powered field extraction.",{"claudeCode":405},"Document Extraction API",{"basePath":487,"githubOwner":410,"githubRepo":411,"locale":305,"slug":488,"type":265},"skills/document-extraction-api","document-extraction-api",{"evaluate":490,"extract":495},{"promptVersionExtension":214,"promptVersionScoring":215,"score":218,"tags":491,"targetMarket":270,"tier":229},[417,492,493,494,223,221],"data-extraction","ai","api",{"commitSha":272,"license":422},{"parentExtensionId":424,"repoId":425},[493,494,492,417,221,223],{"evaluatedAt":499,"extractAt":429,"updatedAt":499},1778691504579,{"_creationTime":501,"_id":502,"community":503,"display":504,"identity":510,"providers":513,"relations":523,"tags":526,"workflow":527},1778695859266.5317,"k172pr1ryd36ctph36d2x74wxx86mh91",{"reviewCount":8},{"description":505,"installMethods":506,"name":508,"sourceUrl":509},"Verarbeiten Sie Dokumente mit Nutrient DWS. Verwenden Sie dies, wenn der Benutzer PDFs aus HTML oder URLs generieren, Office/Bilder/PDFs konvertieren, Pakete zusammenstellen oder aufteilen, Scans OCRen, Text/Tabellen/Schlüssel-Wert-Paare extrahieren, personenbezogene Daten redigieren, Wasserzeichen hinzufügen, signieren, Formulare ausfüllen, PDFs optimieren oder Compliance-Ausgaben wie PDF/A oder PDF/UA erstellen möchte. Auslöser sind: In PDF konvertieren, diese PDFs zusammenführen, diesen Scan OCRen, Tabellen extrahieren, personenbezogene Daten redigieren, dieses PDF signieren, dieses PDF/A erstellen oder zur Webbereitstellung linearisieren.",{"claudeCode":507},"PSPDFKit-labs/nutrient-agent-skill","nutrient-document-processing","https://github.com/PSPDFKit-labs/nutrient-agent-skill",{"basePath":508,"githubOwner":511,"githubRepo":512,"locale":18,"slug":508,"type":265},"PSPDFKit-labs","nutrient-agent-skill",{"evaluate":514,"extract":522},{"promptVersionExtension":214,"promptVersionScoring":215,"score":515,"tags":516,"targetMarket":270,"tier":229},98,[417,223,221,517,518,519,520,521],"conversion","redaction","signing","compliance","extraction",{"commitSha":272},{"repoId":524,"translatedFrom":525},"kd71fjmn43awb0bgafy6r3vers86ngqg","k1704fp8n8znrmyrxm482pgpr586nfzx",[520,517,417,521,221,223,518,519],{"evaluatedAt":528,"extractAt":529,"updatedAt":530},1778695838272,1778695810823,1778695859266]