メインコンテンツへスキップ
このコンテンツはお使いの言語にまだ対応していないため、英語で表示されています。

PaddleOCR Document Parsing

Skill 検証済み
98

Use this skill to extract structured Markdown/JSON from PDFs and document images—tables with cell-level precision, formulas as LaTeX, figures, seals, charts, headers/footers, multi-column layout and correct reading order. Trigger terms: 文档解析, 版面分析, 版面还原, 表格提取, 公式识别, 多栏排版, 扫描件结构化, 发票, 财报, 复杂 PDF, PDF转Markdown, 图表, 阅读顺序; reading order, formula, LaTeX, layout parsing, structure extraction, PP-StructureV3, PaddleOCR-VL.

AI サマリー

This skill leverages the PaddleOCR API to parse complex documents, extracting text, tables, formulas, and layout information into structured Markdown or JSON. It supports both local files and URLs, with options for output customization and error handling.

Versioning

  • warning:Release ManagementNo manifest version (SKILL.md, package.json, etc.) or GitHub release tags are present, and installation instructions reference HEAD.

インストール

npx skills add aidenwu0209/paddleocr-skills

Vercel skills CLI(skills.sh)を npx 経由で実行します。ローカルに Node.js と、skills 対応のエージェント(Claude Code、Cursor、Codex など)が少なくとも 1 つインストールされている必要があります。リポジトリが agentskills.io 形式に従っていることを前提としています。

7 days ago
20 stars
Apache-2.0
7 days ago に更新
ソースコードを表示