メインコンテンツへスキップ
このコンテンツはお使いの言語にまだ対応していないため、英語で表示されています。

PaddleOCR Text Recognition

Skill 検証済み
95

Use this skill whenever the user wants text extracted from images, photos, scans, screenshots, or scanned PDFs. Returns exact machine-readable strings with line-level text and optional bbox coordinates. Strong accuracy for CJK, small print, and handwritten text. Trigger terms: OCR, 文字识别, 图片转文字, 截图识字, 提取图中文字, 扫描识字, 识字, 纯文字, plain text extraction, 坐标, 检测框, bbox, bounding box, image to text, screenshot, photo scan, recognize text.

AI サマリー

This skill leverages the PaddleOCR API to perform optical character recognition on images and PDF documents. It returns extracted text with optional line-level bounding box coordinates, supporting various file types and providing detailed error handling and configuration guidance.

Versioning

  • warning:Release ManagementNo explicit versioning information (e.g., a version field in SKILL.md or package.json, or a CHANGELOG) is present for the skill itself. The README references a specific commit hash from the upstream repository.

インストール

npx skills add aidenwu0209/paddleocr-skills

Vercel skills CLI(skills.sh)を npx 経由で実行します。ローカルに Node.js と、skills 対応のエージェント(Claude Code、Cursor、Codex など)が少なくとも 1 つインストールされている必要があります。リポジトリが agentskills.io 形式に従っていることを前提としています。

2 days ago
20 stars
Apache-2.0
2 days ago に更新
ソースコードを表示