跳转到主要内容

Paddleocr 文本识别

技能 已验证 活跃

当用户希望从图像、照片、扫描件、截图或扫描的 PDF 中提取文本时,请使用此技能。返回机器可读的精确字符串,包含行级文本和可选的 bbox 坐标。对 CJK、小字和手写文本具有很高的准确性。触发词:OCR、文字识别、图片转文字、截图识字、提取图中文字、扫描识字、识字、纯文字、plain text extraction、坐标、检测框、bbox、bounding box、image to text、screenshot、photo scan、recognize text。

目的

以高准确性从图像、照片、扫描件、截图或扫描的 PDF 中提取文本,提供机器可读的字符串和可选的坐标数据以供下游处理。

功能

  • 从图像和 PDF 中提取文本
  • 支持 CJK、小字和手写文本
  • 行级文本和可选的 bbox 坐标
  • 处理本地文件和 URL
  • 返回带有错误详情的结构化 JSON 输出

使用场景

  • 从扫描的文档中提取文本以进行数据录入。
  • 从屏幕截图中获取文本以进行分析。
  • 数字化照片中的招牌或文档中的文本。
  • 处理扫描的 PDF 以使其文本可搜索。

非目标

  • 直接从纯文本、代码或 markdown 文件中提取文本。
  • 解析表格、公式或图表等复杂文档布局。
  • 替换直接文本文件读取功能。

安装

npx skills add PaddlePaddle/PaddleOCR

通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。

质量评分

已验证
99 /100
1 day ago 分析

信任信号

最近提交1 day ago
星标77.8k
许可证Apache-2.0
状态
查看源代码

类似扩展

PaddleOCR 文档解析

99

使用此技能可从 PDF 和文档图像中提取结构化 Markdown/JSON — 表格(精确到单元格)、公式(LaTeX 格式)、图形、印章、图表、页眉/页脚、多栏布局和正确的阅读顺序。触发词:文档解析, 版面分析, 版面还原, 表格提取, 公式识别, 多栏排版, 扫描件结构化, 发票, 财报, 复杂 PDF, PDF转Markdown, 图表, 阅读顺序; reading order, formula, LaTeX, layout parsing, structure extraction, PP-StructureV3, PaddleOCR-VL.

技能
PaddlePaddle

Firecrawl Parse

99

Efficiently extract and convert the contents of any local file—such as PDF, DOCX, DOC, ODT, RTF, XLSX, XLS, or HTML—into clean, well-formatted markdown saved to disk. Use this skill whenever the user requests to parse, read, or extract information from a file on their computer, including phrases like “parse this PDF”, “convert this document”, “read this file”, “extract text from”, or when a local file path (not a URL) is provided. This skill offers advanced options like generating AI-powered summaries and answering questions based on the file's content. Prefer this tool over `scrape` when handling local files to deliver precise, structured outputs for downstream tasks.

技能
firecrawl

Document Extraction API

99

Extract structured data from documents using AI-powered field extraction.

技能
iterationlayer

Nutrient Document Processing

98

使用 Nutrient DWS 处理文档。当用户希望从 HTML 或 URL 生成 PDF、转换 Office/图像/PDF、组装或拆分文件包、OCR 扫描件、提取文本/表格/键值对、进行 PII 拟态、添加水印、签名、填充表单、优化 PDF 或生成 PDF/A 或 PDF/UA 等合规性输出时使用。触发器包括转换为 PDF、合并这些 PDF、OCR 此扫描件、提取表格、拟态 PII、签名此 PDF、制作此 PDF/A 或为 Web 交付进行线性化。

技能
PSPDFKit-labs

Generate Restaurant Menu

100

Generate a branded restaurant menu PDF with sections, items, prices, and descriptions.

技能
iterationlayer

Extract Fleet Vehicle Registration

100

Extract vehicle identification, owner details, registration dates, and technical specifications from vehicle registration documents.

技能
iterationlayer