Paddleocr 文本识别
技能 已验证 活跃当用户希望从图像、照片、扫描件、截图或扫描的 PDF 中提取文本时,请使用此技能。返回机器可读的精确字符串,包含行级文本和可选的 bbox 坐标。对 CJK、小字和手写文本具有很高的准确性。触发词:OCR、文字识别、图片转文字、截图识字、提取图中文字、扫描识字、识字、纯文字、plain text extraction、坐标、检测框、bbox、bounding box、image to text、screenshot、photo scan、recognize text。
以高准确性从图像、照片、扫描件、截图或扫描的 PDF 中提取文本,提供机器可读的字符串和可选的坐标数据以供下游处理。
功能
- 从图像和 PDF 中提取文本
- 支持 CJK、小字和手写文本
- 行级文本和可选的 bbox 坐标
- 处理本地文件和 URL
- 返回带有错误详情的结构化 JSON 输出
使用场景
- 从扫描的文档中提取文本以进行数据录入。
- 从屏幕截图中获取文本以进行分析。
- 数字化照片中的招牌或文档中的文本。
- 处理扫描的 PDF 以使其文本可搜索。
非目标
- 直接从纯文本、代码或 markdown 文件中提取文本。
- 解析表格、公式或图表等复杂文档布局。
- 替换直接文本文件读取功能。
安装
npx skills add PaddlePaddle/PaddleOCR通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。
质量评分
已验证类似扩展
PaddleOCR 文档解析
99使用此技能可从 PDF 和文档图像中提取结构化 Markdown/JSON — 表格(精确到单元格)、公式(LaTeX 格式)、图形、印章、图表、页眉/页脚、多栏布局和正确的阅读顺序。触发词:文档解析, 版面分析, 版面还原, 表格提取, 公式识别, 多栏排版, 扫描件结构化, 发票, 财报, 复杂 PDF, PDF转Markdown, 图表, 阅读顺序; reading order, formula, LaTeX, layout parsing, structure extraction, PP-StructureV3, PaddleOCR-VL.
Firecrawl Parse
99Efficiently extract and convert the contents of any local file—such as PDF, DOCX, DOC, ODT, RTF, XLSX, XLS, or HTML—into clean, well-formatted markdown saved to disk. Use this skill whenever the user requests to parse, read, or extract information from a file on their computer, including phrases like “parse this PDF”, “convert this document”, “read this file”, “extract text from”, or when a local file path (not a URL) is provided. This skill offers advanced options like generating AI-powered summaries and answering questions based on the file's content. Prefer this tool over `scrape` when handling local files to deliver precise, structured outputs for downstream tasks.
Document Extraction API
99Extract structured data from documents using AI-powered field extraction.
Nutrient Document Processing
98使用 Nutrient DWS 处理文档。当用户希望从 HTML 或 URL 生成 PDF、转换 Office/图像/PDF、组装或拆分文件包、OCR 扫描件、提取文本/表格/键值对、进行 PII 拟态、添加水印、签名、填充表单、优化 PDF 或生成 PDF/A 或 PDF/UA 等合规性输出时使用。触发器包括转换为 PDF、合并这些 PDF、OCR 此扫描件、提取表格、拟态 PII、签名此 PDF、制作此 PDF/A 或为 Web 交付进行线性化。
Generate Restaurant Menu
100Generate a branded restaurant menu PDF with sections, items, prices, and descriptions.
Extract Fleet Vehicle Registration
100Extract vehicle identification, owner details, registration dates, and technical specifications from vehicle registration documents.