📄
PDF Reader
文档 搜索与效率工具安装命令
npx clawhub@latest install pdf
安装说明
1
确认环境
确保已安装 Node.js 22+ 和 OpenClaw。在终端运行 openclaw --version 确认 OpenClaw 正常工作。
2
执行安装
在终端中运行上方安装命令,ClawHub 会自动下载并安装 PDF Reader 到 ~/.openclaw/skills/ 目录。
3
验证安装
运行 openclaw skills list 查看已安装技能列表,确认 PDF Reader 已出现在列表中。
4
配置参数(可选)
根据下方介绍中的配置说明,在 ~/.config/openclaw/openclaw.json5 中添加技能的配置项。
手动安装方式:将 Skill 文件夹复制到
~/.openclaw/skills/ 或项目目录下的 skills/ 文件夹,确保文件夹中包含 SKILL.md 文件。
文本提取
表格识别
内容问答
详细介绍
PDF Reader 技能让 OpenClaw 能够直接读取和理解 PDF 文件的内容,把 PDF 从「不可交互的静态文档」变成「可以对话问答的知识源」。
核心功能
- 全文提取:将 PDF 中的文本完整提取出来,保留基本格式结构
- 表格识别:智能识别 PDF 中的表格并转为结构化数据
- 分页阅读:对于大型 PDF 支持按页码范围读取,避免一次性加载过多内容
- 图片 OCR:对于扫描版 PDF,支持 OCR 识别图片中的文字内容
- 对话问答:读取 PDF 后可以基于文档内容进行问答
配置说明
{
skills: {
pdf: {
ocrEnabled: true, // 是否启用 OCR
maxPages: 50, // 单次最大处理页数
tableExtraction: true // 表格提取
}
}
}
使用场景
- 分析学术论文、技术白皮书
- 读取和提取合同、发票等商业文档中的关键信息
- 对产品手册进行问答
- 批量提取多个 PDF 中的数据进行汇总
使用方法
将 PDF 文件发送给 OpenClaw(通过聊天平台的文件发送功能),然后直接提问即可。也可以通过文件路径引用本地 PDF。