📄
PDF Reader
ドキュメント 検索・効率ツールインストールコマンド
npx clawhub@latest install pdf
インストール手順
1
環境確認
Node.js 22以上とOpenClawがインストール済みであることを確認してください。ターミナルでopenclaw --versionを実行して確認できます。
2
インストール実行
上記のインストールコマンドをターミナルで実行します。ClawHubが自動的にPDF Readerを~/.openclaw/skills/ディレクトリにダウンロード・インストールします。
3
インストール確認
openclaw skills listを実行してインストール済みスキル一覧を確認し、PDF Readerが表示されていることを確かめてください。
4
パラメータ設定(任意)
下記の紹介にある設定手順に従い、~/.config/openclaw/openclaw.json5にスキルの設定項目を追加してください。
手動インストール方法:Skillフォルダを
~/.openclaw/skills/またはプロジェクトのskills/ディレクトリにコピーしてください。フォルダ内にSKILL.mdファイルが必要です。
テキスト抽出
表認識
コンテンツQ&A
詳細紹介
PDF Reader スキルにより、OpenClaw は PDF ファイルの内容を直接読み取って理解できるようになり、PDF を「操作不可能な静的ドキュメント」から「対話で質問できる知識ソース」に変えます。
コア機能
- 全文抽出:PDF 内のテキストを完全に抽出し、基本的なフォーマット構造を保持します
- 表認識:PDF 内の表をインテリジェントに認識して構造化データに変換します
- ページ単位の閲読:大容量 PDF ではページ番号範囲を指定して読み取りが可能で、一度に大量のコンテンツを読み込むことを避けられます
- 画像 OCR:スキャン版 PDF では、画像内の文字を OCR で認識します
- 対話型Q&A:PDF 読み取り後、ドキュメント内容に基づいた質疑応答が可能です
設定方法
{
skills: {
pdf: {
ocrEnabled: true, // OCR を有効にするか
maxPages: 50, // 1回の最大処理ページ数
tableExtraction: true // 表抽出
}
}
}
使用シーン
- 学術論文、技術ホワイトペーパーの分析
- 契約書、請求書などのビジネス文書から重要情報を読み取り・抽出する
- 製品マニュアルに対して質疑応答を行う
- 複数の PDF から一括でデータを抽出して集計する
使い方
PDF ファイルを OpenClaw に送信し(チャットプラットフォームのファイル送信機能を使用)、そのまま質問するだけです。ローカル PDF をファイルパスで参照することもできます。