PDF Reader - OpenClaw Skill — OpenClawチュートリアル

インストールコマンド

npx clawhub@latest install pdf

インストール手順

環境確認

Node.js 22以上とOpenClawがインストール済みであることを確認してください。ターミナルでopenclaw --versionを実行して確認できます。

インストール実行

上記のインストールコマンドをターミナルで実行します。ClawHubが自動的にPDF Readerを~/.openclaw/skills/ディレクトリにダウンロード・インストールします。

インストール確認

openclaw skills listを実行してインストール済みスキル一覧を確認し、PDF Readerが表示されていることを確かめてください。

パラメータ設定（任意）

下記の紹介にある設定手順に従い、~/.config/openclaw/openclaw.json5にスキルの設定項目を追加してください。

手動インストール方法：Skillフォルダを~/.openclaw/skills/またはプロジェクトのskills/ディレクトリにコピーしてください。フォルダ内にSKILL.mdファイルが必要です。

テキスト抽出表認識コンテンツQ&A

詳細紹介

PDF Reader スキルにより、OpenClaw は PDF ファイルの内容を直接読み取って理解できるようになり、PDF を「操作不可能な静的ドキュメント」から「対話で質問できる知識ソース」に変えます。

コア機能

全文抽出：PDF 内のテキストを完全に抽出し、基本的なフォーマット構造を保持します
表認識：PDF 内の表をインテリジェントに認識して構造化データに変換します
ページ単位の閲読：大容量 PDF ではページ番号範囲を指定して読み取りが可能で、一度に大量のコンテンツを読み込むことを避けられます
画像 OCR：スキャン版 PDF では、画像内の文字を OCR で認識します
対話型Q&A：PDF 読み取り後、ドキュメント内容に基づいた質疑応答が可能です

設定方法

{
  skills: {
    pdf: {
      ocrEnabled: true,     // OCR を有効にするか
      maxPages: 50,         // 1回の最大処理ページ数
      tableExtraction: true // 表抽出
    }
  }
}

使用シーン

学術論文、技術ホワイトペーパーの分析
契約書、請求書などのビジネス文書から重要情報を読み取り・抽出する
製品マニュアルに対して質疑応答を行う
複数の PDF から一括でデータを抽出して集計する

使い方

PDF ファイルを OpenClaw に送信し（チャットプラットフォームのファイル送信機能を使用）、そのまま質問するだけです。ローカル PDF をファイルパスで参照することもできます。

← Skills一覧に戻る