ホーム チュートリアル カテゴリ Skills サイトについて
ZH EN JA KO
📄

PDF Reader

ドキュメント 検索・効率ツール

インストールコマンド

npx clawhub@latest install pdf

インストール手順

1
環境確認

Node.js 22以上とOpenClawがインストール済みであることを確認してください。ターミナルでopenclaw --versionを実行して確認できます。

2
インストール実行

上記のインストールコマンドをターミナルで実行します。ClawHubが自動的にPDF Readerを~/.openclaw/skills/ディレクトリにダウンロード・インストールします。

3
インストール確認

openclaw skills listを実行してインストール済みスキル一覧を確認し、PDF Readerが表示されていることを確かめてください。

4
パラメータ設定(任意)

下記の紹介にある設定手順に従い、~/.config/openclaw/openclaw.json5にスキルの設定項目を追加してください。

手動インストール方法:Skillフォルダを~/.openclaw/skills/またはプロジェクトのskills/ディレクトリにコピーしてください。フォルダ内にSKILL.mdファイルが必要です。
テキスト抽出 表認識 コンテンツQ&A

詳細紹介

PDF Reader スキルにより、OpenClaw は PDF ファイルの内容を直接読み取って理解できるようになり、PDF を「操作不可能な静的ドキュメント」から「対話で質問できる知識ソース」に変えます。

コア機能

  • 全文抽出:PDF 内のテキストを完全に抽出し、基本的なフォーマット構造を保持します
  • 表認識:PDF 内の表をインテリジェントに認識して構造化データに変換します
  • ページ単位の閲読:大容量 PDF ではページ番号範囲を指定して読み取りが可能で、一度に大量のコンテンツを読み込むことを避けられます
  • 画像 OCR:スキャン版 PDF では、画像内の文字を OCR で認識します
  • 対話型Q&A:PDF 読み取り後、ドキュメント内容に基づいた質疑応答が可能です

設定方法

{
  skills: {
    pdf: {
      ocrEnabled: true,     // OCR を有効にするか
      maxPages: 50,         // 1回の最大処理ページ数
      tableExtraction: true // 表抽出
    }
  }
}

使用シーン

  • 学術論文、技術ホワイトペーパーの分析
  • 契約書、請求書などのビジネス文書から重要情報を読み取り・抽出する
  • 製品マニュアルに対して質疑応答を行う
  • 複数の PDF から一括でデータを抽出して集計する

使い方

PDF ファイルを OpenClaw に送信し(チャットプラットフォームのファイル送信機能を使用)、そのまま質問するだけです。ローカル PDF をファイルパスで参照することもできます。