ホーム チュートリアル カテゴリ Skills サイトについて
ZH EN JA KO
👻

GhostFetch

スクレイピング ブラウザ・自動化

インストールコマンド

npx clawhub@latest install ghostfetch

インストール手順

1
環境確認

Node.js 22以上とOpenClawがインストール済みであることを確認してください。ターミナルでopenclaw --versionを実行して確認できます。

2
インストール実行

上記のインストールコマンドをターミナルで実行します。ClawHubが自動的にGhostFetchを~/.openclaw/skills/ディレクトリにダウンロード・インストールします。

3
インストール確認

openclaw skills listを実行してインストール済みスキル一覧を確認し、GhostFetchが表示されていることを確かめてください。

4
パラメータ設定(任意)

下記の紹介にある設定手順に従い、~/.config/openclaw/openclaw.json5にスキルの設定項目を追加してください。

手動インストール方法:Skillフォルダを~/.openclaw/skills/またはプロジェクトのskills/ディレクトリにコピーしてください。フォルダ内にSKILL.mdファイルが必要です。
軽量スクレイピング Markdown出力 バッチ処理

詳細紹介

GhostFetch は軽量なウェブコンテンツ抽出スキルで、フルブラウザ自動化よりも高速かつ省リソースで、大量のウェブページ本文を取得する場面に最適です。

コア機能

  • 本文抽出:ウェブページの本文エリアを自動認識し、広告やナビゲーションなどの干渉を除去
  • Markdown 出力:ウェブコンテンツをクリーンな Markdown 形式に変換
  • バッチ取得:複数の URL を一度に入力して並列取得
  • メタデータ抽出:タイトル、説明、著者、公開日などのメタ情報を抽出
  • 軽量・高効率:HTTP リクエストベースでブラウザ不要、高速かつ低リソース消費

設定方法

{
  skills: {
    ghostfetch: {
      timeout: 10000,
      maxConcurrent: 5,
      userAgent: "OpenClaw/1.0",
      extractImages: false
    }
  }
}

使用シーン

  • ウェブ記事のコンテンツを素早く読む(JS レンダリング不要なページ)
  • 複数のウェブページの情報を一括収集して分析
  • RAG システムへのウェブコンテンツ入力
  • 記事ナレッジベースの構築

Agent Browser との違い

GhostFetch は HTTP リクエストベースで高速ですが、JavaScript レンダリングが必要なページは処理できません。対象ページが SPA(シングルページアプリケーション)やログインが必要な場合は、Agent Browser をお使いください。