👻
GhostFetch
スクレイピング ブラウザ・自動化インストールコマンド
npx clawhub@latest install ghostfetch
インストール手順
1
環境確認
Node.js 22以上とOpenClawがインストール済みであることを確認してください。ターミナルでopenclaw --versionを実行して確認できます。
2
インストール実行
上記のインストールコマンドをターミナルで実行します。ClawHubが自動的にGhostFetchを~/.openclaw/skills/ディレクトリにダウンロード・インストールします。
3
インストール確認
openclaw skills listを実行してインストール済みスキル一覧を確認し、GhostFetchが表示されていることを確かめてください。
4
パラメータ設定(任意)
下記の紹介にある設定手順に従い、~/.config/openclaw/openclaw.json5にスキルの設定項目を追加してください。
手動インストール方法:Skillフォルダを
~/.openclaw/skills/またはプロジェクトのskills/ディレクトリにコピーしてください。フォルダ内にSKILL.mdファイルが必要です。
軽量スクレイピング
Markdown出力
バッチ処理
詳細紹介
GhostFetch は軽量なウェブコンテンツ抽出スキルで、フルブラウザ自動化よりも高速かつ省リソースで、大量のウェブページ本文を取得する場面に最適です。
コア機能
- 本文抽出:ウェブページの本文エリアを自動認識し、広告やナビゲーションなどの干渉を除去
- Markdown 出力:ウェブコンテンツをクリーンな Markdown 形式に変換
- バッチ取得:複数の URL を一度に入力して並列取得
- メタデータ抽出:タイトル、説明、著者、公開日などのメタ情報を抽出
- 軽量・高効率:HTTP リクエストベースでブラウザ不要、高速かつ低リソース消費
設定方法
{
skills: {
ghostfetch: {
timeout: 10000,
maxConcurrent: 5,
userAgent: "OpenClaw/1.0",
extractImages: false
}
}
}
使用シーン
- ウェブ記事のコンテンツを素早く読む(JS レンダリング不要なページ)
- 複数のウェブページの情報を一括収集して分析
- RAG システムへのウェブコンテンツ入力
- 記事ナレッジベースの構築
Agent Browser との違い
GhostFetch は HTTP リクエストベースで高速ですが、JavaScript レンダリングが必要なページは処理できません。対象ページが SPA(シングルページアプリケーション)やログインが必要な場合は、Agent Browser をお使いください。