🔥
Firecrawl
Webスクレイピング 検索・効率ツールインストールコマンド
npx clawhub@latest install firecrawl
インストール手順
1
環境確認
Node.js 22以上とOpenClawがインストール済みであることを確認してください。ターミナルでopenclaw --versionを実行して確認できます。
2
インストール実行
上記のインストールコマンドをターミナルで実行します。ClawHubが自動的にFirecrawlを~/.openclaw/skills/ディレクトリにダウンロード・インストールします。
3
インストール確認
openclaw skills listを実行してインストール済みスキル一覧を確認し、Firecrawlが表示されていることを確かめてください。
4
パラメータ設定(任意)
下記の紹介にある設定手順に従い、~/.config/openclaw/openclaw.json5にスキルの設定項目を追加してください。
手動インストール方法:Skillフォルダを
~/.openclaw/skills/またはプロジェクトのskills/ディレクトリにコピーしてください。フォルダ内にSKILL.mdファイルが必要です。
Webページの深層クロールと構造化抽出
一括URLスクレイピングとMarkdown変換
動的ページレンダリングとJavaScript実行
詳細紹介
Firecrawl は大規模言語モデル向けに設計されたWebスクレイピングおよびデータ抽出ツールで、あらゆるウェブサイトのコンテンツをクリーンで構造化された Markdown や JSON 形式に変換し、AIが直接理解・活用できるようにします。
コア機能
- Webスクレイピング(Scrape):単一のURLを入力するだけで、JavaScriptレンダリングやアンチスクレイピング対策を自動処理し、ナビゲーションバーや広告などの不要な要素を除去したクリーンなMarkdownコンテンツを返します
- サイトクロール(Crawl):エントリーURLから出発し、サイト全体のサブページを自動的に発見・クロールします。クロール深度やページ数の制限を設定できます
- データ抽出(Extract):カスタムSchemaに基づいてWebページから構造化データを抽出します。JSON Schemaでフィールドと型を定義できます
- バッチ処理:複数のURLを同時に送信して一括スクレイピングを行い、非同期で実行して結果を返します
設定方法
{
"mcpServers": {
"firecrawl": {
"command": "npx",
"args": ["-y", "firecrawl-mcp"],
"env": {
"FIRECRAWL_API_KEY": "fc-your-api-key" // firecrawl.dev から取得
}
}
}
}
活用シーン
- RAGナレッジベースの構築:ドキュメントサイトを一括スクレイピングし、ベクトルデータベースでインデックス可能な形式に変換します
- 競合分析:競合サイトをクロールして製品情報や価格データを抽出します
- コンテンツ集約:複数のニュースソースから記事をスクレイピングし、構造化して保存します
- データ収集:ECサイトから商品名、価格、評価などのフィールドを抽出します