首页 教程 分类 Skills下载 关于
ZH EN JA KO
🔥

Firecrawl

网页抓取 搜索与效率工具

安装命令

npx clawhub@latest install firecrawl

安装说明

1
确认环境

确保已安装 Node.js 22+ 和 OpenClaw。在终端运行 openclaw --version 确认 OpenClaw 正常工作。

2
执行安装

在终端中运行上方安装命令,ClawHub 会自动下载并安装 Firecrawl 到 ~/.openclaw/skills/ 目录。

3
验证安装

运行 openclaw skills list 查看已安装技能列表,确认 Firecrawl 已出现在列表中。

4
配置参数(可选)

根据下方介绍中的配置说明,在 ~/.config/openclaw/openclaw.json5 中添加技能的配置项。

手动安装方式:将 Skill 文件夹复制到 ~/.openclaw/skills/ 或项目目录下的 skills/ 文件夹,确保文件夹中包含 SKILL.md 文件。
网页深度爬取与结构化提取 批量URL抓取与Markdown转换 动态页面渲染与JavaScript执行

详细介绍

Firecrawl 是专为大语言模型设计的网页抓取与数据提取工具,能够将任意网站内容转换为干净、结构化的 Markdown 或 JSON 格式,方便 AI 直接理解和使用。

核心功能

  • 网页抓取(Scrape):输入单个 URL,自动处理 JavaScript 渲染、反爬机制,返回干净的 Markdown 内容,剥离导航栏、广告等无关元素
  • 站点爬取(Crawl):从入口 URL 出发,自动发现并爬取整个站点的所有子页面,支持设置爬取深度和页面数量限制
  • 数据提取(Extract):根据自定义 Schema 从网页中提取结构化数据,支持 JSON Schema 定义字段和类型
  • 批量处理:支持同时提交多个 URL 进行批量抓取,异步执行并返回结果

配置说明

{
  "mcpServers": {
    "firecrawl": {
      "command": "npx",
      "args": ["-y", "firecrawl-mcp"],
      "env": {
        "FIRECRAWL_API_KEY": "fc-your-api-key"  // 从 firecrawl.dev 获取
      }
    }
  }
}

使用场景

  • 构建 RAG 知识库:批量抓取文档站点,将内容转为向量数据库可索引的格式
  • 竞品分析:爬取竞品网站提取产品信息和定价数据
  • 内容聚合:从多个新闻源抓取文章并结构化存储
  • 数据采集:从电商网站提取商品名称、价格、评分等字段