首页 教程 分类 Skills下载 关于
ZH EN JA KO
👻

GhostFetch

抓取 浏览器与自动化

安装命令

npx clawhub@latest install ghostfetch

安装说明

1
确认环境

确保已安装 Node.js 22+ 和 OpenClaw。在终端运行 openclaw --version 确认 OpenClaw 正常工作。

2
执行安装

在终端中运行上方安装命令,ClawHub 会自动下载并安装 GhostFetch 到 ~/.openclaw/skills/ 目录。

3
验证安装

运行 openclaw skills list 查看已安装技能列表,确认 GhostFetch 已出现在列表中。

4
配置参数(可选)

根据下方介绍中的配置说明,在 ~/.config/openclaw/openclaw.json5 中添加技能的配置项。

手动安装方式:将 Skill 文件夹复制到 ~/.openclaw/skills/ 或项目目录下的 skills/ 文件夹,确保文件夹中包含 SKILL.md 文件。
轻量抓取 Markdown输出 批量处理

详细介绍

GhostFetch 是一个轻量级的网页内容提取技能,比完整的浏览器自动化更快速、更省资源,适合需要大量抓取网页正文的场景。

核心功能

  • 正文提取:自动识别网页正文区域,去除广告、导航等干扰内容
  • Markdown 输出:将网页内容转为干净的 Markdown 格式
  • 批量抓取:一次性传入多个 URL,并行抓取
  • 元数据提取:提取标题、描述、作者、发布日期等元信息
  • 轻量高效:基于 HTTP 请求而非浏览器,速度快,资源占用低

配置说明

{
  skills: {
    ghostfetch: {
      timeout: 10000,
      maxConcurrent: 5,
      userAgent: "OpenClaw/1.0",
      extractImages: false
    }
  }
}

使用场景

  • 快速阅读网页文章内容(不需要 JS 渲染的页面)
  • 批量收集多个网页的信息做汇总分析
  • 为 RAG 系统提供网页内容输入
  • 建立文章知识库

与 Agent Browser 的区别

GhostFetch 基于 HTTP 请求,速度快但无法处理需要 JavaScript 渲染的页面。如果目标页面是单页应用(SPA)或需要登录,请使用 Agent Browser。