👻
GhostFetch
抓取 浏览器与自动化安装命令
npx clawhub@latest install ghostfetch
安装说明
1
确认环境
确保已安装 Node.js 22+ 和 OpenClaw。在终端运行 openclaw --version 确认 OpenClaw 正常工作。
2
执行安装
在终端中运行上方安装命令,ClawHub 会自动下载并安装 GhostFetch 到 ~/.openclaw/skills/ 目录。
3
验证安装
运行 openclaw skills list 查看已安装技能列表,确认 GhostFetch 已出现在列表中。
4
配置参数(可选)
根据下方介绍中的配置说明,在 ~/.config/openclaw/openclaw.json5 中添加技能的配置项。
手动安装方式:将 Skill 文件夹复制到
~/.openclaw/skills/ 或项目目录下的 skills/ 文件夹,确保文件夹中包含 SKILL.md 文件。
轻量抓取
Markdown输出
批量处理
详细介绍
GhostFetch 是一个轻量级的网页内容提取技能,比完整的浏览器自动化更快速、更省资源,适合需要大量抓取网页正文的场景。
核心功能
- 正文提取:自动识别网页正文区域,去除广告、导航等干扰内容
- Markdown 输出:将网页内容转为干净的 Markdown 格式
- 批量抓取:一次性传入多个 URL,并行抓取
- 元数据提取:提取标题、描述、作者、发布日期等元信息
- 轻量高效:基于 HTTP 请求而非浏览器,速度快,资源占用低
配置说明
{
skills: {
ghostfetch: {
timeout: 10000,
maxConcurrent: 5,
userAgent: "OpenClaw/1.0",
extractImages: false
}
}
}
使用场景
- 快速阅读网页文章内容(不需要 JS 渲染的页面)
- 批量收集多个网页的信息做汇总分析
- 为 RAG 系统提供网页内容输入
- 建立文章知识库
与 Agent Browser 的区别
GhostFetch 基于 HTTP 请求,速度快但无法处理需要 JavaScript 渲染的页面。如果目标页面是单页应用(SPA)或需要登录,请使用 Agent Browser。