首页 教程 分类 Skills下载 关于
ZH EN JA KO
模型接入

Together AI 模型接入教程

· 8 分钟

Together AI 简介

Together AI 是一个专注于开源模型推理的云平台,提供 Llama、Mixtral、Qwen 等主流开源模型的托管推理服务。其 API 完全兼容 OpenAI 格式,价格通常低于闭源模型,是 OpenClaw 的性价比之选。

获取 API Key

  1. 访问 api.together.ai 注册账号
  2. 新用户通常赠送免费额度
  3. 在 Settings → API Keys 中获取 API Key

基础配置

{
  "providers": {
    "together": {
      "type": "openai",
      "baseUrl": "https://api.together.xyz/v1",
      "apiKey": "{{TOGETHER_API_KEY}}",
      "models": [
        "meta-llama/Llama-3.1-70B-Instruct-Turbo",
        "meta-llama/Llama-3.1-8B-Instruct-Turbo",
        "mistralai/Mixtral-8x22B-Instruct-v0.1",
        "Qwen/Qwen2.5-72B-Instruct-Turbo"
      ]
    }
  }
}

设置密钥:

openclaw secrets set TOGETHER_API_KEY "your-together-api-key"

推荐模型

Together AI 上的热门模型:

模型 参数量 特点
Llama-3.1-70B-Instruct-Turbo 70B 通用能力强
Llama-3.1-8B-Instruct-Turbo 8B 快速经济
Mixtral-8x22B-Instruct-v0.1 MoE 性价比高
Qwen2.5-72B-Instruct-Turbo 72B 中文能力强
DeepSeek-V3 671B 推理能力强

模型配置

{
  "models": {
    "together-smart": {
      "provider": "together",
      "model": "meta-llama/Llama-3.1-70B-Instruct-Turbo",
      "temperature": 0.7,
      "maxTokens": 4096
    },
    "together-fast": {
      "provider": "together",
      "model": "meta-llama/Llama-3.1-8B-Instruct-Turbo",
      "temperature": 0.5,
      "maxTokens": 2048
    },
    "together-chinese": {
      "provider": "together",
      "model": "Qwen/Qwen2.5-72B-Instruct-Turbo",
      "temperature": 0.7,
      "maxTokens": 4096
    }
  }
}

频道分配

{
  "channels": {
    "telegram-main": {
      "model": "together-smart"
    },
    "wechat-group": {
      "model": "together-chinese"
    },
    "discord-quick": {
      "model": "together-fast"
    }
  }
}

使用 JSON 模式

Together AI 支持 JSON 输出模式:

{
  "models": {
    "together-json": {
      "provider": "together",
      "model": "meta-llama/Llama-3.1-70B-Instruct-Turbo",
      "responseFormat": {"type": "json_object"},
      "temperature": 0.3
    }
  }
}

函数调用支持

部分模型支持函数调用,可与 OpenClaw 工具配合:

{
  "models": {
    "together-tools": {
      "provider": "together",
      "model": "meta-llama/Llama-3.1-70B-Instruct-Turbo",
      "supportsFunctionCalling": true
    }
  }
}

成本优化

Together AI 的计费按 Token 数量计算,利用以下策略降低成本:

  1. 使用 Turbo 版本:带 Turbo 后缀的模型推理速度更快、单价更低
  2. 小模型处理简单任务:8B 模型足以应对日常问答
  3. 设置 maxTokens 上限:避免不必要的长输出
{
  "providers": {
    "together": {
      "costTracking": true,
      "dailyBudget": 5.00,
      "alertThreshold": 0.8
    }
  }
}

与其他供应商搭配

将 Together AI 作为备用供应商:

{
  "models": {
    "main-model": {
      "provider": "openai",
      "model": "gpt-4o",
      "fallback": "together-smart"
    }
  }
}

连接测试

openclaw doctor --provider together

常见问题

Q: Turbo 和非 Turbo 模型有什么区别? Turbo 版本使用了量化和推理优化,速度更快价格更低,但精度略有下降。对于大多数场景足够使用。

Q: 模型名称在哪查? 在 Together AI 的 Models 页面 可以查看所有可用模型及其完整名称。

Q: 支持 embedding 模型吗? 支持,Together AI 提供多种 embedding 模型,可用于 OpenClaw 的向量记忆功能。

总结

Together AI 提供了丰富的开源模型选择和极具竞争力的价格,是 OpenClaw 多模型策略中不可或缺的一员。特别适合对成本敏感但又需要大模型能力的场景。

OpenClaw 是开源免费的个人AI助手,支持 WhatsApp、Telegram、Discord 等多平台接入