비용 분석
OpenClaw의 주요 비용은 모델 API 호출의 토큰 소비에서 발생합니다. 비용 구성을 이해하는 것이 최적화의 첫 단계입니다.
openclaw models cost --period 30d --detailed
전략 1: 모델 계층별 사용
모든 요청에 가장 비싼 모델을 사용하지 마세요:
{
"routing": {
"rules": [
{"match": {"contentLength": {"max": 50}}, "model": "fast"},
{"match": {"content": ".*"}, "model": "smart"}
]
}
}
전략 2: 출력 길이 제어
시스템 프롬프트를 통해 모델이 더 간결한 응답을 생성하도록 유도합니다.
전략 3: 컨텍스트 창 최적화
대화 이력은 많은 입력 토큰을 소비합니다. maxHistory, contextStrategy, summaryAfter를 적절히 설정하세요.
전략 4: 캐시 사용
반복성이 높은 Q&A(예: FAQ)에 대해 응답 캐싱을 활성화합니다:
{
"cache": {
"enabled": true,
"ttl": 3600,
"strategy": "semantic",
"similarityThreshold": 0.95
}
}
전략 5: 예산 상한 설정
{
"budget": {
"daily": 10.00,
"monthly": 200.00,
"actions": {
"warning": 0.8,
"downgrade": 0.9,
"stop": 1.0
},
"downgradeModel": "fast"
}
}
전략 6: 로컬 모델 사용
비핵심 시나리오에는 무료 로컬 모델을 사용합니다.
전략 7: 속도 제한
단일 사용자가 과도한 리소스를 소비하는 것을 방지합니다.
정리
비용 최적화의 핵심은 "올바른 시나리오에 올바른 모델을 사용하는 것"입니다. 모델 계층화, 컨텍스트 최적화, 캐싱 및 예산 관리를 조합하면, 서비스 품질을 유지하면서 보통 50-70%의 비용을 절감할 수 있습니다.