튜토리얼 카테고리 Skills 소개
ZH EN JA KO
스킬 플러그인

OpenClaw 이미지 생성 스킬 설정

· 8 분 소요

개요

이미지 생성은 AI 에이전트의 가장 인기 있는 기능 중 하나입니다. OpenClaw은 스킬 플러그인 시스템을 통해 다양한 AI 그림 생성 서비스 통합을 지원하여, 에이전트가 사용자의 텍스트 설명을 기반으로 이미지를 생성할 수 있습니다. 이 글에서는 OpenClaw에서 이미지 생성 스킬을 설정하고 최적화하는 방법을 소개합니다.

스킬 아키텍처

이미지 생성 스킬은 OpenClaw 도구 시스템의 일부로, 7단계 도구 파이프라인에서 등록 및 관리됩니다. canvas 내장 도구의 그래픽 처리 기능과 외부 AI 그림 생성 API의 생성 기능을 결합합니다.

Pi SDK의 직접 임베딩 특성 덕분에 이미지 생성의 호출 체인이 더 짧아집니다. 사용자 요청부터 API 호출까지 동일한 런타임 내에서 완료되며, 프로세스 간 통신이 필요하지 않습니다.

지원 생성 서비스

OpenAI DALL-E

skills:
  imageGen:
    provider: openai
    model: dall-e-3
    apiKey: ${OPENAI_API_KEY}
    defaultSize: "1024x1024"
    defaultQuality: standard
    defaultStyle: vivid

Stable Diffusion (로컬 또는 원격)

skills:
  imageGen:
    provider: stable-diffusion
    endpoint: "http://localhost:7860/sdapi/v1/txt2img"
    defaultSteps: 30
    defaultSampler: "DPM++ 2M Karras"
    defaultSize: "512x512"
    defaultCfgScale: 7

Midjourney (프록시를 통해)

skills:
  imageGen:
    provider: midjourney
    proxyEndpoint: "https://mj-proxy.example.com"
    apiKey: ${MJ_API_KEY}
    defaultAspectRatio: "1:1"

설정 상세 설명

기본 매개변수

  • provider: 이미지 생성 서비스 제공업체
  • apiKey: API 인증 키(환경 변수 참조 사용 권장)
  • defaultSize: 기본 이미지 크기
  • maxGenerationsPerDay: 일일 최대 생성 횟수(비용 제어)
  • outputFormat: 출력 포맷(png / jpg / webp)

프롬프트 번역

대부분의 이미지 생성 모델이 영어 프롬프트에서 최상의 효과를 발휘하므로, OpenClaw에는 프롬프트 번역 기능이 내장되어 있습니다. 사용자가 다른 언어로 요구 사항을 설명하면, AI 에이전트가 먼저 설명을 영어로 번역한 후 프롬프트로 생성 서비스에 전송합니다.

skills:
  imageGen:
    promptTranslation:
      enabled: true
      targetLanguage: en
      enhancePrompt: true

enhancePrompt를 활성화하면, AI 에이전트가 번역뿐만 아니라 그림 생성 모범 사례에 따라 프롬프트를 최적화합니다. 화질 설명, 스타일 키워드, 조명 설명 등을 추가합니다.

네거티브 프롬프트

전역 네거티브 프롬프트를 설정하여 모든 생성 요청에 자동으로 첨부할 수 있습니다:

skills:
  imageGen:
    negativePrompt: "low quality, blurry, watermark, text, deformed"

채널 적응

각 채널은 이미지를 다르게 처리하며, 이미지 생성 스킬은 채널 유형에 따라 자동으로 적응합니다.

Discord

생성된 이미지는 임베드 메시지(Embed) 형태로 전송되며, 프롬프트 설명과 생성 매개변수가 첨부됩니다. discord_embed 채널 도구와 함께 사용하면 "재생성" 버튼도 추가할 수 있습니다.

Telegram

이미지가 사진 메시지로 직접 전송됩니다. Telegram은 큰 이미지를 자동으로 압축하므로, 원본 품질을 유지하려면 파일 형태로 전송하도록 설정할 수 있습니다.

Slack

Slack의 파일 업로드 API를 통해 이미지를 전송하며, 접근성 향상을 위해 alt text가 자동으로 첨부됩니다.

WhatsApp

이미지가 미디어 메시지로 전송되며, WhatsApp의 파일 크기 제한(최대 16MB)을 따릅니다.

이미지 처리 파이프라인

생성된 이미지는 전송 전에 처리 파이프라인을 거칠 수 있습니다:

  1. 크기 조정: 대상 채널에 따라 자동 스케일링
  2. 포맷 변환: 채널에 가장 적합한 포맷으로 변환
  3. 워터마크 추가: 선택적으로 커스텀 워터마크 추가
  4. 메타데이터 삽입: 생성 매개변수를 이미지 EXIF 데이터에 기록
  5. 콘텐츠 심사: 선택적 NSFW 감지로 부적절한 콘텐츠 필터링
skills:
  imageGen:
    pipeline:
      resize: auto
      format: auto
      watermark:
        enabled: false
        text: "Generated by OpenClaw"
      contentFilter:
        enabled: true
        strictness: medium

세션 내 이미지 관리

생성된 이미지는 세션에 바인딩됩니다. 세션이 JSONL 형식으로 영구 저장될 때, 이미지의 참조 경로와 메타데이터가 기록되지만 이미지 파일 자체는 별도의 파일 스토리지에 저장됩니다.

세션 압축(compaction) 수행 시, 오래된 이미지 참조가 정리될 수 있습니다. imageRetentionDays 설정으로 이미지 보존 기간을 제어할 수 있습니다.

비용 제어

AI 이미지 생성은 일반적으로 건당 과금되며, OpenClaw은 다양한 비용 제어 메커니즘을 제공합니다:

  • 일일 쿼터: 하루 생성 횟수 제한
  • 사용자 쿼터: 각 사용자에 대한 독립적인 사용 한도 설정
  • 채널 쿼터: 채널별 생성 빈도 제어
  • 캐시: 동일한 프롬프트를 단기간 내에 중복 생성하지 않음
skills:
  imageGen:
    quotas:
      daily: 100
      perUser: 10
      perChannel: 30
    cache:
      enabled: true
      ttl: 3600

다른 도구와의 협업

이미지 생성 스킬은 OpenClaw의 다른 도구와 연동할 수 있습니다:

  • browser + imageGen: 먼저 웹페이지에서 참조 자료를 가져온 후 참조를 기반으로 이미지 생성
  • cron + imageGen: 정기적으로 이미지 생성(예: 일일 배경화면 추천)
  • canvas + imageGen: 생성된 이미지에 대한 2차 편집 및 주석 작업

문제 해결

일반적인 문제와 해결 방법:

  1. 생성 타임아웃: 이미지 생성에는 보통 10-30초가 소요되므로, 타임아웃 설정이 충분히 길어야 합니다
  2. API 속도 제한: 요청 큐와 재시도 로직을 추가합니다
  3. 콘텐츠 거부: 프롬프트를 조정하거나 콘텐츠 정책을 확인합니다
  4. 이미지 품질 저하: enhancePrompt를 활성화하거나 생성 매개변수를 조정합니다

정리

OpenClaw의 이미지 생성 스킬은 AI 그림 생성 기능을 대화 경험에 자연스럽게 통합합니다. 유연한 서비스 제공업체 설정, 지능적인 프롬프트 최적화 및 완벽한 비용 제어를 통해 사용자에게 편리하고 효율적인 이미지 창작 도구를 제공합니다.

OpenClaw는 무료 오픈소스 개인 AI 어시스턴트로, WhatsApp, Telegram, Discord 등 다양한 플랫폼을 지원합니다