Moonshot AI와 Kimi 대규모 언어 모델
월지암면(Moonshot AI)은 중국의 선도적인 AI 기업 중 하나로, 그 플래그십 제품인 Kimi는 초장문 컨텍스트 윈도우로 유명합니다. Kimi는 수십만 Token에 달하는 입력을 처리할 수 있어, 긴 문서 분석, 다중 턴 심층 대화 등의 시나리오에서 독특한 강점을 가지고 있습니다.
OpenClaw은 Moonshot AI를 모델 제공자로 네이티브 지원합니다. OpenClaw에서 Kimi 시리즈 모델을 직접 호출하여, 강력한 장문 컨텍스트 처리 능력을 활용할 수 있습니다.
Moonshot API 키 발급
- Moonshot AI의 개방 플랫폼(platform.moonshot.cn)에 접속하여 계정을 등록합니다.
- 실명 인증을 완료합니다(플랫폼 요구 시).
- API 관리 페이지에서 새 API 키를 생성합니다.
- 키를 안전하게 보관합니다. 이후 설정에 필요한 핵심 정보입니다.
Moonshot은 보통 신규 사용자에게 무료 할당량을 제공하여, 초기 테스트와 평가를 진행할 수 있습니다.
Onboard로 빠른 설정
openclaw onboard
Moonshot AI를 모델 제공자로 선택하고, API 키를 입력한 후 기본 모델을 선택합니다. 가이드 도구가 올바른 설정 파일을 자동으로 생성합니다.
수동 설정
openclaw.json에서 수동으로 설정합니다:
{
"agents": {
"defaults": {
"model": {
"primary": "moonshot/moonshot-v1-128k"
}
}
}
}
인증 설정
{
"providers": {
"moonshot": {
"auth": [
{
"key": "Moonshot API 키"
}
]
}
}
}
다중 키 순환 설정 지원:
{
"providers": {
"moonshot": {
"auth": [
{ "key": "키A", "profile": "기본 계정" },
{ "key": "키B", "profile": "백업 계정" }
]
}
}
}
OpenClaw의 다중 계정 인증 메커니즘은 기본 키가 속도 제한에 걸리면 자동으로 백업 키로 전환합니다. 실패한 키는 쿨다운 상태에 들어가며, 쿨다운이 끝나면 자동으로 사용이 복구됩니다.
사용 가능한 모델
Moonshot AI는 다양한 컨텍스트 길이의 모델 버전을 제공합니다:
- moonshot/moonshot-v1-8k: 8K 컨텍스트 윈도우, 짧은 대화와 간단한 문답에 적합하며, 응답 속도가 빠르고 비용이 가장 낮습니다.
- moonshot/moonshot-v1-32k: 32K 컨텍스트 윈도우, 중간 길이의 문서 처리와 다중 턴 대화에 적합합니다.
- moonshot/moonshot-v1-128k: 128K 컨텍스트 윈도우, 플래그십 모델로 초장문 문서 분석과 복잡한 대화에 적합합니다.
모델 선택 시 핵심 고려 요소는 컨텍스트 요구사항입니다. 사용 시나리오에 긴 텍스트가 관련되지 않으면, 더 작은 컨텍스트 버전을 선택하여 더 빠른 응답 속도와 더 낮은 비용을 얻을 수 있습니다.
장문 컨텍스트 시나리오 실전
Moonshot의 128K 컨텍스트 윈도우는 다음 시나리오에 특히 적합합니다:
- 장문 문서 문답: 논문, 보고서 또는 계약서 전체를 업로드하여 전문을 기반으로 직접 문답합니다.
- 다중 턴 심층 대화: 이전 컨텍스트를 잃지 않고 수십 턴의 연속 대화를 진행합니다.
- 코드 리뷰: 여러 코드 파일을 한 번에 전달하여 전체적인 리뷰와 분석을 수행합니다.
- 회의록 생성: 긴 회의의 완전한 녹취 텍스트를 처리하여 구조화된 회의록을 생성합니다.
장애 조치 설정
{
"agents": {
"defaults": {
"model": {
"primary": "moonshot/moonshot-v1-128k",
"fallback": "qwen/qwen-long"
}
}
}
}
Qwen의 장문 컨텍스트 모델을 백업으로 사용하는 것은 합리적인 장애 조치 전략입니다. 두 모델 모두 우수한 중국어 능력과 장문 컨텍스트 지원을 갖추고 있습니다.
사용 권장사항
- 컨텍스트 길이를 합리적으로 선택하세요: 기본적으로 128K 버전을 사용하지 마세요. 대부분의 일상 대화는 8K 또는 32K로 충분하며, 더 작은 컨텍스트 윈도우를 사용하면 비용과 지연을 크게 줄일 수 있습니다.
- 속도 제한에 주의하세요: Moonshot의 API에는 동시 접속 및 RPM 제한이 있으므로, 높은 빈도의 호출 시나리오에서는 여러 API 키를 설정하는 것을 권장합니다.
- 중국어 우선: Kimi 모델은 중국어 이해 및 생성에 대규모 최적화가 이루어져 있어, 중국어 시나리오에서의 성능이 보통 영어 시나리오보다 우수합니다.
설정 검증
설정 완료 후 테스트 메시지를 보냅니다. 긴 텍스트를 보내 모델에 요약을 요청하여 장문 컨텍스트 기능이 정상 작동하는지 검증할 수 있습니다. OpenClaw 로그를 확인하여 요청이 Moonshot 제공자로 올바르게 라우팅되었는지 확인합니다.
이상으로 OpenClaw에 월지암면의 Kimi 대규모 언어 모델을 성공적으로 통합했습니다. 장문 컨텍스트 능력은 대화 경험에 질적인 향상을 가져다줄 것입니다.