ThorKit

2026 LLM API 가격 비교표 — Claude·GPT·Gemini·DeepSeek 토큰 단가

Anthropic·OpenAI·Google·DeepSeek 주요 모델의 input·output 토큰 단가, 컨텍스트 길이, 캐시 지원을 한 표로 정리.

마지막 업데이트: 2026-05-15
  • Claude Opus 4.7
    공급사
    Anthropic
    Input ($/1M)
    $15
    Output ($/1M)
    $75
    컨텍스트
    200K (1M Beta)
    캐시 지원
    ○ (~90% 절감)
    주요 용도
    최고급 추론·코드
  • Claude Sonnet 4.6
    공급사
    Anthropic
    Input ($/1M)
    $3
    Output ($/1M)
    $15
    컨텍스트
    200K (1M Beta)
    캐시 지원
    ○ (~90% 절감)
    주요 용도
    범용·일반 챗봇
  • Claude Haiku 4.5
    공급사
    Anthropic
    Input ($/1M)
    $1
    Output ($/1M)
    $5
    컨텍스트
    200K
    캐시 지원
    ○ (~90% 절감)
    주요 용도
    고속·대량 처리
  • GPT-5
    공급사
    OpenAI
    Input ($/1M)
    $10
    Output ($/1M)
    $40
    컨텍스트
    256K
    캐시 지원
    ○ (~50% 절감)
    주요 용도
    범용·추론
  • GPT-5 mini
    공급사
    OpenAI
    Input ($/1M)
    $0.5
    Output ($/1M)
    $2
    컨텍스트
    256K
    캐시 지원
    주요 용도
    경량·고속
  • GPT-4o
    공급사
    OpenAI
    Input ($/1M)
    $2.5
    Output ($/1M)
    $10
    컨텍스트
    128K
    캐시 지원
    주요 용도
    범용·음성·비전
  • GPT-4o mini
    공급사
    OpenAI
    Input ($/1M)
    $0.15
    Output ($/1M)
    $0.6
    컨텍스트
    128K
    캐시 지원
    주요 용도
    초저가 대량
  • Gemini 2.5 Pro
    공급사
    Google
    Input ($/1M)
    $1.25
    Output ($/1M)
    $10
    컨텍스트
    1M (2M Beta)
    캐시 지원
    주요 용도
    초장문·멀티모달
  • Gemini 2.5 Flash
    공급사
    Google
    Input ($/1M)
    $0.3
    Output ($/1M)
    $2.5
    컨텍스트
    1M
    캐시 지원
    주요 용도
    고속·대량
  • Gemini 2.5 Flash-Lite
    공급사
    Google
    Input ($/1M)
    $0.075
    Output ($/1M)
    $0.3
    컨텍스트
    1M
    캐시 지원
    주요 용도
    초저가
  • DeepSeek V3
    공급사
    DeepSeek
    Input ($/1M)
    $0.27
    Output ($/1M)
    $1.1
    컨텍스트
    128K
    캐시 지원
    주요 용도
    고성능·초저가
  • DeepSeek R1
    공급사
    DeepSeek
    Input ($/1M)
    $0.55
    Output ($/1M)
    $2.19
    컨텍스트
    128K
    캐시 지원
    주요 용도
    추론 특화·초저가
  • Mistral Large
    공급사
    Mistral
    Input ($/1M)
    $2
    Output ($/1M)
    $6
    컨텍스트
    128K
    캐시 지원
    주요 용도
    유럽·오픈소스 기반
  • Mistral Small
    공급사
    Mistral
    Input ($/1M)
    $0.2
    Output ($/1M)
    $0.6
    컨텍스트
    128K
    캐시 지원
    주요 용도
    경량
  • Grok 4
    공급사
    xAI
    Input ($/1M)
    $5
    Output ($/1M)
    $15
    컨텍스트
    128K
    캐시 지원
    주요 용도
    범용·X 통합

설명

본 도표는 2026년 5월 기준 주요 LLM API의 공시 가격을 한 표에 정리한 자료입니다. 가격은 각 사 공식 페이지(Anthropic·OpenAI·Google·DeepSeek 등)에서 확인할 수 있으며, 수시로 변경되므로 최종 확인은 공식 콘솔에서 하시기 바랍니다.

Input 가격이 Output 가격보다 훨씬 낮은 것은 LLM이 생성하는 토큰이 입력 처리보다 연산 비용이 크기 때문입니다. 일반적으로 Output이 Input의 4~5배 비싸므로, 출력 길이를 적정 수준으로 제한하는 것이 비용 절감의 1순위입니다.

프롬프트 캐시(Prompt Caching)는 동일 시스템 프롬프트·문서를 반복 사용할 때 input 비용을 약 90% 절감해주는 기능입니다. Anthropic·OpenAI·Google 모두 지원하며, RAG·챗봇처럼 같은 컨텍스트를 반복 전달하는 서비스라면 도입 즉시 비용이 절반 이하로 줄어듭니다.

한국어는 영어 대비 토큰 수가 약 2~3배 많아 동일 분량 텍스트라도 한국어 비용이 더 비쌉니다. 토큰 측정은 OpenAI tiktoken, Anthropic Tokenizer, Google Gemini Tokenizer로 사전 검증할 수 있습니다.

자주 묻는 질문

가장 저렴한 모델은?
범용 모델 중에는 Gemini 2.5 Flash-Lite($0.075/$0.3) 또는 GPT-4o mini($0.15/$0.6)가 가장 저렴합니다. 단순 분류·요약 작업에 적합합니다.
추론·코딩에 가장 강한 모델은?
2026년 5월 기준 Claude Opus 4.7과 GPT-5가 일반적으로 가장 강력한 추론·코딩 성능으로 평가받습니다. 복잡한 코드 리뷰·논리 추론 작업에 권장됩니다.
한국 데이터·한국어에 가장 강한 모델은?
Claude Sonnet 4.6·GPT-5·Gemini 2.5 Pro 모두 한국어 성능이 우수합니다. 네이버 HyperCLOVA X도 한국 도메인 특화 옵션입니다.
장문(긴 문서) 처리에 강한 모델은?
컨텍스트 1M 토큰을 기본 지원하는 Gemini 2.5 Pro·Flash가 강점입니다. Claude는 1M 토큰 베타 지원, 일반적으로 200K가 표준입니다.