2026 LLM API 가격 비교표 — Claude·GPT·Gemini·DeepSeek 토큰 단가
Anthropic·OpenAI·Google·DeepSeek 주요 모델의 input·output 토큰 단가, 컨텍스트 길이, 캐시 지원을 한 표로 정리.
마지막 업데이트: 2026-05-15
| 모델 | 공급사 | Input ($/1M) | Output ($/1M) | 컨텍스트 | 캐시 지원 | 주요 용도 |
|---|---|---|---|---|---|---|
| Claude Opus 4.7 | Anthropic | $15 | $75 | 200K (1M Beta) | ○ (~90% 절감) | 최고급 추론·코드 |
| Claude Sonnet 4.6 | Anthropic | $3 | $15 | 200K (1M Beta) | ○ (~90% 절감) | 범용·일반 챗봇 |
| Claude Haiku 4.5 | Anthropic | $1 | $5 | 200K | ○ (~90% 절감) | 고속·대량 처리 |
| GPT-5 | OpenAI | $10 | $40 | 256K | ○ (~50% 절감) | 범용·추론 |
| GPT-5 mini | OpenAI | $0.5 | $2 | 256K | ○ | 경량·고속 |
| GPT-4o | OpenAI | $2.5 | $10 | 128K | ○ | 범용·음성·비전 |
| GPT-4o mini | OpenAI | $0.15 | $0.6 | 128K | ○ | 초저가 대량 |
| Gemini 2.5 Pro | $1.25 | $10 | 1M (2M Beta) | ○ | 초장문·멀티모달 | |
| Gemini 2.5 Flash | $0.3 | $2.5 | 1M | ○ | 고속·대량 | |
| Gemini 2.5 Flash-Lite | $0.075 | $0.3 | 1M | ○ | 초저가 | |
| DeepSeek V3 | DeepSeek | $0.27 | $1.1 | 128K | ○ | 고성능·초저가 |
| DeepSeek R1 | DeepSeek | $0.55 | $2.19 | 128K | ○ | 추론 특화·초저가 |
| Mistral Large | Mistral | $2 | $6 | 128K | — | 유럽·오픈소스 기반 |
| Mistral Small | Mistral | $0.2 | $0.6 | 128K | — | 경량 |
| Grok 4 | xAI | $5 | $15 | 128K | — | 범용·X 통합 |
- Claude Opus 4.7
- 공급사
- Anthropic
- Input ($/1M)
- $15
- Output ($/1M)
- $75
- 컨텍스트
- 200K (1M Beta)
- 캐시 지원
- ○ (~90% 절감)
- 주요 용도
- 최고급 추론·코드
- Claude Sonnet 4.6
- 공급사
- Anthropic
- Input ($/1M)
- $3
- Output ($/1M)
- $15
- 컨텍스트
- 200K (1M Beta)
- 캐시 지원
- ○ (~90% 절감)
- 주요 용도
- 범용·일반 챗봇
- Claude Haiku 4.5
- 공급사
- Anthropic
- Input ($/1M)
- $1
- Output ($/1M)
- $5
- 컨텍스트
- 200K
- 캐시 지원
- ○ (~90% 절감)
- 주요 용도
- 고속·대량 처리
- GPT-5
- 공급사
- OpenAI
- Input ($/1M)
- $10
- Output ($/1M)
- $40
- 컨텍스트
- 256K
- 캐시 지원
- ○ (~50% 절감)
- 주요 용도
- 범용·추론
- GPT-5 mini
- 공급사
- OpenAI
- Input ($/1M)
- $0.5
- Output ($/1M)
- $2
- 컨텍스트
- 256K
- 캐시 지원
- ○
- 주요 용도
- 경량·고속
- GPT-4o
- 공급사
- OpenAI
- Input ($/1M)
- $2.5
- Output ($/1M)
- $10
- 컨텍스트
- 128K
- 캐시 지원
- ○
- 주요 용도
- 범용·음성·비전
- GPT-4o mini
- 공급사
- OpenAI
- Input ($/1M)
- $0.15
- Output ($/1M)
- $0.6
- 컨텍스트
- 128K
- 캐시 지원
- ○
- 주요 용도
- 초저가 대량
- Gemini 2.5 Pro
- 공급사
- Input ($/1M)
- $1.25
- Output ($/1M)
- $10
- 컨텍스트
- 1M (2M Beta)
- 캐시 지원
- ○
- 주요 용도
- 초장문·멀티모달
- Gemini 2.5 Flash
- 공급사
- Input ($/1M)
- $0.3
- Output ($/1M)
- $2.5
- 컨텍스트
- 1M
- 캐시 지원
- ○
- 주요 용도
- 고속·대량
- Gemini 2.5 Flash-Lite
- 공급사
- Input ($/1M)
- $0.075
- Output ($/1M)
- $0.3
- 컨텍스트
- 1M
- 캐시 지원
- ○
- 주요 용도
- 초저가
- DeepSeek V3
- 공급사
- DeepSeek
- Input ($/1M)
- $0.27
- Output ($/1M)
- $1.1
- 컨텍스트
- 128K
- 캐시 지원
- ○
- 주요 용도
- 고성능·초저가
- DeepSeek R1
- 공급사
- DeepSeek
- Input ($/1M)
- $0.55
- Output ($/1M)
- $2.19
- 컨텍스트
- 128K
- 캐시 지원
- ○
- 주요 용도
- 추론 특화·초저가
- Mistral Large
- 공급사
- Mistral
- Input ($/1M)
- $2
- Output ($/1M)
- $6
- 컨텍스트
- 128K
- 캐시 지원
- —
- 주요 용도
- 유럽·오픈소스 기반
- Mistral Small
- 공급사
- Mistral
- Input ($/1M)
- $0.2
- Output ($/1M)
- $0.6
- 컨텍스트
- 128K
- 캐시 지원
- —
- 주요 용도
- 경량
- Grok 4
- 공급사
- xAI
- Input ($/1M)
- $5
- Output ($/1M)
- $15
- 컨텍스트
- 128K
- 캐시 지원
- —
- 주요 용도
- 범용·X 통합
설명
본 도표는 2026년 5월 기준 주요 LLM API의 공시 가격을 한 표에 정리한 자료입니다. 가격은 각 사 공식 페이지(Anthropic·OpenAI·Google·DeepSeek 등)에서 확인할 수 있으며, 수시로 변경되므로 최종 확인은 공식 콘솔에서 하시기 바랍니다.
Input 가격이 Output 가격보다 훨씬 낮은 것은 LLM이 생성하는 토큰이 입력 처리보다 연산 비용이 크기 때문입니다. 일반적으로 Output이 Input의 4~5배 비싸므로, 출력 길이를 적정 수준으로 제한하는 것이 비용 절감의 1순위입니다.
프롬프트 캐시(Prompt Caching)는 동일 시스템 프롬프트·문서를 반복 사용할 때 input 비용을 약 90% 절감해주는 기능입니다. Anthropic·OpenAI·Google 모두 지원하며, RAG·챗봇처럼 같은 컨텍스트를 반복 전달하는 서비스라면 도입 즉시 비용이 절반 이하로 줄어듭니다.
한국어는 영어 대비 토큰 수가 약 2~3배 많아 동일 분량 텍스트라도 한국어 비용이 더 비쌉니다. 토큰 측정은 OpenAI tiktoken, Anthropic Tokenizer, Google Gemini Tokenizer로 사전 검증할 수 있습니다.
자주 묻는 질문
- 가장 저렴한 모델은?
- 범용 모델 중에는 Gemini 2.5 Flash-Lite($0.075/$0.3) 또는 GPT-4o mini($0.15/$0.6)가 가장 저렴합니다. 단순 분류·요약 작업에 적합합니다.
- 추론·코딩에 가장 강한 모델은?
- 2026년 5월 기준 Claude Opus 4.7과 GPT-5가 일반적으로 가장 강력한 추론·코딩 성능으로 평가받습니다. 복잡한 코드 리뷰·논리 추론 작업에 권장됩니다.
- 한국 데이터·한국어에 가장 강한 모델은?
- Claude Sonnet 4.6·GPT-5·Gemini 2.5 Pro 모두 한국어 성능이 우수합니다. 네이버 HyperCLOVA X도 한국 도메인 특화 옵션입니다.
- 장문(긴 문서) 처리에 강한 모델은?
- 컨텍스트 1M 토큰을 기본 지원하는 Gemini 2.5 Pro·Flash가 강점입니다. Claude는 1M 토큰 베타 지원, 일반적으로 200K가 표준입니다.