2026 LLM API 가격 비교표 — Claude·GPT·Gemini·DeepSeek 토큰 단가
Anthropic·OpenAI·Google·DeepSeek 주요 모델의 input·output 토큰 단가, 컨텍스트 길이, 캐시 지원을 한 표로 정리.
핵심 팁
LLM API 가격 비교표은(는) 포맷, 옵션, 규칙 차이를 빠르게 대조하는 개발용 표입니다. 문법을 외우기보다 어떤 상황에서 어떤 형식을 써야 하는지 정리할 때 효과적입니다.
- 입력 형식과 출력 형식을 먼저 구분해서 보세요.
- 테스트 데이터로 한 번 확인한 뒤 실데이터에 적용하세요.
- 표준 문서와 같이 보면 해석 오류를 줄일 수 있습니다.
- 관련 계산기와 해설 글을 같이 보면 실제 적용이 쉬워집니다.
| 모델 | 공급사 | Input ($/1M) | Output ($/1M) | 컨텍스트 | 캐시 지원 | 주요 용도 |
|---|---|---|---|---|---|---|
| Claude Opus 4.7 | Anthropic | $15 | $75 | 200K (1M Beta) | ○ (~90% 절감) | 최고급 추론·코드 |
| Claude Sonnet 4.6 | Anthropic | $3 | $15 | 200K (1M Beta) | ○ (~90% 절감) | 범용·일반 챗봇 |
| Claude Haiku 4.5 | Anthropic | $1 | $5 | 200K | ○ (~90% 절감) | 고속·대량 처리 |
| GPT-5 | OpenAI | $10 | $40 | 256K | ○ (~50% 절감) | 범용·추론 |
| GPT-5 mini | OpenAI | $0.5 | $2 | 256K | ○ | 경량·고속 |
| GPT-4o | OpenAI | $2.5 | $10 | 128K | ○ | 범용·음성·비전 |
| GPT-4o mini | OpenAI | $0.15 | $0.6 | 128K | ○ | 초저가 대량 |
| Gemini 2.5 Pro | $1.25 | $10 | 1M (2M Beta) | ○ | 초장문·멀티모달 | |
| Gemini 2.5 Flash | $0.3 | $2.5 | 1M | ○ | 고속·대량 | |
| Gemini 2.5 Flash-Lite | $0.075 | $0.3 | 1M | ○ | 초저가 | |
| DeepSeek V3 | DeepSeek | $0.27 | $1.1 | 128K | ○ | 고성능·초저가 |
| DeepSeek R1 | DeepSeek | $0.55 | $2.19 | 128K | ○ | 추론 특화·초저가 |
| Mistral Large | Mistral | $2 | $6 | 128K | — | 유럽·오픈소스 기반 |
| Mistral Small | Mistral | $0.2 | $0.6 | 128K | — | 경량 |
| Grok 4 | xAI | $5 | $15 | 128K | — | 범용·X 통합 |
- Claude Opus 4.7
- 공급사
- Anthropic
- Input ($/1M)
- $15
- Output ($/1M)
- $75
- 컨텍스트
- 200K (1M Beta)
- 캐시 지원
- ○ (~90% 절감)
- 주요 용도
- 최고급 추론·코드
- Claude Sonnet 4.6
- 공급사
- Anthropic
- Input ($/1M)
- $3
- Output ($/1M)
- $15
- 컨텍스트
- 200K (1M Beta)
- 캐시 지원
- ○ (~90% 절감)
- 주요 용도
- 범용·일반 챗봇
- Claude Haiku 4.5
- 공급사
- Anthropic
- Input ($/1M)
- $1
- Output ($/1M)
- $5
- 컨텍스트
- 200K
- 캐시 지원
- ○ (~90% 절감)
- 주요 용도
- 고속·대량 처리
- GPT-5
- 공급사
- OpenAI
- Input ($/1M)
- $10
- Output ($/1M)
- $40
- 컨텍스트
- 256K
- 캐시 지원
- ○ (~50% 절감)
- 주요 용도
- 범용·추론
- GPT-5 mini
- 공급사
- OpenAI
- Input ($/1M)
- $0.5
- Output ($/1M)
- $2
- 컨텍스트
- 256K
- 캐시 지원
- ○
- 주요 용도
- 경량·고속
- GPT-4o
- 공급사
- OpenAI
- Input ($/1M)
- $2.5
- Output ($/1M)
- $10
- 컨텍스트
- 128K
- 캐시 지원
- ○
- 주요 용도
- 범용·음성·비전
- GPT-4o mini
- 공급사
- OpenAI
- Input ($/1M)
- $0.15
- Output ($/1M)
- $0.6
- 컨텍스트
- 128K
- 캐시 지원
- ○
- 주요 용도
- 초저가 대량
- Gemini 2.5 Pro
- 공급사
- Input ($/1M)
- $1.25
- Output ($/1M)
- $10
- 컨텍스트
- 1M (2M Beta)
- 캐시 지원
- ○
- 주요 용도
- 초장문·멀티모달
- Gemini 2.5 Flash
- 공급사
- Input ($/1M)
- $0.3
- Output ($/1M)
- $2.5
- 컨텍스트
- 1M
- 캐시 지원
- ○
- 주요 용도
- 고속·대량
- Gemini 2.5 Flash-Lite
- 공급사
- Input ($/1M)
- $0.075
- Output ($/1M)
- $0.3
- 컨텍스트
- 1M
- 캐시 지원
- ○
- 주요 용도
- 초저가
- DeepSeek V3
- 공급사
- DeepSeek
- Input ($/1M)
- $0.27
- Output ($/1M)
- $1.1
- 컨텍스트
- 128K
- 캐시 지원
- ○
- 주요 용도
- 고성능·초저가
- DeepSeek R1
- 공급사
- DeepSeek
- Input ($/1M)
- $0.55
- Output ($/1M)
- $2.19
- 컨텍스트
- 128K
- 캐시 지원
- ○
- 주요 용도
- 추론 특화·초저가
- Mistral Large
- 공급사
- Mistral
- Input ($/1M)
- $2
- Output ($/1M)
- $6
- 컨텍스트
- 128K
- 캐시 지원
- —
- 주요 용도
- 유럽·오픈소스 기반
- Mistral Small
- 공급사
- Mistral
- Input ($/1M)
- $0.2
- Output ($/1M)
- $0.6
- 컨텍스트
- 128K
- 캐시 지원
- —
- 주요 용도
- 경량
- Grok 4
- 공급사
- xAI
- Input ($/1M)
- $5
- Output ($/1M)
- $15
- 컨텍스트
- 128K
- 캐시 지원
- —
- 주요 용도
- 범용·X 통합
설명
본 도표는 2026년 5월 기준 주요 LLM API의 공시 가격을 한 표에 정리한 자료입니다. 가격은 각 사 공식 페이지(Anthropic·OpenAI·Google·DeepSeek 등)에서 확인할 수 있으며, 수시로 변경되므로 최종 확인은 공식 콘솔에서 하시기 바랍니다.
Input 가격이 Output 가격보다 훨씬 낮은 것은 LLM이 생성하는 토큰이 입력 처리보다 연산 비용이 크기 때문입니다. 일반적으로 Output이 Input의 4~5배 비싸므로, 출력 길이를 적정 수준으로 제한하는 것이 비용 절감의 1순위입니다.
프롬프트 캐시(Prompt Caching)는 동일 시스템 프롬프트·문서를 반복 사용할 때 input 비용을 약 90% 절감해주는 기능입니다. Anthropic·OpenAI·Google 모두 지원하며, RAG·챗봇처럼 같은 컨텍스트를 반복 전달하는 서비스라면 도입 즉시 비용이 절반 이하로 줄어듭니다.
한국어는 영어 대비 토큰 수가 약 2~3배 많아 동일 분량 텍스트라도 한국어 비용이 더 비쌉니다. 토큰 측정은 OpenAI tiktoken, Anthropic Tokenizer, Google Gemini Tokenizer로 사전 검증할 수 있습니다.
이 표를 읽을 때 같이 볼 것
직접 금액이나 수치를 바꿔 보려면 LLM API 비용 계산기 — Claude·GPT·Gemini 토큰 단가로 월 비용로 이어서 확인하는 편이 가장 빠릅니다.
공식 확인 경로
이 페이지는 빠르게 이해하기 좋게 정리한 요약본입니다. 실제 신청, 신고, 계약, 예약, 제출 단계에서는 아래 원문 안내를 함께 확인하는 편이 안전합니다.
- MDN Web Docs — HTML·URL·인코딩·웹 표준 참고
- RFC Editor — JWT·URI·JSON 관련 표준 원문
- Cloudflare Docs — 배포·엣지·DNS 공식 문서
자주 묻는 질문
- LLM API 가격 비교표 표는 어떤 때 참고하면 좋나요?
- 여러 조건을 빠르게 나눠 봐야 할 때 유용합니다. LLM 가격 비교처럼 시기나 대상에 따라 기준이 갈리는 주제는 표로 먼저 범위를 좁힌 뒤 세부 가이드로 넘어가면 훨씬 이해가 빠릅니다.
- LLM API 가격 비교표에서 먼저 볼 항목은 무엇인가요?
- 본인 상황과 직접 연결되는 시기, 대상, 금액, 준비물 칸부터 먼저 보는 편이 좋습니다. 그런 다음 주의사항이나 예외 조건을 확인하면 판단 실수를 줄일 수 있습니다.
- LLM API 가격 비교표를 해석할 때 주의할 점은 무엇인가요?
- 같은 조건끼리 비교하고 있는지부터 봐야 합니다. 지역, 연령, 시즌, 가족 구성처럼 기준이 조금만 달라도 같은 행처럼 보여도 의미가 달라질 수 있습니다.
- LLM API 가격 비교표만 보고 바로 결정해도 되나요?
- LLM API 가격 비교표은 후보를 빠르게 줄이고 차이를 읽는 용도로 쓰는 편이 좋습니다. 실제 신청, 계약, 구매 단계에서는 연결된 가이드와 공식 안내를 함께 확인해야 해석이 흔들리지 않습니다.
이 표로 더 확인하기
표에서 본 기준을 직접 계산하거나, 관련 해설과 비슷한 표로 이어서 확인하세요.