📊 2026년 3월 확인 기준
LLM 모델 성능·가격 비교표
GPT, Claude, Gemini 등 주요 LLM의 가격과 성능을 한눈에 비교하세요
LLM 모델별 성능 / 가격 비교표
2026년 3월 기준 주요 LLM 모델의 가격, 컨텍스트 윈도우, 벤치마크 점수를 한눈에 비교합니다.
| 모델 | 입력 ($/1M) |
출력 ($/1M) |
컨텍스트 | 코딩 | 추론 |
|---|
* 코딩/추론 점수는 HumanEval, MMLU 등 공개 벤치마크 기반 상대 비교용 점수로, 절대값이 아닌 모델 간 비교에 참고하세요. 가격은 2026년 3월 기준이며 변동될 수 있습니다.
LLM 비교표는 언제 쓰나요?
서비스에 적합한 LLM 모델을 선택할 때 가격, 컨텍스트 윈도우, 코딩·추론 성능을 한눈에 비교하면 의사결정 시간을 줄일 수 있습니다.
가격 비교입력·출력 토큰 단가를 모델별로 직접 비교
성능 비교코딩·추론 벤치마크 기준 상대 점수 확인
모델 선택비용 대비 성능 효율이 높은 모델 판단
자주 묻는 질문
벤치마크 점수는 절대적인가요?
아닙니다. HumanEval, MMLU 등 공개 벤치마크 기반 상대 비교용 점수이며, 실제 서비스 적용 시 프롬프트 설계에 따라 결과가 달라질 수 있습니다.
가격이 자주 바뀌나요?
네. AI 모델 가격은 경쟁과 기술 발전에 따라 빠르게 변동됩니다. 실제 적용 전 벤더 공식 사이트에서 최신 가격을 확인하세요.
컨텍스트 윈도우가 크면 항상 좋은가요?
긴 문서 처리에는 유리하지만, 토큰 사용량이 늘어 비용도 증가합니다. 실제 사용 패턴에 맞는 모델을 선택하는 것이 중요합니다.
최종 검토: 2026.03.25 · 가격과 성능은 변동될 수 있습니다.
다른 AI / 테크 계산기