LLM 모델별 성능 / 가격 비교표

💡

2026년 3월 기준 주요 LLM 모델의 가격, 컨텍스트 윈도우, 벤치마크 점수를 한눈에 비교합니다.

모델	입력 ($/1M)	출력 ($/1M)	컨텍스트	코딩	추론

* 코딩/추론 점수는 HumanEval, MMLU 등 공개 벤치마크 기반 상대 비교용 점수로, 절대값이 아닌 모델 간 비교에 참고하세요. 가격은 2026년 3월 기준이며 변동될 수 있습니다.

LLM 비교표는 언제 쓰나요?

서비스에 적합한 LLM 모델을 선택할 때 가격, 컨텍스트 윈도우, 코딩·추론 성능을 한눈에 비교하면 의사결정 시간을 줄일 수 있습니다.

가격 비교입력·출력 토큰 단가를 모델별로 직접 비교

성능 비교코딩·추론 벤치마크 기준 상대 점수 확인

모델 선택비용 대비 성능 효율이 높은 모델 판단

자주 묻는 질문

아닙니다. HumanEval, MMLU 등 공개 벤치마크 기반 상대 비교용 점수이며, 실제 서비스 적용 시 프롬프트 설계에 따라 결과가 달라질 수 있습니다.

네. AI 모델 가격은 경쟁과 기술 발전에 따라 빠르게 변동됩니다. 실제 적용 전 벤더 공식 사이트에서 최신 가격을 확인하세요.

긴 문서 처리에는 유리하지만, 토큰 사용량이 늘어 비용도 증가합니다. 실제 사용 패턴에 맞는 모델을 선택하는 것이 중요합니다.

최종 검토: 2026.03.25 · 가격과 성능은 변동될 수 있습니다.

다른 AI / 테크 계산기