[Gemini API] 구글 생성형 AI API 모델별 요금 및 청구 방식!!
💡 1. 요금 체계 요약
구글은 모델별로 Free Tier(무료) 및 Pay‑as‑you‑go(종량 요금제)를 제공합니다. Free Tier는 제한된 토큰 수와 요청 수를 제공하며, 유료 요금을 활성화하려면 Google Cloud Billing 계정을 연결해야 합니다 Google One+8Google AI for Developers+8Google Cloud+8.
▶ 무료 요금제: 일부 모델에 대해 입력/출력 토큰 수가 한정된 무료 사용 허용
▶ 유료 요금제: 더 많은 사용, 높은 속도 제한, 데이터가 제품 개선에 사용되지 않음 등의 혜택
🧠 2. Gemini 모델별 요금표 (2025년 6월 기준)
Gemini 2.5 Flash‑Lite (가장 저렴한 옵션)
-
입력 토큰 (텍스트·이미지·비디오): $0.10/백만 토큰
-
출력 토큰(응답 포함): $0.40/백만 토큰
-
컨텍스트 캐싱 비용: $0.025/백만 토큰, 저장: $1.00/백만 토큰당 시간당
정확한 활성화일은 2025년 6월 Reddit+5Google AI for Developers+5Google Cloud+5Android Central.
Gemini 2.5 Flash (일반)
-
입력: $0.30/백만 토큰
-
출력: $2.50/백만 토큰
-
캐싱: $0.075/백만 토큰, 저장: 비슷하게 시간당 계산 Google AI for Developers
Gemini 2.5 Pro (고성능 모델)
-
입력: $1.25 (200K 토큰 이하) 또는 $2.50 (200K 초과)/백만 토큰
-
출력: $10 / $15 /백만 토큰
-
캐싱: $0.31 / $0.625 /백만 토큰, 저장: $4.50/백만 토큰∙시간 apidog+7Google AI for Developers+7Google Cloud+7Google Cloud
📦 모델 요약 비교
모델 | 입력 비용 | 출력 비용 | 캐싱 비용 | 저장 비용 |
---|---|---|---|---|
Gemini 2.5 Flash‑Lite | $0.10/백만 | $0.40/백만 | $0.025/백만 | $1.00/백만·시간 |
Gemini 2.5 Flash | $0.30/백만 | $2.50/백만 | $0.075/백만 | (저장 비용 유사) |
Gemini 2.5 Pro | $1.25–2.50/백만 | $10–15/백만 | $0.31–0.625/백만 | $4.50/백만·시간 |
🔎 3. 그 외 요금 요소
-
오디오 텍스트 변환(TTS), 이미지, 비디오 등은 별도 요금 (예: Gemini Flash‑Lite 오디오 입력 $0.30/백만 토큰, 출력 $0.40 등) Reddit+15Google AI for Developers+15Android Central+15Android CentralGoogle AI for Developersbusinessinsider.comGoogle Cloud.
-
검색 기반 응답 (Grounding with Google Search): 무료 한도 초과 시 1,500 요청/일 무료, 이후 $35/1,000 요청 부과 Google AI for Developers.
-
Gemini CLI 등 일부 도구는 무료 제한 내 무료 사용 가능하며, 초과 시 별도 비용 계획 확인 필요 theverge.com+1Google AI for Developers+1.
✅ 4. 요금제 활성화 방법
-
Google AI Studio 접속 → 프로젝트의 Plan information 메뉴
-
Set up Billing 또는 Upgrade 클릭 → Cloud Billing 계정 연결
-
사용량은 Google Cloud Console에서
generativelanguage.googleapis.com
서비스로 모니터링 가능 Google Cloud+5Google AI for Developers+5Google Cloud+5 -
Free Tier보다 높은 속도 제한, 프라이버시 보호 기능 필요 시에는 유료 Tier 활성화 결정
🧮 5. 실제 사용 예시 👉 비용 계산
예를 들어:
-
Flash‑Lite 모델에서 입력 100만 토큰 + 출력 50만 토큰 사용 시
→ 100만 입력 × 0.10 + 50만 출력 × 0.40 = $10 (입력 $10 + 출력 $20? 아님?)
실제로는 출력 $0.40/백만이므로 50만은 $0.20이므로 $10.20 정도입니다. -
컨텍스트 캐싱 저장 1백만 토큰×1시간 → $1.00 추가
비용은 여러분의 토큰 사용량과 모델 선택에 따라 결정됩니다.
📌 마무리
-
Flash‑Lite는 가장 저렴하고 빠른 모델, 일반 텍스트 작업이나 멀티모달 처리에 적합
-
Flash 및 Pro는 복잡한 reasoning, 높은 정확도 또는 큰 컨텍스트 창이 필요할 때 사용
-
Free Tier 사용 후 실제 사용량과 요구에 따라 유료 요금제를 활성화하세요.
댓글
댓글 쓰기