METAVERSE TIMES: [Gemini API] 구글 생성형 AI API 모델별 요금 및 청구 방식!!

💡 1. 요금 체계 요약

구글은 모델별로 Free Tier(무료) 및 Pay‑as‑you‑go(종량 요금제)를 제공합니다. Free Tier는 제한된 토큰 수와 요청 수를 제공하며, 유료 요금을 활성화하려면 Google Cloud Billing 계정을 연결해야 합니다 Google One+8Google AI for Developers+8Google Cloud+8.

▶ 무료 요금제: 일부 모델에 대해 입력/출력 토큰 수가 한정된 무료 사용 허용
▶ 유료 요금제: 더 많은 사용, 높은 속도 제한, 데이터가 제품 개선에 사용되지 않음 등의 혜택

🧠 2. Gemini 모델별 요금표 (2025년 6월 기준)

Gemini 2.5 Flash‑Lite (가장 저렴한 옵션)

입력 토큰 (텍스트·이미지·비디오): $0.10/백만 토큰
출력 토큰(응답 포함): $0.40/백만 토큰
컨텍스트 캐싱 비용: $0.025/백만 토큰, 저장: $1.00/백만 토큰당 시간당
정확한 활성화일은 2025년 6월 Reddit+5Google AI for Developers+5Google Cloud+5Android Central.

Gemini 2.5 Flash (일반)

입력: $0.30/백만 토큰
출력: $2.50/백만 토큰
캐싱: $0.075/백만 토큰, 저장: 비슷하게 시간당 계산 Google AI for Developers

Gemini 2.5 Pro (고성능 모델)

입력: $1.25 (200K 토큰 이하) 또는 $2.50 (200K 초과)/백만 토큰
출력: $10 / $15 /백만 토큰
캐싱: $0.31 / $0.625 /백만 토큰, 저장: $4.50/백만 토큰∙시간 apidog+7Google AI for Developers+7Google Cloud+7Google Cloud

📦 모델 요약 비교

모델	입력 비용	출력 비용	캐싱 비용	저장 비용
Gemini 2.5 Flash‑Lite	$0.10/백만	$0.40/백만	$0.025/백만	$1.00/백만·시간
Gemini 2.5 Flash	$0.30/백만	$2.50/백만	$0.075/백만	(저장 비용 유사)
Gemini 2.5 Pro	$1.25–2.50/백만	$10–15/백만	$0.31–0.625/백만	$4.50/백만·시간

🔎 3. 그 외 요금 요소

오디오 텍스트 변환(TTS), 이미지, 비디오 등은 별도 요금 (예: Gemini Flash‑Lite 오디오 입력 $0.30/백만 토큰, 출력 $0.40 등) Reddit+15Google AI for Developers+15Android Central+15Android CentralGoogle AI for Developersbusinessinsider.comGoogle Cloud.
검색 기반 응답 (Grounding with Google Search): 무료 한도 초과 시 1,500 요청/일 무료, 이후 $35/1,000 요청 부과 Google AI for Developers.
Gemini CLI 등 일부 도구는 무료 제한 내 무료 사용 가능하며, 초과 시 별도 비용 계획 확인 필요 theverge.com+1Google AI for Developers+1.

✅ 4. 요금제 활성화 방법

Google AI Studio 접속 → 프로젝트의 Plan information 메뉴
Set up Billing 또는 Upgrade 클릭 → Cloud Billing 계정 연결
사용량은 Google Cloud Console에서 generativelanguage.googleapis.com 서비스로 모니터링 가능 Google Cloud+5Google AI for Developers+5Google Cloud+5
Free Tier보다 높은 속도 제한, 프라이버시 보호 기능 필요 시에는 유료 Tier 활성화 결정

🧮 5. 실제 사용 예시 👉 비용 계산

예를 들어:

Flash‑Lite 모델에서 입력 100만 토큰 + 출력 50만 토큰 사용 시
→ 100만 입력 × 0.10 + 50만 출력 × 0.40 = $10 (입력 $10 + 출력 $20? 아님?)
실제로는 출력 $0.40/백만이므로 50만은 $0.20이므로 $10.20 정도입니다.
컨텍스트 캐싱 저장 1백만 토큰×1시간 → $1.00 추가

비용은 여러분의 토큰 사용량과 모델 선택에 따라 결정됩니다.

📌 마무리

Flash‑Lite는 가장 저렴하고 빠른 모델, 일반 텍스트 작업이나 멀티모달 처리에 적합
Flash 및 Pro는 복잡한 reasoning, 높은 정확도 또는 큰 컨텍스트 창이 필요할 때 사용
Free Tier 사용 후 실제 사용량과 요구에 따라 유료 요금제를 활성화하세요.

METAVERSE TIMES

[Gemini API] 구글 생성형 AI API 모델별 요금 및 청구 방식!!