[Gemini API] 구글 생성형 AI API 모델별 요금 및 청구 방식!!



💡 1. 요금 체계 요약

구글은 모델별로 Free Tier(무료) 및 Pay‑as‑you‑go(종량 요금제)를 제공합니다. Free Tier는 제한된 토큰 수와 요청 수를 제공하며, 유료 요금을 활성화하려면 Google Cloud Billing 계정을 연결해야 합니다 Google One+8Google AI for Developers+8Google Cloud+8.

▶ 무료 요금제: 일부 모델에 대해 입력/출력 토큰 수가 한정된 무료 사용 허용
▶ 유료 요금제: 더 많은 사용, 높은 속도 제한, 데이터가 제품 개선에 사용되지 않음 등의 혜택


🧠 2. Gemini 모델별 요금표 (2025년 6월 기준)

Gemini 2.5 Flash‑Lite (가장 저렴한 옵션)

  • 입력 토큰 (텍스트·이미지·비디오): $0.10/백만 토큰

  • 출력 토큰(응답 포함): $0.40/백만 토큰

  • 컨텍스트 캐싱 비용: $0.025/백만 토큰, 저장: $1.00/백만 토큰당 시간당
    정확한 활성화일은 2025년 6월 Reddit+5Google AI for Developers+5Google Cloud+5Android Central.

Gemini 2.5 Flash (일반)

  • 입력: $0.30/백만 토큰

  • 출력: $2.50/백만 토큰

  • 캐싱: $0.075/백만 토큰, 저장: 비슷하게 시간당 계산 Google AI for Developers

Gemini 2.5 Pro (고성능 모델)


📦 모델 요약 비교

모델입력 비용출력 비용캐싱 비용저장 비용
Gemini 2.5 Flash‑Lite$0.10/백만$0.40/백만$0.025/백만$1.00/백만·시간
Gemini 2.5 Flash$0.30/백만$2.50/백만$0.075/백만(저장 비용 유사)
Gemini 2.5 Pro$1.25–2.50/백만$10–15/백만$0.31–0.625/백만$4.50/백만·시간

🔎 3. 그 외 요금 요소


✅ 4. 요금제 활성화 방법

  1. Google AI Studio 접속 → 프로젝트의 Plan information 메뉴

  2. Set up Billing 또는 Upgrade 클릭 → Cloud Billing 계정 연결

  3. 사용량은 Google Cloud Console에서 generativelanguage.googleapis.com 서비스로 모니터링 가능 Google Cloud+5Google AI for Developers+5Google Cloud+5

  4. Free Tier보다 높은 속도 제한, 프라이버시 보호 기능 필요 시에는 유료 Tier 활성화 결정


🧮 5. 실제 사용 예시 👉 비용 계산

예를 들어:

  • Flash‑Lite 모델에서 입력 100만 토큰 + 출력 50만 토큰 사용 시
    → 100만 입력 × 0.10 + 50만 출력 × 0.40 = $10 (입력 $10 + 출력 $20? 아님?)
    실제로는 출력 $0.40/백만이므로 50만은 $0.20이므로 $10.20 정도입니다.

  • 컨텍스트 캐싱 저장 1백만 토큰×1시간 → $1.00 추가

비용은 여러분의 토큰 사용량과 모델 선택에 따라 결정됩니다.


📌 마무리

  • Flash‑Lite는 가장 저렴하고 빠른 모델, 일반 텍스트 작업이나 멀티모달 처리에 적합

  • Flash 및 Pro는 복잡한 reasoning, 높은 정확도 또는 큰 컨텍스트 창이 필요할 때 사용

  • Free Tier 사용 후 실제 사용량과 요구에 따라 유료 요금제를 활성화하세요.


 


댓글

이 블로그의 인기 게시물

[8/9] 1184회 로또 당첨번호 추천!!

[AWS] SCP, OU, Policy 사용하기 !!

[AWS] AWS Activate 스타트업 $1,000 지원 성공

[8/2] 1183회 로또 당첨번호 추천!!

[Shopizer E‑commerce] Shopizer란?

📘 ads.txt란 무엇인가? (2025 최신 가이드)

[Vault] 온프레미스 구축 개요!!