[OpenAI] GPT-OSS 오픈 웨이트(open‑weight) 언어 모델 !!
“GPT‑OSS”는 OpenAI가 2025년 8월 5일에 공개한 6년 만의 오픈 웨이트(open‑weight) 언어 모델 시리즈입니다. 이는 GPT‑2 이후 처음으로, 모델의 학습된 파라미터(가중치)를 공개해 누구나 다운로드하고 자율적으로 실행·수정·파인튜닝할 수 있게 한 것이 핵심입니다 Business InsiderThe Verge.
주요 모델 구성
모델명 | 파라미터 수 | 하드웨어 요구사항 | 용도 및 특징 |
---|---|---|---|
gpt‑oss‑120b | 약 117B | 80 GB H100 또는 고성능 GPU | o4‑mini 수준의 고급 추론, 복잡한 수학/건강 응답 등에서 우수한 성능 OpenAICinco DíasThe Verge |
gpt‑oss‑20b | 약 21B | 16 GB VRAM 환경 (일반 PC, 노트북) | o3‑mini 수준 성능, 경량화된 현장 실행에 적합 OpenAIThe VergeWindows Central |
성능 및 기술적 특성
-
Mixture of Experts (MoE) 구조 활용
→ 예: 120b 모델은 전체 128개 전문가 중 4개만 활성화되어 추론 비용을 줄이면서 성능을 유지 GeekNewsOpenAI. -
벤치마크 성능
-
MMLU: 120b ≈ 90.0% (o4‑mini와 비슷한 수준)
-
AIME 수학: 97~98% (o4‑mini 및 상업 모델 종합)
-
Codeforces Elo: 2622 (상위권 수준)
-
HealthBench: GPT-4o 대비 우수 성능
-
다국어 MMLU: 약 81% (14개 언어) GeekNewsCinco Días
-
-
Chain-of-Thought(생각의 흐름) 노출 기능
→ 추론 과정을 공개해 디버깅 및 신뢰도 검증 가능 GeekNews.
생태계 및 활용 환경
-
즉시 호환 플랫폼: Hugging Face, vLLM, Ollama 등에서 바로 사용 가능 GeekNewsWindows Central.
-
Microsoft와 통합: GPT‑OSS‑20b는 Windows AI Foundry (Windows 11) 및 Azure AI Foundry를 통해 현지 실행 및 에이전트 구축에 활용 가능 The VergeMicrosoft Azure.
-
안전성 확보: 내부 및 외부 전문가의 엄격한 안전 테스트를 거쳤으며, 악용 가능성에 대한 사전 검토도 진행됨 The VergeFinancial Times.
요약
“GPT‑OSS”는 OpenAI의 첫 번째 오픈 웨이트 언어 모델 시리즈로, gpt‑oss‑120b와 gpt‑oss‑20b 두 가지로 구성되어 있습니다. 높은 자유도와 뛰어난 성능, 개발자 친화적인 생태계를 갖추었으며, 오프라인 실행이나 커스터마이징이 필요한 다양한 환경에서 강력한 선택지로 자리 잡고 있습니다.
댓글
댓글 쓰기