“GPT‑OSS”는 OpenAI가 2025년 8월 5일에 공개한 6년 만의 오픈 웨이트(open‑weight) 언어 모델 시리즈입니다. 이는 GPT‑2 이후 처음으로, 모델의 학습된 파라미터(가중치)를 공개해 누구나 다운로드하고 자율적으로 실행·수정·파인튜닝할 수 있게 한 것이 핵심입니다 Business InsiderThe Verge.
주요 모델 구성
| 모델명 | 파라미터 수 | 하드웨어 요구사항 | 용도 및 특징 |
|---|---|---|---|
| gpt‑oss‑120b | 약 117B | 80 GB H100 또는 고성능 GPU | o4‑mini 수준의 고급 추론, 복잡한 수학/건강 응답 등에서 우수한 성능 OpenAICinco DíasThe Verge |
| gpt‑oss‑20b | 약 21B | 16 GB VRAM 환경 (일반 PC, 노트북) | o3‑mini 수준 성능, 경량화된 현장 실행에 적합 OpenAIThe VergeWindows Central |
성능 및 기술적 특성
-
Mixture of Experts (MoE) 구조 활용
→ 예: 120b 모델은 전체 128개 전문가 중 4개만 활성화되어 추론 비용을 줄이면서 성능을 유지 GeekNewsOpenAI. -
벤치마크 성능
-
MMLU: 120b ≈ 90.0% (o4‑mini와 비슷한 수준)
-
AIME 수학: 97~98% (o4‑mini 및 상업 모델 종합)
-
Codeforces Elo: 2622 (상위권 수준)
-
HealthBench: GPT-4o 대비 우수 성능
-
다국어 MMLU: 약 81% (14개 언어) GeekNewsCinco Días
-
-
Chain-of-Thought(생각의 흐름) 노출 기능
→ 추론 과정을 공개해 디버깅 및 신뢰도 검증 가능 GeekNews.
생태계 및 활용 환경
-
즉시 호환 플랫폼: Hugging Face, vLLM, Ollama 등에서 바로 사용 가능 GeekNewsWindows Central.
-
Microsoft와 통합: GPT‑OSS‑20b는 Windows AI Foundry (Windows 11) 및 Azure AI Foundry를 통해 현지 실행 및 에이전트 구축에 활용 가능 The VergeMicrosoft Azure.
-
안전성 확보: 내부 및 외부 전문가의 엄격한 안전 테스트를 거쳤으며, 악용 가능성에 대한 사전 검토도 진행됨 The VergeFinancial Times.
요약
“GPT‑OSS”는 OpenAI의 첫 번째 오픈 웨이트 언어 모델 시리즈로, gpt‑oss‑120b와 gpt‑oss‑20b 두 가지로 구성되어 있습니다. 높은 자유도와 뛰어난 성능, 개발자 친화적인 생태계를 갖추었으며, 오프라인 실행이나 커스터마이징이 필요한 다양한 환경에서 강력한 선택지로 자리 잡고 있습니다.
댓글 없음:
댓글 쓰기
참고: 블로그의 회원만 댓글을 작성할 수 있습니다.