본문 바로가기
AI

GPT-OSS OpenAI가 공개한 오픈소스 AI 모델 , gpt-oss-120b와 gpt-oss-20b 권장 사양 및 활용법 등

by icebear3000 2025. 8. 8.
반응형

OpenAI가 GPT-2 이후 6년 만에 선보인 완전히 새로운 오픈소스 AI 모델 GPT-OSS가 등장했습니다.

이번 출시는 개발자와 일반 사용자 모두에게 AI 기술을 무료로 제공한다는 점에서 혁신적입니다. GPT-OSS는 단순한 오픈소스 모델을 넘어, Apache 2.0 라이선스로 상업적 활용까지 완전 자유롭게 허용하며, 심지어 개인 노트북에서도 실행할 수 있는 놀라운 접근성을 보여줍니다.^1

^1


GPT-OSS란 무엇인가? 게임 체인저일까?

GPT-OSS(GPT Open Source Series)는 OpenAI가 개발한 오픈 웨이트 대규모 언어 모델로, 누구나 자유롭게 다운로드하고 수정하며 배포할 수 있는 혁신적인 AI 모델입니다. 기존의 ChatGPT와 달리 모델의 가중치(weights)가 완전히 공개되어 있어, 개발자들이 자신만의 AI 서비스를 구축할 수 있는 기반을 제공합니다.^1

두 가지 강력한 모델 버전

GPT-OSS-120B: 1,170억 개의 매개변수를 보유한 대형 모델로, 단일 80GB GPU에서 실행 가능하며 OpenAI의 o4-mini 모델과 거의 동등한 성능을 발휘합니다. 복잡한 추론 작업과 전문적인 용도에 최적화되어 있어, 기업이나 연구 기관에서 활용하기에 적합합니다.^1

 

GPT-OSS-20B: 210억 개의 매개변수를 가진 경량 모델로, 단 16GB 메모리만으로도 일반 노트북에서 실행 가능합니다. 개인 사용자나 소규모 팀이 로컬 환경에서 AI를 활용하고 싶을 때 완벽한 선택지입니다.^5

 

GPT-OSS 모델 주요 사양 비교: 120B vs 20B

 


핵심 기술들

MoE(Mixture-of-Experts) 아키텍처

가장 큰 특징은 MoE(전문가 혼합) 구조입니다. 이 기술은 전체 모델 중 일부만 활성화하여 연산 효율을 극대화합니다. 예를 들어 GPT-OSS-120B는 1,170억 개의 매개변수를 보유하지만, 실제로는 토큰당 51억 개만 활성화되어 빠른 추론 속도를 실현합니다.^1

Chain-of-Thought 추론

 

GPT-OSS는 복잡한 문제를 단계별로 해결하는 사고의 연쇄 방식을 채택했습니다. AI가 바로 답을 제시하는 대신, 문제 해결 과정을 단계별로 보여주어 더 정확하고 신뢰할 수 있는 결과를 제공합니다. 이는 수학 문제나 논리적 추론이 필요한 작업에서 특히 뛰어난 성능을 발휘합니다.^7

128K 토큰

두 모델 모두 최대 128,000개 토큰을 처리할 수 있어, 긴 문서나 책 한 권 분량의 텍스트를 한 번에 분석할 수 있습니다. 이는 문서 요약, 코드 분석, 연구 논문 검토 등 대용량 텍스트 처리가 필요한 작업에서 엄청난 장점을 제공합니다.^1


GPT-OSS 성능은 얼마나 뛰어날까? 

수학과 추론 능력: 경쟁 모델을 압도

GPT-OSS-120B는 AIME(미국 수학 경시대회) 2024에서 96.6%, 2025에서 97.9%라는 성적을 기록했습니다. 이는 OpenAI의 유료 모델인 o4-mini보다도 뛰어난 결과로, 무료 오픈소스 모델이 유료 모델을 수준을 제공합니다.^9^11

코딩 실력: 개발자의 든든한 파트너

Codeforces에서 GPT-OSS-120B는 2,622점이라는 높은 Elo 레이팅을 기록했으며, HumanEval 코드 생성 테스트에서는 87.3% 통과율을 달성했습니다. 이는 프로그래밍 영역에서도 최상급 성능을 입증하는 결과입니다.^12

의료 분야: 전문 지식의 새로운 가능성

HealthBench 의료 벤치마크에서 GPT-OSS는 기존 독점 모델들을 앞서는 성과를 보여주었습니다. 의료진을 위한 진단 보조, 의학 문헌 분석, 환자 데이터 요약 등 다양한 의료 AI 애플리케이션 개발 가능성을 열었습니다.^1


🛠 GPT-OSS 설치부터 활용까지

Ollama로 간편하게 시작하기

Ollama는 GPT-OSS를 가장 쉽게 설치하고 실행할 수 있는 플랫폼입니다. 다음 단계를 따라하면 몇 분 안에 나만의 AI를 구축할 수 있습니다:^5

1단계: Ollama 설치

# macOS/Linux 사용자
curl -fsSL https://ollama.com/install.sh | sh

# Windows 사용자는 ollama.com에서 직접 다운로드

2단계: GPT-OSS 모델 다운로드

# 경량 모델 (16GB 메모리 권장)
ollama pull gpt-oss-20b

# 대형 모델 (80GB 메모리 권장) 
ollama pull gpt-oss-120b

3단계: 모델 실행

# 대화형 채팅 시작
ollama run gpt-oss-20b

# 또는 한 번의 질문으로 빠른 답변
ollama run gpt-oss-20b "파이썬으로 웹 크롤러 만드는 방법 알려줘"

 

 


Hugging Face를 통한 전문가 설정

더 세밀한 제어가 필요한 개발자들은 Hugging Face를 통해 직접 모델을 다운로드할 수 있습니다. Python 환경에서 다음과 같이 사용 가능합니다:^14

from transformers import AutoTokenizer, AutoModelForCausalLM

# 모델과 토크나이저 로드
tokenizer = AutoTokenizer.from_pretrained("openai/gpt-oss-20b")
model = AutoModelForCausalLM.from_pretrained("openai/gpt-oss-20b")

# 추론 실행
inputs = tokenizer("안녕하세요, AI와 대화하고 있습니다", return_tensors="pt")
outputs = model.generate(**inputs, max_length=100)
print(tokenizer.decode(outputs[^0]))

클라우드 플랫폼 활용하기

하드웨어 제약이 있는 사용자들을 위해 여러 클라우드 서비스에서 GPT-OSS를 제공합니다:^16

  • Groq: 초고속 추론 (초당 1,065토큰)
  • Cerebras: 실시간 응답 (초당 최대 3,000토큰)
  • AWS Bedrock: 기업용 안정적 서비스
  • Together AI: 개발자 친화적 API

비용 혁명: GPT-OSS로 AI 비용을 90% 절약하자

로컬 실행의 경제적 이점

GPT-OSS의 가장 큰 장점은 로컬에서 무료 실행이 가능하다는 점입니다. 한 번 설치하면 API 비용 없이 무제한 사용할 수 있어, 대규모 AI 활용이 필요한 기업에게는 엄청난 비용 절감 효과를 제공합니다.^17

클라우드 비용 비교 분석

클라우드에서 사용할 때도 GPT-OSS는 경쟁력 있는 가격을 보여줍니다:^17

  • GPT-OSS-120B: 입력 100만 토큰당 $0.15, 출력 $0.60
  • GPT-4: 입력 100만 토큰당 약 $20.00 (30배 이상 비싸다!)
  • Claude 3.5 Sonnet: 입력 100만 토큰당 $3.00

이는 동일한 작업을 수행하면서도 최대 90% 비용 절감을 실현할 수 있음을 의미합니다.^12

 


GPT-OSS 성능 최적화

하드웨어 요구사항 최적화

GPT-OSS-20B 권장 사양

  • RAM: 최소 16GB (32GB 권장)
  • GPU: NVIDIA RTX 3060 12GB 이상
  • 저장공간: 약 12GB

GPT-OSS-120B 권장 사양

  • RAM: 최소 32GB (64GB 권장)
  • GPU: NVIDIA RTX 4090 24GB 또는 전문가용 GPU
  • 저장공간: 약 60GB

미래 전망: GPT-OSS가 열어가는 AI 민주화 시대

GPT-OSS의 등장은 AI 기술의 완전한 민주화를 의미합니다. 이제 개인 개발자부터 대기업까지 누구나 최고 수준의 AI 기술에 접근할 수 있게 되었으며, 이는 AI 생태계 전체에 혁신적 변화를 가져올 것으로 예상됩니다.^2

 

특히 중소기업과 개발도상국에서 GPT-OSS는 게임 체인저가 될 것입니다. 높은 AI 서비스 비용 때문에 접근하기 어려웠던 첨단 기술을 이제 누구나 활용할 수 있게 되어, 전 세계적인 AI 혁신의 기회 균등이 실현될 것으로 보입니다.[^22][^23]

 

또한 OpenAI의 이번 결정은 다른 AI 기업들에게도 영향을 미쳐, 오픈소스 AI 경쟁이 더욱 치열해질 것으로 예상됩니다. 이는 결국 사용자들에게 더 나은 AI 서비스와 더 저렴한 비용이라는 혜택으로 돌아올 것입니다.

 

반응형

댓글