[LLM] Large Language Model (대규모 언어 모델) 이란 무엇인가?
1. LLM이란 무엇인가? LLM의 정의 LLM 은 **Large Language Model(대규모 언어 모델)**의 약자로, 인간의 언어를 이해하고 생성할 수 있도록 훈련된 AI 모델 입니다. LLM은 수십억 개의 단어와 문장을 학습한 후, 사용자가 입력한 문장(프롬프트)에 대해 자연스럽고 논리적인 텍스트 를 생성할 수 있습니다. 예시: ChatGPT, Claude, Amazon Titan, Google Gemini 등 2. LLM의 주요 특징 1) 대규모 학습 데이터 수백 GB ~ 수 TB 규모의 텍스트 데이터로 학습 위키백과, 뉴스, 책, 웹사이트 등 다양한 출처 포함 2) 딥러닝 기반 구조 대부분 **트랜스포머(Transformer)**라는 구조를 기반으로 함 입력 단어의 문맥을 이해하고 다음 단어를 예측하는 방식 3) 다양한 작업 수행 문장 요약 질문 답변 코드 생성 문서 번역 콘텐츠 생성 (광고, 블로그 등) 3. LLM은 어떻게 동작하나요? 입력 → 처리 → 출력 입력(프롬프트) : "삼성전자의 최근 주가 동향은?" 처리 : 문맥을 이해하고 관련된 데이터를 바탕으로 추론 출력 : "삼성전자의 주가는 최근 3개월간 완만한 상승세를 보이고 있으며..." 내부적으로는? 문장을 벡터로 변환 이전 단어들을 기반으로 다음 단어 예측 확률적으로 가장 적절한 단어 선택 4. LLM의 한계와 고려사항 항목 설명 지식 한계 사전 학습된 지식만 반영됨 (실시간 데이터 반영 X) 사고력 한계 논리적 추론은 가능하지만, 인간 수준의 직관은 부족 오답 생성 그럴듯하지만 틀린 정보도 생성 가능 비용 GPU 자원 소모가 많고 운영비용이 큼 5. Amazon Bedrock과 LLM의 관계 Amazon Bedrock은? Amazon Web Services(AWS)에서 제공하는 생성형 AI 서비스 플랫폼 으로, ...