메뉴 건너띄기
상단메뉴 바로가기 본문 바로가기

SW마에스트로 소식

요즘 대세! 생성형 언어 모델: LLM 소개

  • 2024-06-24 16:16
  • SW마에스트로

안녕하세요 여러분!

SW마에스트로 서포터즈입니다.

오늘은 '요즘 대세! 생성형 언어 모델'이라는 제목으로

생성형 인공지능과 거대 언어 모델, 각 기업별 모델에 대해 알아보려고 해요.

 

002

 

먼저 생성형 인공지능에 대해 알아볼까요?

생성형 인공지능이란 텍스트나 미디어 등의 콘텐츠를 새롭게 '생성'하는 인공지능으로,

최근 각광받고 있는 AI 분야 중 하나입니다.

언어를 생성할 수도 있고 이미지비디오 생성, 작곡,

사람의 말을 이해하고 텍스트나 이미지 형식의 답변을 생성해 줄 수도 있어요.

그 중에서도 특히 LLM은 Large Language Model의 약자로, 번역하면 거대 언어 모델이라는 뜻입니다.

 

사람의 말을 이해하고 답변을 생성하는, 텍스트를 다루는 인공지능이에요.

 

003

 

거대 언어 모델은 방대한 데이터 세트를 학습하기 때문에 '대규모', '거대'라는 이름이 붙었어요.

데이터의 품질이 모델의 성능을 가르는 중요한 요소이기 때문에 엄선한 데이터를 다시 가공하고 정제해서 사용해야 해요.

ChatGPT 같은 모델을 사용해 보면 알 수 있듯, LLM은 자연스러운 인간의 언어로 예측 불가능한 것을 물어봐도 잘 대답할 수 있어요.

학습된 말에 대해서만 학습된 대답을 하던 프로그램과는 달라요.

LLM은 이처럼 사용자가 사람에게 물어보듯 질문하면 답변을 해 주는 AI 자체로써 주로 사용되지만

감정 분석, DNA 연구, 챗봇, 고객 서비스, 온라인 검색 등에도 활용되고 있어요.

 

축하

 

004

 

그렇다면 이처럼 강력한 성능을 보여주는 LLM을 어떻게 만들 수 있을까요?

인공지능을 만드는 과정은 크게 데이터 수집과 전처리 - 학습 - 평가의 단계로 이루어져요.

아까 LLM에서는 데이터가 중요하다고 했죠?

데이터를 엄선해서 수집한 후 학습하기 좋은 형태로 다시 가공합니다.

이후 사전학습을 수행해서 규모가 작고 일반적인 모델을 만들어요.

자연어 처리 인공지능에서는 인코더와 디코더가 많이 사용됩니다.

이렇게 사전학습된 모델은 이후 전이학습에서 쓰여요.

전이학습이란, 미리 적당히 학습된 모델을 가지고

어느 부분을 더 개선할지를 계획해서 특정 분야에 맞게 학습시키는 작업이에요.

파인 튜닝(Fine-Tuning)은 전이학습의 한 형태로,

만들고자 하는 모델이 특정 작업을 더 잘할 수 있게 학습시키는 작업이죠.

이후 일반적인 딥러닝 과정과 마찬가지로 평가와 피드백이 이루어집니다.

 

005

 

그렇다면 유명한 LLM에는 무엇이 있을까요?

첫 타자는 LLM 시장의 대중화를 이끌었던 ChatGPT입니다!

2022년 11월에 등장해서 전세계 사람들의 과제와 공부에 도움을 주고 있어요.

무료 버전은 3.5, 유료 버전은 4인데 업데이트되면서 4도 체험해 볼 수 있게 됐어요.

하지만 횟수 제한이 있어서 GPT-4o 모델을 계속 사용하려면 한 달에 한화로 약 28,000원을 결제해야 합니다.

일반적으로 대학 학부 수준의 지식, 상식 추론 등에서 강세를 보인다고 해요.

 

006

 

또 다른 유명한 모델로는 Meta의 LLaMA가 있어요.

메타는 페이스북과 인스타그램을 만든 회사죠?

인공지능 모델은 주로 파라미터(매개변수) 개수에 따라 그 규모를 결정하는데,

라마의 경우에는 다양한 크기에 따른 모델을 제공해요.

ChatGPT보다 매개변수 개수가 적지만 성능이 좋고,

모델을 커스터마이징(파인튜닝)하기 좋아 개발자들 사이에서 인기를 끌고 있어요.

 

하지만 웹으로 서비스하지 않아 사용자가 스크립트를 다운로드하고 환경을 설정해야 하는 불편함이 존재합니다.

 

007

 

그 외에도 Claude, Gemini, Falcon, Copilot 등의 모델이 있어요.

Claude는 Anthropic의 생성형 언어 모델로,

ChatGPT, Gemini와 함께 최근 가장 주목받는 3대 LLM 중 하나예요.

대부분의 분야에서 Gemini와 ChatGPT를 앞서고 있다는 평가가 많아요.

최상위 버전은 Claude 3 Opus인데,

GPT-4o와 마찬가지로 횟수 제한이 있고, 제한 없이 사용하려면 결제를 해야 해요.

Google의 Gemini도 유명하죠?

앞서 말했듯 ChatGPT, Claude와 함께 LLM 3대 강자로 손꼽혀요.

광범위한 지식으로 대답을 잘하고 쓰기, 요약 등의 작업에서도 우수성을 보입니다.

특히 Google의 Colab에서 코딩 중 질문이 있을 때 같은 화면에서 Gemini를 바로 사용할 수 있고,

Google Cloud에서도 연계해서 사용할 수 있어요.

특히, Google Cloud에서는 Gemini를 파인튜닝해보는 것도 가능하답니다.

그 외에도 유명한 LLM으로는 Falcon, Copilot 등이 있어요.

 

이번 소식에서는 다루지 않았지만 국내에도 좋은 모델들이 많이 있답니다!

 

축하놀람

 

008

 

첨부파일 (1)