SlideShare a Scribd company logo
1 of 59
최근 AI 이슈와 LLM 구축방안
2023
AI가 사람을 그리는….
예상보다 빠르게 다가오는….
Generative AI
(생성AI)
ChatGPT가 뭔가
요?
분류/추론 인공지능
(Discriminative Model)
고양이
생성 인공지능
(Generative Model)
고양이
최근 AI, Generative AI(생성AI)
최근 AI, Generative AI(생성AI)
Generative AI란 이용자의 특정 요구에 따라 결과를 생성해내는 인공지능을 말한다.
데이터 원본을 통한 학습으로 주로 소설, 이미지, 비디오, 코딩, 시, 미술 등 다양한 콘텐츠 생성에 이용된다
AI, 기계 학습 : 데이터로부터 임의의 함수를 도출해보자!
입력값으로 부터 결과 값을 내는
함수를 만들어 내는 것
하드코딩 인공지능(?)
곱셈 인공지능(?)
GAN(Generative Adversarial Networks)
생성AI를 위해 대표적으로 활용되는 GAN 알고리즘
대표적인 Generative AI 서비스
대표적인 Generative AI 기업
서비스 구분 서비스명 웹사이트 과금 서비스설명
채팅 Chat-GPT https://ai.com 무료,유료 openai에서 만든 대화형 AI
채팅 GPT API https://platform.openai.com/playground 유료 API를 통해 GPT를 사용할 수 있음.
번역 DeepL https://www.deepl.com/translator 무료,유료 AI를 통해 번역을 해 줌
채팅 poe https://poe.com/ 무료 4가지 Chat-AI를 비교해볼 수 있음
파워포인트 beautiful https://www.beautiful.ai/ Freemium 텍스트를 입력하면 PPT로 만들어 줌
채팅 character https://beta.character.ai/ 무료 원하는 캐릭터와 채팅을 할 수 있음
받아쓰기 다글로 https://daglo.ai/ 무료,유료 음성을 텍스르로 변환
AI llama-dl https://github.com/shawwn/llama-dl 무료 메타에서 나온 LLAMA 유출본
프롬프트 promptbase https://promptbase.com/prompt 유료 프롬프트를 사고 파는 플랫폼
이미지 prompthero https://prompthero.com/ 무료 이미지를 키워드로 검색하고 그에 대한 프롬프트를 알아내는 서비스
채팅 native https://www.native.me 무료 모바일로 Chat-GPT를 이용할 수 있는 서비스. 한글로 입력하면 자동으로 영어로 물어보고, 답변을 한글로 보여줌.
프롬프트 learnprompting https://learnprompting.org/ 무료 프롬프트 작성법 배우는 곳
프롬프트 prompt-generator https://prompt-generator.cckn.vercel.app/ 무료 DAN 모드로 프롬프트 작성해주는 곳
이미지 DALL-E2 https://openai.com/product/dall-e-2 무료,유료 텍스트를 이미지로 바꿔주는 Openai 서비스
이미지 lexica https://lexica.art/ 무료 이미 생성된 AI 이미지를 검색으로 보여주는 서비스
이미지 vanceai https://vanceai.com/?medium=top_nav_logo Freemium 이미지 해상도를 AI로 개선시켜주는 서비스
이미지 scribblediffusion https://scribblediffusion.com/ 무료 대충 선을 그리면 멋진 그림으로 만들어주는 서비스
정보 교원을 위한 인공지능 https://bit.ly/41TlSBt 무료 교원을 위한 인공지능 첫걸음 (서울시교육청)
마인드맵 whimsical https://whimsical.com/ 무료,유료 인공지능 마인드맵
채팅 chat.d-id https://chat.d-id.com/ 무료,유료 음성으로 채팅을 하고 AI와 얼굴을 보며 대화
크롬확장프로그램 프롬프트 지니 https://bit.ly/aigptauto 무료 ChatGPT 자동 번역기, 한글로 입력하면 영어로 프롬프트를 넣어줌
크롬확장프로그램 ShareGPT https://bit.ly/aigptshare 무료 ChatGPT에서 작성한 채팅을 URL로 공유 가능하게 만들어줌
크롬확장프로그램 YouTube Summary https://bit.ly/AIYOUTUBE 무료 Youtube 영상의 내용을 텍스트로 요약해줌.
크롬확장프로그램 ChatGPT Writer https://bit.ly/AIEMAIL 무료 이메일을 chatgpt로 작성해줌
크롬확장프로그램 ArxivGPT https://bit.ly/ARXIVGPT 무료 Arxiv에 있는 논문을 요약해줌
크롬확장프로그램 AIPRM https://bit.ly/3JrVE1M 무료 다른 사람들이 저장해둔 프롬프트를 사용할 수 있음
크롬확장프로그램 ChatGPT Optimizer https://bit.ly/3Jr9b9E 무료 인터페이스에 기존 ChatGPT에 없던 여러 기능을 넣어줌
크롬확장프로그램 GoogleChatGPT https://bit.ly/41ZzivK 무료 프롬프트를 입력하면 구글에서 검색 결과를 넣어줘서 최신 정보 가능
크롬확장프로그램 WebChatGPT https://bit.ly/3YGnsE0 무료 프롬프트를 입력하면 구글에서 검색 결과를 넣어줘서 최신 정보 가능
채팅 AskUP http://pf.kakao.com/_BhxkWxj 무료,유료 카카오톡에서 ChatGPT를 사용할 수 있음. 친추 후 사용. by 업스케일
채팅 native https://www.native.me/ 무료 모바일에서 한글로 입력하면 영어로 프롬프트를 넣어주는 ChatGPT API 서비스
파워포인트 tome https://beta.tome.app 무료 텍스트를 넣으면 PPT를 만들어주는 서비스
API FutureTools https://www.futuretools.io/ 무료 AI 도구 모음 사이트
영상 pictory https://pictory.ai/ 유료 스크립트를 넣으면 영상으로 제작해주는 서비스
정보 theresanaiforthat https://theresanaiforthat.com/ 무료 유용한 AI 정보 모음
정보 AI Tool Master List https://bit.ly/41VdOjA 무료 유용한 AI 정보 모음
문서요약 Chat with any PDF https://www.chatpdf.com/ 무료 PDF 파일 내용 요약 서비스
문서요약 filechat https://www.filechat.io/ 무료,유료 PDF, docx, html, txt 내용 요약 서비스
사이트생성 Mixo https://app.mixo.io/ 유료 랜딩페이지를 만들어주는 서비스
이미지 sporky https://sporky.ai/ 무료 텍스트를 이미지로 만들어주는 서비스
Generative AI 도구 모음
Generative AI 도구 모음
1.챗GPT로 홍보 시나리오를 만들고
https://chat.openai.com/auth/login?next=/chat
2.미드저니로 AI 그림을 그린 후에
https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F
3.네이버 클로바로 음성을 합성하고
https://clova.ai/voice
4.D-ID로 모양 AI영상과 자막맞춤 AI기능을 사용하여
https://www.d-id.com/
저희 파트너사의 회사 홍보 영상을 30분만에 뚝딱 만들어 낸 결과물
https://www.youtube.com/watch?v=WZLTGDkGeww
Generative AI 활용은 -> 30분만에 회사 홍보 영상
AI 구현시의 이슈자체 생성AI 포털?
엔터테인먼트 및 미디어: 생성형 AI는 이미 게임이나 영화를 위한 더욱 사실적이고 몰입감
있는 가상 환경을 만드는 데 사용되고 있다.
전자상거래: 생성형 AI는 고객 데이터를 분석하고 제품·서비스에 대한 개인화된 추천을 생
성하는 데 사용되고 있다. 이를 통해 기업은 마케팅·판매 전략을 개선하고 고객 만족도와
충성도를 높일 수 있다.
의료: 생성형 AI를 사용하여 의료 이미지를 분석하고, 의사가 질병을 더욱 정확하고 빠르게
식별하고 진단할 수 있다. 또 다양한 질병에 대한 신약·치료법을 개발하는 데 사용될 수 있
다.
교육: 생성형 AI를 사용하여 학생을 위한 개인화된 학습 경험을 만들고 대화형 교육 콘텐트
를 생성할 수 있다.
제조 및 설계: 생성형 AI를 사용하여 새로운 제품 설계·제조 프로세스를 생성하고 공급망·
물류 운영을 최적화할 수 있다. 이를 통해 기업은 비용을 절감하고 효율성을 높일 수 있다.
Generative AI 활용분야는?
Generative AI 활용은…이미지, 글, 음악, 디자인…..
Generative AI - 디자인 및 설계
LLM 대표주자인
ChatGPT와 활용안
LLM(대규모 언어모델)이 트렌드
-22-
AI 알고리즘, Transformer와 그 후
□ 인공지능 모델의 발전은 2017년 Transformer가 분기점
• Transformer는 CNN, RNN 계열의 신경망 구조를 탈피한 Attention 메커니
즘만으로 구현
입력 데이터를 병렬적으로 처리하며, 모델의 품질, 훈련시간 면에서 효율
적이다
• 2017년 구글에서 내놓은 “Attention is all you need”라는 논문에서 처음 발
표
2021, NIA, 「IT & Future Strategy 보고서」
-23-
BERT와 GPT의 차이
□ Transformer 는 Encoder와 Decoder로 이루어짐
• Encoder를 중심으로 일부 알고리즘을 변경하여 BERT를 개발(현재 구글
번역엔진)
• Decoder에서 Multi-Head Attention을 제거하고 파라미터수를 늘린 모델이
GPT
BERT(Bidirectional Encoder Representations from Transformers)
GPT? 오랜시간 삽질의 결과….
데이터셋
45TB
GPT-3 ….GPT - 4 ?? In 2023
ChatGPT : https://chat.openai.com/chat
DALL-E
구글 인공지능 모델과 ChatGPT의 개발과정
ChatGPT란
ChatGPT란
✅ Open AI가 만든 초거대 언어 생성 모델을 이용한
AI 챗봇
[Ref] On the Opportunities and Risks of Foundation Models – https://arxiv.org/abs/2108.07258
 모든문제해결의기반이되는Foundation Model의등장
 엄청난양의데이터를이용한사전 훈련(pre-train)으로범용모델
생성
 Foundationmodel에Adaptation(orFine-tuning)과정을통해
각각의application/task에적용
ChatGPT란
✅ Open AI가 만든 초거대 언어 생성 모델을 이용한
AI 챗봇
 단어가리고맞추기형태로사람의개입없이도수많은데이터를학습가능
 자가 지도(Self-supervised)를이용한사전학습(Pre-training)이가능
 초거대모델의경우언어를단순기호로처리하는성능이발현되어프롬프
트만으로 새로운걸학습이가능:In-Context Learning/Prompt Learning
 프롬프트를어떻게잘쓰는지에따라모델의동작방식이달라지기때문에최
근에는
프롬프트엔지니어링이라는분야도생김
Make The World Smarter with SOSLAB
Make The World ? with SOSLAB
ChatGPT란
ChatGPT란
ChatGPT란
1750억개의 변수를 학습한 GPT 3.5 turbo기반의 챗봇 서비스
33
ChatGPT :
API
GPT3 : Fine-
Tunning
ChatGPT 사용법
둘 다 인터넷 연결이 항상 되어야 하며 클라우드 기반임(로컬 구축이 안됨)
API만 지원, Fine-Tuning안됨, 낮은 사용료
GPT 3.5/4.0
Fine-Tuning지원, 매우 높은 사용료
GPT 4, 5,6….MulitiModal , 아이폰 출현과 맞먹는??
35
ChatGPT 활용가이드
망분리
챗GPT 테마로 삼은 악성 플러그인, 페이스북 계정 탈취해
ChatGPT 활용가이드
보안은?
ChatGPT 활용가이드
그나마 다행……
MS 네이버 클로바
🆗할 것
- 그것이무엇이든초안을작성할때매우유용함(시간을매우절약함)
- 시킬때구체적인내용을prompt에함께줄것(e.g.자세하게,친근하게,혁신적인표현으로,한국어로,영
어로등)
- 시키는일의예시를보여주면좀더잘함(Few-shot)
- 항상내용을보고자세히읽고체크를해야함
- 영어로입력하고만들어진결과를한국어로번역하면보통퀄리티가더좋음(전문지식에가까운것일수
록더욱)
- 인터랙티브하게활용할것(e.g.위의결과에이렇게더해줘…)
- 매우그럴듯하지만일반적인수준이많아서본인만의차별화된내용추가필요
- 언어사용문화나법적인부분은학습이덜되어있음.사용시주의필요
🚫 하지 말 것
- 검색같이정확한답을기대하면안됨!(글을 잘 쓰는 AI일 뿐 그것이 Fact라는 보장 못함)
- 정확한내용이필요한글은내용이정확해야하는부분을반드시더블체크해야함.
- 최신지식을물어보지말것(지금집을사야할까?주식이런거사야하나?X)←2021.09데이터까지
학습
ChatGPT가 촉발한 초거대 AI시대 우리의 대응 전략 (하정우 / NAVER AI Lab 연구소장)
ChatGPT 활용가이드
프롬프트 작성을 위한 TIP
1. 프롬프트(입력문)를처음입력했을때,원하는결과를바로얻기는어려워요.만족스러운결과를얻을때까지입력, 테스트, 수정을 반
복해보세요.
2.광범위한질문보다는구체적인 단어를 포함해서 질문할 때 효과가높아요.대화의초점이나방향이불명확한경우,필요한답변
을받기어려워요. 자세히알고싶은주제와관련된세부정보나예시등추가정보를함께입력하세요.
❌ BAD:UX디자인에대해말해줘.
👍 BETTER:소규모스타트업을위한UX디자인의중요성에대해블로그포스팅을작성해줘.
3. 특정 역할을 요청하는건AI가요청의맥락을이해하도록만드는좋은장치가될수있어요!
👍“
영어선생님처럼내작문의문법실수를지적해줘.”
👍 Actas~:영문으로ChatGPT입력문을작성할때는“Actas~”로입력문을시작하면좋아요.(e.g.,마케터처럼,PM처럼,면접관처럼)
4. 다양한답변 형식을 요청할수있어요.
👍”이메일형식으로써줘/블로그포스팅의개요를작성해줘/표를그려줘/엑셀시트형식으로답변해줘/파이썬,HTML코드를작
성해줘”
[Ref] ChatGPT 활용 가이드(프롬프터 자료) / 헤이조이스
ChatGPT 활용가이드
보고서 작성
즉시 제출할 수 있는 보고서 작성
법령, 규정 등 검색 챗봇 활용
새로운 아이디어 탐색
YouTube 추천 같은 개인화 서비스
“나” 맞춤형 업무 지시
한글, 엑셀 등 문서 서식 변환
같은 내용을 다른 어조로 변환
단락을 요약하거나 번역하기
그림 그리기
표 해석시키기
한글, 영어 모두 가능. 분량 지정
가능
허위 사실 포함 가능. 사실 검증
필수.
사실에 민감하거나
최신성 중요 서비스는 위험
사실 관계와 무관하게 생각의 범
위 확장 가능.
동일 창에서만 기억 유지. 다시 접속
하면 초기화됨.
“나”에 대한 정보가 필요함.
RPA(업무 자동화)를 쓰세요.
예) 전문적  대중적
예) 영어  한국어
DALL.E, Stable Diffusion
등 별도 전문 모델 사용.
예) 동향 요약, 평균 출력
1
2
3
4
5
6
7
8
9
10
11
ChatGPT 활용가이드
ChatGPT 챗봇
LG전자의 “Home Chat”
- 홈챗은 모바일 메신저(카카오톡, 라인)를 이용해 집안의 가전제품과 채팅 하며 이러한 가전제품을 제어
할 수 있는 스마트홈 챗봇 서비스
- 매달 평균 1만 6,000여 가구, 하루 평균 550여 가구가 가입하고 있으며 2016년 1월 누적 가입자 가구 10
만 가구를 돌파
ChatGPT - 코딩
로컬 구축 LLM은?
Kor-Merino
AI 구현시의 이슈
AI의 실체
• 아주 큰 모델과 아주 많은 양의 텍스트를 사용해서 자연어를 이
해하고 생성할 수 있도록 학습된 모델
• attention과 transformer를 기반으로 한 BERT, ELMo, GPT 시리
즈 등
• 언어 모델링, 문장 생성, 질의응답, 요약, 번역 등 다양한 자연어
처리 작업을 수행
AI 구현시의 이슈
LLM이란?
AI 구현시의 이슈
LLM 모델의 추이
구분 BERT GPT(GPT-1)
제작 Google OpenAI
출시 공개: 2018.11. (출시: 2019.10.) 공개: 2018.6.
학습
데이터
 총 33억 개의 단어로 언어모델 학습
- 위키백과 25억 개, 도서말뭉치 8억 개
 7천 권의 도서 말뭉치 데이터로 모델 학습
- 이후 미세 조정을 위한 과업별 데이터 활
용
구조
 Base 모델: 인코더12개, 어텐션헤드12개, 학
습모수(파라미터) 1.1억 개
 Large 모델: 인코더 24개, 어텐션헤드 16개,
학습모수(퍼라미터) 3.3억 개
 디코더 12개, 어텐션 헤드는 각 디코더별12
개, 학습모수(파라미터) 1.17억 개
특징
 텍스트 데이터 중간을 빈 칸(마스크)으로 설
정 하여 예측하는 기법과 다음 문장 예측을
동시에 학습시켜 범용 언어모델 구축
 트랜스포머를 언어모델 학습에 활용하기
위 해 초점, 학습된 언어모델이 재학습에
효 율이 높은점을 착안하여 GPT2, GPT3
개발
모델명 크기변화(파라미터 수) 변화량
GPT(GPT1) 0.117B -
GPT2 1.5B GPT1 대비 12.8배
GPT3 175B GPT2 대비 117배
GPT3.5(ChatGPT) 1.3B, 6B, 175B “
도표 5 GPT-3 모델학습 데🕔터 규모
※ 자료: OpenAI, 언론기사, 삼일PwC경영연구
원
GPT-3
(총 753.4GB
)
웹 데이터
(570GB)
웹 문서
(50GB)
바이블리오틱e
북
(101GB)
위키피디아
문서 (11.
4GB)
구텐베르크
프로젝트 e
북 (21GB)
AI 구현시의 이슈BERT와 GPT 비교
• 데이터셋의 한계
LLM은 대규모의 데이터셋에서 학습되어야 하지만, 실제로는 모든 분야와 언어에 대한 충
분한 양의 데이터가 준비되어 있지 않다.
• 계산 리소스의 한계
LLM은 매우 큰 모델이기 때문에 학습 및 추론에 많은 계산 리소스가 필요. 따라서 이러한
모델을 학습하기 위해서는 대규모의 컴퓨팅 클러스터 또는 전용 하드웨어가 필요하다.
한정적인 데이터셋과 컴퓨터 하드웨어를 가지고는 처음부터 Train 시킬 수 없다.
이미 pretrained된 모델을 가져와서 Fine-Turning 하게 되면 시간 및 비용을 아낄 수 있다.
AI 구현시의 이슈
LLM의 한계점
• OpenAI : GPT-3, 상용 버전
(API 사용 – 비용 발생)
• GPT-J : GPT3의 오픈소스 버전
• Google : BERT
• Facebook : RoBERTa
(기존 BERT 모델 유지, 성능 ↑)
• SKT-AI : KoGPT
• Meta의 LLaMA : 오픈소스 버전
• DistilBERT
AI 구현시의 이슈
로컬로 구축가능한 LLM(빨간색)
로컬로 저비용으로 LLM을 구축하고 ChatGPT 성능을 내기 위해서는
빨간색으로 된 알고리즘 활용이 가장 현실적임
• GPT-3
https://lsjsj92.tistory.com/656
https://platform.openai.com/docs/guides/fine-tuning
• GPT-J : GPT-3의 오픈소스 버전
https://medium.com/ai-networkkr/ai-%EB%AA%A8%EB%8D%B8-%ED%83%90%ED%97%98%EA%B8%B0-21-gpt-
3%EC%9D%98-%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-%EB%B2%84%EC%A0%84-gpt-j-de3bdcdf65dd
• BERT
https://github.com/nlpyang/BertSum
• RoBERTa
https://huggingface.co/klue/roberta-small
• KoGPT
https://github.com/kakaobrain/kogpt
https://github.com/SKT-AI/KoGPT2/tree/3b3cbb79caed1ad8230ce6cb4b0cede94b353ec8#user-contributed-examples
https://www.youtube.com/watch?v=YLLGtpzupGQ
• Alpaca
https://github.com/tatsu-lab/stanford_alpaca#data-release
• DistilBERT
https://huggingface.co/docs/transformers/model_doc/distilbert
• 통합
https://github.com/kiyoungkim1/LMkor
AI 구현시의 이슈
로컬로 구축가능한 LLM 링크
AI 구현시의 이슈
로컬로 구축가능한 LLM 작업
자연어 데이터셋
(형태소분석기/
토크나이징)
GPU 서버
(4 GPU 장착 서버
2대 이상)
LLM 모델 선택
모델 검증
QA검증
“가장 중요”
문서 a4 1,000만장 기준 ,1,800자 기준, 18,000,000,000 글자
LLM기반 질의 응답 구축
방법 자원 소요 기간 및 작업량
특정 BERT모델 기반
fine-tuning
(많이 적용된 방식)
학습서버 - 최소 NVIDIA A100 16GB
추론서버 - 최소 GeForce RTX 3090
< 6~7개월 소요 >
 데이터 수집 및 전처리 : 3달
 학습 및 검증 : 3개월 (학습당 ~2일)
 웹서비스 개발 (추론)
ChatGPT API 사용
(GPT3는 fine-tuning 가능)
학습서버 - 최소 NVIDIA A100 16GB
추론서버 - 최소 GeForce RTX 3090
< 5~6개월소요 >
 데이터 수집 및 전처리 : 3달
 학습은 용량에 따라 과금 (현재 기능 제한적)
 웹서비스 개발 (추론)
ChatGPT 오픈소스 사용
(최신 방식)
학습서버 - 최소 NVIDIA A100 16GB
추론서버 - 최소 GeForce RTX 3090
< 6~7개월 소요 >
 데이터 수집 및 전처리 : 3달
 학습 및 검증 : 3개월 (학습당 ~3일)
 웹서비스 개발 (추론)
AI 구현시의 이슈
로컬로 구축가능한 LLM 작업
• 텍스트 분류(Text Classification)
감정 분석(Sentiment Analysis), 스팸 감지(Spam Detection) 등
• 개체명 인식(Named Entity Recognition, NER)
텍스트에서 특정 정보(이름, 날짜, 위치 등)를 추출
• 기계 번역(Machine Translation)
한 언어에서 다른 언어로 텍스트를 번역
• 질문 응답(Question Answering)
자연어 질문에 대해 텍스트에서 정확한 답변을 찾는 작업을 수행
• 텍스트 요약(Text Summarization)
긴 텍스트를 짧게 요약하는 작업을 수행할 수 있습니다.
• 텍스트 생성(Text Generation)
주어진 주제나 조건에 따라 새로운 텍스트를 생성
• 텍스트 완성(Text Completion)
주어진 텍스트의 빈칸을 적절한 단어나 문장으로 채우는 작업
AI 구현시의 이슈
LLM의 활용방안
구분 분야 활용 내용
사용자 편의
성 향상
의료
24시간 의료상담, 개인화된 치료 지원으로 의료 전문가는 이를 활용하여 고 품질의 서비스 제공 가능
법률
일본의 벤고시(변호사)닷컴은ChatGPT 법률상담 서비스를 예고, 기존 법률 및 판례 소개 등 일반적인 정보 제공 상황에 활용
농업
방대한 양의 데이터로 학습된 AI는 토양의 상태와 그에 따른 최적화된 작물 및 종자 선정 등 정보를 제공하여 접근성 개선
창작 영역
패션
AI 코디, AI 사이징, 최신 트렌드 분석, 패션 디자인, 시장조사 등에 소비자의 특성과 변화를 파악하기 위해 활용
마케팅
마케팅 자동화, 컨텐츠 제작 활용, 광고 최적화 등 기존 사람의 노력과 시간이 소요되던 작업의 생산성 개선
프
로
그
래
밍
ChatGPT를 활용한 스켈레톤 코드 확보, 코드 분석, 디버깅 자동화 등을 통해 개발 속도 개선과 교육 편의성 증대
AI 구현시의 이슈
LLM의 활용방안
AI 구현시의 이슈
LLM의 활용방안
내외부 교육, 직원 교육에 활용
도표 6 챗GPT와 같은AI 기술을 활용하여업무효율을높일수 있는 비즈니스분야 예시
마케팅· 영업 운영 IT
· 엔지니어링 법률 인사 인력최적화
마케팅및 영업콘텐
츠 (SNS, 기술서 등)
생성
생산상품관련 고객문의
사항 해결
복잡한 코딩 문제해결,
신규코드생성
계약, 특허출원 등 법적
문서 검토
인력 채용 시 사용될
면접 질문생성
사내 커뮤니케이션 기
능 최적화 (이메일발
송 자동화, 번역 등)
상품 및 서비스사용 가
이드북생성
프로세스에러, 생산 이
상, 상품결함등 파악 데이터테이블 자동 생
성
대량의규제 관련문서들
을 검토, 규제 변화추적
HR 업무 자동화 처리 (
Ex. 직원온보 딩, 복지,
규정 등 설명)
비즈니스 프레젠테이
션 생성
고객피드백 요약및
분석
프로세스 자동화를 통
해 고객서비스 향상
머신러닝 모델의훈련
정확도를 높이 기 위해
합성 데이터생성
공공 및 민간기관관
련 법적문서내 질의사
항 답변
온라인 회의 내용, 발
표 자료등 업무 요약
최적화된 영업방법추
출 하여 서비스
향상
문서분석을 통해 구체
적인 계약조건파악
사내 지식 포털관련
Q&A 자동화 처리
실시간 고객지원
서비스제공
고성능스캐너, 머신러닝
, 문서 인식등으로 회계
업무 자동화
※ 자료: 삼일PwC경영연구원
AI 구현시의 이슈
LLM의 활용방안
AI가 도와줄 듯

More Related Content

What's hot

What's hot (20)

ChatGPT에 대한 인문학적 이해
ChatGPT에 대한 인문학적 이해ChatGPT에 대한 인문학적 이해
ChatGPT에 대한 인문학적 이해
 
웹 Front-End 실무 이야기
웹 Front-End 실무 이야기웹 Front-End 실무 이야기
웹 Front-End 실무 이야기
 
인공지능과 딥러닝에 대한 소개
인공지능과 딥러닝에 대한 소개인공지능과 딥러닝에 대한 소개
인공지능과 딥러닝에 대한 소개
 
20170227 파이썬으로 챗봇_만들기
20170227 파이썬으로 챗봇_만들기20170227 파이썬으로 챗봇_만들기
20170227 파이썬으로 챗봇_만들기
 
데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.
 
Chat GPT_중학생 강의.pptx
Chat GPT_중학생 강의.pptxChat GPT_중학생 강의.pptx
Chat GPT_중학생 강의.pptx
 
코로나19로 인해 변화된 우리 시대의 데이터 트랜드
코로나19로 인해 변화된 우리 시대의 데이터 트랜드코로나19로 인해 변화된 우리 시대의 데이터 트랜드
코로나19로 인해 변화된 우리 시대의 데이터 트랜드
 
LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드
 
화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자화성에서 온 개발자, 금성에서 온 기획자
화성에서 온 개발자, 금성에서 온 기획자
 
기계학습 / 딥러닝이란 무엇인가
기계학습 / 딥러닝이란 무엇인가기계학습 / 딥러닝이란 무엇인가
기계학습 / 딥러닝이란 무엇인가
 
머신러닝의 자연어 처리기술(I)
머신러닝의 자연어 처리기술(I)머신러닝의 자연어 처리기술(I)
머신러닝의 자연어 처리기술(I)
 
고려대학교 컴퓨터학과 특강 - 대학생 때 알았더라면 좋았을 것들
고려대학교 컴퓨터학과 특강 - 대학생 때 알았더라면 좋았을 것들고려대학교 컴퓨터학과 특강 - 대학생 때 알았더라면 좋았을 것들
고려대학교 컴퓨터학과 특강 - 대학생 때 알았더라면 좋았을 것들
 
인공지능 방법론 - 딥러닝 이해하기
인공지능 방법론 - 딥러닝 이해하기인공지능 방법론 - 딥러닝 이해하기
인공지능 방법론 - 딥러닝 이해하기
 
[MLOps KR 행사] MLOps 춘추 전국 시대 정리(210605)
[MLOps KR 행사] MLOps 춘추 전국 시대 정리(210605)[MLOps KR 행사] MLOps 춘추 전국 시대 정리(210605)
[MLOps KR 행사] MLOps 춘추 전국 시대 정리(210605)
 
자습해도 모르겠던 딥러닝, 머리속에 인스톨 시켜드립니다.
자습해도 모르겠던 딥러닝, 머리속에 인스톨 시켜드립니다.자습해도 모르겠던 딥러닝, 머리속에 인스톨 시켜드립니다.
자습해도 모르겠던 딥러닝, 머리속에 인스톨 시켜드립니다.
 
Context2Vec 기반 단어 의미 중의성 해소, Word Sense Disambiguation
Context2Vec 기반 단어 의미 중의성 해소, Word Sense DisambiguationContext2Vec 기반 단어 의미 중의성 해소, Word Sense Disambiguation
Context2Vec 기반 단어 의미 중의성 해소, Word Sense Disambiguation
 
파이썬을 활용한 챗봇 서비스 개발 3일차
파이썬을 활용한 챗봇 서비스 개발 3일차파이썬을 활용한 챗봇 서비스 개발 3일차
파이썬을 활용한 챗봇 서비스 개발 3일차
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
 
생성인공지능둘러보기.pdf
생성인공지능둘러보기.pdf생성인공지능둘러보기.pdf
생성인공지능둘러보기.pdf
 
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
 

Similar to [코세나, kosena] 생성AI 프로젝트와 사례

에코노베이션 3차 세미나 교안 1st Edition.~
에코노베이션 3차 세미나 교안 1st Edition.~에코노베이션 3차 세미나 교안 1st Edition.~
에코노베이션 3차 세미나 교안 1st Edition.~
Lee Jungpyo
 

Similar to [코세나, kosena] 생성AI 프로젝트와 사례 (20)

[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례
[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례
[Partner TechForum] 딥러닝 기반의 챗봇 기술을 활용한 구축 사례
 
[마인즈랩] Ai 플랫폼 maum.ai 소개서 201707
[마인즈랩] Ai 플랫폼 maum.ai 소개서 201707[마인즈랩] Ai 플랫폼 maum.ai 소개서 201707
[마인즈랩] Ai 플랫폼 maum.ai 소개서 201707
 
02 fount ai_ir자료
02 fount ai_ir자료02 fount ai_ir자료
02 fount ai_ir자료
 
AI_introduction and requirements(2024.05.12).pdf
AI_introduction and requirements(2024.05.12).pdfAI_introduction and requirements(2024.05.12).pdf
AI_introduction and requirements(2024.05.12).pdf
 
Big data
Big dataBig data
Big data
 
인터렉 1주차 과제
인터렉 1주차 과제인터렉 1주차 과제
인터렉 1주차 과제
 
Google IO 2015 Keynote Summary
Google IO 2015 Keynote SummaryGoogle IO 2015 Keynote Summary
Google IO 2015 Keynote Summary
 
E-commerce BigData Scale AI Journey
E-commerce BigData Scale AI JourneyE-commerce BigData Scale AI Journey
E-commerce BigData Scale AI Journey
 
Neural stream
Neural streamNeural stream
Neural stream
 
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용
Python과 Tensorflow를 활용한  AI Chatbot 개발 및 실무 적용Python과 Tensorflow를 활용한  AI Chatbot 개발 및 실무 적용
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용
 
A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)
 
chatGPT 활용한 부산관광기업의 경쟁력강화.pptx
chatGPT 활용한 부산관광기업의 경쟁력강화.pptxchatGPT 활용한 부산관광기업의 경쟁력강화.pptx
chatGPT 활용한 부산관광기업의 경쟁력강화.pptx
 
에코노베이션 3차 세미나 교안 1st Edition.~
에코노베이션 3차 세미나 교안 1st Edition.~에코노베이션 3차 세미나 교안 1st Edition.~
에코노베이션 3차 세미나 교안 1st Edition.~
 
Brightics Studio 발표자료 AWSKRUG 염성욱
Brightics Studio 발표자료 AWSKRUG 염성욱Brightics Studio 발표자료 AWSKRUG 염성욱
Brightics Studio 발표자료 AWSKRUG 염성욱
 
[MINDsLab]maum.ai platform_Introduction_20230220.pdf
[MINDsLab]maum.ai platform_Introduction_20230220.pdf[MINDsLab]maum.ai platform_Introduction_20230220.pdf
[MINDsLab]maum.ai platform_Introduction_20230220.pdf
 
Oracle Digital Assistant 소개
Oracle Digital Assistant 소개Oracle Digital Assistant 소개
Oracle Digital Assistant 소개
 
1시간만에 만드는 음성인식 인공지능 챗봇
1시간만에 만드는 음성인식 인공지능 챗봇1시간만에 만드는 음성인식 인공지능 챗봇
1시간만에 만드는 음성인식 인공지능 챗봇
 
오픈소스 컨트리뷰톤 2020 backend.ai 발표자료
오픈소스 컨트리뷰톤 2020 backend.ai 발표자료오픈소스 컨트리뷰톤 2020 backend.ai 발표자료
오픈소스 컨트리뷰톤 2020 backend.ai 발표자료
 
키트웍스 AI day
키트웍스 AI day키트웍스 AI day
키트웍스 AI day
 
[마인즈랩] 마음아카데미 소개서 201707
[마인즈랩] 마음아카데미 소개서 201707[마인즈랩] 마음아카데미 소개서 201707
[마인즈랩] 마음아카데미 소개서 201707
 

More from kosena

More from kosena (11)

빅재미(BigZAMi), 빅데이터 분석 플랫폼(AutoML포함) 소개해 드립니다.
빅재미(BigZAMi), 빅데이터 분석 플랫폼(AutoML포함) 소개해 드립니다.빅재미(BigZAMi), 빅데이터 분석 플랫폼(AutoML포함) 소개해 드립니다.
빅재미(BigZAMi), 빅데이터 분석 플랫폼(AutoML포함) 소개해 드립니다.
 
[코세나, kosena] Auto ML, H2O.ai의 헬스케어분야 AI 활용 사례
[코세나, kosena] Auto ML, H2O.ai의 헬스케어분야 AI 활용 사례[코세나, kosena] Auto ML, H2O.ai의 헬스케어분야 AI 활용 사례
[코세나, kosena] Auto ML, H2O.ai의 헬스케어분야 AI 활용 사례
 
[코세나, kosena] Auto ML, H2O.ai의 보험분야 활용사례
[코세나, kosena] Auto ML, H2O.ai의 보험분야 활용사례[코세나, kosena] Auto ML, H2O.ai의 보험분야 활용사례
[코세나, kosena] Auto ML, H2O.ai의 보험분야 활용사례
 
[코세나, kosena] Auto ML, H2O.ai의 제조분야 AI 활용 사례
[코세나, kosena] Auto ML, H2O.ai의 제조분야 AI 활용 사례[코세나, kosena] Auto ML, H2O.ai의 제조분야 AI 활용 사례
[코세나, kosena] Auto ML, H2O.ai의 제조분야 AI 활용 사례
 
[코세나, kosena] Auto ML 플랫폼 : H2O.ai DAI
[코세나, kosena] Auto ML 플랫폼 : H2O.ai DAI[코세나, kosena] Auto ML 플랫폼 : H2O.ai DAI
[코세나, kosena] Auto ML 플랫폼 : H2O.ai DAI
 
[코세나, kosena] NFT Minting제언서
[코세나, kosena] NFT Minting제언서[코세나, kosena] NFT Minting제언서
[코세나, kosena] NFT Minting제언서
 
[코세나, kosena] 산업부문별 인공지능 활용제안 가이드
[코세나, kosena] 산업부문별 인공지능 활용제안 가이드[코세나, kosena] 산업부문별 인공지능 활용제안 가이드
[코세나, kosena] 산업부문별 인공지능 활용제안 가이드
 
[코세나, kosena] 금융권의 머신러닝 활용사례
[코세나, kosena] 금융권의 머신러닝 활용사례[코세나, kosena] 금융권의 머신러닝 활용사례
[코세나, kosena] 금융권의 머신러닝 활용사례
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드
 
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.
 
[코세나, kosena] FDS(Fraud Detection System) Securities
[코세나, kosena] FDS(Fraud Detection System) Securities[코세나, kosena] FDS(Fraud Detection System) Securities
[코세나, kosena] FDS(Fraud Detection System) Securities
 

[코세나, kosena] 생성AI 프로젝트와 사례

  • 1. 최근 AI 이슈와 LLM 구축방안 2023
  • 4.
  • 6. ChatGPT가 뭔가 요? 분류/추론 인공지능 (Discriminative Model) 고양이 생성 인공지능 (Generative Model) 고양이 최근 AI, Generative AI(생성AI)
  • 7. 최근 AI, Generative AI(생성AI) Generative AI란 이용자의 특정 요구에 따라 결과를 생성해내는 인공지능을 말한다. 데이터 원본을 통한 학습으로 주로 소설, 이미지, 비디오, 코딩, 시, 미술 등 다양한 콘텐츠 생성에 이용된다
  • 8. AI, 기계 학습 : 데이터로부터 임의의 함수를 도출해보자! 입력값으로 부터 결과 값을 내는 함수를 만들어 내는 것 하드코딩 인공지능(?) 곱셈 인공지능(?)
  • 9. GAN(Generative Adversarial Networks) 생성AI를 위해 대표적으로 활용되는 GAN 알고리즘
  • 12. 서비스 구분 서비스명 웹사이트 과금 서비스설명 채팅 Chat-GPT https://ai.com 무료,유료 openai에서 만든 대화형 AI 채팅 GPT API https://platform.openai.com/playground 유료 API를 통해 GPT를 사용할 수 있음. 번역 DeepL https://www.deepl.com/translator 무료,유료 AI를 통해 번역을 해 줌 채팅 poe https://poe.com/ 무료 4가지 Chat-AI를 비교해볼 수 있음 파워포인트 beautiful https://www.beautiful.ai/ Freemium 텍스트를 입력하면 PPT로 만들어 줌 채팅 character https://beta.character.ai/ 무료 원하는 캐릭터와 채팅을 할 수 있음 받아쓰기 다글로 https://daglo.ai/ 무료,유료 음성을 텍스르로 변환 AI llama-dl https://github.com/shawwn/llama-dl 무료 메타에서 나온 LLAMA 유출본 프롬프트 promptbase https://promptbase.com/prompt 유료 프롬프트를 사고 파는 플랫폼 이미지 prompthero https://prompthero.com/ 무료 이미지를 키워드로 검색하고 그에 대한 프롬프트를 알아내는 서비스 채팅 native https://www.native.me 무료 모바일로 Chat-GPT를 이용할 수 있는 서비스. 한글로 입력하면 자동으로 영어로 물어보고, 답변을 한글로 보여줌. 프롬프트 learnprompting https://learnprompting.org/ 무료 프롬프트 작성법 배우는 곳 프롬프트 prompt-generator https://prompt-generator.cckn.vercel.app/ 무료 DAN 모드로 프롬프트 작성해주는 곳 이미지 DALL-E2 https://openai.com/product/dall-e-2 무료,유료 텍스트를 이미지로 바꿔주는 Openai 서비스 이미지 lexica https://lexica.art/ 무료 이미 생성된 AI 이미지를 검색으로 보여주는 서비스 이미지 vanceai https://vanceai.com/?medium=top_nav_logo Freemium 이미지 해상도를 AI로 개선시켜주는 서비스 이미지 scribblediffusion https://scribblediffusion.com/ 무료 대충 선을 그리면 멋진 그림으로 만들어주는 서비스 정보 교원을 위한 인공지능 https://bit.ly/41TlSBt 무료 교원을 위한 인공지능 첫걸음 (서울시교육청) 마인드맵 whimsical https://whimsical.com/ 무료,유료 인공지능 마인드맵 채팅 chat.d-id https://chat.d-id.com/ 무료,유료 음성으로 채팅을 하고 AI와 얼굴을 보며 대화 크롬확장프로그램 프롬프트 지니 https://bit.ly/aigptauto 무료 ChatGPT 자동 번역기, 한글로 입력하면 영어로 프롬프트를 넣어줌 크롬확장프로그램 ShareGPT https://bit.ly/aigptshare 무료 ChatGPT에서 작성한 채팅을 URL로 공유 가능하게 만들어줌 크롬확장프로그램 YouTube Summary https://bit.ly/AIYOUTUBE 무료 Youtube 영상의 내용을 텍스트로 요약해줌. 크롬확장프로그램 ChatGPT Writer https://bit.ly/AIEMAIL 무료 이메일을 chatgpt로 작성해줌 크롬확장프로그램 ArxivGPT https://bit.ly/ARXIVGPT 무료 Arxiv에 있는 논문을 요약해줌 크롬확장프로그램 AIPRM https://bit.ly/3JrVE1M 무료 다른 사람들이 저장해둔 프롬프트를 사용할 수 있음 크롬확장프로그램 ChatGPT Optimizer https://bit.ly/3Jr9b9E 무료 인터페이스에 기존 ChatGPT에 없던 여러 기능을 넣어줌 크롬확장프로그램 GoogleChatGPT https://bit.ly/41ZzivK 무료 프롬프트를 입력하면 구글에서 검색 결과를 넣어줘서 최신 정보 가능 크롬확장프로그램 WebChatGPT https://bit.ly/3YGnsE0 무료 프롬프트를 입력하면 구글에서 검색 결과를 넣어줘서 최신 정보 가능 채팅 AskUP http://pf.kakao.com/_BhxkWxj 무료,유료 카카오톡에서 ChatGPT를 사용할 수 있음. 친추 후 사용. by 업스케일 채팅 native https://www.native.me/ 무료 모바일에서 한글로 입력하면 영어로 프롬프트를 넣어주는 ChatGPT API 서비스 파워포인트 tome https://beta.tome.app 무료 텍스트를 넣으면 PPT를 만들어주는 서비스 API FutureTools https://www.futuretools.io/ 무료 AI 도구 모음 사이트 영상 pictory https://pictory.ai/ 유료 스크립트를 넣으면 영상으로 제작해주는 서비스 정보 theresanaiforthat https://theresanaiforthat.com/ 무료 유용한 AI 정보 모음 정보 AI Tool Master List https://bit.ly/41VdOjA 무료 유용한 AI 정보 모음 문서요약 Chat with any PDF https://www.chatpdf.com/ 무료 PDF 파일 내용 요약 서비스 문서요약 filechat https://www.filechat.io/ 무료,유료 PDF, docx, html, txt 내용 요약 서비스 사이트생성 Mixo https://app.mixo.io/ 유료 랜딩페이지를 만들어주는 서비스 이미지 sporky https://sporky.ai/ 무료 텍스트를 이미지로 만들어주는 서비스 Generative AI 도구 모음
  • 14. 1.챗GPT로 홍보 시나리오를 만들고 https://chat.openai.com/auth/login?next=/chat 2.미드저니로 AI 그림을 그린 후에 https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F 3.네이버 클로바로 음성을 합성하고 https://clova.ai/voice 4.D-ID로 모양 AI영상과 자막맞춤 AI기능을 사용하여 https://www.d-id.com/ 저희 파트너사의 회사 홍보 영상을 30분만에 뚝딱 만들어 낸 결과물 https://www.youtube.com/watch?v=WZLTGDkGeww Generative AI 활용은 -> 30분만에 회사 홍보 영상
  • 15. AI 구현시의 이슈자체 생성AI 포털?
  • 16. 엔터테인먼트 및 미디어: 생성형 AI는 이미 게임이나 영화를 위한 더욱 사실적이고 몰입감 있는 가상 환경을 만드는 데 사용되고 있다. 전자상거래: 생성형 AI는 고객 데이터를 분석하고 제품·서비스에 대한 개인화된 추천을 생 성하는 데 사용되고 있다. 이를 통해 기업은 마케팅·판매 전략을 개선하고 고객 만족도와 충성도를 높일 수 있다. 의료: 생성형 AI를 사용하여 의료 이미지를 분석하고, 의사가 질병을 더욱 정확하고 빠르게 식별하고 진단할 수 있다. 또 다양한 질병에 대한 신약·치료법을 개발하는 데 사용될 수 있 다. 교육: 생성형 AI를 사용하여 학생을 위한 개인화된 학습 경험을 만들고 대화형 교육 콘텐트 를 생성할 수 있다. 제조 및 설계: 생성형 AI를 사용하여 새로운 제품 설계·제조 프로세스를 생성하고 공급망· 물류 운영을 최적화할 수 있다. 이를 통해 기업은 비용을 절감하고 효율성을 높일 수 있다. Generative AI 활용분야는?
  • 17. Generative AI 활용은…이미지, 글, 음악, 디자인…..
  • 18. Generative AI - 디자인 및 설계
  • 20.
  • 22. -22- AI 알고리즘, Transformer와 그 후 □ 인공지능 모델의 발전은 2017년 Transformer가 분기점 • Transformer는 CNN, RNN 계열의 신경망 구조를 탈피한 Attention 메커니 즘만으로 구현 입력 데이터를 병렬적으로 처리하며, 모델의 품질, 훈련시간 면에서 효율 적이다 • 2017년 구글에서 내놓은 “Attention is all you need”라는 논문에서 처음 발 표 2021, NIA, 「IT & Future Strategy 보고서」
  • 23. -23- BERT와 GPT의 차이 □ Transformer 는 Encoder와 Decoder로 이루어짐 • Encoder를 중심으로 일부 알고리즘을 변경하여 BERT를 개발(현재 구글 번역엔진) • Decoder에서 Multi-Head Attention을 제거하고 파라미터수를 늘린 모델이 GPT
  • 25. GPT? 오랜시간 삽질의 결과…. 데이터셋 45TB
  • 26. GPT-3 ….GPT - 4 ?? In 2023 ChatGPT : https://chat.openai.com/chat DALL-E
  • 27. 구글 인공지능 모델과 ChatGPT의 개발과정 ChatGPT란
  • 29. ✅ Open AI가 만든 초거대 언어 생성 모델을 이용한 AI 챗봇 [Ref] On the Opportunities and Risks of Foundation Models – https://arxiv.org/abs/2108.07258  모든문제해결의기반이되는Foundation Model의등장  엄청난양의데이터를이용한사전 훈련(pre-train)으로범용모델 생성  Foundationmodel에Adaptation(orFine-tuning)과정을통해 각각의application/task에적용 ChatGPT란
  • 30. ✅ Open AI가 만든 초거대 언어 생성 모델을 이용한 AI 챗봇  단어가리고맞추기형태로사람의개입없이도수많은데이터를학습가능  자가 지도(Self-supervised)를이용한사전학습(Pre-training)이가능  초거대모델의경우언어를단순기호로처리하는성능이발현되어프롬프 트만으로 새로운걸학습이가능:In-Context Learning/Prompt Learning  프롬프트를어떻게잘쓰는지에따라모델의동작방식이달라지기때문에최 근에는 프롬프트엔지니어링이라는분야도생김 Make The World Smarter with SOSLAB Make The World ? with SOSLAB ChatGPT란
  • 32. ChatGPT란 1750억개의 변수를 학습한 GPT 3.5 turbo기반의 챗봇 서비스
  • 33. 33 ChatGPT : API GPT3 : Fine- Tunning ChatGPT 사용법 둘 다 인터넷 연결이 항상 되어야 하며 클라우드 기반임(로컬 구축이 안됨) API만 지원, Fine-Tuning안됨, 낮은 사용료 GPT 3.5/4.0 Fine-Tuning지원, 매우 높은 사용료
  • 34.
  • 35. GPT 4, 5,6….MulitiModal , 아이폰 출현과 맞먹는?? 35
  • 37. 챗GPT 테마로 삼은 악성 플러그인, 페이스북 계정 탈취해 ChatGPT 활용가이드 보안은?
  • 39. 🆗할 것 - 그것이무엇이든초안을작성할때매우유용함(시간을매우절약함) - 시킬때구체적인내용을prompt에함께줄것(e.g.자세하게,친근하게,혁신적인표현으로,한국어로,영 어로등) - 시키는일의예시를보여주면좀더잘함(Few-shot) - 항상내용을보고자세히읽고체크를해야함 - 영어로입력하고만들어진결과를한국어로번역하면보통퀄리티가더좋음(전문지식에가까운것일수 록더욱) - 인터랙티브하게활용할것(e.g.위의결과에이렇게더해줘…) - 매우그럴듯하지만일반적인수준이많아서본인만의차별화된내용추가필요 - 언어사용문화나법적인부분은학습이덜되어있음.사용시주의필요 🚫 하지 말 것 - 검색같이정확한답을기대하면안됨!(글을 잘 쓰는 AI일 뿐 그것이 Fact라는 보장 못함) - 정확한내용이필요한글은내용이정확해야하는부분을반드시더블체크해야함. - 최신지식을물어보지말것(지금집을사야할까?주식이런거사야하나?X)←2021.09데이터까지 학습 ChatGPT가 촉발한 초거대 AI시대 우리의 대응 전략 (하정우 / NAVER AI Lab 연구소장) ChatGPT 활용가이드
  • 40. 프롬프트 작성을 위한 TIP 1. 프롬프트(입력문)를처음입력했을때,원하는결과를바로얻기는어려워요.만족스러운결과를얻을때까지입력, 테스트, 수정을 반 복해보세요. 2.광범위한질문보다는구체적인 단어를 포함해서 질문할 때 효과가높아요.대화의초점이나방향이불명확한경우,필요한답변 을받기어려워요. 자세히알고싶은주제와관련된세부정보나예시등추가정보를함께입력하세요. ❌ BAD:UX디자인에대해말해줘. 👍 BETTER:소규모스타트업을위한UX디자인의중요성에대해블로그포스팅을작성해줘. 3. 특정 역할을 요청하는건AI가요청의맥락을이해하도록만드는좋은장치가될수있어요! 👍“ 영어선생님처럼내작문의문법실수를지적해줘.” 👍 Actas~:영문으로ChatGPT입력문을작성할때는“Actas~”로입력문을시작하면좋아요.(e.g.,마케터처럼,PM처럼,면접관처럼) 4. 다양한답변 형식을 요청할수있어요. 👍”이메일형식으로써줘/블로그포스팅의개요를작성해줘/표를그려줘/엑셀시트형식으로답변해줘/파이썬,HTML코드를작 성해줘” [Ref] ChatGPT 활용 가이드(프롬프터 자료) / 헤이조이스 ChatGPT 활용가이드
  • 41. 보고서 작성 즉시 제출할 수 있는 보고서 작성 법령, 규정 등 검색 챗봇 활용 새로운 아이디어 탐색 YouTube 추천 같은 개인화 서비스 “나” 맞춤형 업무 지시 한글, 엑셀 등 문서 서식 변환 같은 내용을 다른 어조로 변환 단락을 요약하거나 번역하기 그림 그리기 표 해석시키기 한글, 영어 모두 가능. 분량 지정 가능 허위 사실 포함 가능. 사실 검증 필수. 사실에 민감하거나 최신성 중요 서비스는 위험 사실 관계와 무관하게 생각의 범 위 확장 가능. 동일 창에서만 기억 유지. 다시 접속 하면 초기화됨. “나”에 대한 정보가 필요함. RPA(업무 자동화)를 쓰세요. 예) 전문적  대중적 예) 영어  한국어 DALL.E, Stable Diffusion 등 별도 전문 모델 사용. 예) 동향 요약, 평균 출력 1 2 3 4 5 6 7 8 9 10 11 ChatGPT 활용가이드
  • 42. ChatGPT 챗봇 LG전자의 “Home Chat” - 홈챗은 모바일 메신저(카카오톡, 라인)를 이용해 집안의 가전제품과 채팅 하며 이러한 가전제품을 제어 할 수 있는 스마트홈 챗봇 서비스 - 매달 평균 1만 6,000여 가구, 하루 평균 550여 가구가 가입하고 있으며 2016년 1월 누적 가입자 가구 10 만 가구를 돌파
  • 46. • 아주 큰 모델과 아주 많은 양의 텍스트를 사용해서 자연어를 이 해하고 생성할 수 있도록 학습된 모델 • attention과 transformer를 기반으로 한 BERT, ELMo, GPT 시리 즈 등 • 언어 모델링, 문장 생성, 질의응답, 요약, 번역 등 다양한 자연어 처리 작업을 수행 AI 구현시의 이슈 LLM이란?
  • 47. AI 구현시의 이슈 LLM 모델의 추이
  • 48. 구분 BERT GPT(GPT-1) 제작 Google OpenAI 출시 공개: 2018.11. (출시: 2019.10.) 공개: 2018.6. 학습 데이터  총 33억 개의 단어로 언어모델 학습 - 위키백과 25억 개, 도서말뭉치 8억 개  7천 권의 도서 말뭉치 데이터로 모델 학습 - 이후 미세 조정을 위한 과업별 데이터 활 용 구조  Base 모델: 인코더12개, 어텐션헤드12개, 학 습모수(파라미터) 1.1억 개  Large 모델: 인코더 24개, 어텐션헤드 16개, 학습모수(퍼라미터) 3.3억 개  디코더 12개, 어텐션 헤드는 각 디코더별12 개, 학습모수(파라미터) 1.17억 개 특징  텍스트 데이터 중간을 빈 칸(마스크)으로 설 정 하여 예측하는 기법과 다음 문장 예측을 동시에 학습시켜 범용 언어모델 구축  트랜스포머를 언어모델 학습에 활용하기 위 해 초점, 학습된 언어모델이 재학습에 효 율이 높은점을 착안하여 GPT2, GPT3 개발 모델명 크기변화(파라미터 수) 변화량 GPT(GPT1) 0.117B - GPT2 1.5B GPT1 대비 12.8배 GPT3 175B GPT2 대비 117배 GPT3.5(ChatGPT) 1.3B, 6B, 175B “ 도표 5 GPT-3 모델학습 데🕔터 규모 ※ 자료: OpenAI, 언론기사, 삼일PwC경영연구 원 GPT-3 (총 753.4GB ) 웹 데이터 (570GB) 웹 문서 (50GB) 바이블리오틱e 북 (101GB) 위키피디아 문서 (11. 4GB) 구텐베르크 프로젝트 e 북 (21GB) AI 구현시의 이슈BERT와 GPT 비교
  • 49. • 데이터셋의 한계 LLM은 대규모의 데이터셋에서 학습되어야 하지만, 실제로는 모든 분야와 언어에 대한 충 분한 양의 데이터가 준비되어 있지 않다. • 계산 리소스의 한계 LLM은 매우 큰 모델이기 때문에 학습 및 추론에 많은 계산 리소스가 필요. 따라서 이러한 모델을 학습하기 위해서는 대규모의 컴퓨팅 클러스터 또는 전용 하드웨어가 필요하다. 한정적인 데이터셋과 컴퓨터 하드웨어를 가지고는 처음부터 Train 시킬 수 없다. 이미 pretrained된 모델을 가져와서 Fine-Turning 하게 되면 시간 및 비용을 아낄 수 있다. AI 구현시의 이슈 LLM의 한계점
  • 50. • OpenAI : GPT-3, 상용 버전 (API 사용 – 비용 발생) • GPT-J : GPT3의 오픈소스 버전 • Google : BERT • Facebook : RoBERTa (기존 BERT 모델 유지, 성능 ↑) • SKT-AI : KoGPT • Meta의 LLaMA : 오픈소스 버전 • DistilBERT AI 구현시의 이슈 로컬로 구축가능한 LLM(빨간색) 로컬로 저비용으로 LLM을 구축하고 ChatGPT 성능을 내기 위해서는 빨간색으로 된 알고리즘 활용이 가장 현실적임
  • 51. • GPT-3 https://lsjsj92.tistory.com/656 https://platform.openai.com/docs/guides/fine-tuning • GPT-J : GPT-3의 오픈소스 버전 https://medium.com/ai-networkkr/ai-%EB%AA%A8%EB%8D%B8-%ED%83%90%ED%97%98%EA%B8%B0-21-gpt- 3%EC%9D%98-%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-%EB%B2%84%EC%A0%84-gpt-j-de3bdcdf65dd • BERT https://github.com/nlpyang/BertSum • RoBERTa https://huggingface.co/klue/roberta-small • KoGPT https://github.com/kakaobrain/kogpt https://github.com/SKT-AI/KoGPT2/tree/3b3cbb79caed1ad8230ce6cb4b0cede94b353ec8#user-contributed-examples https://www.youtube.com/watch?v=YLLGtpzupGQ • Alpaca https://github.com/tatsu-lab/stanford_alpaca#data-release • DistilBERT https://huggingface.co/docs/transformers/model_doc/distilbert • 통합 https://github.com/kiyoungkim1/LMkor AI 구현시의 이슈 로컬로 구축가능한 LLM 링크
  • 52. AI 구현시의 이슈 로컬로 구축가능한 LLM 작업 자연어 데이터셋 (형태소분석기/ 토크나이징) GPU 서버 (4 GPU 장착 서버 2대 이상) LLM 모델 선택 모델 검증 QA검증 “가장 중요”
  • 53.
  • 54. 문서 a4 1,000만장 기준 ,1,800자 기준, 18,000,000,000 글자 LLM기반 질의 응답 구축 방법 자원 소요 기간 및 작업량 특정 BERT모델 기반 fine-tuning (많이 적용된 방식) 학습서버 - 최소 NVIDIA A100 16GB 추론서버 - 최소 GeForce RTX 3090 < 6~7개월 소요 >  데이터 수집 및 전처리 : 3달  학습 및 검증 : 3개월 (학습당 ~2일)  웹서비스 개발 (추론) ChatGPT API 사용 (GPT3는 fine-tuning 가능) 학습서버 - 최소 NVIDIA A100 16GB 추론서버 - 최소 GeForce RTX 3090 < 5~6개월소요 >  데이터 수집 및 전처리 : 3달  학습은 용량에 따라 과금 (현재 기능 제한적)  웹서비스 개발 (추론) ChatGPT 오픈소스 사용 (최신 방식) 학습서버 - 최소 NVIDIA A100 16GB 추론서버 - 최소 GeForce RTX 3090 < 6~7개월 소요 >  데이터 수집 및 전처리 : 3달  학습 및 검증 : 3개월 (학습당 ~3일)  웹서비스 개발 (추론) AI 구현시의 이슈 로컬로 구축가능한 LLM 작업
  • 55. • 텍스트 분류(Text Classification) 감정 분석(Sentiment Analysis), 스팸 감지(Spam Detection) 등 • 개체명 인식(Named Entity Recognition, NER) 텍스트에서 특정 정보(이름, 날짜, 위치 등)를 추출 • 기계 번역(Machine Translation) 한 언어에서 다른 언어로 텍스트를 번역 • 질문 응답(Question Answering) 자연어 질문에 대해 텍스트에서 정확한 답변을 찾는 작업을 수행 • 텍스트 요약(Text Summarization) 긴 텍스트를 짧게 요약하는 작업을 수행할 수 있습니다. • 텍스트 생성(Text Generation) 주어진 주제나 조건에 따라 새로운 텍스트를 생성 • 텍스트 완성(Text Completion) 주어진 텍스트의 빈칸을 적절한 단어나 문장으로 채우는 작업 AI 구현시의 이슈 LLM의 활용방안
  • 56. 구분 분야 활용 내용 사용자 편의 성 향상 의료 24시간 의료상담, 개인화된 치료 지원으로 의료 전문가는 이를 활용하여 고 품질의 서비스 제공 가능 법률 일본의 벤고시(변호사)닷컴은ChatGPT 법률상담 서비스를 예고, 기존 법률 및 판례 소개 등 일반적인 정보 제공 상황에 활용 농업 방대한 양의 데이터로 학습된 AI는 토양의 상태와 그에 따른 최적화된 작물 및 종자 선정 등 정보를 제공하여 접근성 개선 창작 영역 패션 AI 코디, AI 사이징, 최신 트렌드 분석, 패션 디자인, 시장조사 등에 소비자의 특성과 변화를 파악하기 위해 활용 마케팅 마케팅 자동화, 컨텐츠 제작 활용, 광고 최적화 등 기존 사람의 노력과 시간이 소요되던 작업의 생산성 개선 프 로 그 래 밍 ChatGPT를 활용한 스켈레톤 코드 확보, 코드 분석, 디버깅 자동화 등을 통해 개발 속도 개선과 교육 편의성 증대 AI 구현시의 이슈 LLM의 활용방안
  • 57. AI 구현시의 이슈 LLM의 활용방안 내외부 교육, 직원 교육에 활용
  • 58. 도표 6 챗GPT와 같은AI 기술을 활용하여업무효율을높일수 있는 비즈니스분야 예시 마케팅· 영업 운영 IT · 엔지니어링 법률 인사 인력최적화 마케팅및 영업콘텐 츠 (SNS, 기술서 등) 생성 생산상품관련 고객문의 사항 해결 복잡한 코딩 문제해결, 신규코드생성 계약, 특허출원 등 법적 문서 검토 인력 채용 시 사용될 면접 질문생성 사내 커뮤니케이션 기 능 최적화 (이메일발 송 자동화, 번역 등) 상품 및 서비스사용 가 이드북생성 프로세스에러, 생산 이 상, 상품결함등 파악 데이터테이블 자동 생 성 대량의규제 관련문서들 을 검토, 규제 변화추적 HR 업무 자동화 처리 ( Ex. 직원온보 딩, 복지, 규정 등 설명) 비즈니스 프레젠테이 션 생성 고객피드백 요약및 분석 프로세스 자동화를 통 해 고객서비스 향상 머신러닝 모델의훈련 정확도를 높이 기 위해 합성 데이터생성 공공 및 민간기관관 련 법적문서내 질의사 항 답변 온라인 회의 내용, 발 표 자료등 업무 요약 최적화된 영업방법추 출 하여 서비스 향상 문서분석을 통해 구체 적인 계약조건파악 사내 지식 포털관련 Q&A 자동화 처리 실시간 고객지원 서비스제공 고성능스캐너, 머신러닝 , 문서 인식등으로 회계 업무 자동화 ※ 자료: 삼일PwC경영연구원 AI 구현시의 이슈 LLM의 활용방안