안녕하세요, 전처리 담당 AI 프로젝트의 발표를 맡게 된 ING 팀의 손지현이라고 합니다. 우선 발표로 들어가기 전, 팀원 소개를 하고자 하는데요, 저희는 개발자 3명, 기획자 한 명으로 이루어졌습니다. 여기서 개발자이자 팀장님이신 심승철님께서 기술 Q&A를 맡기 위해, 저는 전반적인 발표를 맡기 위해 이 자리에 섰습니다.
우선 발표 콘텐츠를 설명 드리자면, 저희는 문제진단, 해결방안, 결과소개, 그리고 사업화, 이 네 가지로 발표를 나눴습니다. 하지만 문제진단을 하기 앞서, 간단하게 배경 설명을 해야 할 것 같은데요,
요즘 digital transformation이란 말이 뜨면서 사람들은 여러 분야에 관심을 가지게 되었는데, 여기서 저희가 집중하고자 하는 부분은
Big Data, 또는 데이터 산업입니다. 특히 AI의 학습에 쓰이는 데이터의 역할에 관심을 가지게 되었는데, 저희는 AI와 자동화 시스템을 통해 어떻게 이 분야를 더욱 효율적으로 바꿔나갈지를 고민하게 되었습니다.
AI의 학습과정을 보자면 이렇게 정리가 되는데요, 여기서 시간 소모가 가장 큰 과정이 바로 여기 pre-processing, 혹은 데이터 전처리라고 합니다. 데이터 전처리 과정을 설명 드리자면, AI가 학습과정에 많은 데이터가 필요한데, AI가 이해할 수 있는 형식으로 데이터를 가공하고 정제하는 과정이 바로 데이터 전처리입니다. 현재 대부분 수작업으로 진행되기 때문에 가장 많은 시간과 인력을 소모하고 있죠.
그렇다면 이 부분에다가 RPA에 적용한다면 어떨까? 저희 프로젝트의 주제를 간단히 말씀 드리자면, AI를 학습시키는데 AI를 사용하자는 결론에 도달하는 거죠.
데이터 전처리 시장을 조사한 바, 현재 amazon mechanical turk와 crowdworks라는 두 기업이 자리잡고 있는데, 이 두 기업은 전처리 된 데이터가 필요한 기업과 전처리를 하고자 하는 일반인 아르바이트를 연결시켜주는 플랫폼이라 생각하시면 됩니다. 하지만 여기서 세가지 문제를 발견했는데, 이것은 한정된 유저 인터페이스, 데이트의 신뢰성 부족, 그리고 수작업으로 인한 비효율적 시스템입니다.
예시를 보여드리자면, 이게 AMT의 인터페이스인데요, 보시다시피 영수증 내용을 AI가 이해하도록 바꾸기 위해 일일이 내용을 옮겨 적어야 하는 형식입니다. 인터페이스도 웹으로만 접근 가능한거라 접근성도 안 좋고 상당히 번거롭죠.
그렇다면 저희가 생각해낸 솔루션들은? 첫째, 간편한 안드로이드 유저인터페이스를 만들고 UI/UX를 고칠 것, 둘째, 교차 인증 및 게이미피케이션 기능을 추가해서 정확도를 높일 것, 그리고 마지막으로 데이터전처리에 딥러닝 AI를 기반해서 사용자의 효율 및 정확성을 확보하는 것입니다. 특히 세번째가 중요한데, 제가 앞서 말씀 드린 AI를 이용해서 AI를 학습시킨다 개념에 들어간다고 생각하시면 됩니다.
앞에 두 솔루션을 설명 드리자면, UI/UX를 기존의 상품에 비해 사용자가 사용하기 편하게 고치고자 노력했습니다. 곧 제품시연 때 직접 체감하실 수 있을 것이라 믿고 다음 솔루션으로 넘어가겠습니다. 기존의 상품들의 경우, 본인의 성과를 체크하는 기능은 있어도 본인의 성과를 다른 작업자들과 비교하는 기능이 없었으며, 그나마 crowdworks에는 소수의 상위랭커 리스트만 있었습니다. 저희는 상대적 위치, 예를 들어 여기 상위 13%다, 등을 알려주며 사람들이 더욱 열심히 작업을 하도록 자극시키는 게이미피케이션 요소를 추가하고자 했습니다.
자, 마지막으로 가장 중요한 RPA의 응용으로 넘어갈텐데, 제품 시연이랑 함께 설명을 드리겠습니다. 저희 제품은 이미지 라벨링 자동화, 문자 라벨링 자동화, 그리고 음성 라벨링 자동화 이렇게 세 가지로 구성되어됩니다. 이미지 라벨링 자동화의 경우를 확인한다면 AI가 미리 이미지를 분석하고 확인한 다음, 세 가지 가능성을 제안한다면 사용자는 단순히 저 중 하나를 고르는 형식입니다. 다음 문자 라벨링의 경우, 아까 AMT 사진이랑 상당히 비교가 되는데, AI가 미리 문자를 인식해서 적어놓은 상태로 사용자는 단순히 맞는지 틀린지만 확인하고, 틀린 것들만 수정하는 형식입니다. 세번째도 두번째와 비슷한데, 이렇게 영상이 나왔을 때 AI가 인식하고 적어내린 것들을 작업자가 수정하는 형식입니다. 제품 시연을 넘어가기 전에 마지막으로 한 부분으로 보여드릴텐데요, 여기서 보시는 점수와 활동 내역은 사용자가 자신이 했던 것 일의 내역을 보고 자극될 수 있도록 시각화되어있는, 앞서 말씀드린 게이미피케이션의 일부라고 보시면 됩니다. 이 차트는 사용자가 했던 활동을 실시간 반영하며, 본인이 했던 것을 좀 더 예쁘게 볼 수 있도록 디자인되어있습니다.
이제 사업화를 할 시에 고려해야 할 것들을 몇 가지 제시하겠습니다. 제일 중요하다고 여긴 것들 은 시스템의 간편화, 경쟁업체의 고객화, 그리고 홍보였습니다. 간편화의 경우 특히 급여지급의 간편화가 필요한데, 복잡한 payment system을 가져 작업자의 의욕을 꺾었던 이전 서비스에 비해 저희는 카카오페이 등의 금융앱과의 제휴를 통해 인센티브 비용을 쉽게 제공하고자 합니다. 또, 이미 자리잡아있는 경쟁업체와 경쟁을 하기보다는 저희 RPA 솔루션을 제공하는 등의 협업을 생각했습니다. 마지막으로 홍보가 가장 중요한데, 일반인들도 작업자로써 활동할 수 있도록 데이터 전처리 플랫폼을 게임 광고, 가상화폐 대체 광고 등으로 가시화하는 것이 중요하다 생각합니다.
그렇다면 마지막으로 몇 가지 참고 장표들을 보여드릴 텐데요, 이 장표의 내용들은 안타깝게도 시간제한상 설명을 드리기 어렵지만 혹시나 저희 프로젝트에 대해서 궁금하실 분들을 위해 따로 마련해드렸습니다. 혹시 Q&A 때 알고 싶으신 점들이 있다면 언제든지 질문하시길 바랍니다.
이로써 발표를 마치겠습니다.
감사합니다.
H2O Driverless AI에 대한 소개와 IBM Power Systems 에서의 기능을 간략히 소개한 장표입니다.
In this presentation, IBM introduces H2O Driverless AI on IBM Power system to accelerate the speed of deep learning workflow .
최근 글로벌 혁신의 트렌드인 AI의 다양한 사례를 살펴보고 단계적으로 어떻게 접근하고 준비해야 할지를 알려드립니다. 이미지/비디오 인식 등 AI 어플리케이션의 유형과 트렌드를 전달드립니다. 특히 AWS AI 서비스를 성공적으로 도입하고 활용하기 위한 전략을 살펴보고 사례를 통한 Use Case를 통해 단계별 접근 전략을 소개드립니다. 이번 세미나를 통해 최신 AI트렌드와 정의, 그리고 사례 기반의 도입 유형, 접근 전략과 방법론 등을 알 수 있습니다.
더 많은 AWS 온라인 세미나 알아보기: https://aws.amazon.com/ko/events/webinars/series
H2O Driverless AI에 대한 소개와 IBM Power Systems 에서의 기능을 간략히 소개한 장표입니다.
In this presentation, IBM introduces H2O Driverless AI on IBM Power system to accelerate the speed of deep learning workflow .
최근 글로벌 혁신의 트렌드인 AI의 다양한 사례를 살펴보고 단계적으로 어떻게 접근하고 준비해야 할지를 알려드립니다. 이미지/비디오 인식 등 AI 어플리케이션의 유형과 트렌드를 전달드립니다. 특히 AWS AI 서비스를 성공적으로 도입하고 활용하기 위한 전략을 살펴보고 사례를 통한 Use Case를 통해 단계별 접근 전략을 소개드립니다. 이번 세미나를 통해 최신 AI트렌드와 정의, 그리고 사례 기반의 도입 유형, 접근 전략과 방법론 등을 알 수 있습니다.
더 많은 AWS 온라인 세미나 알아보기: https://aws.amazon.com/ko/events/webinars/series
스마트 제조: AWS를 활용한 제조사의 디지털 트랜스포메이션 실현 방법 및 사례 – 석진호 AWS 제조업 사업개발 담당, 최계현 현대건설기...Amazon Web Services Korea
제조사의 제조/생산에서부터 유통/서비스 체인, 그리고 비즈니스 오퍼레이션에 이르기까지 디지털 혁신을 어디에 얼마나 어떻게 활용하는 것이 중요해지고 있습니다. 제조사의 Digital Transformation을 위한 AWS의 다양한 기술 솔루션과 연관 사례를 소개해드립니다.
인공지능 기술은 차 산업혁명의 주요한 기반기술로서 글로벌 업체는 핵심 알고리즘 및 개발
플랫폼을 선도하며 핵심기술개발 및 표준 선점을 주도하고 있으며 국내는 인공지능 응용
기술 및 서비스 기술 및 경험을 우위로 표준 개발 주도권을 지속적으로 확보하고 국내외
표준 확산을 통해 국내 인공지능 산업의 경쟁력 강화를 위해 선도경쟁공략으로 선정
클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...Amazon Web Services Korea
제조업의 디지털 혁신을 위해 오퍼레이션 및 고객 데이터 등을 분석하고, 이를 경영 전략에 활용하는 것이 점점 중요해 지고 있습니다. 본 세션에서는 제조업 현장에서 클라우드를 도입하는 다양한 국내외 사례를 통해 스마트 프로덕트를 기획하는 단계부터 생산에 이르기까지 다양한 과정을 거치면서 어떻게 클라우드를 활용하여 혁신을 이루어 내었는지 삼성중공업, 현대 건설 기계 및 GS칼텍스 등 국내 사례 위주로 소개 합니다.
인공지능 / 기계학습 기반의 디지털 트랜스포메이션 및 글로벌 사례 - 김선수 사업개발 담당, AWS / 정진환 팀장, SK텔레콤 / 구태훈...Amazon Web Services Korea
인공지능 / 기계학습 기반의 디지털 트랜스포메이션 및 글로벌 사례
김선수 사업개발 담당, AWS
정진환 팀장, SK텔레콤
구태훈 데이터기획부 부서장, KB국민은행
디지털 트랜스포메이션에 있어서 인공 지능 및 기계 학습(AI/ML) 기술은 핵심 기술이자 필수요소가 되었습니다. 전 세계 많은 고객들이 효과적으로 활용하고 있는 AWS의 AI/ML서비스에 대해서 알아보고, 이러한 서비스를 통해 다양한 혁신을 이루고 있는 주요 고객 현황과 트렌드를 살펴 봅니다. 아울러, 실제로 비즈니스에 성공적으로 적용한 고객 사례를 함께 소개합니다.
발표자: 석진호 제조업 사업개발, AWS / 이세현 솔루션즈 아키텍트
Part 1 : 제조업의 Digital Transformation 트렌드 및 사례
전반적인 Smart Factory 트렌드 및 방향성에 대해 제시합니다. 그리고 주요 AWS 기반 제조업이 어떻게 혁신하고 있는지 사례를 소개해드립니다.
Part 2 : Smart Factory의 AWS 주요 기술
Smart Factory와 Robotics에 사용되는 주요 기술들을 소개합니다. 제조업체가 여러 생산 프로세스 영역에서 디지털 방식으로 변환하는데 사용하는 주요 기술들에 대해 알아봅니다.
Event storming based msa training commerce example v2uEngine Solutions
Event storming based msa training with a commerce example. Contains analysis, implementation and operation by event storming and microservices frameworks and devops tools
More Related Content
Similar to Kpmg ideation challenge: ING team (korean)
스마트 제조: AWS를 활용한 제조사의 디지털 트랜스포메이션 실현 방법 및 사례 – 석진호 AWS 제조업 사업개발 담당, 최계현 현대건설기...Amazon Web Services Korea
제조사의 제조/생산에서부터 유통/서비스 체인, 그리고 비즈니스 오퍼레이션에 이르기까지 디지털 혁신을 어디에 얼마나 어떻게 활용하는 것이 중요해지고 있습니다. 제조사의 Digital Transformation을 위한 AWS의 다양한 기술 솔루션과 연관 사례를 소개해드립니다.
인공지능 기술은 차 산업혁명의 주요한 기반기술로서 글로벌 업체는 핵심 알고리즘 및 개발
플랫폼을 선도하며 핵심기술개발 및 표준 선점을 주도하고 있으며 국내는 인공지능 응용
기술 및 서비스 기술 및 경험을 우위로 표준 개발 주도권을 지속적으로 확보하고 국내외
표준 확산을 통해 국내 인공지능 산업의 경쟁력 강화를 위해 선도경쟁공략으로 선정
클라우드를 활용한 디지털 제조(Digital Manufacturing)실현 방법 및 사례 소개 - 윤석찬 (AWS 테크에반젤리스트) :: ...Amazon Web Services Korea
제조업의 디지털 혁신을 위해 오퍼레이션 및 고객 데이터 등을 분석하고, 이를 경영 전략에 활용하는 것이 점점 중요해 지고 있습니다. 본 세션에서는 제조업 현장에서 클라우드를 도입하는 다양한 국내외 사례를 통해 스마트 프로덕트를 기획하는 단계부터 생산에 이르기까지 다양한 과정을 거치면서 어떻게 클라우드를 활용하여 혁신을 이루어 내었는지 삼성중공업, 현대 건설 기계 및 GS칼텍스 등 국내 사례 위주로 소개 합니다.
인공지능 / 기계학습 기반의 디지털 트랜스포메이션 및 글로벌 사례 - 김선수 사업개발 담당, AWS / 정진환 팀장, SK텔레콤 / 구태훈...Amazon Web Services Korea
인공지능 / 기계학습 기반의 디지털 트랜스포메이션 및 글로벌 사례
김선수 사업개발 담당, AWS
정진환 팀장, SK텔레콤
구태훈 데이터기획부 부서장, KB국민은행
디지털 트랜스포메이션에 있어서 인공 지능 및 기계 학습(AI/ML) 기술은 핵심 기술이자 필수요소가 되었습니다. 전 세계 많은 고객들이 효과적으로 활용하고 있는 AWS의 AI/ML서비스에 대해서 알아보고, 이러한 서비스를 통해 다양한 혁신을 이루고 있는 주요 고객 현황과 트렌드를 살펴 봅니다. 아울러, 실제로 비즈니스에 성공적으로 적용한 고객 사례를 함께 소개합니다.
발표자: 석진호 제조업 사업개발, AWS / 이세현 솔루션즈 아키텍트
Part 1 : 제조업의 Digital Transformation 트렌드 및 사례
전반적인 Smart Factory 트렌드 및 방향성에 대해 제시합니다. 그리고 주요 AWS 기반 제조업이 어떻게 혁신하고 있는지 사례를 소개해드립니다.
Part 2 : Smart Factory의 AWS 주요 기술
Smart Factory와 Robotics에 사용되는 주요 기술들을 소개합니다. 제조업체가 여러 생산 프로세스 영역에서 디지털 방식으로 변환하는데 사용하는 주요 기술들에 대해 알아봅니다.
Event storming based msa training commerce example v2uEngine Solutions
Event storming based msa training with a commerce example. Contains analysis, implementation and operation by event storming and microservices frameworks and devops tools
Similar to Kpmg ideation challenge: ING team (korean) (20)
20. 참고 1. Lean Plan
핵심지표
비용구조
솔루션 고유 가치 제안 경쟁우위
채널
수익원
고객군
• 데이터 전처리는 21세
기 최첨단 노가다로서
인공지능 솔루션 개발
시 80% 시간이 소요됨
• 사람이 수동으로 일일
이 확인해야 하며 인건
비 과다 투입됨 QA/QC
문제가 큼
문제점
• 이미지 라벨링 과정에
서 RPA를 이용해서 효
율 극대화
• RPA를 이용한 점에서
차별성
• 안드로이드 인터페이스
이용
• 인공지능 학습 데이터
전처리 작업 자동화로
인건비 절감
• 앱 스토어
• 웹사이트
• 가진 데이터의 정확도를 높이고자 하는 회사들
• RPA 솔루션 판매
• 개발비용
• 작업자를 위한 인센티브 비용
• 절감 Manhour 시간 x
평균인건비 = 절감금액
• 머신러닝 데이터 플랫
폼 회사 (크라우드윅스,
AMT, 셀렉트스타 등)
• 데이터학습을 위해 데
이터가 필요한 인공지
능 회사
• 원격으로 편하게 돈 벌
고자 하는 작업자들
참고 1. Lean Plan
21. 클라이언트 물리서버
웹서버/웹어플리케이션
서버 (톰캣&스프링)
데이터베이스
AI
1
4
3
1.안드로이드에서 Sound Labelling
작업을 할 동영상 파일을 음성파일으
로 변환하는 요청을 합니다.
2. FFmpeg 인코더를 통해 동영상파
일 음성파일로 변환합니다.
3.Clova Speech Recognition API를
통해 음성파일에 대한 자막파일을 생
성합니다.
4.음성파일과 자막파일에 대한 정보
를 데이터베이스에 저장합니다.
인코더
2
참고 2. Sound Labelling Automation
22. 클라이언트
웹서버/웹어플리케이션
서버 (톰캣&스프링)
데이터베이스
1
3
1.안드로이드에서 OCR(Optical Char
acter Recognition) Labelling 작업
을 할 이미지 파일에서 텍스트 정보
추출을 요청을 합니다.
2. Tesseract-OCR을 통해 이미지에서
글자를 탐지(Detection)하고, 탐지한
글자를 인식(Recognition)하여 텍스
트를 생성합니다.
3. 이미지파일과 텍스트 정보를 데이
터베이스에 저장합니다.
AI
2
참고 3. OCR Labelling Automation
물리서버
23. 클라이언트
웹서버/웹어플리케이션
서버 (톰캣&스프링)
데이터베이스
1
3
1.안드로이드에서 Image Labelling
작업을 할 이미지 파일과 유사한 물체
3가지에 대한 텍스트 정보를 서버에
요청합니다.
2. CNN Layer를 사용해 학습한 모델
을 통해 요청한 이미지와 유사도가 가
장 높은 물체 3가지에 대한 텍스트
정보를 생성하고, 반환합니다.
3.이미지 파일과 사용자가 입력한 라
벨링 텍스트를 데이터베이스에 저장
합니다.
AI
2
CNN
참고 4. Image Labelling Automation
*부가설명
-cifar100* 데이터를 사용하여 학습 (*cifar100 : 물체 100개에 대해서 구성되어 있는 데이터 셋)
-CNN Layer를 사용해 학습, activation function은 relu 사용 -batch normalization으로 정규화
- loss function으로 categorical crossentropy 사용
-Input 32 x 32 크기로 이미지 받고 output layer 노드 개수는 100개로 물체가 100 개 이기 때문에 노드 개수를 100개로 설정
물리서버