우리 생활의 밀접한 교통수단인 철도는 최근 열차탈선사고가 잇따라 발생하면서 철도안전에 빨간불이 들어와 철도안전의 중요성이 대두되고 있다. 이러한 이유로 철도사고위험예측을 진행하여 철도안전관계자의 의사결정을 지원하여 철도안전에 이바지 하고자 한다.
철도사고 위험예측 프로세스는 다음과 같다. 철도사고에 대한 통계적 데이터분석을 통해 전반적인 데이터를 파악하고 신경망, Support Vector Machine과 같은 머신러닝 알고리즘을 적용하여 사고위험을 예측한다. 그리고 예측결과를 리포트로 생성하여 철도안전관계자에게 전달한다. 이처럼, 머신러닝을 활용한 방법에는 예측뿐만 아니라 추천 등 다양한 분야에 활용할 수 있으며, 이런 분야에 적용할 수 있는 머신러닝 플랫폼에 간략히 소개하고자 한다.
[2016 데이터 그랜드 컨퍼런스] 4 1(인공지능). 경희대 이경전 교수 경험과 사례를 통한 인공지능 응용 및 사업 방법론K data
Button Internet 회사 벤플은 공간에 부착된 버튼을 누르면, 누른 개인에게 합당한 맞춤형 서비스를 제공하며, 해당 공간의 사용자에게 마케팅을 하고자 하는 사업자들의 정보와 서비스를 자연스럽게 전달하는 세렌디피티 서비스를 제공한다. 또한, 새로운 문화 채널 benple G 앱을 통한 문화 장소/이벤트 추천에도 세렌디피티 추천 방법론을 활용한다. 이렇게, IoT와 O2O가 결합된 사업에서의 인공지능 기법 응용 사례를 설명하고, 경희대 소셜네트워크과학과 Serendipity Science Lab에서 진행하고 있는 딥 러닝과 기계 학습 기반 투자 앙상블 운용 시스템 연구에 대해서 소개한다. 또한, 미국인공지능학회의 혁신적 인공지능 응용상을 수상했던 Spatial Scheduling Expert System과 Construction Project Planning System의 구현 및 적용 경험을 소개함으로써, 기업이 경영관리와 신사업 창출, 그리고 고객 가치 혁신에 어떻게 AI를 응용할 수 있을지 인사이트를 제공한다.
[2016 데이터 그랜드 컨퍼런스] 3 1(io t). 핸디소프트-finding benefits of iot_service by case ...K data
IoT 플랫폼(HandyPIA IoT Platform) 소개와 이를 기반으로 구축된 다양한 분야의 IoT 서비스(보일러, 스마트웨어, 자전거 분실방지, 스마트 오피스) 사례를 소개하며, 각 서비스 구축시 고려해야 할 다양한 KnowHow와 일부 서비스에서의 데이터 분석 사례를 통해 IoT 서비스의 유효성에 대한 소개를 합니다.
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안K data
빅데이터 시대에서 중요한 것은 의미 분석입니다. 통계분석에서 얻을 수 없는 가치를 빅데이터 분석을 통해 얻을 수 있습니다. 빅데이터는 정형데이터와 비정형데이터를 모두 포함하며, 기업 내부 문서, 이메일, ERP, CRM 같은 시스템에도 있고, 소셜 미디어, 웹블로그 같은 일반 인터넷에도 존재 합니다.
인공지능 알고리즘은 빅데이터를 활용하고 숨은 의미를 찾는데 중요한 역할을 합니다. 현재의 인공지능 기술은 아직 인간의 상식, 창의성, 도덕성을 담을 수 없는 한계를 안고 있습니다. 그러나 특정 분야에서, 예를 들어 고객 민원 자동 분류, 금융 상품 상담과 같은 영역에서 인간보다 뛰어난 처리 능력을 보일 수 있습니다. 궁극적으로 일처리에 효율과 효과를 높이는 방향으로 빅데이터와 인공지능이 활용되고 있습니다.
인공지능 스타트업 마인드셋은creative AI platform을 NASA Jet Propultion Lab과 협업하여 개발하였고, 현재 두가지 상품을 시장에 출시했다. 이번 강연에서는 게임에 적용되는 핵심 인공지능 알고리즘 그리고 자연어 처리와 실제 데모를 보여줄 예정이다.
[2016 데이터 그랜드 컨퍼런스] 4 1(인공지능). 경희대 이경전 교수 경험과 사례를 통한 인공지능 응용 및 사업 방법론K data
Button Internet 회사 벤플은 공간에 부착된 버튼을 누르면, 누른 개인에게 합당한 맞춤형 서비스를 제공하며, 해당 공간의 사용자에게 마케팅을 하고자 하는 사업자들의 정보와 서비스를 자연스럽게 전달하는 세렌디피티 서비스를 제공한다. 또한, 새로운 문화 채널 benple G 앱을 통한 문화 장소/이벤트 추천에도 세렌디피티 추천 방법론을 활용한다. 이렇게, IoT와 O2O가 결합된 사업에서의 인공지능 기법 응용 사례를 설명하고, 경희대 소셜네트워크과학과 Serendipity Science Lab에서 진행하고 있는 딥 러닝과 기계 학습 기반 투자 앙상블 운용 시스템 연구에 대해서 소개한다. 또한, 미국인공지능학회의 혁신적 인공지능 응용상을 수상했던 Spatial Scheduling Expert System과 Construction Project Planning System의 구현 및 적용 경험을 소개함으로써, 기업이 경영관리와 신사업 창출, 그리고 고객 가치 혁신에 어떻게 AI를 응용할 수 있을지 인사이트를 제공한다.
[2016 데이터 그랜드 컨퍼런스] 3 1(io t). 핸디소프트-finding benefits of iot_service by case ...K data
IoT 플랫폼(HandyPIA IoT Platform) 소개와 이를 기반으로 구축된 다양한 분야의 IoT 서비스(보일러, 스마트웨어, 자전거 분실방지, 스마트 오피스) 사례를 소개하며, 각 서비스 구축시 고려해야 할 다양한 KnowHow와 일부 서비스에서의 데이터 분석 사례를 통해 IoT 서비스의 유효성에 대한 소개를 합니다.
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안K data
빅데이터 시대에서 중요한 것은 의미 분석입니다. 통계분석에서 얻을 수 없는 가치를 빅데이터 분석을 통해 얻을 수 있습니다. 빅데이터는 정형데이터와 비정형데이터를 모두 포함하며, 기업 내부 문서, 이메일, ERP, CRM 같은 시스템에도 있고, 소셜 미디어, 웹블로그 같은 일반 인터넷에도 존재 합니다.
인공지능 알고리즘은 빅데이터를 활용하고 숨은 의미를 찾는데 중요한 역할을 합니다. 현재의 인공지능 기술은 아직 인간의 상식, 창의성, 도덕성을 담을 수 없는 한계를 안고 있습니다. 그러나 특정 분야에서, 예를 들어 고객 민원 자동 분류, 금융 상품 상담과 같은 영역에서 인간보다 뛰어난 처리 능력을 보일 수 있습니다. 궁극적으로 일처리에 효율과 효과를 높이는 방향으로 빅데이터와 인공지능이 활용되고 있습니다.
인공지능 스타트업 마인드셋은creative AI platform을 NASA Jet Propultion Lab과 협업하여 개발하였고, 현재 두가지 상품을 시장에 출시했다. 이번 강연에서는 게임에 적용되는 핵심 인공지능 알고리즘 그리고 자연어 처리와 실제 데모를 보여줄 예정이다.
[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...K data
비용절감 및 클라우드를 통한 각종 효율성을 위해 기존의 인프라에서 구축된 데이터베이스들이 클라우드 환경으로 이관되거나 신규 구축될 때, 데이터베이스 보안 구축도 기존 고객이 직접 운영하는 인프라가 아닌 클라우드 서비스 사업자의 인프라로 이관되며 이에 따른 인프라 환경의 변화와 침해 사고 시 발생할 수 있는 책임소재의 분쟁, 법규의 변화 등 고민할 부분이 많아지게 된다. 따라서, 클라우드 환경에서의 데이터베이스 보안 구축은 클라우드로 데이터를 이관하기 전, 이관하는 단계 그리고 이관 이후에 데이터를 어떻게 보호할 것인가를 다양한 기술적인 측면으로 살펴볼 필요가 있다.
[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료K data
국내 클라우드 시장 현황은 공공에 의해서 선도되고 있으며 행정자치부의 G클라우드, 서울특별시의 IT Complex센터가 대표적입니다. 민간은 KT, LG, SK, 아마존 웹서비스가 사업을 선도하고 있습니다. 이와 같은 사업트렌드와 오픈소스 클라우드 도입에 따른 장점, 그리고 시장 내 다양한 오픈소스SW를 소개합니다. 또한 CUBRID의 실제 민간 공공 분야 적용사례에 대해서 안내합니다.
[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...K data
기존 레거시 시스템의 가장 중요한 자산은 데이터베이스이다. 전세계적인 클라우드화에 직면해서, 우리는 가장 중요한 데이터베이스를 어떻게 클라우드에 적용해서 비용을 절감하고, 비지니스의 유연성과 발전동력이 되기 위한 방안이 필요하다. 이에 기존 데이터베이스를 클라우드화 하는데 필요한 요구사항이 무엇인지를 살펴보고, 구체적인 기술적 요구사항을 정의해 본다. 그리고 이를 해결하기 위한 관련 기술동향과 솔루션들을 소개함으로써, 기업이 데이터베이스를 클라우드화하기 위한 새로운 시각을 제공하고자 한다.
[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남K data
정보통신 혁명으로 사회기반 시설이 된 인터넷 그 인터넷을 통해 사물들이 자동적으로 대화합니다.세계최초로 상용화한 사물인터넷 기술의 무인보관함은 과연 어떤대화를 나누고 거기서 우리는 어떤 의미 있는 가치를 찾을 수 있을까요? 이번 발표에서는 온라인 쇼핑몰의 발전과 현재 택배 시장 분석, 기존 택배시스템의 문제점, 기존 컴퓨터 기반 기계와 IoT 기술을 접목한 스마트박스의 차이, 휴대전화번호를 키 값으로하는 비식별조치화 된 개인정보를 통한 빅데이터 수집 및 활용의 가능성, 조합된 빅데이터로 가지는 개인정보유출 방지에 관련된 기대 효과, 스마트박스 IoT 플랫폼으로 활용되는 타제품...
[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상K data
국내 클라우드 시장 현황은 공공에 의해서 선도되고 있으며 행정자치부의 G클라우드, 서울특별시의 IT Complex센터가 대표적입니다. 민간은 KT, LG, SK, 아마존 웹서비스가 사업을 선도하고 있습니다. 이와 같은 사업트렌드와 오픈소스 클라우드 도입에 따른 장점, 그리고 시장 내 다양한 오픈소스SW를 소개합니다. 또한 CUBRID의 실제 민간 공공 분야 적용사례에 대해서 안내합니다.
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
미래의 ICT생태계는 데이터를 중심으로 형성될 것입니다. 디지털라이제이션(digitalization)의 가속화로 우리의 일상은 빠르게 데이터 기반으로 급변하고 있습니다. 빅데이터라는 용어가 라디오 프로그램의 선곡기준으로도 등장하는 현 시점에서 다양한 관점의 빅데이터를 살펴봄으로써 실제 산업 생태계에 가져올 기술, 사회, 제도적 혁신의 조짐을 살펴보고자 합니다.
먼저 오픈소스가 가져오는 IT 생태계의 변화와 공유경제라는 키워드를 통해 함께함으로써 커지는 데이터의 가치, 그리고 그 가치를 더욱 크게 할 메타데이터의 중요성을 이야기하겠습니다. 또한 데이터 생태계의 활성화를 위한 거래 플랫폼이 가진 멀티 사이드 플랫폼의 가치와 이러한 플랫폼 활성화를 위한 공공 정책의 데이터 기반 변화 트렌드와 개인 프라이버시 보호 트렌드 및 기술을 살펴보고자합니다.
[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-finalK data
머신러닝은 인공지능 내부 시스템 가운데 학습영역을 구체화한 기술로 데이터를 반복해서 기계를 학습시키는 알고리즘과 기술을 개발하는 분야이다. 머신러닝 알고리즘은 특성과 사용 분야를 기준으로 크게 유사성 베이스, 정보, 비지도, 신경망의 5가지 유형으로 분류된다. 이번 발표에서 머신러닝이 활용되는 산업별 세계 시장 규모와 실제 머신러닝이 어떻게 실생활에 적용되어 있는지 사례를 들어 설명할 예정이다. 특히 머신러닝 구현을 위해 필수적 요소인 도메인 지식 데이터의 중요성을 확인할 수 있다.
Malware detection within enterprise networks is a critical component of an effective information security strategy. Instances of malware attacks are increasing – making them especially important to detect – and data science can help. This presentation outlines data science driven approaches to finding domains that have time and user-based co-occurrence relationships. It also includes a demonstration of a scalable and operationalizable framework to detect domain associations by analyzing the web traffic of users in any organization.
Additional information:
http://www.datasciencecentral.com/video/dsc-webinar-series-data-science-driven-approaches-to-malware
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질K data
4차 산업혁명의 도래는 IOT, 빅데이터 관리 등 신 기술의 개발로 “광대한 데이터”의 활용이 가능함에 따라 급속도로 발전하고 있습니다. 여기서 간과해서 안 될 사실 하나는 수집, 활용되는 데이터의 정확성과 유의미성이라고 볼 수 있으며, 기존의 정형데이터 위주의 품질관리의 영역에서 비정형/빅데이터로 품질관리 기술도 개발되어야 합니다. 2000년 초반 DW/CRM 초기에 저 품질 데이터로 인한 시행착오를 우리는 기억하고 있습니다.
2016년, 그 동안 버려졌던 관측센서데이터, SNS 데이터, 통신데이터 등을 기반으로 하는 AI가 가까운 미래에 우리에게 새로운 문명의 혜택일지 재앙일지는 정확하지 않습니다. 이번 발표는 이런 폐해를 줄이기 위해 데이터 품질관리 동향, 사례, 향후 방향성에 대해 공유하고 고민하는 시간이 되겠습니다.
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안K data
개인정보보호법과 정통망법에 이어 상거래 종료 고객 데이터의 파기와 분리보관에 대한 신용정보법이 시행된 지 8개월이 지났습니다. 그러나, 실제 실무에 적용하기 위해서 많은 고려사항이 존재하고 추진하는데 어려움이 있는 것이 사실입니다. 또한 적용 범위와 구체적인 실행 방안에서도 많은 혼란이 있습니다. ㈜바넷정보기술이 개인정보 파기/분리보관 솔루션을 이용하여 금융권 고객사에 구축했던 경험을 기반으로 그 적용 과정에 발생했던 이슈들과 고려사항, 해결방안 등을 말씀 드리고자 합니다. 또한, 자체 개발로 진행할 때와 전문 솔루션을 구축할 때의 차이점과 필요한 기술들에 대해 소개함으로써 앞으로 사업 추진 방향을 결정하는데 도움을 드리고자 합니다. 그리고, 추가로 데이터 보안 관련 최신 트랜드와 관련 솔루션에 대해 간략히 소개합니다.
[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이 데이터정제와품질검증을위한mdm 시스템의기능과역할K data
기업 시스템의 기본 인프라인 기준정보관리는 기업에서 고품질의 정확한 데이터를 적시에 필요한 곳에서 사용할 수 있도록 기준정보의 라이프사이클을 관리하고, 기준정보가 필요한 곳에 연계하며, 기준정보의 품질을 관리합니다. 기준정보관리 프로젝트 과정에서 고품질 데이터의 확보를 위해 가장 기초적인 작업인 데이터정제(Cleansing)을 수행하게 됩니다. 데이터 정제작업은 다수의 현업 워킹그룹과 스프레드시트를 통해 협업을 진행하고, 변경된 표준과 품질규칙을 적용하기 위해서 매우 반복적이고 소모적인 작업을 수행하곤 합니다. 변경되는 표준체계와 추가되는 품질규칙을 효과적으로 데이터 정제작업에 반영하고, 현업 워킹그룹과 정제 수행그룹간의 효과적인 협업을 유도하고 지원하기 위한, 기준정보관리시스템(MDM)의 기능과 역할에 대해 살펴보고 제안하고자 합니다.
[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다K data
앱 시장이정체되고 AI에 대한 관심이 높아지면서 챗봇이 새로운 혁신으로 떠오르게 됐다. 인공지능을 가진 챗봇은 기존 앱과는 달리 사용자와의 대화와 교류를 통해 능동적인 일처리가 가능하다. 초기 챗봇기술은 명령어와 대답을 일대일 매칭시키는 시나리오방식이었다. 이후 점차 사람의 말을 잘 이해하는 NLU(Natural Language Understanding)기술이 개발되었고 Deep Learning을 통해 방대한 데이터를 바탕으로 사람의 말을 학습시키려는 노력이 진행되고 있다. 하지만 현 기술은 일차원적인 답변만 가능하다는 한계점을 지니고 있다. 그것을 극복하기 위해선 HTA(Hierarchical task analysis)기술이 필요하며 HTA기술은 챗봇의 지능을 한층 높이며 챗봇의 상용화에 크게 기여할 것이다.
[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상K data
공간정보의 역할? 데이터는 다른 데이터 소스들과 결합할 때 데이터의 진정한 가치가 발휘됩니다. 이중 고강은 많은 데이터 셋이 공존하게 하는 중요한 허브 역할을 합니다. 이와 함께 국가데이터가 개방되면서 공간정보의 역할은 무궁무진해졌습니다. 기존에 상권정보에만 국한되었던 GIS 분석 서비스가 이제는 Location Intelligence로 다양한 역할을 하기 시작하게 되었습니다. 복지시설의 입지 선정, 공공정책의 수립, 그리고 헬스케어 분야까지! 공간정보로 풀수 있는 빅데이터 세상! 그 가능성을 보여드립니다!
[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현K data
빅데이터 환경에서 기업의 의사결정에 필요한 DW 시스템은 더욱 중요해졌고, 대용량 데이터 분석은 필수가 되었다. 전통적인 DBMS의 확장성, 성능 한계를 해결하기 위해서 소프트웨어 뿐만 아니라 최신의 하드웨어 디바이스와 결합하여 어플라이언스 형태의 DW 구축이 대세가 되고 있는 환경에서, 국산 DBMS의 선두주자 티맥스소프트는 외산 DB 어플라이언스와 경쟁할 수 있는 데이터베이스 어플라이언스를 출시하였다. 최근 HP 하드웨어와 어플라이언스 협력 모델을 내놓았으며, 기존의 DBMS가 해결하지 못한 초대용량과 고성능, 그리고 데이터의 확장성이 특징이다. ZetaData는 고성능 데이터베이스 서버와 지능형 스토리지 서버, 초고속 네트워크를 통해 대용량 데이터의 빠른 처리와 시스템 안정성을 제공하는 통합(Consolidated) 데이터 솔루션이다.
[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략K data
빅데이터 환경에서 기업의 의사결정에 필요한 DW 시스템은 더욱 중요해졌고, 대용량 데이터 분석은 필수가 되었다. 전통적인 DBMS의 확장성, 성능 한계를 해결하기 위해서 소프트웨어 뿐만 아니라 최신의 하드웨어 디바이스와 결합하여 어플라이언스 형태의 DW 구축이 대세가 되고 있는 환경에서, 국산 DBMS의 선두주자 티맥스소프트는 외산 DB 어플라이언스와 경쟁할 수 있는 데이터베이스 어플라이언스를 출시하였다. 최근 HP 하드웨어와 어플라이언스 협력 모델을 내놓았으며, 기존의 DBMS가 해결하지 못한 초대용량과 고성능, 그리고 데이터의 확장성이 특징이다. ZetaData는 고성능 데이터베이스 서버와 지능형 스토리지 서버, 초고속 네트워크를 통해 대용량 데이터의 빠른 처리와 시스템 안정성을 제공하는 통합(Consolidated) 데이터 솔루션이다.
[2016 데이터 그랜드 컨퍼런스] 5 1(보안,품질). 웨어밸리 data security challenges and its solutio...K data
비용절감 및 클라우드를 통한 각종 효율성을 위해 기존의 인프라에서 구축된 데이터베이스들이 클라우드 환경으로 이관되거나 신규 구축될 때, 데이터베이스 보안 구축도 기존 고객이 직접 운영하는 인프라가 아닌 클라우드 서비스 사업자의 인프라로 이관되며 이에 따른 인프라 환경의 변화와 침해 사고 시 발생할 수 있는 책임소재의 분쟁, 법규의 변화 등 고민할 부분이 많아지게 된다. 따라서, 클라우드 환경에서의 데이터베이스 보안 구축은 클라우드로 데이터를 이관하기 전, 이관하는 단계 그리고 이관 이후에 데이터를 어떻게 보호할 것인가를 다양한 기술적인 측면으로 살펴볼 필요가 있다.
[2016 데이터 그랜드 컨퍼런스] 6 2(전략,솔루션). 큐브리드 오픈소스 dbms의 클라우드 구축 사례-발표자료K data
국내 클라우드 시장 현황은 공공에 의해서 선도되고 있으며 행정자치부의 G클라우드, 서울특별시의 IT Complex센터가 대표적입니다. 민간은 KT, LG, SK, 아마존 웹서비스가 사업을 선도하고 있습니다. 이와 같은 사업트렌드와 오픈소스 클라우드 도입에 따른 장점, 그리고 시장 내 다양한 오픈소스SW를 소개합니다. 또한 CUBRID의 실제 민간 공공 분야 적용사례에 대해서 안내합니다.
[2016 데이터 그랜드 컨퍼런스] 1 2. bk2(티맥스) 2016데이터그랜드컨퍼런스-티맥스소프트_클라우드 시대의 데이터베이스 시스템 변...K data
기존 레거시 시스템의 가장 중요한 자산은 데이터베이스이다. 전세계적인 클라우드화에 직면해서, 우리는 가장 중요한 데이터베이스를 어떻게 클라우드에 적용해서 비용을 절감하고, 비지니스의 유연성과 발전동력이 되기 위한 방안이 필요하다. 이에 기존 데이터베이스를 클라우드화 하는데 필요한 요구사항이 무엇인지를 살펴보고, 구체적인 기술적 요구사항을 정의해 본다. 그리고 이를 해결하기 위한 관련 기술동향과 솔루션들을 소개함으로써, 기업이 데이터베이스를 클라우드화하기 위한 새로운 시각을 제공하고자 한다.
[2016 데이터 그랜드 컨퍼런스] 3 5(io t). 스마트박스-iot와 생활 속 사물함의 만남K data
정보통신 혁명으로 사회기반 시설이 된 인터넷 그 인터넷을 통해 사물들이 자동적으로 대화합니다.세계최초로 상용화한 사물인터넷 기술의 무인보관함은 과연 어떤대화를 나누고 거기서 우리는 어떤 의미 있는 가치를 찾을 수 있을까요? 이번 발표에서는 온라인 쇼핑몰의 발전과 현재 택배 시장 분석, 기존 택배시스템의 문제점, 기존 컴퓨터 기반 기계와 IoT 기술을 접목한 스마트박스의 차이, 휴대전화번호를 키 값으로하는 비식별조치화 된 개인정보를 통한 빅데이터 수집 및 활용의 가능성, 조합된 빅데이터로 가지는 개인정보유출 방지에 관련된 기대 효과, 스마트박스 IoT 플랫폼으로 활용되는 타제품...
[2016 데이터 그랜드 컨퍼런스] 6 3(전략, 솔루션).크레딧데이터 공공데이터를 활용한 생활의 질 향상K data
국내 클라우드 시장 현황은 공공에 의해서 선도되고 있으며 행정자치부의 G클라우드, 서울특별시의 IT Complex센터가 대표적입니다. 민간은 KT, LG, SK, 아마존 웹서비스가 사업을 선도하고 있습니다. 이와 같은 사업트렌드와 오픈소스 클라우드 도입에 따른 장점, 그리고 시장 내 다양한 오픈소스SW를 소개합니다. 또한 CUBRID의 실제 민간 공공 분야 적용사례에 대해서 안내합니다.
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
미래의 ICT생태계는 데이터를 중심으로 형성될 것입니다. 디지털라이제이션(digitalization)의 가속화로 우리의 일상은 빠르게 데이터 기반으로 급변하고 있습니다. 빅데이터라는 용어가 라디오 프로그램의 선곡기준으로도 등장하는 현 시점에서 다양한 관점의 빅데이터를 살펴봄으로써 실제 산업 생태계에 가져올 기술, 사회, 제도적 혁신의 조짐을 살펴보고자 합니다.
먼저 오픈소스가 가져오는 IT 생태계의 변화와 공유경제라는 키워드를 통해 함께함으로써 커지는 데이터의 가치, 그리고 그 가치를 더욱 크게 할 메타데이터의 중요성을 이야기하겠습니다. 또한 데이터 생태계의 활성화를 위한 거래 플랫폼이 가진 멀티 사이드 플랫폼의 가치와 이러한 플랫폼 활성화를 위한 공공 정책의 데이터 기반 변화 트렌드와 개인 프라이버시 보호 트렌드 및 기술을 살펴보고자합니다.
[2016 데이터 그랜드 컨퍼런스] 1 1. bk1(위세아이텍) 2016데이터그랜드컨퍼런스-머신러닝동향과 산업별 활용_김종현-finalK data
머신러닝은 인공지능 내부 시스템 가운데 학습영역을 구체화한 기술로 데이터를 반복해서 기계를 학습시키는 알고리즘과 기술을 개발하는 분야이다. 머신러닝 알고리즘은 특성과 사용 분야를 기준으로 크게 유사성 베이스, 정보, 비지도, 신경망의 5가지 유형으로 분류된다. 이번 발표에서 머신러닝이 활용되는 산업별 세계 시장 규모와 실제 머신러닝이 어떻게 실생활에 적용되어 있는지 사례를 들어 설명할 예정이다. 특히 머신러닝 구현을 위해 필수적 요소인 도메인 지식 데이터의 중요성을 확인할 수 있다.
Malware detection within enterprise networks is a critical component of an effective information security strategy. Instances of malware attacks are increasing – making them especially important to detect – and data science can help. This presentation outlines data science driven approaches to finding domains that have time and user-based co-occurrence relationships. It also includes a demonstration of a scalable and operationalizable framework to detect domain associations by analyzing the web traffic of users in any organization.
Additional information:
http://www.datasciencecentral.com/video/dsc-webinar-series-data-science-driven-approaches-to-malware
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 비투엔 4차산업혁명의성공 데이터품질K data
4차 산업혁명의 도래는 IOT, 빅데이터 관리 등 신 기술의 개발로 “광대한 데이터”의 활용이 가능함에 따라 급속도로 발전하고 있습니다. 여기서 간과해서 안 될 사실 하나는 수집, 활용되는 데이터의 정확성과 유의미성이라고 볼 수 있으며, 기존의 정형데이터 위주의 품질관리의 영역에서 비정형/빅데이터로 품질관리 기술도 개발되어야 합니다. 2000년 초반 DW/CRM 초기에 저 품질 데이터로 인한 시행착오를 우리는 기억하고 있습니다.
2016년, 그 동안 버려졌던 관측센서데이터, SNS 데이터, 통신데이터 등을 기반으로 하는 AI가 가까운 미래에 우리에게 새로운 문명의 혜택일지 재앙일지는 정확하지 않습니다. 이번 발표는 이런 폐해를 줄이기 위해 데이터 품질관리 동향, 사례, 향후 방향성에 대해 공유하고 고민하는 시간이 되겠습니다.
[2016 데이터 그랜드 컨퍼런스] 5 4(보안,품질). 바넷정보기술 컴플라이언스 대응을 위한 효율적인 데이터 관리 방안K data
개인정보보호법과 정통망법에 이어 상거래 종료 고객 데이터의 파기와 분리보관에 대한 신용정보법이 시행된 지 8개월이 지났습니다. 그러나, 실제 실무에 적용하기 위해서 많은 고려사항이 존재하고 추진하는데 어려움이 있는 것이 사실입니다. 또한 적용 범위와 구체적인 실행 방안에서도 많은 혼란이 있습니다. ㈜바넷정보기술이 개인정보 파기/분리보관 솔루션을 이용하여 금융권 고객사에 구축했던 경험을 기반으로 그 적용 과정에 발생했던 이슈들과 고려사항, 해결방안 등을 말씀 드리고자 합니다. 또한, 자체 개발로 진행할 때와 전문 솔루션을 구축할 때의 차이점과 필요한 기술들에 대해 소개함으로써 앞으로 사업 추진 방향을 결정하는데 도움을 드리고자 합니다. 그리고, 추가로 데이터 보안 관련 최신 트랜드와 관련 솔루션에 대해 간략히 소개합니다.
[2016 데이터 그랜드 컨퍼런스] 5 2(보안,품질). 투비웨이 데이터정제와품질검증을위한mdm 시스템의기능과역할K data
기업 시스템의 기본 인프라인 기준정보관리는 기업에서 고품질의 정확한 데이터를 적시에 필요한 곳에서 사용할 수 있도록 기준정보의 라이프사이클을 관리하고, 기준정보가 필요한 곳에 연계하며, 기준정보의 품질을 관리합니다. 기준정보관리 프로젝트 과정에서 고품질 데이터의 확보를 위해 가장 기초적인 작업인 데이터정제(Cleansing)을 수행하게 됩니다. 데이터 정제작업은 다수의 현업 워킹그룹과 스프레드시트를 통해 협업을 진행하고, 변경된 표준과 품질규칙을 적용하기 위해서 매우 반복적이고 소모적인 작업을 수행하곤 합니다. 변경되는 표준체계와 추가되는 품질규칙을 효과적으로 데이터 정제작업에 반영하고, 현업 워킹그룹과 정제 수행그룹간의 효과적인 협업을 유도하고 지원하기 위한, 기준정보관리시스템(MDM)의 기능과 역할에 대해 살펴보고 제안하고자 합니다.
[2016 데이터 그랜드 컨퍼런스] 4 5(인공지능). 머니브레인 앱의 시대는 가고 인공지능 봇의 시대가 온다K data
앱 시장이정체되고 AI에 대한 관심이 높아지면서 챗봇이 새로운 혁신으로 떠오르게 됐다. 인공지능을 가진 챗봇은 기존 앱과는 달리 사용자와의 대화와 교류를 통해 능동적인 일처리가 가능하다. 초기 챗봇기술은 명령어와 대답을 일대일 매칭시키는 시나리오방식이었다. 이후 점차 사람의 말을 잘 이해하는 NLU(Natural Language Understanding)기술이 개발되었고 Deep Learning을 통해 방대한 데이터를 바탕으로 사람의 말을 학습시키려는 노력이 진행되고 있다. 하지만 현 기술은 일차원적인 답변만 가능하다는 한계점을 지니고 있다. 그것을 극복하기 위해선 HTA(Hierarchical task analysis)기술이 필요하며 HTA기술은 챗봇의 지능을 한층 높이며 챗봇의 상용화에 크게 기여할 것이다.
[2016 데이터 그랜드 컨퍼런스] 2 4(빅데이터). 오픈메이트 공간정보로 풀어보는 빅데이터 세상K data
공간정보의 역할? 데이터는 다른 데이터 소스들과 결합할 때 데이터의 진정한 가치가 발휘됩니다. 이중 고강은 많은 데이터 셋이 공존하게 하는 중요한 허브 역할을 합니다. 이와 함께 국가데이터가 개방되면서 공간정보의 역할은 무궁무진해졌습니다. 기존에 상권정보에만 국한되었던 GIS 분석 서비스가 이제는 Location Intelligence로 다양한 역할을 하기 시작하게 되었습니다. 복지시설의 입지 선정, 공공정책의 수립, 그리고 헬스케어 분야까지! 공간정보로 풀수 있는 빅데이터 세상! 그 가능성을 보여드립니다!
[2016 데이터 그랜드 컨퍼런스] 2 3(빅데이터). 엑셈 빅데이터 적용 사례 및 플랫폼 구현K data
빅데이터 환경에서 기업의 의사결정에 필요한 DW 시스템은 더욱 중요해졌고, 대용량 데이터 분석은 필수가 되었다. 전통적인 DBMS의 확장성, 성능 한계를 해결하기 위해서 소프트웨어 뿐만 아니라 최신의 하드웨어 디바이스와 결합하여 어플라이언스 형태의 DW 구축이 대세가 되고 있는 환경에서, 국산 DBMS의 선두주자 티맥스소프트는 외산 DB 어플라이언스와 경쟁할 수 있는 데이터베이스 어플라이언스를 출시하였다. 최근 HP 하드웨어와 어플라이언스 협력 모델을 내놓았으며, 기존의 DBMS가 해결하지 못한 초대용량과 고성능, 그리고 데이터의 확장성이 특징이다. ZetaData는 고성능 데이터베이스 서버와 지능형 스토리지 서버, 초고속 네트워크를 통해 대용량 데이터의 빠른 처리와 시스템 안정성을 제공하는 통합(Consolidated) 데이터 솔루션이다.
[2016 데이터 그랜드 컨퍼런스] 2 1(빅데이터). 티맥스 빅데이터시대,더욱중요해진dw를위한어플라이언스전략K data
빅데이터 환경에서 기업의 의사결정에 필요한 DW 시스템은 더욱 중요해졌고, 대용량 데이터 분석은 필수가 되었다. 전통적인 DBMS의 확장성, 성능 한계를 해결하기 위해서 소프트웨어 뿐만 아니라 최신의 하드웨어 디바이스와 결합하여 어플라이언스 형태의 DW 구축이 대세가 되고 있는 환경에서, 국산 DBMS의 선두주자 티맥스소프트는 외산 DB 어플라이언스와 경쟁할 수 있는 데이터베이스 어플라이언스를 출시하였다. 최근 HP 하드웨어와 어플라이언스 협력 모델을 내놓았으며, 기존의 DBMS가 해결하지 못한 초대용량과 고성능, 그리고 데이터의 확장성이 특징이다. ZetaData는 고성능 데이터베이스 서버와 지능형 스토리지 서버, 초고속 네트워크를 통해 대용량 데이터의 빠른 처리와 시스템 안정성을 제공하는 통합(Consolidated) 데이터 솔루션이다.
2. 1. 철도 안전 소개
2. 철도 사고위험예측
3. WISE ADVISOR
4. WISE 제품과 머신러닝
3. 최근 잇단 열차 탈선 사고로 인해 철도안전의 중요성 대두
105
93
81 75
66
135
115 113 112
46
235
207
182
178
104
0
50
100
150
200
250
2011년 2012년 2013년 2014년 2015년
단위: 건, 명
한국철도공사, 사상사고 발생현황
사망 사상자 사고건수
철도안전의 중요성
철도 안전 소개
5. 선로이상 위험예측 프로세스
1. 데이터
엔지니어링
2. 예측모델링
예측
정보
생성
데이터
가공
예측모델
생성
비교검증
모델선
정
3. 운용적용
철도
사고위험예측
6. 분석범위: 경부고속선
일반선경부고속선경부고속선 일반선 경부고속선
주의 /위험 주의 /위험
분석대상: KTX와 KTX-산천
분석데이터 수집기간: 2011년~2015년
*월 1회 / 분기 1회 정기점검으로 결함 정보 부족
선로구간별
정기점검정보
선로구간별
기상정보
선로구간별
유지보수정보
데이터 수집 및 통합
철도
사고위험예측
7. 평 균 5 0 5 . 7 9 6 7
• 다양한 종속변수를 사용하여 모델을 생성하고
테스트한 결과를 바탕으로 설정
• 구간별로 발생하는 결함들의 평균결함면적으로
설정
• 평균결함면적은 결함횟수와 결함면적을 동시에
고려할 수 있음
• 0.1%의 이상치 제거한 데이터의 평균을 기준으
로 주의 (0) / 위험(1) 이항 종속변수 생성
평균 548
데이터가공
모델
생성
검증
종속변수 데이터 가공
철도
사고위험예측
8. 평 균 5 0 5 . 7 9 6 7
• 이전 점검일 사이의 유지보수 관련 정보 가공
이전 점검일 해당 점검일
• 연속적 기상상태의 중요성 (기온, 풍속, 강수량)
3일/ 7일/ 30일 – 평균/최고/최저 기상상태
독립변수 데이터 가공
철도
사고위험예측
10. • 결함면적을 • 결함면적을
기상정보
선로
정보 시계열정보
Train data: 800개
• 독립변수(x) – 연속형 / 범주형 포함 : 41 개
Reference
Prediction 위험 주의
위험 235 77
주의 166 322
예측정확도 : 69.75%
Reference
Prediction
위험
위험 주의
주의
서포트 벡터 머신
철도
사고위험예측
11. • 결함면적을
• 결함면적을
• 결함면적을
예측정확도 : 80.25%
모
델
A
모
델
B
예측정확도 : 71.25%
실제
예측 주의 위험
주의 0 -10
위험 -2 0
실제
예측 주의 위험
주의 343 101
위험 57 299
실제
예측 주의 위험
주의 238 68
위험 162 332
예측정확도 비용-이득
모델 A 80.25% -1,124
모델 B 71.25% -1,004
• 실제로 주의인데 주의로 예측한 경우와 위험인데 위험
으로 예측한 경우, 비용과 이득을 0으로 봄
• 실제로 주의인데 위험으로 예측한 경우 과도한 비용
이 소요될 수 있어 비용을 -2로 측정함
• 실제로 위험인데 주의로 예측한 경우 추가비용이 발생
될 수 있어 비용을 -10으로 보다 높게 측정함
• 모델 A가 예측 정확도 80%로 모델 B보다 높지만,
오분류 결과는 비용발생으로 이어지기 때문에
비용-이득 계산결과가 낮은 모델 B를 채택하였음
비교검증 및 모델선정
철도
사고위험예측