내가 대학원에 들어왔을 때 알았더라면 좋았을 연구 노하우 (개정증보판) (UST 대학원 신입생 OT 강연)Yoon Sup Choi
UST (과학기술연합대학원대학교)의 2013년 대학원 신입생 오리엔테이션에서 대학원 생활 및 연구 방법론에 관한 강연을 하였던 슬라이드입니다. 대학원에 이제 입학하는 신입생들을 위해서 예전에 올린 '대학원 연구 노하우 (http://www.slideshare.net/pelexus/ss-11919783)'를 수정 및 업데이트 한 버전입니다.
How I ended up with three degrees in three departmentsSangwoong Yoon
서울대학교 데이터사이언스 대학원 Career Workshop (ExploreCSR)에서 발표한 자료입니다.
제가 머신러닝 연구자로써 진로를 선택하기까지의 인생 여정을 다루고 있습니다. 구두로 설명된 정보들이 빠져있지만, 그래도 큰 흐름은 파악하실 수 있을 것이라 생각됩니다.
혹시 더 자세한 이야기를 듣고 싶거나 개인적인 상담이 필요하면 따로 연락주세요.
내가 대학원에 들어왔을 때 알았더라면 좋았을 연구 노하우 (개정증보판) (UST 대학원 신입생 OT 강연)Yoon Sup Choi
UST (과학기술연합대학원대학교)의 2013년 대학원 신입생 오리엔테이션에서 대학원 생활 및 연구 방법론에 관한 강연을 하였던 슬라이드입니다. 대학원에 이제 입학하는 신입생들을 위해서 예전에 올린 '대학원 연구 노하우 (http://www.slideshare.net/pelexus/ss-11919783)'를 수정 및 업데이트 한 버전입니다.
How I ended up with three degrees in three departmentsSangwoong Yoon
서울대학교 데이터사이언스 대학원 Career Workshop (ExploreCSR)에서 발표한 자료입니다.
제가 머신러닝 연구자로써 진로를 선택하기까지의 인생 여정을 다루고 있습니다. 구두로 설명된 정보들이 빠져있지만, 그래도 큰 흐름은 파악하실 수 있을 것이라 생각됩니다.
혹시 더 자세한 이야기를 듣고 싶거나 개인적인 상담이 필요하면 따로 연락주세요.
This document discusses Julia 0.5, packages for Julia like DataFrames.jl and TensorFlow.jl, and the Julia community. Key points include:
- Julia 0.5 was released in September 2016 with improvements like generator expressions and fused broadcasting syntax.
- Popular Julia packages for working with data like DataFrames.jl and the machine learning library TensorFlow.jl were presented.
- The global Julia community and local Julia Korea community, which works to translate Julia documentation, were described.
This document discusses KakaoBank's reasons for adopting an open source approach. It provides three main reasons:
1. The focus is on data and using open source tools allows focusing on data instead of specific technologies.
2. Open source allows for innovation beyond what closed source software allows by avoiding limitations and enabling new opportunities.
3. Open source exits the constraints of legacy systems and localization, freeing the organization to innovate more.
Structured Streaming with Apache SparkDataya Nolja
This document discusses structured streaming in Apache Spark. It begins with an overview of how structured streaming allows for batch, streaming and static table processing using a DataFrame/Dataset API. It then covers the logical and physical planning processes when using structured streaming, similar to normal DataFrame operations. Finally, it acknowledges some current limitations in structured streaming, such as lack of support for update modes and complex transformations, but notes that it provides scalability and accuracy benefits over other streaming methods in Spark.
This document discusses Julia 0.5, packages for Julia like DataFrames.jl and TensorFlow.jl, and the Julia community. Key points include:
- Julia 0.5 was released in September 2016 with improvements like generator expressions and fused broadcasting syntax.
- Popular Julia packages for working with data like DataFrames.jl and the machine learning library TensorFlow.jl were presented.
- The global Julia community and local Julia Korea community, which works to translate Julia documentation, were described.
This document discusses KakaoBank's reasons for adopting an open source approach. It provides three main reasons:
1. The focus is on data and using open source tools allows focusing on data instead of specific technologies.
2. Open source allows for innovation beyond what closed source software allows by avoiding limitations and enabling new opportunities.
3. Open source exits the constraints of legacy systems and localization, freeing the organization to innovate more.
Structured Streaming with Apache SparkDataya Nolja
This document discusses structured streaming in Apache Spark. It begins with an overview of how structured streaming allows for batch, streaming and static table processing using a DataFrame/Dataset API. It then covers the logical and physical planning processes when using structured streaming, similar to normal DataFrame operations. Finally, it acknowledges some current limitations in structured streaming, such as lack of support for update modes and complex transformations, but notes that it provides scalability and accuracy benefits over other streaming methods in Spark.
1. 창조 데이터
데이터 수집, 어디까지 해봤니?
김태준 (Jun Kim)
i2r.jun@gmail.com
데이터야놀자
2017. 10. 13.
창조에 가까운 데이터 수집 X고생 이야기, 지금 시작합니다.
2. — University of South Florida, 권창현 교수님
“연구란 뭘 하는지도 모르면서 뭔가 열심히 하다가,
수많은 과정을 거쳐서,
결국에는 새로운 지식을 얻게 되는 과정이다.”
대학원생 때 알았더라면 좋았을 것들, http://gradschoolstory.net/
3. — University of South Florida, 권창현 교수님
“연구란 뭘 하는지도 모르면서 뭔가 열심히 하다가,
수많은 과정을 거쳐서,
결국에는 새로운 지식을 얻게 되는 과정이다.”
대학원생 때 알았더라면 좋았을 것들, http://gradschoolstory.net/
4. — University of South Florida, 권창현 교수님
“연구란 뭘 하는지도 모르면서 뭔가 열심히 하다가,
수많은 과정을 거쳐서,
결국에는 새로운 지식을 얻게 되는 과정이다.”
대학원생 때 알았더라면 좋았을 것들, http://gradschoolstory.net/
노가다
뻘짓
삽질
5. 안녕하세요, 김태준 입니다!
• 서울시립대학교 데이터마이닝 연구실 석사과정
• 연구원들과 함께 연구하며 수많은 노가다/뻘짓/삽질 경험
• 데이터야놀자 발장 (발표자들의 장)
• 데이터야놀자 BGM 담당
• 데이터야 “제플린이랑” 놀자 조교
42. — 이화여대 오욱환 교수님
“걸작(傑作)이나 대작(大作)보다
습작(習作)에 충실하십시오.”
학문을 직업으로 삼으려는 젊은 학자들을 위하여, https://sites.google.com/site/jeonggilko/for_young_scientists_oh
43. — 이화여대 오욱환 교수님
“논문을 쓰지 못하는 학자들의 특징 가운데 하나가 바로
걸작에 대한 집착입니다.”
학문을 직업으로 삼으려는 젊은 학자들을 위하여, https://sites.google.com/site/jeonggilko/for_young_scientists_oh
“그러나 걸작은 쉽게 나오지 않을 뿐만 아니라
걸작을 지향한 논문이라고 해서 걸작이 되는 것도 아닙니다.”
“논문을 쓸 때마다 최선을 다하고
그 논문들이 쌓여지면서
걸작과 대작이 가능해질 뿐입니다.”
65. 매칭에 사용된 기법들
• Locality sensitive hashing (LSH)
• Deep Neural Network (DNN)
• Generative Adversarial Networks (GAN)
• Semi-supervised Learning
- EM algorithm
• Ensemble
유한묵
66. 매칭 결과
• 서울 화재 사건 17000건을 약 50만개의 건축물과 매칭
• Top-3 accuracy 63% 달성
- 1개의 화재 사건당 3개의 후보 건물을 매칭한 경우 63%의 확률로 3개 중 하나는
맞다
- 1개의 화재 사건을 50만개 중 3개로 매칭해주는 것이라 정말 높은 수치임
• 이 과정이 10개월이 걸림
유한묵
67. • R 초고수
• Python도 함
• 데이터 집착남
• 데이터 마이닝 지식 풍부
- 데이터분석
- 머신러닝
- 딥러닝
- 키워드 추천
• 하시면 제게 연락주 요..!
⭑유한묵⭑
구 직 중
마지막 학기
77. 지금은 한 클러스터 내에서
화재/비화재 건물의
공통점은 무엇인지
차이점은 무엇인지
알아내는 연구를 하고 있습니다.
(데이터 수집 완료된지 한달도 안됨;;; 분석해본게 얼마 없음;;;)
78. — 알베르트 아인슈타인
“If we know what it was we were doing,
it would not be called research, would it?”
(우리도 우리가 뭐하는지 잘 모르잖아요.
알면 연구 아니잖아요. 그렇잖아요.)
대학원생 때 알았더라면 좋았을 것들, http://gradschoolstory.net/
79. — University of South Florida, 권창현 교수님
“연구란 뭘 하는지도 모르면서 뭔가 열심히 하다가,
수많은 과정을 거쳐서,
결국에는 새로운 지식을 얻게 되는 과정이다.”
대학원생 때 알았더라면 좋았을 것들, http://gradschoolstory.net/
80. 그 유명한 베이즈 정리도
40년 후 주목 받았다.
고지마 히로유키, 세상에서 가장 쉬운 베이즈 통계학 입문, 지상사 (2017)
81. 어느 통계학 책에나 등장하는 t분포 또한
그 당시 별로 주목받지 못했다.
고지마 히로유키, 세상에서 가장 쉬운 통계학 입문, 지상사 (2017)