SlideShare a Scribd company logo
1 of 29
Download to read offline
YBIGTA
연세대학교
S T U D Y
빅 데 이 터 학 술 동 아 리
인간의 “패턴 인식능력”은
생각보다 많이 쓸만하다
데이터만 담긴 표에서는
각각의 수치를 제외한
다른 정보를 얻기 힘들다
그래프 등의 시각화를 통해
트렌드와 패턴을 파악할 수 있다
저널리즘 오락
R 스터디 LEVEL 1_week 00
연세대학교 빅데이터 동아리 YBigTa
R Study
3기 구지연
LEVEL 1
R 스터디 LEVEL 1_week 00
Study 소개
대상 : R을 처음 다뤄 보시는분,
R을 다뤄보긴 했지만 다시 기초를 닦고
싶으신분
요일 : 아마 일요일
진행 내용 : R 기초문법 + 약간의 응용(R 맛보기)
+ 과제(열심히 하실분 오세요^^)
R 스터디 LEVEL 1_week 00
Thank You
감사합니다
연세대학교 빅데이터 동아리 YBigTa
수강대상 – R초급 내용은 시시하다! 난 좀 더 심화 된 것을 배우고
싶다고 생각하는 사람.
지난 학기의 R 중급 스터디와 동일한 내용을 다룰 예정.
수강요일 – 스터디원이 확정 된 후 협의.
진행내용 – 다양한 차트, 회귀모델 만들기, 상관분석, 시계열 분석,
텍스트 마이닝 등.
R 중급 스터디 계획
분석 기초반 스터디
1
스터디 개설 배경 및 운영 방안
- 빅데이터 분석을 위해 통계학을 모두 배울 필요는 없음
- 그러나, 통계학의 필요한 부분을 습득하여 분석을 편하게 하기 위함
- 분석에 꼭 통계학을 사용할 필요는 없음
- 통계학적 분석기법이 아닌 다른 분석기법 공부
- 텍스트 분석, 그래프 분석기법 중심
- 분석만 한다고 다 된 것은 아님
- 분석 앞 단에 어떤 작업이 이루어지는지 간단한 개념 이해
- Web log, Schema 에 대한 개념 이해 중심
위의 3가지 내용을 기본으로 하여 진행 될 예정이고,
수업 신청한 모든 사람들과 인터뷰를 통해서
수업 내용을 최종 결정할 예정입니다.
2
스터디 일정
- 주말동안에만 진행 (직장인이라서요..;;)
- 토요일 오후, 2주에 1번 정도 진행 예정 (조정 가능)
- 첫 모임 : 7월 5일 오후 2시 (장소 미정-필참)
스터디 방식
- 인터뷰 후 결정
- 강의 1번당 실습 및 결과토론 1번 방식 or 한 사람이 1 강의 맡아서
같이 준비 등. 참여형 스터디로 준비할 예정
- 인원 수 상관 없음. 그러나 수업을 빠지면 안됨.
3
Python + MySQL
YBIGTA 1기 홍지호
Python + MySQL
!
!
!
• 배우기 쉬운 프로그래밍 언어
• 다양한 모듈
• www.python.org
• Python(Wikipedia)
!
!
!
• 가장 많이 사용되는 관계형
데이터베이스
• www.mysql.com
• MySQL(Wikipedia)
공부할 내용
공부할 내용
웹 데이터 수집
데이터 전처리
공부할 내용
데이터 저장
공부할 내용
데이터 활용
공부할 내용
• 파이썬을 사용한 웹 데이터 수집 및 전처리
• 온라인 커뮤니티 게시글, 네이버 뉴스 검색 API, 트위터
• MySQL 스키마, 자료형
• SQL 문법
Keywords
• Python
• MySQL
• SQL
• RDBMS
• JSON
• XML
• HTML Parsing
• BeautifulSoup
• CSS Selector
• AWS
• Crontab
• RSS
• API
• SSH
스터디를 시작하기 전에…
• 노트북 준비
• Eclipse 설치
• MySQL Workbench 설치
• Putty 다운로드(윈도우 사용자)
• AWS(http://aws.amazon.com/) 계정 만들기
• Codecademy(http://www.codecademy.com/)에서
파이썬 공부 시작
관련 링크
• Codecademy
• http://www.codecademy.com/
• Eclipse
• http://eclipse.org/
• Putty
• http://www.chiark.greenend.org.uk/~sgtatham/putty/
• MySQL Workbench
• http://www.mysql.com/products/workbench/
• AWS
• http://aws.amazon.com/ko/
Machine Learning%
3기 윤승현
• 대상 : Machine Learning을 처음 배워 보시는
분과 응용을 해보고 싶으신 분
• 계획 : Coursera Stanford Machine Learning
강의 수강 후 kaggle의 데이터에등 다양한 데이
터에 적용
• 모임 : X, 과제 체크, 적용 부터는 모임 있슴다!
Machine Learning%
월 화 수 목 금 토 일
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20 인강
끝
21데이터
적용
22 23 24 25 26 27
28 29 30 31
Machine Learning%
YB Study

More Related Content

Similar to YB Study

Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayYoungchan Jo
 
기술사수검전략3
기술사수검전략3기술사수검전략3
기술사수검전략3skccsocial
 
데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력Youngjae Kim
 
파이썬과 커뮤니티와 한국어 오픈데이터
파이썬과 커뮤니티와 한국어 오픈데이터파이썬과 커뮤니티와 한국어 오픈데이터
파이썬과 커뮤니티와 한국어 오픈데이터Eunjeong (Lucy) Park
 
PyCon Korea 2018 - 파이썬으로 학생 들여다보기
PyCon Korea 2018 - 파이썬으로 학생 들여다보기PyCon Korea 2018 - 파이썬으로 학생 들여다보기
PyCon Korea 2018 - 파이썬으로 학생 들여다보기Yungon Park
 
나의 8년 (2012~2019)
나의 8년 (2012~2019)나의 8년 (2012~2019)
나의 8년 (2012~2019)Yungon Park
 
단국대 통계데이터사이언스학과 학술 동아리 플러스 알파 소개 자료 입니다.
단국대 통계데이터사이언스학과 학술 동아리 플러스 알파 소개 자료 입니다.단국대 통계데이터사이언스학과 학술 동아리 플러스 알파 소개 자료 입니다.
단국대 통계데이터사이언스학과 학술 동아리 플러스 알파 소개 자료 입니다.dkuplusalpha
 
데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?Glen Park
 
황승원 포항공대 교수
황승원 포항공대 교수황승원 포항공대 교수
황승원 포항공대 교수Hye-rim Jang
 
[교육수강후기] 디자인씽킹기반 데이터분석과정 (2020.08)
[교육수강후기] 디자인씽킹기반 데이터분석과정 (2020.08)[교육수강후기] 디자인씽킹기반 데이터분석과정 (2020.08)
[교육수강후기] 디자인씽킹기반 데이터분석과정 (2020.08)Youngok Kim
 
200820 NAVER TECH CONCERT 12_상반기 네이버 인턴을 돌아보며
200820 NAVER TECH CONCERT 12_상반기 네이버 인턴을 돌아보며200820 NAVER TECH CONCERT 12_상반기 네이버 인턴을 돌아보며
200820 NAVER TECH CONCERT 12_상반기 네이버 인턴을 돌아보며NAVER Engineering
 
Pycon2017 이성용 Dances with the Last Samurai
Pycon2017 이성용 Dances with the Last SamuraiPycon2017 이성용 Dances with the Last Samurai
Pycon2017 이성용 Dances with the Last SamuraiSungYong Lee
 

Similar to YB Study (14)

Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start today
 
기술사수검전략3
기술사수검전략3기술사수검전략3
기술사수검전략3
 
Rdata 180320
Rdata 180320Rdata 180320
Rdata 180320
 
데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력
 
Orientation
OrientationOrientation
Orientation
 
파이썬과 커뮤니티와 한국어 오픈데이터
파이썬과 커뮤니티와 한국어 오픈데이터파이썬과 커뮤니티와 한국어 오픈데이터
파이썬과 커뮤니티와 한국어 오픈데이터
 
PyCon Korea 2018 - 파이썬으로 학생 들여다보기
PyCon Korea 2018 - 파이썬으로 학생 들여다보기PyCon Korea 2018 - 파이썬으로 학생 들여다보기
PyCon Korea 2018 - 파이썬으로 학생 들여다보기
 
나의 8년 (2012~2019)
나의 8년 (2012~2019)나의 8년 (2012~2019)
나의 8년 (2012~2019)
 
단국대 통계데이터사이언스학과 학술 동아리 플러스 알파 소개 자료 입니다.
단국대 통계데이터사이언스학과 학술 동아리 플러스 알파 소개 자료 입니다.단국대 통계데이터사이언스학과 학술 동아리 플러스 알파 소개 자료 입니다.
단국대 통계데이터사이언스학과 학술 동아리 플러스 알파 소개 자료 입니다.
 
데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?
 
황승원 포항공대 교수
황승원 포항공대 교수황승원 포항공대 교수
황승원 포항공대 교수
 
[교육수강후기] 디자인씽킹기반 데이터분석과정 (2020.08)
[교육수강후기] 디자인씽킹기반 데이터분석과정 (2020.08)[교육수강후기] 디자인씽킹기반 데이터분석과정 (2020.08)
[교육수강후기] 디자인씽킹기반 데이터분석과정 (2020.08)
 
200820 NAVER TECH CONCERT 12_상반기 네이버 인턴을 돌아보며
200820 NAVER TECH CONCERT 12_상반기 네이버 인턴을 돌아보며200820 NAVER TECH CONCERT 12_상반기 네이버 인턴을 돌아보며
200820 NAVER TECH CONCERT 12_상반기 네이버 인턴을 돌아보며
 
Pycon2017 이성용 Dances with the Last Samurai
Pycon2017 이성용 Dances with the Last SamuraiPycon2017 이성용 Dances with the Last Samurai
Pycon2017 이성용 Dances with the Last Samurai
 

YB Study

  • 1. YBIGTA 연세대학교 S T U D Y 빅 데 이 터 학 술 동 아 리
  • 2.
  • 4. 데이터만 담긴 표에서는 각각의 수치를 제외한 다른 정보를 얻기 힘들다 그래프 등의 시각화를 통해 트렌드와 패턴을 파악할 수 있다
  • 6.
  • 7.
  • 8. R 스터디 LEVEL 1_week 00 연세대학교 빅데이터 동아리 YBigTa R Study 3기 구지연 LEVEL 1
  • 9. R 스터디 LEVEL 1_week 00 Study 소개 대상 : R을 처음 다뤄 보시는분, R을 다뤄보긴 했지만 다시 기초를 닦고 싶으신분 요일 : 아마 일요일 진행 내용 : R 기초문법 + 약간의 응용(R 맛보기) + 과제(열심히 하실분 오세요^^)
  • 10. R 스터디 LEVEL 1_week 00 Thank You 감사합니다 연세대학교 빅데이터 동아리 YBigTa
  • 11.
  • 12. 수강대상 – R초급 내용은 시시하다! 난 좀 더 심화 된 것을 배우고 싶다고 생각하는 사람. 지난 학기의 R 중급 스터디와 동일한 내용을 다룰 예정. 수강요일 – 스터디원이 확정 된 후 협의. 진행내용 – 다양한 차트, 회귀모델 만들기, 상관분석, 시계열 분석, 텍스트 마이닝 등. R 중급 스터디 계획
  • 14. 스터디 개설 배경 및 운영 방안 - 빅데이터 분석을 위해 통계학을 모두 배울 필요는 없음 - 그러나, 통계학의 필요한 부분을 습득하여 분석을 편하게 하기 위함 - 분석에 꼭 통계학을 사용할 필요는 없음 - 통계학적 분석기법이 아닌 다른 분석기법 공부 - 텍스트 분석, 그래프 분석기법 중심 - 분석만 한다고 다 된 것은 아님 - 분석 앞 단에 어떤 작업이 이루어지는지 간단한 개념 이해 - Web log, Schema 에 대한 개념 이해 중심 위의 3가지 내용을 기본으로 하여 진행 될 예정이고, 수업 신청한 모든 사람들과 인터뷰를 통해서 수업 내용을 최종 결정할 예정입니다. 2
  • 15. 스터디 일정 - 주말동안에만 진행 (직장인이라서요..;;) - 토요일 오후, 2주에 1번 정도 진행 예정 (조정 가능) - 첫 모임 : 7월 5일 오후 2시 (장소 미정-필참) 스터디 방식 - 인터뷰 후 결정 - 강의 1번당 실습 및 결과토론 1번 방식 or 한 사람이 1 강의 맡아서 같이 준비 등. 참여형 스터디로 준비할 예정 - 인원 수 상관 없음. 그러나 수업을 빠지면 안됨. 3
  • 16. Python + MySQL YBIGTA 1기 홍지호
  • 17. Python + MySQL ! ! ! • 배우기 쉬운 프로그래밍 언어 • 다양한 모듈 • www.python.org • Python(Wikipedia) ! ! ! • 가장 많이 사용되는 관계형 데이터베이스 • www.mysql.com • MySQL(Wikipedia)
  • 19. 공부할 내용 웹 데이터 수집 데이터 전처리
  • 22. 공부할 내용 • 파이썬을 사용한 웹 데이터 수집 및 전처리 • 온라인 커뮤니티 게시글, 네이버 뉴스 검색 API, 트위터 • MySQL 스키마, 자료형 • SQL 문법
  • 23. Keywords • Python • MySQL • SQL • RDBMS • JSON • XML • HTML Parsing • BeautifulSoup • CSS Selector • AWS • Crontab • RSS • API • SSH
  • 24. 스터디를 시작하기 전에… • 노트북 준비 • Eclipse 설치 • MySQL Workbench 설치 • Putty 다운로드(윈도우 사용자) • AWS(http://aws.amazon.com/) 계정 만들기 • Codecademy(http://www.codecademy.com/)에서 파이썬 공부 시작
  • 25. 관련 링크 • Codecademy • http://www.codecademy.com/ • Eclipse • http://eclipse.org/ • Putty • http://www.chiark.greenend.org.uk/~sgtatham/putty/ • MySQL Workbench • http://www.mysql.com/products/workbench/ • AWS • http://aws.amazon.com/ko/
  • 27. • 대상 : Machine Learning을 처음 배워 보시는 분과 응용을 해보고 싶으신 분 • 계획 : Coursera Stanford Machine Learning 강의 수강 후 kaggle의 데이터에등 다양한 데이 터에 적용 • 모임 : X, 과제 체크, 적용 부터는 모임 있슴다! Machine Learning%
  • 28. 월 화 수 목 금 토 일 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 인강 끝 21데이터 적용 22 23 24 25 26 27 28 29 30 31 Machine Learning%