데이터분석 고수가 되기 위해서는 최고의 연장 (툴채인; toolchain)을 구비하는
것이 중요하다.
최고의 연장은 컴퓨터와 몇가지 오픈소스 소프트웨어들이다.
툴 설치에 관한 디테일들은 생략한다. 앞장에서 “고기를 잡을 줄 알게 된" 여러분
들에게는 쉬운 일일 것이다: 구글에서 검색하고, 웹페이지에서 따라하면 된다.
* 다시 강조하건데, 이것은 2015년 현재 실리콘밸리 인터넷사업 자료분석가들이 흔히 사용하는 툴채인
이다. 다른 지역 / 인더스트리의 툴들은 다를 수 있다.
고수의 연장
보통* 맥 OSX
아니면 리눅스 랩탑.
하여간 유닉스/리눅스 되는 것이 좋다. (unix command line tool 때문에...)
* 어디까지나 실리콘밸리가 그렇다는 것. 이 시리즈의 모든 내용은 MS 윈도우즈 (Windows) PC 에서도
실행가능하다. 유일하게 부족한 “bash” 부분은 cygwin이나 win-bash 등의 소프트웨어로 이뮬레이션이
가능하다. 구글에서 “windows bash” 로 검색해보자.
연장: 컴퓨터
해당 사이트에서 다운받고 인스톨하면 된다.
인터넷에 연결한 후, RStudio 를 실행하고 다음 패키지들은 설치해주자. 앞으로
자주 쓸 것이다.
연장: R과 알스튜디오 (RStudio)
연장: 써브라임 에디터 (Sublime Text)
코딩 덕후들은 좋은 에디터에 (그리고 좋은 의자!)에 집착한다.
현재 밸리의 최고인기에디터는 써브라임 에디터이다.
http://www.sublimetext.com/
50불이다. 오만원이 아까우면 무료로 며칠에 한번 나오는 “안사실래요?" 메시지
를 무시하고 쓰면 된다.
써브라임 에디터의 강점:
● 키보드 숏컷들,
● 무한한 개인화 기능들 (customization),
● 고수들이 공헌한 수많은 쓸모있는 패키지들, 등등.
특히 다중선택 (multiple selection; Cmd+D)은 묘한 중독성이 있다.
패키지 덕을 잘 보려면 일단 Sublime Package Control부터 설치하자.
“Cmd+Shift+P”를 누르면 Command Palette 시작.
“install”을 입력하면 아래와 같은 리스트가 뜨고,
그중 “install package”를 선택하면 몇 초 후 (굉장히 많은 패키지를 읽어옴) 패키
지 리스트가 로드된다. 그중 원하는 패키지를 찾아서 선택하면 인스톨된다.
써브라임 에디터 셋업
써브라임 에디터 유용한 패키지들
개인 취향마다 다르겠지만 내가 생각하는 필수 패키지는:
● Monokai-extended # 화면이 편안해진다
● SublimeLinter # 코드 linting
● SublimeLinter-pylint # pylint plugin
● Markdown-extended # 마크다운 신택스 하이라이트
● GitGutter # 깃(git)에서 편집된 행이 어디인지를 보여준다.
연장: 파이썬 Python
“anaconda python”이 가장 속편한 디스트리뷰션이다.
2.7 버전이 아직은 쓸만하다. (3.x 버전으로 갈아탈 필요 없는 듯)
다음처럼 정상적으로 인스톨되었는지 확인!
OSX에 기본으로 따라 나오는 터미널이다. “Terminal” 앱을 실행하면 된다.
일단은 간단한 명령만 쓰려고 한다:
● ls
● cd
● mkdir
● more
● rm
● mv
● wc
● grep
장기적으로 고수가 되려면 친해지도록 애쓰자.
배쉬 쉘 터미널 (Bash shell)