데이터분석 고수가 되기위해서는 최고의 연장 (툴채인; toolchain)을 구비하는
것이 중요하다.
최고의 연장은 컴퓨터와 몇가지 오픈소스 소프트웨어들이다.
툴 설치에 관한 디테일들은 생략한다. 앞장에서 “고기를 잡을 줄 알게 된" 여러분
들에게는 쉬운 일일 것이다: 구글에서 검색하고, 웹페이지에서 따라하면 된다.
* 다시 강조하건데, 이것은 2015년 현재 실리콘밸리 인터넷사업 자료분석가들이 흔히 사용하는 툴채인
이다. 다른 지역 / 인더스트리의 툴들은 다를 수 있다.
고수의 연장
4.
보통* 맥 OSX
아니면리눅스 랩탑.
하여간 유닉스/리눅스 되는 것이 좋다. (unix command line tool 때문에...)
* 어디까지나 실리콘밸리가 그렇다는 것. 이 시리즈의 모든 내용은 MS 윈도우즈 (Windows) PC 에서도
실행가능하다. 유일하게 부족한 “bash” 부분은 cygwin이나 win-bash 등의 소프트웨어로 이뮬레이션이
가능하다. 구글에서 “windows bash” 로 검색해보자.
연장: 컴퓨터
5.
해당 사이트에서 다운받고인스톨하면 된다.
인터넷에 연결한 후, RStudio 를 실행하고 다음 패키지들은 설치해주자. 앞으로
자주 쓸 것이다.
연장: R과 알스튜디오 (RStudio)
6.
연장: 써브라임 에디터(Sublime Text)
코딩 덕후들은 좋은 에디터에 (그리고 좋은 의자!)에 집착한다.
현재 밸리의 최고인기에디터는 써브라임 에디터이다.
http://www.sublimetext.com/
50불이다. 오만원이 아까우면 무료로 며칠에 한번 나오는 “안사실래요?" 메시지
를 무시하고 쓰면 된다.
써브라임 에디터의 강점:
● 키보드 숏컷들,
● 무한한 개인화 기능들 (customization),
● 고수들이 공헌한 수많은 쓸모있는 패키지들, 등등.
특히 다중선택 (multiple selection; Cmd+D)은 묘한 중독성이 있다.
7.
패키지 덕을 잘보려면 일단 Sublime Package Control부터 설치하자.
“Cmd+Shift+P”를 누르면 Command Palette 시작.
“install”을 입력하면 아래와 같은 리스트가 뜨고,
그중 “install package”를 선택하면 몇 초 후 (굉장히 많은 패키지를 읽어옴) 패키
지 리스트가 로드된다. 그중 원하는 패키지를 찾아서 선택하면 인스톨된다.
써브라임 에디터 셋업
8.
써브라임 에디터 유용한패키지들
개인 취향마다 다르겠지만 내가 생각하는 필수 패키지는:
● Monokai-extended # 화면이 편안해진다
● SublimeLinter # 코드 linting
● SublimeLinter-pylint # pylint plugin
● Markdown-extended # 마크다운 신택스 하이라이트
● GitGutter # 깃(git)에서 편집된 행이 어디인지를 보여준다.