쉽게 배우는 R 데이터 분석
나도 데이터를 정제하고 분석해서 그 안에서 의미를 찾아낼 수 있을까? 데이터를 다루고 통계 프로그램을 사용하는 것은 전문가의 영역이라고 생각했다. 왜냐하면 내가 접한 통계 프로그램은 조사방법론을 공부하며 다뤄본 SPSS가 전부였기 때문이다. 프로그램 사용료도 비싸고, 통계 프로그램은 논문을 쓸 때나 사용하겠거니 했다. 하지만 데이터 저널리즘 수업을 들으면서 R을 공부하게 됐다. 가볍고, 할 수 있는 기능이 다양하다고 했다. 잘 배우면 좋은 프로그램이겠다. 근데 어떻게 배우지? 세상에 유용한 프로그램이 아무리 많다고 하더라도 내가 사용할 줄 모르면 당연히 아무 소용이 없는 거다. 또 프로그램의 다양한 기능한 기능 때문에 시작하기도 전에 겁을 먹을 수도 있다.
김영우 씨가 쓴 "쉽게 배우는 R 데이터 분석"은 처음 R을 배우는 이들을 위해 쓰인 책이다. 접근법이 매우 실용적이다. 이론적인 논의는 초반의 일부부을 제외하고는 바로 그 사용법과 실제 데이터 분석을 할 수 있도록 구성되어있다. 초반 30페이지 이후부터는 곧바로 "데이터 분석 환경 만들기"와 "R설치하기"로 넘어간다. 책의 말미, 저자는 앞으로 데이터 분석을 어떻게 할 것인지 첨부해놓은 장에 실용주의적 접근의 중요성을 강조한다. "... 데이터 분석에 필요한 기초부터 착실히 다지겠다는 마음으로 두꺼운 수학 전공 서적이나 프로그래밍 관련 책으로 공부를 시작하는 분들이 있습니다. ...(생략)... 엔진 작동 원리를 자세히 알지 못해도 자동차를 운전할 수 있는 것과 마찬가지입니다." 데이터 분야를 학문적으로 깊이 파고들 생각이 아니라면 바로 써먹으라는 말이다. 이 책은 저자의 이러한 생각에 부합한다.
또 친절하다. 멋있는 척을 하지 않는다. 초보자의 입장에서 사소한 것들도 설명해준다. 책의 전반부에 변수를 설명하면서 삽입한 밥공기 그림은 변수가 무엇인지 직관적으로 이해할 수 있게 해준다. 무언가를 처음 배우면서 가장 기초적인 개념과 기능들이 이해가 되지 않아 어려움을 겪을 때가 더러 있는데 이 책은 처음 배우는 이들의 어려움을 잘 알아차려 친절하게 설명하고 있다.
좋은 책이지만 처음 배우는 입장이라 어려움도 있었다. 데이터를 전체적으로 파악하고, 다시 부분적으로 수정을 거듭하는 과정에서 나의 사고방식을 더듬어보게 됐다. 분석적 사고의 모자람을 느꼈기 때문이다. DPLYR을 공부하면서 특히 분석적·논리적 사고의 필요를 더 절감했다. 데이터를 문제가 요구하는대로 또는 내가 분석하고자 하는 상태로 만들기 위해서는 데이터의 구조와 작업의 순서가 머릿속에서 정리가 되어야 했다. 논리 공부를 계속 해나가면서 이 부분을 보충하고 있다.
책에서 가장 흥미를 느꼈던 부분은 텍스트 마이닝이었다. 통계분석을 한다든가, 자료를 분석한다든가 하는 것은 R이 아니라 엑셀과 또 다른 통게분석 프로그램으로도 가능하다. 하지만 워드클라우들 통해서 자주 나오는 텍스트를 분석하는 것은 내가 아는한 R이 처음이었다. 저널리스트로서 앞으로 취재 아이템이나 시각화 자료를 만드는데 유용하게 사용할 수 있을 것이다. "국정원 트윗"분석 예제에서 영감을 많이 받았다. 앞으로 트위터나 주요 사이트의 댓글 등을 분석하면서 트렌트나 사람들의 생각을 읽어내고 그 안에서 의미를 찾아가는 일을 할 수 있겠다.
급변하는 시대에 나만 너무 옛날 사람인 것 같은 느낌을 받을 때가 있었다. R을 공부하고 시대의 흐름에 맞출 수 있는 도구를 하나 얻은 느낌이다. "쉽게 배우는 R 데이터 분석"은 그 기회를 제공한 책이다. 감사합니다.
'책읽고' 카테고리의 다른 글
탈종교화 시대 종교를 알아야 하는 이유 (0) | 2021.08.26 |
---|---|
[책읽고] 디지털 지구를 위한 안내서 "메타버스" (0) | 2021.08.05 |
[책읽고] 생각하는 힘, 두뇌보완계획 100 (0) | 2021.01.28 |
[책읽고] 비움과 절제의 자기관리 "절제의 성공학" -미즈노 남보쿠 (0) | 2021.01.25 |
[책읽고] 쓰기의 법칙 PREP (0) | 2020.12.19 |
댓글