데이터 분석이 우리에게 판단의 근거를 제공한다는 것은 너무나도 잘 알려진 사실이다. 그렇다면 구체적으로 어떤 식의 데이터 분석과 응용이 이루어지고 있을까? 그리고 이 과정에서 유의해야 할 점은 무엇일까?


 

나이스한 데이터 분석은 앞서 언급한 질문들에 대한 답을 제시하는 책이다.

빅데이터 사업을 담당하는 데이터 전문회사의 전문가들이 공동집필한 책이다.

 

 

책은 크게 1부와 2부로 나뉘어 있는데, 1부는 데이터를 활용한 트렌드 사례를 다루고, 2부는 빅데이터 담당자들이 실제 업무 속에서 유의해야 할 점들을 알려준다.

처음에는 1부가 절반 이상을 차지하고 있어, '사례만 절반 넘게 다루는 건 과한 게 아닌가?'라고 생각했다.

하지만 그 사례 속에서 데이터가 실제 어떤 식으로 활용되고 있는지를 생생하게 살펴볼 수 있어, 앞으로 내가 데이터를 다룬다면 어떤 식으로 데이터를 활용하게 될 것인가 그려볼 수 있었다.

 

 

예시를 하나 들어보면, '집콕'에 대한 워드클라우드를 통해 집콕의 트렌드가 확장되고 있음을 살펴볼 수 있다.

 

 

또 지역별 등록차량 대비 수입차 비중을 살펴보면, 울산은 수입차 비율이 현저히 낮다는 것을 볼 수 있다. 물론 이 데이터만으로는 원인을 정확히 알 수 없게지만, 책에서는 "실제 울산에는 현대자동차 공장이 인접해 있어 임직원들과 협력사 직원들이 자사 차량을 저렴하게 구매한 영향을 받았을 것으로 추정된다. 또한 연간 수입차 증가율도 타지역의 평균을 넘지 못하는 것으로 보아, 울산의 수입차 비중은 당분간 상대적으로 낮을 것으로 예상된다."라고 설명을 덧붙인다.

 

 

이어서 2부에서는 각 장을 통해 데이터 분석가, 운영자, 과학자, 그리고 데이터를 가진 CEO에게 도움을 줄 수 있는 이야기를 담았다.

그중에서도 맨 처음 언급된 데이터 분석가의 자질을 살펴보자면 해당 영ㅇ역에 대한 도메인 지식이 필요하다고 한다.

또 데이터 과학자에 대해서는, 전처리 기술의 필요성에 대해 언급하고, 더불어 화려한 알고리즘에 앞서 SQL의 기초가 얼마나 중요한지 역설하고 있다.

 

 

총평

데이터 분야를 배우고 싶다는 마음은 크지만 부끄럽게도 아는 것을 별로 없는 나에게 이 책은 또다시 지식의 범위를 넓혀주었다.

데이터 현업에 종사하려는 예비 전문가도, 혹은 호기심을 가지는 일반인들도 누구나 쉽게 읽을 수 있으면서도 핵심 메시지가 가득찬 책이라고 생각한다.

 

 

출판사로부터 책을 제공받아 주관적으로 작성한 글입니다

 

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기