로봇, 인공지능, 반도체

[중앙일보] 멘토링 자료, 데이터

FERRIMAN 2019. 10. 6. 18:00

[유혁의 데이터이야기] 데이터를 잘 다루는 사람이란?

입력 2019-09-30 00:18:56
 
유혁 윌로우 데이터 스트래티지 대표

유혁 윌로우 데이터 스트래티지 대표

데이터가 커지고 복잡해지면서 그것을 다루는 사람들이 갖춰야 할 능력과 소양도 과거에 비해 많이 달라졌다. 요즘 흔히 말하는 데이터 사이언티스트라는 사람들은 여러 종류의 데이터를 자유자재로 다룰 수 있어야 한다. 단순한 리포팅을 넘어 통계적 모델과 머신 러닝을 사용하여 예측적 분석도 할 수 있어야 한다. 더욱이 데이터를 직업적으로 다루지 않는 사람들을 상대하며 그들의 의도를 파악하고, 분석 결과를 전문적 용어 대신 쉽게 이야기로 풀어 나갈 줄도 알아야 한다. 그들에게 주어진 임무는 한 사람이 독자적으로 해 내기에는 결코 간단한 일이 아니다. 

빅데이터에 발을 들여놓으려는 많은 조직들은 흔히 소수의-혹은 단 한 명의-데이터 사이언티스트를 고용하고 그들에게 정제되지도 않은 산더미같은 데이터와 모호한 과제를 주고는 알아서 가치를 창출하라는 주문을 한다. 그 사업모델에 실질적으로 도움이 될 데이터 업무를 제대로 파악하는 것만 해도 컴퓨터나 통계에 관한 지식을 훨씬 뛰어 넘는 일이다. 사람들이 말하는 사업목적은 늘 완벽한 논리적 표현의 형태로 있지도 않고, 주어진 데이터가 항상 분석을 위해 최적화되어 있지도 않기 때문이다. 

일례로 "새로운 통신 사업에 가치가 높은 고객을 확보해달라"라는 사업목적이 주어졌다고 가정하면, 과연 그것을 어떻게 컴퓨터도 알아듣는 언어로 표현할 것인가? 그 단순한 "고객가치"란 말도 매출총액, 계약기간, 구매 서비스와 그 가짓수, 할인액, 정시납부비율, 혹은 계약갱신 건수 등 여러 변수의 조합으로 표현될 수 있으며, 그 해석방식에 따라 분석 자체가 엉뚱한 방향으로 갈 수도 있다. 사업목적을 확실히 이해하고 그에 적합한 프로젝트를 만들어 가시적 기여를 하는 일은 데이터나 통계에 관한 지식만큼이나 비즈니스에 관한 이해를 필요로 한다. 

데이터이야기 9/30

데이터이야기 9/30

데이터 전문가가 되려는 지망자들이 어느 정도의 기술적 소양은 갖추었다고 가정해 보자. 데이터에 손을 댈 때 마다 새로운 가치를 창출하는 훌륭한 데이터 사이언티스트와 그저 정보를 이리저리 옮겨 놓는 것이 일상인 단순 노무자로 확연히 가르는 요소는 그들의 해당 비즈니스에 관한 이해 수준이다. 문제는 고급인력에 대한 수요는 계속 늘어나는 반면 기술과 비즈니스에 대한 균형적 감각을 한 몸에 갖춘 마스터급 데이터 전문가는 결코 흔치 않다는 점이다. 

세상에는 혼자서 작사, 작곡, 편곡, 연주, 노래, 녹음, 그리고 제작까지 할 수 있는 뮤지션들도 있다. 그런데 꼭 그런 사람만 음악계에 발을 들여놓을 수 있다고 우기면 들을 음악이 별로 없을 것이다. 데이터에 관한 업무도 마찬가지다. 그것을 크게 (1) 데이터의 수집과 가공, (2) 분석과 예측, 그리고 (3) 과제를 만들고 그 결과를 사업에 적용하는 비즈니스 컨설팅으로 나누었을 때, 그 셋 중 하나의 분야에서 전문가가 되는 것도 쉽지 않다. 그런데 이 세 요소를 다 갖춘 사람만 찾다 보면 채용하는 측도 어렵고, 채용된 사람도 열악한 분석 환경에서 터무니없이 높은 기대치에 부응하려고 고생만 하다가 낭패를 보는 경우가 많다. 

데이터를 다루는 일은 팀 스포츠다. 데이터가 커지고 분석도 복잡해진 상황에서는 더욱 그러하다. 사용자들도 접근방식을 바꿀 필요가 있다. 슈퍼 히어로만 찾다가는 되는 일이 없게 마련이다. 

유혁 윌로우 데이터 스트래티지 대표