로봇, 인공지능, 반도체

[중앙일보] 멘토링, 빅데이터, 인공지능

FERRIMAN 2020. 2. 28. 13:16

[유혁의 데이터이야기] 데이터는 제대로 분석해야 맛이 난다

입력 2020-02-17 00:11:00
  에서 제공
글자크기 선택 SNS로 공유하기
"구슬도 꿰어야 보배다"란 말이 있듯이 데이터도 제대로 된 분석이 없으면 진가를 발휘할 수 없다. 빅 데이터란 말이 공허하게 들리는 것도 정보만 많이 쌓아 놓았다고 거기서 저절로 답이 나오는 것이 아니기 때문이다. 

데이터에서 질문에 대한 답을 도출해내는 활동을 영어권에서는 ‘Analytics’라고 부른다. 많은 이들이 ‘분석’이라고 간단히 번역되는 말을 두고 혼란스러워하는 것은 분석의 종류가 아주 다양하기 때문이다. 이제는 모두가 데이터와 더 친해져야 하는 시대에 살고 있으니 분석 활동을 크게 네 가지로 나누어 간추려 보겠다. 

가장 기초적인 종류는 BI(Business Intelligence)라고 불린다. 마치 운전할 때 계기판을 보고 현재 속도, 운행시간, 목적지까지의 거리, 가진 연료로 갈 수 있는 거리 등을 알 수 있는 것처럼 기본적인 계량 수치를 사용자에게 보이는 것이다. 비즈니스를 위한 대시보드라면 공정에 따른 불량률, 마케팅 캠페인 반응률, 매장이나 상품별 매출분포, 과거 회기연도에 비한 변화 등을 나타낼 수 있겠다. 보여줄 지표를 정하는 것부터 복잡한 숫자들을 인식이 쉬운 표나 도식으로 간략히 표현하는 것까지 기본적이지만 아주 중요한 활동이다. 

그다음 단계는 묘사적 분석(Descriptive Analytics)이라고 하는데, 여기서부터 어떤 현상의 배경에 대한 분석가의 해석이 본격적으로 들어간다. 매출액이 떨어지고 있다면 그 이유는 무엇인가? 전지역에서 그런지, 상품에 따라 다른 것인지, 마케팅 활동에 변화가 있었는지, 소비자 프로파일이 변한 것인지 다각도로 검토하는 것이다. 아예 고객 프로파일을 해 본 적도 없다면 그 자체가 문제지만, 많은 국제적 기업들은 고객들을 여러 군(segment)으로 나누어 그 성향을 심층적으로 분석하고 마케팅 계획을 세운다. 여기까지가 ‘현재’에 대한 분석이다. 

미래에 관한 데이터 작업은 예측적 분석(Predictive Analytics)이라고 한다. 데이터 사이언티스트의 자질을 논할 때 통계적 지식이 필수적으로 요구되는 이유이기도 하고, 머신러닝이 중점적으로 적용되는 분야이기도 하다. 단지 미래에 대한 예측 뿐 아니라 데이터베이스 안에 필연적으로 존재하는 수많은 구멍들, 즉 가진 데이터만 가지고는 확실히 알 수 없는 부분들을 메워주는 역할도 한다. 이런 작업을 ‘모델링’이라고 하는데 거기에도 수많은 방법들이 있다. AI의 근간을 이루는 신경망 분석(Neural Network)도 그중 하나다. 

예측적 분석을 통해 향후 분기별 매출은 얼마나 될 것인지, 누가 어떤 상품에 반응할 것인지, 누가 단골이 될 가능성이 있는지, 어느 기계에서 불량품이 나올지 등의 예측을 할 수 있다. 쉬운 예로 우리가 매일 대하는 일기예보도 예측적 분석의 한가지다. 그 결과는 확답이 아니라 ‘내일 비가 올 가능성이 10중 7’이라는 점수나 확률의 개념으로 이해하면 된다. 마케팅의 예로 어떤 고객이 신상품을 선호할지 확실히 알 수는 없어도 보유한 데이터로 ‘그럴 가능성’은 산출이 가능하다. 실제로 많은 기업들은 예측적 분석을 이용해 예산을 짜고 공급라인 관리를 하며, 더 나아가 모델로 그려진 고객 성향에 따라 맞춤형 서비스도 제공한다. 

또 다른 종류의 분석은 최적화(Optimization)인데, 가진 자본과 인력을 어떻게 분배해야 수익이 극대화되는지를 밝혀내는 작업이다. 주로 광고회사 등에서 쓰는 분석으로 이를 통해 주어진 마케팅 예산을 효율적으로 나누고, 이익을 극대화할 수 있는 최적가격도 산출해 낸다. 개인정보를 필요로 하지 않으면서도 전략적으로 중요한 활동이다. 

다소 전문적일 수 있는 내용을 이렇게 다룬 이유는 일반 사용자도 어떤 종류의 분석을 해야 원하는 답이 나오는지 기초적인 지식은 있어야 하기 때문이다. 아니면 뭐든 AI에게 맡기면 저절로 결과가 나올 것으로 착각하게 된다. 

분석을 인간이 하든 기계가 하든 명확한 목표를 정하는 것은 답을 원하는 사람들의 몫이며, 숙제를 제대로 내려면 질문이 현재나 혹은 미래에 관한 것인지, 서비스의 개인화를 위한 것인지 혹은 전략적 계획 수립을 위한 것인지 등의 기본적 분류를 우선적으로 해야 한다. 목적에 따라 분석의 형태와 그에 필요한 데이터가 크게 달라지므로 막연한 희망 사항의 나열은 금물이다. 그건 아무리 기술이 발달해도 마찬가지다. 

유혁 윌로우 데이터 스트래티지 대표