D.S

www.ciokorea.com

벤더 기고 | 고급 분석의 문턱을 낮추다 ‘Approachable Analytics’ - CIO Korea

벤더 기고 | 고급 분석의 문턱을 낮추다 ‘Approachable Analytics’ - CIO Korea 뉴스센터 칼럼/기고 인터뷰/사례 CIO 스토리 슬라이드쇼 인사이더 컨퍼런스 테크서베이 테크라이브러리 리더십|조직관리 빅데이터 신기술|미래 클라우드 IoT SNS 디지털 트랜스포메이션 개발자 마케팅 > SAS Tweet BI / 비즈니스|경제 / 빅 데이터 / 애플리케이션 2016.04.15 벤더 기고 | 고급 분석의 문턱을 낮추다 ‘Approachable Analytics’ 편집부 | CIO KR ‘분석’은 어느덧 기업에게 필수적인 존재로 자리 잡았다. 경험과 직관에 의존했던 비즈니스 의사 결정 대신 ‘데이터 드리븐(Data-Driven)’ 기업으로의 변화가 숨가쁘게 이어지고 있다. 이제는 기업 곳곳에서 일어나는 다양한 의사결정에 있어 분석이 큰 역할을 할 수 있다는 점을 누구나 인정하고 있다. 하지만 기업 곳곳에서 분석을 이용할 수 있는 여건이 마련됐는지에 대해서는 고개가 갸웃거려지는 것 또한 사실이다. 데이터는 여전히 기업 각지에 파편화되어 있으며 분석 도구의 최전선에는 아직도 ‘엑셀’이 자리 잡고 있다. 방대한 데이터를 정교하게 분석할 수 있는 분석 도구들은 훈련 받은 통계 분석 전문가에게 맞춰져 있다. 복잡한 분석이라도 하려면 수많은 조율과 요청, 문서 작업에 직면해야 한다. 데이터의 중요성을 누구나 인정하지만 정작 현실에서는 담당자 역량 문제, 데이터 처리 속도 문제, 조직구조적 문제와 같은 한계가 나타나고 있는 것이다. 그럼에도 불구하고 빅데이터 시대에 접어들면서 상황이 변화하고 있다. 기업이 수집하는 데이터가 변화하고 데이터 분석에 대한 니즈도 변화했다. 데이터를 담는 플랫폼 또한 변화했다. 무엇보다도 비즈니스 성공을 위해 데이터 분석을 요구하는 목소리가 높아지고 있으며, 이에 따라 이제 좀더 빠르고 편리하게, 많은 이들이 다룰 수 있는 분석 툴에 대한 수요가 늘어나고 있다. 누구나 쉽게 접근할 수 있는 애널리틱스, 즉 ‘Approachable Analytics’는 이렇게 등장했다. IDC가 2015년 발간한 ‘Worldwide Big Data and Analytics 2015 Top 10 Decision Imperatives’ 보고서에 따르면 ‘비주얼 데이터 디스커버리’ 분야는 기업 내 확산 속도 및 사용자 측면에서 압도적인 존재감을 발휘하고 있었다. 그래프에 따르면 ‘Approachable Analytics’의 핵심 요소인 데이터 시각화 및 탐색 기술은 가장 빠른 시간(12개월 이내)에 전사적으로 활용의 확산을 기대할 수 있는 유일한 분야다. 적은 비용으로 가장 큰 효과를 누를 수 있는 투자 영역이라는 의미다. 가트너의 연도별 매직쿼드런트 보고서를 살펴보면 흥미로운 변화를 감지할 수 있다. ‘분석’ 기술의 범주를 표현하는 용어가 변화하는 현상이 그것이다. 2012년에는 비즈니스 인텔리전스 플랫폼이었다가 2013년 애널리틱스 플랫폼이라는 용어가 등장한 이후 2014년에는 어드밴스드 애널리틱스 플랫폼이라는 용어가 활용됐다. 그리고 2015년에는 ‘시티즌 데이터 사이언티스트’라는 새로운 용어가 등장했다. 분석 시장이 점점 확대되고 새로운 방법론과 접근법이 출현하고 있음을 대변하는 현상이다. 시티즌 데이터 사이언티스트의 대두 문턱이 낮아진 애널리틱스의 부분적인 사례는 부분적이나마 우리 주변에서 이미 흔하게 볼 수 있다. 교통 현황 지도(그림1)가 그 중 하나다. 교통 상황을 표시할 때 평균 속도를 숫자로 표시하는 ‘데이터 기반’ 방식과 비교해 속도를 색으로 표현한 ‘시각화 기반’ 방식이 오늘날 널리 활용된다. 한눈에 보기에도 지도에 색을 직접 입힌 표시 방식이 직관적임을 확인할 수 있다. 이러한 접근법이 기업 업무에 적용되는 상황을 가정해볼 수 있다. 유기농 식품 구매 데이터 세트를 기반으로 피어슨 상관 분석을 진행하는 상황(그림 2)에서 오로지 표와 숫자만 표기하는 왼쪽의 방식과, 데이터의 의미를 곧바로 확인할 수 있도록 보여주는 오른쪽의 시각화 기반 방식을 비교해보자. 왼쪽의 경우 데이터 탐색에 대부분의 시간이 소요되는데 반해 오른쪽의 방식은 데이터가 의미하는 바를 직관적으로 확인할 수 있다. 이로 인해 빠르고 효율적으로 의사 결정을 할 수 있게 된다. 이는 골든타임 내 의사결정을 내리도록 함으로써 기업 결정력을 확보하고 동종 업계의 시장을 선점하는 결과로 이어진다. 그림 1│2016년 2월 3일, 오전 9시 33분 서울시 교통상황 네이버 지도 그림 2│유기농 식품 구매 데이터 세트 기반 피어슨 상관 분석 가트너는 2015년 선보인 ‘시티즌 데이터 사이언티스트’라는 용어를 통해 애널리틱스의 대중화 시대를 강조했다. 이 시장조사기관은 분석이 기업에 필수적인 요소로 대두된 반면, 통계 분석가 부족 현상이 이어지고 있으며 이에 따라 현업 업무 전문가들이 애널리틱스 업무를 수행할 필요성이 증가하고 있다고 진단했다. 그리고 이로 인해 셀프 서비스 애널리틱스 도구에 대한 수요가 늘어나고 있다고 설명했다. 세계적인 분석 선두 기업 SAS는 수년 전부터 이러한 동향을 감지해 고급 분석의 대중화에 초점을 맞춰오고 있다. 현업 업무를 수행하는 비즈니스 분석가들도 이용할 수 있도록 종전의 분석 도구와 서비스를 정교화하고 있다. SAS는 기업 내 시티즌 데이터 사이언티스트를 육성하고 이들이 바텀 업 방식으로 이용할 수 있는 솔루션을 제공하고 있으며, 이러한 트렌드를 일러 ‘Approachable Analytics’라고 부른다. 업무 분석가를 위한 도구 기업 곳곳에서 고급 분석을 활용할 수 있도록 하기 위해서는 시티즌 데이터 사이언티스트, 즉 업무 분석가가 각종 데이터를 이용할 수 있도록 해주는 도구가 관건이다. 강력한 시각화 기능은 물론 데이터를 모아놓은 환경에 업무 분석가가 직접 질의 및 탐색하고 모델링 할 수 있는 환경과 도구가 마련되어야 한다. 그래야 현업 전문 지식을 바탕으로 많은 시행착오를 거쳐 유용한 통찰을 뽑아낼 수 있다. 일일이 질의에 맞는 요구사항을 규정해 IT 부서에 전달하고 IT 부서가 해당 요구사항에 부응하기 위해 플랫폼을 구축한 후 분석 과정을 거쳐 대답을 결과를 전달하는 기존의 프로세스와는 완전히 다른 환경 및 도구가 필요하다. 한편 이와 관련해 주의해야 할 점은 전통적인 데이터 분석 및 접근 방법이 영역에 따라 여전히 유용하다는 사실이다. 새롭게 등장하는 빅데이터 플랫폼이 기존의 EDW를 대체할 것으로 생각한다면 오해다. 각각 서로 다른 활용처와 유용성을 지니고 있다.  전통적인 방법(좌)에 더해 새롭게 부상하고 있는 빅데이터 접근 방법(우)은 비싼 EDW에 대한 부담을 덜어주면서도 새로운 비즈니스 기회를 제시한다. 세분화 기반의 고객 인사이트 강화 사례 이제 조금 더 구체적인 비즈니스 실례를 살펴보자. SAS가 한 클라이언트 기업을 위해 진행한 실제 사례다. 이 기업은 효율적인 마케팅 활동을 위해 고객 기반을 세분화하고 고객 인사이트를 도출해 마케팅에 활용하려 했다. 이를 전통적으로 해결하려면 분석/설계, 구축/개발, 테스트 단계에 걸쳐 데이터통합, 시각화 리포트, 분석 모델링, 마케팅 컨설팅 업무를 진행해야 했다. 적어도 30맨먼스(man/month) 이상의 인력이 필요한 6개월짜리 프로젝트다. 모델링을 몇 가지 더 추가한다면 50맨먼스까지도 순식간에 늘어난다. 그러나 이 기업에게는 고민이 있었다. 이렇게 구축된 분석 시스템을 비즈니스 환경이 변화한 2년 후에도 이용할 수 있을까? 구축을 담당했던 인력들이 대부분 떠나고 소수의 유지보수 인력만 남은 상황에서 변화한 외부 여건에 맞춰 지속적으로 이용할 수 있을까? ‘Approachable Analytics’ 접근법은 이러한 상황에 대한 해답을 제시했다. 데이터에 빠르게 접근하고 저예산으로 직접할 수 있는, 그러면서도 유연성과 품질 이슈에 대응할 수 있는 방안을 제시했기 때문이다. 정형 데이터는 물론 내외부의 비정형 데이터까지 담아낼 수 있는 인프라를 구축하고 시각적 분석도구 및 마이닝 도구와 연동해 기업 내 업무 분석가들이 고도의 예측 모델링까지도 수행할 수 있도록 하는 것이다. 그 결과 분석가 1인이 단 하루 만에 분석에 착수해 정제 및 검증 과정을 거쳐 분석 데이터를 생성하는 것이 가능해졌다. 이제는 기업 내 일반 분석가들도 고객 프로파일을 조사하고 변수의 변별력 유의성을 검토하고 해당 변수를 가지고 모델을 수정할 수 있다. 전통적인 접근법을 이용한다면 2인 이상의 IT 인력 지원과 3~4개월 이상의 소요시간이 요구되는 업무다. 모델 적합도 분석은 물론 예측모델까지 수립하고 공유할 수 있는 것은 물론이다. 분석가 1인이 단 하루 만에 분석에 착수해 정제 및 검증 과정을 거쳐 분석 데이터를 생성하는 것이 가능해졌다. ‘Approachable Analytics’의 3가지 구성요소 그렇다면 ‘Approachable Analytics’는 어떻게 구현할 수 있을까? 하둡을 도입해 데이터 레이크를 구성하면 되는 것일까? 탁월한 시각화 기능이 핵심일까? 아니면 통계분석 예측 모델링이 관건일까? SAS는 ‘Approachable Analytics’에는 3가지 구성 요소가 있어야 한다고 판단한다. 첫 번째, 데이터 수집, 통제, 스토리 프로파일링 요소가 있어야 한다. 두 번째는 데이터를 탐색하고 분석하기 위해 시각화 요소가 있어야 한다. 마지막으로 분석한 결과를 활용하기 위해 공유하고 협업할 수 있도록 하는 요소가 있어야 한다. 여기에는 아마존 등의 외부 클라우드 환경이나 임베디드 및 모바일 환경으로 확장해 나갈 수 있는 요소도 포함된다. 이 3가지 요소를 외부 솔루션의 도움 없이 독립적으로 갖춘 플랫폼을 ‘Approachable Analytics’ 솔루션이라고 부를 수 있다. 요약하자면 시각화 및 데이터 관리 기능, 리포트 및 대시보드 기능, 대화형 데이터 탐색 기능, 분석 모델링 기능, 모델 평가 및 성능 비교 기능을 모두 갖추고 있어야 ‘Approachable Analytics’이며, 오늘날 이 모든 라인업을 갖춘 한편 고도의 완성도와 편의성까지 갖춘 기업은 단연 SAS 뿐이다. ‘Approachable Analytics’이루는 3가지 요소는 ‘Data’, ‘Discovery’, ‘Deployment’다. 기업