[2020-1: 4주] BC카드 빅데이터센터, 『빅데이터, 사람을 읽다』
『빅데이터, 사람을 읽다』
: 소비로 보는 사람, 시간 그리고 공간
BC카드 빅데이터센터 지음 | 미래의창 | 2019년 12월 10일 출간
목차
1장 빅데이터란 무엇인가?
사람의 마음까지 알 수 있을까?│소비 데이터의 활용│
빅데이터 시대, 소비 데이터의 역할│빅데이터의 활용 가치를 찾는 연습
2장 소비자 프로파일링
소비자 프로파일링 방법│동네 생활 소비형│종합 소비형│오프라인 올빼미형│
외식 집중형│온라인 온리형│헤비 드라이버형│BMW형│일상 소확행형│워라밸 웰빙형│레저 활동형
3장 빅데이터로 본 요즘 뜨는 소비 트렌드 9
미세먼지│문화 소비│홈쇼핑│편의점│워라밸│디지털 생활비│홈바디│5060 세대│배달 음식
4장 빅데이터로 본 요즘 뜨는 상권 5
힙지로│성수동 카페 거리│샤로수길│황리단길│해리단길
데이터 분석이 통계학이나 프로그래밍으로 온전히 환원될 수 없는 이유는, 분석에 인간 삶의 양태와 감정에 대한 직관이 들어가야 하기 때문이라고 생각합니다. BC카드 데이터를 바탕으로 한 모델링과 클러스터링의 결과물에 삶의 흔적을 묻혀 새로운 제언으로 이끌어내는 일련의 흐름을 따라가 볼 수 있어서 좋았습니다.
저자께서 책에서 밝히신 것처럼, 데이터 3법 이후로, 사회의 여러 주체들이 데이터를 확보하고 공유함으로써 획득할 수 있는 가치는 무궁무진하다고 생각합니다. 특히 오픈 뱅킹과 클라우드 컴퓨팅 기술이 발전하면서, 통합되어 수집되고 공유되는 데이터로부터 얻을 수 있는 새로운 통찰이 있을 것이라고 생각합니다. 그러나 기술적/분석적 성취와 별개로 우리가 생각해 보아야 할 것은, 데이터 통합의 시대에서 이러한 통찰과 분석이 건강하게 순환될 수 있는 시스템이 빈틈없이 마련되었느냐는 점입니다. 그 예의 하나로 데이터 오너쉽(Data Ownership)을 들어보고자 합니다.
미국 대선의 경선 후보 중 한 사람인 앤드류 양은 구글, 아마존 등 데이터 회사들에게 데이터세를 걷어야 한다고 주장한 바가 있습니다. 한국에서도 2018년 마이 데이터 사업 이후로 데이터를 독점하는 행태에 대한 부분적 제한을 시행하기도 하였습니다. 그러나 여전히, 데이터라는 자원에 대한 명확한 법적 정의는 존재하지 않습니다. 기존의 재화처럼 전통적 소유권의 영역에 속하지도 아니하고, 인간의 창의적인 지적 활동이 수반되어야 하는 지적 재산권의 영역에 속하지도 않습니다. 개인이 데이터를 제공할 때, 기업이 동의를 구하는 것으로 이 과정을 대체하고 있습니다만, 저자가 언급한 바와 같이 우리 삶의 모든 흔적과 소비가 데이터가 되는 세상에서 이러한 동의만으로 데이터 활용에 대한 부분을 모두 커버하기란 쉽지 않다고 생각합니다.
개인-기업 간의 관계 뿐만 아니라 기업-기업 간의 데이터 공유 또한 생각해보아야 할 점이라고 생각합니다. 클라우드 시대가 시작되면서, 아마존, MS, 구글 등 소위 IT Giants들의 서버에 수많은 데이터가 저장되고 있습니다. 이러한 회사들은 데이터 보관/분석의 플랫폼으로 기능하면서 하나의 시스템을 형성하고 있습니다. 새로운 회사가 데이터를 활용한 분석이나, 데이터 플랫폼으로 기능하기 위해서는 큰 회사들과의 공조 혹은 데이터 공유가 필수적입니다. 마이 데이터 사업이 의도하는 목표 중 하나가 이러한 것이었습니다만, 데이터의 소유와 흐름에 대한 명확한 기준이 제시되지 않는다면 실효성이 상당 부분 제한될 것이라고 생각합니다.
저번 시간 이광근 교수님께서 머신 러닝 소프트웨어를 서당개에 비유하신 바가 있습니다. 이러한 서당개는 누구 개인지가 궁금합니다. 사서삼경을 쓴 학자들의 것인지, 그것을 읊은 학생들의 것인지, 서당의 것인지, 서당이 존재하도록 하는 마을 공통의 것인지, 아니면 이를 새롭게 정의할 새로운 방식이 있을 것인지 여쭤보고 싶습니다.
다양한 통계적 기법과 머신러닝을 이용하여 소비 데이터에 드러난 한국인을 군집화하였다. '한국인'이라는 거대한 분야를 체계적으로 쪼개어 파악하기 쉽도록 한 것이다. 각 군집에 상상력을 더하여 그 군집을 대표하는 인격을 창조한 것이 흥미로웠다. 책을 읽는 내내 나는 어떤 소비 그룹에 속하며, 어떤 트렌드에 반응하고 있는지 생각하게 되었다. 그 중, 현대의 소비가 상품을 소유하는것에서 경험을 추구하는 것으로 그 목적이 달라지고 있는 것에 공감한다. 나 역시 공유 경제와 구독 서비스 등을 적극적으로 이용하며 경험의 폭을 넓힌다. 2년마다 스마트폰을 교체하는 것도 같은 원리로 설명할 수 있을 것이다. 한편으로는 이렇게 경험해 본 상품 중에서 구매한 것에 대한 애착이 강해진다. 다양한 경험을 바탕으로 고심하며 '소유'를 결정하게 된 것이기 때문이다. 집은 이러한 것들, 즉 내가 정말 좋아하는 것들로 꾸며진다. 때문에 집에만 있어도 행복할 수 있다.
책에서는 소비데이터를 다룬다. 때문에 소비에서 소외된 사람들을 설명하기에는 한계가 있어 보인다. 특정 수준 이상의 소비가 있는 사람들, 혹은 그렇게 될 가능성이 있는 사람들만이 분석 대상이 된다. 이윤을 추구하는 카드 회사의 데이터 분석 답다. 공적인 영역에서 보다 포괄적으로 사람을 읽는 데이터 분석이 이루어 지고 있는 지 궁금하다. 이를테면, 한국전력의 전력사용 데이터나 KT의 보행자 이동 데이터 등을 어떻게 이용하고 있는지 말이다.