모두 입을 모아 도널드 트럼프 같은 사람은 대통령이 될 수 없다고 말했다. 그런데 트럼프가 당선됐다. .... 사람들이 거짓말을 한 걸까?
저자인 세스 스티븐스 다비도위츠는 인터넷 데이터 전문가다. 그는 단순한 설문조사로는 알 수 없는 사실들, 사람들이 다른 사람에게는 하지 않을 이야기를 익명성이 보장된 인터넷상에서는 한다는 것을 알아차렸다. 그렇다. 인터넷 검색, 방문 기록 등의 빅데이터를 통해, 우리는 진실이 무엇인지, 사람들이(심지어 스스로에게도) 어떤 거짓말을 하고 있는지 알 수 있다.
직감은 불완전하다.
우리에게는 자신의 경험이 가진 타당성을 과장하는 경향이 있다. 즉, 우리는 자신의 데이터에 큰 비중을 둔다. 들은 것이나 개인적인 경험에만 의존하면 세상이 어떻게 돌아가는지에 관해 틀리게 생각하기 쉽다. 개인의 경험은 어떤 현상을 일반화하기엔 그 표본이 너무 적다. 또한 설문조사에서(아마도 미국) 사람들은 토네이도를 천식보다 더 흔상 사망 원인으로 평가하지만 사실 천식의 사망률은 토네이도보다 70배 높다. 토네이도에 의한 사망은 뉴스에 자극적으로 보도되어 기억에 강하게 남는 반면, 천식으로 인한 사망은 뉴스거리가 되지 않기 때문이다.
빅데이터의 힘
1. 새로운 유형의 데이터 제공
현재 우리가 활용할 수 있는 다양한 종류의 빅데이터 들은 20년 전만해도 존재하지 않았다. 지금에야 존재하는 이 빅데이터는 이전에는 짐작만 할 뿐 확인할 수 없었던 영역에 대한 다양한 창을 열어주는 독특한 데이터 소스가 많다.
2. 솔직한 데이터 제공
디지털 시대 이전에는 사람들이 자신의 쑥쓰러운 생각을 다른 사람들에게 숨기며 살았다. 디지털 시대에도 여전히 다른 사람들에게 그런 생각을 숨긴다. 하지만 인터넷과 익명성을 보호 해주는 구글이나 폰허브(세계 최대 규모의 포르노 사이트)같은 특정 사이트에서는 태도가 달라진다. 이런 사이트들은 일종의 '디지털 자백약'으로 기능해서 특정한 성적 취향에 대한 매혹을 드러낸다. 빅데이터를 통해 우리는 사람들이 원한다고 말하는 것, 하고 있다고 말하는 것이 아니라 사람들이 정말로 원하고, 정말로 하고 있는 일이 무엇인지를 볼 수 있다.
3. 작은 집단의 클로즈업
지금은 데이터가 너무나 많기 때문에 작은 규모의 집단에 관한 유의미한 정보도 존재한다. 예를 들어, 오이 꿈을 꾸는 사람의 수와 토마토 꿈을 꾸는 사람의 수를 비교할 수 있다.
4. 인과적 실험의 실행 가능성
빅데이터를 활용하여 빠른 통제실험을 할 수 있다. 이로써 단순히 상관관계만이 아니라 인과관계도 확인할 수 있다. 이런 유형의 시험은 현재 기업이 많이 사용하고 있지만 곧 사회과학자들에게도 강력한 도구가 될 것이다.
현재 사용할 수 있는 새로운 유형의 모든 데이터를 활용하고 무엇이 데이터로 간주되는지 광범위한 시각으로 보는 것은 학자들은 물론 기업가들에게도 큰 가치를 지닌다. 현대 데이터 과학자들은 데이터를 보는 전통적인 관점에 얽매여서는 안 된다. 슈퍼마켓의 대기 줄을 찍은 사진도 귀중한 데이터가 된다. 꽉 찬 슈퍼마켓 쓰레기통도 데이터다. 사과가 잘 익었는지도 데이터다. 우주에서 찍은 사진도 데이터다. 입술의 곡선도 데이터다. 모든 것이 데이터다!
이 모든 새로운 데이터로 사람들의 거짓말을 꿰뚫어 볼 수 있다.
빅데이터 : 취급 주의
빅데이터가 가진 힘은 때로 윤리적 문제를 야기할 수 있다.
빅데이터를 통해 '하나님', '약속', '감사' 등 특정한 단어를 자주 언급하며, 인정에 호소하는 사람일수록 채무를 불이행할 가능성이 높다는 것을 확인했다. 그렇다면 돈을 빌리고자 하는 사람은 특정 단어를 자주 사용하고 인정에 호소하는 말을 했다는 이유를 토대로 대출을 거절받아도 되는 것일까? 또한 범죄 활동과 연관된 구글 검색이 범죄 활동과 상관관계가 있다는 증거가 늘어나고 있으므로, 실제 범죄를 저지르지 않았지만 범죄와 관련된 내용을 인터넷에 검색하는 행위만으로 경찰이 누군가를 취조할 수 있을까?
언제부턴가 '빅데이터' 라는 단어가 자주 들리기 시작했다. '메타버스'니 'NFT'니 하는 새로운 기술들과 비교하면 어렵지 않은 개념이긴 하다. 말 그대로 엄청나게 많은 양의 데이터. 하지만 대부분의 사람들이 인터넷을 사용하는 현대가 되어서야 비로소 활용 가능해진 이 무한한 양의 데이터는 놀라울 정도로 많은 것들에 활용이 될 수 있다.(대표적으로 넷플릭스에서는 수많은 사용자들이 봤던 콘텐츠들의 데이터를 바탕으로 나와 비슷한 취향을 가진 사람들이 봤던 콘텐츠를 추천한다.)
단순히 유용하게만 생각했던 빅데이터이지만, 앞으로 우리의 삶을 바꾸는데 큰 역할을 할 것이다.
'Book > 경제경영' 카테고리의 다른 글
돈의 심리학 #모건 하우절 (0) | 2022.03.27 |
---|---|
보도 섀퍼의 돈 #보도 섀퍼 (0) | 2022.03.04 |
오리지널스 #애덤 그랜트 (0) | 2022.02.15 |
순서파괴 #콜린 브라이어 #빌 카 (0) | 2022.01.24 |
선택 설계자들 #올리비에 시보니 (0) | 2022.01.14 |