데이터 시각화의 함정, 신뢰하지 말아야 할 4가지 방법

데이터 시각화에 함정이 있다는 말 들어 보셨나요?

시각화는 데이터 분석에서 빼놓은 수 없는 중요한 요소입니다. 고객과 커뮤니케이션 할 때도 시각화 도구를 활용하기도 하죠. 가끔은 시각화 내용이 우리를 속이는 것일 수도 있죠.

데이터 시각화를 통해 어떻게 진실을 왜곡할 수 있는지를 살펴보겠습니다. 이 글에서는 데이터를 효과적으로 악용하여 잘못된 분석 의도를 강화하는 네 가지 고급 기법을 소개하겠습니다.

데이터 시각화-함정

데이터 시각화의 함정

데이터 시각화는 복잡한 정보를 간단하게 전달할 수 있는 강력한 도구입니다. 하지만 사용자의 데이터 분석 능력이 부족할 겨우, 때때로 이러한 시각화는 우리에게 잘못된 신호를 줄 수 있습니다.

하지만 이 글을 작성하면서 생각하는 것은 나 또한 의도적으로 프리젠테이션을 잘 하기 위해 듣는 사람들을 내편으로 끌어드리기 위해 많이 사용하는 방법이라는 사실을 알게 됐습니다.  

데이터 분야에 일하면서 항상 데이터의 투명성과 윤리에 대한 생각을 하게 되었습니다. 그래서 이 문제를 끄집어 내어 글을 통해 작성하게 되었습니다.

 

1. 필요 없는 데이터 포인트 생략하기

어떤 분석 의도를 강조하고 싶으세요?

혹시 특정 데이터가 당신의 주장에 방해가 되는 경우가 있으신가요? 그렇다면, 가볍게 그 데이터를 빼버리는 겁니다.

베스트셀러 “우리는 왜 잠을 자야 하는가”에서는 이런 기법이 완벽하게 적용되었습니다. 책에서 데이터 포인트가 줄어들면서, 강조하고자 하는 메시지가 더욱 명확해졌습니다.

이 방법은 우리가 의도한 방향으로 결과를 왜곡할 수 있는 가장 손쉬운 방법 중 하나 입니다.

 

2. 패턴 심리학 활용하기

심리학은 데이터 시각화에서 크게 활용될 수 있습니다. 예를 들어, 사람들은 색상과 패턴에 강한 인상을 받습니다. 빨간색이 나쁨을, 초록색이 좋음을 의미한다는 인식이 있는 것처럼 말이죠.

이러한 색상의 통념을 활용하여 데이터 차트에서 시각적 충격을 주는 것이 가능합니다. 주요한 데이터 포인트를 필요에 따라 조정함으로써 사용자에게 다른 감정적 반응을 유도할 수 있습니다.

 

3. 선택적으로 데이터 범주화하기

데이터 집합에서 일부 데이터만 범주화하여 보고하면 완전히 다른 이야기를 전달할 수 있습니다. 연구 논문이나 보고서에서 자주 볼 수 있는 이 방법은 데이터를 재구성하여 자신이 원하는 이야기를 만들어냅니다.

예를 들어, 과밀 가구 수를 강조하려는 경우와 그렇지 않은 경우에는 각각 다른 방식으로 데이터를 그룹화하여 서로 다른 인상을 줄 수 있습니다.

이 방법은 언론에 나온 기사들도 자주 사용되는 방식입니다. ‘어떻게 범주화 하느냐’에 따라 완전이 다른 반향을 일으킨다는 사실을 알게 됩니다. 

 

4. 가독성 전략적으로 조정하기

마지막 방법은 가독성을 조정하는 것입니다. 당신의 이야기에 적합하지 않은 데이터를 제거할 수 없다면, 차트를 복잡하게 만들어 데이터를 읽기 어렵게 만드세요.

보기가 불편한 표나 지나치게 복잡한 그래프를 활용하여 참조하기 어렵게 만들 수 있습니다. 이렇게 하면 그 데이터에 대해서는 일반인들이 접근하기는 어려워 집니다. 

자신이 속한 집단이 유리하지 않는 데이터에 대해 숨기는 방법이라도 할 수도 있습니다. 다만 데이터를 아는 사람들에게는 무조건 걸리게 되어 있는 편법입니다. 

 

마무리

데이터 비판적 소비자라면, 이런 기법들이 사용되었는지를 염두에 두고 데이터 시각화를 주의 깊게 살펴보아야 합니다.

데이터를 이해하고 활용하는 사람으로서, 윤리적인 데이터 시각화 실천에 대한 중요성을 인식하고 이에 대한 인식을 함께 높여가기를 바랍니다. 

모든 분들에게 데이터로부터 얻는 통찰이 윤리적이고 본질적인 것인지 늘 질문하며, 데이터를 통해 진정한 가치를 발견하시길 바랍니다. 

Leave a Comment