파워 BI(Power BI)에서의 모델 최적화, 그리 어렵고 지루한 작업이라고만 생각하셨나요?
그런데 몇 가지 변화를 주면 성능을 높일 수 있습니다. 오늘은 Power BI에서 데이터 타입을 바꾸는 단순한 방법으로도 성능을 크게 향상 시킬 수 있는 팁을 공유하고자 합니다.
Power BI 성능 개선 needs
얼마 전, 제가 담당한 프로젝트에서 성능이 저조한 Power BI 보고서를 최적화하라는 과제를 받았습니다. 다양한 이유로 보고서의 성능이 저하될 수 있는데요. 이번 포스팅에서는 손쉽게 적용할 수 있는 부분에 집중해보고자 합니다.
데모로 사용할 데이터는 가상의 회사인 Customer First의 고객 지원 부서에서 수행한 채팅 데이터를 포함하고 있는 팩트 테이블입니다.
이 테이블은 약 900만 개의 행을 포함하고 있는데, Power BI 및 분석 작업 부하의 맥락에서 큰 테이블로 간주되지 않습니다.
간단하게 설명하자면, 우리의 모델은 이 단일 테이블로만 구성되어 있다고 가정하겠습니다. 마지막으로, 우리의 분석 모델은 Import 모드로 설정되어 있습니다.
데이터 타입 변경 4가지
1. 정수로의 데이터 변환
수치 데이터를 정수형으로 바꾸면 메모리 사용량이 크게 줄어들어 모델의 응답 속도가 빨라집니다. 수치 데이터의 1자리 소수도 쌓이고 쌓이면 상당한 용량을 차지할 수 있습니다.
2. 날짜 데이터 최적화
날짜 데이터는 많은 경우 시간 정보까지 포함되곤 합니다. 그러나 일 단위 분석이라면 날짜 필드의 시간 정보를 제거하는 것만으로도 필요 없는 처리 시간을 줄일 수 있습니다.
3. 텍스트 데이터 압축
문자열 데이터를 줄일 수 있는 기회도 놓치지 말아야 합니다. 예를 들어 ‘Department of Customer Care’ 대신 ‘Customer Care’로 줄여 쓸 수 있다면, 저장 공간을 크게 절약할 수 있습니다.
4. 필요 없는 데이터 제거
불필요한 열이나 중복된 정보를 제거하는 것도 하나의 방법니다. 모델의 무게를 가볍게 만들 수 있고, 성능을 올릴 수 있는 중요한 방법입니다.
5. 데이터형 일관성 유지
같은 데이터가 여러 개의 형식으로 저장되면 일관성이 떨어지고 성능에 악영향을 미칠 수 있습니다. 일관성을 유지함으로써 처리 속도를 높일 수 있습니다.
마무리
데이터 타입의 변경은 겉으로 보기엔 별거 아닌 작은 변화일 수 있습니다. 하지만 Power BI 모델의 성능을 최적화하는 데 있어 매우 중요한 역할을 할 수 있습니다.
다양한 옵션을 시도해보고, 여러분의 보고서가 짧은 시간에 더욱 빠르고 효율적으로 분석할 수 있도록 개선해 보시기 바랍니다. 시간과 비용을 절약하면서도 품질 높은 데이터를 사용할 수 있다는 것을 몸소 느낄실 수 있을 것입니다.