웨렌 버핏이 투자한 스노우플레이크 아시나요?
바로 ‘Snowflake’라는 이름의 데이터웨어하우스입니다. IPO 당시 데이터 분석 플랫폼 회사로 웨런 버핏의 투자회사로 기사가 났었죠. Snowflake는 데이터웨어하우스 시장에서 가장 가장 경쟁력 있는 툴(tool)로 평가 받고 있습니다.
이 글에서 우리는 Snowflake가 무엇인지, 다른 dw와 차별화는 무엇인지, 그리고 어떤 사례가 있는지 알아 보도록 하시죠.
스노우플레이크 소개
공동 창업자들이 겨울 스포츠를 좋아했기 때문에 ‘눈송이’라는 뜻의 ‘Snowflake’를 회사 이름으로 선택했다고 합니다.
스노우플레이크로 이름을 정한 이유는 눈송이가 각각 고유하고 독특한 모양을 가진 것처럼, Snowflake의 기술과 서비스도 독특하고 차별화된 것임을 나타낸다고 합니다.
Snowflake는 클라우드 기반의 데이터 웨어하우스인데요. Snowflake는 이 클라우드 공간에서 엄청나게 많은 양의 데이터를 저장하고 분석할 수 있게 해주는 도구예요. 데이터 웨어하우스는 회사나 조직에서 사용하는 모든 데이터를 한 곳에 모아 정리하고 분석에 활용합니다.
Snowflake의 특별한 점은 이 모든 과정을 더 빠르고, 더 쉽게, 그리고 더 안전하게 할 수 있다는 겁니다. 엄청나게 많은 양의 데이터도 순식간에 저장하고 분석할 수 있죠. 게다가 여러 사람이 동시에 같은 데이터를 볼 수 있고, 필요한 만큼만 사용하여 비용 효율적입니다.
Snowflake는 2012년에 만들어졌는데, 지금은 전 세계 수많은 기업들이 사용하고 있습니다. 2020년 기준으로 Snowflake의 고객 수는 3,000개가 넘었다고 합니다. 이렇게 빠르게 성장한 이유는 바로 Snowflake만의 특별한 장점들 때문이에요. 이제 그 장점들에 대해 자세히 알아볼까요?
스노우플레이크를 선택해야 하는 이유, 기존 DW와의 차별점
첫째, Snowflake는 빠릅니다.
엄청나게 많은 양의 데이터를 순식간에 처리할 수 있습니다. 예를 들어, 전국의 모든 학교의 성적 데이터를 분석한다고 생각해보세요. 기존의 방식으로는 며칠이 걸릴 수 있는 일을 Snowflake는 몇 분 만에 해낼 수 있습니다.
둘째, Snowflake는 유연하고 협업에 좋습니다. 데이터의 양이 갑자기 많아져도, 또는 적어져도 문제없이 대응할 수 있어요. 또 여러 사람이 동시에 사용할 수 있습니다. 여러 사람이 동시에 같은 데이터를 보고 분석할 수 있죠. 이런 특징 덕분에 팀 프로젝트를 할 때 정말 유용해요.
셋째, Snowflake는 비용 면에서도 효율적입니다. 여러분이 필요한 만큼만 데이터를 가져와 사용하고 그 만큼만 비용을 지불하면 됩니다. 가격적으로 이득이 없으면 기업들이 사용할 이유가 없겠죠.
이런 특징들 때문에 Snowflake는 기존의 데이터 웨어하우스와는 완전히 다른 경험을 제공해요. 실제로 많은 기업들이 Snowflake를 도입한 후 데이터 처리 속도가 10배 이상 빨라졌다고 해요. 또한, 데이터 관리에 들어가는 비용도 평균 50% 이상 줄었다고 합니다.
그래서 실제로 어떤 기업들이 사용하고 있냐고요?
스노우플레이크 활용 사례
우리가 좋아하는 게임이나 영화, 음악 서비스들도 Snowflake를 사용한다는 걸 알고 계셨나요?
먼저, 제가 좋아하는 게임 회사인 ‘스퀘어 에닉스’ 사례입니다. ‘파이널 판타지’나 ‘드래곤 퀘스트’ 같은 유명한 게임을 만든 회사죠.
이 회사는 Snowflake를 사용해서 게임 플레이어들의 행동을 분석해요. 예를 들어, 어떤 레벨에서 플레이어들이 가장 많이 어려워하는지, 어떤 아이템이 가장 인기 있는지 등을 알아낼 수 있죠. 이런 정보를 바탕으로 더 재미있는 게임을 만들 수 있게 됐다고 합니다.
다음은 음악 스트리밍 서비스인 ‘판도라’의 사례예요. 여러분도 음악을 들을 때 취향에 맞는 노래를 추천받고 싶죠? 판도라는 Snowflake를 이용해 수십억 개의 음악 데이터를 분석합니다. 그래서 각 사용자의 취향에 꼭 맞는 음악을 추천할 수 있게 됐다고 합니다.
영화와 드라마하면, ‘넷플릭스’죠. 넷플릭스는 Snowflake를 사용해서 전 세계 사용자들의 시청 기록을 분석합니다. 어떤 장르의 영화가 인기 있는지, 어떤 배우가 출연한 작품을 사람들이 좋아하는지 등을 알아낼 수 있었습니다.
마지막으로, 우리가 매일 사용하는 소셜 미디어 플랫폼인 ‘트위터’의 사례도 있어요. 트위터는 매일 수억 개의 트윗이 올라오는 엄청난 양의 데이터를 다뤄야 하는데요.
Snowflake를 사용하면서 트위터는 이 모든 데이터를 빠르게 처리하고 분석할 수 있었다고 합니다. 덕분에 어떤 주제가 지금 가장 인기 있는지, 어떤 광고가 사용자들의 관심을 끄는지 등을 실시간으로 파악할 수 있게 됐죠.
마치며
여러분, 이제 Snowflake가 인기있는 이유를 이해 하셨나요?
실제로 Snowflake를 도입한 기업들은 평균적으로 데이터 처리 속도가 10배 이상 빨라졌고, 비용은 50% 이상 절감됐다고 합니다.
요즘 국내에서도 클라우드에서 데이터 웨어하우즈 시장은 스노우플레이크가 대세인 것을 체감합니다. 여러분도 기회되시면 경험해 보세요. 스노우플레이크에서 관심있는 사람들을 위해 웨비나 또는 세미나를 제공합니다.