회고 및 기록

문과생 네이버제트 Data Analyst(데이터 분석가) 전환형 인턴 후기

강떡볶 2023. 3. 7. 17:22

6개월 동안 네이버제트에서 인턴이 끝난 지금 돌아보면, 확실히 6개월 전의 나보다 많이 성장했다는 것을 느낄 수 있었다. 그리고 무엇보다 이전 회사에서 경험했던 데이터 분석 컨설팅과 프로덕트 데이터 분석이 어떻게 다른지 몸소 경험할 수 있었다(이에 대해 작성한 글은 여기 참고). 이번 글에서는 네이버제트에서 데이터 분석가 인턴으로서 어떤 업무를 했는지, 그리고 이를 통해 어떤 것들을 배웠는지 작성해보려고 한다.
 
서류 지원부터 면접까지의 과정은 아래 글에서 확인할 수 있다.

문과생 네이버제트 Data Analyst(데이터 분석가) 전환형 인턴 - 서류부터 면접까지

지난 6개월(22.07~23.01) 동안 네이버 계열사인 네이버제트의 데이터 분석가 인턴 포지션을 경험할 수 있었다. 네이버제트는 글로벌 메타버스 플랫폼 '제페토'를 운영하는 회사다. 이전 글에서도 알

ddukbbok-kang.tistory.com

 
 

1. 앰플리튜드를 활용한 유저 분석

말로만 들었던 앰플리튜드를 직접 사용해볼 수 있었다. 앰플리튜드는 비싼 툴이고 구글 애널리틱스와는 다르게 사실상 개인이 사용하기 어렵기 때문에, 이렇게 회사에서 앰플리튜드를 다뤄볼 수 있는 경험은 매우 소중한 기회라고 생각했다. 그만큼 열심히 익히고 배우기 위해 노력했다. 사용법을 익히기 위해 사내에서 예전에 진행했던 AB180의 앰플리튜드 가이드 영상 녹화본을 정독했다. 그리고 항상 앰플리튜드 공식 홈페이지에 있는 가이드를 참고했고 그래도 모르는 부분이 있으면 같이 일하는 분들께 여쭤보거나 앰플리튜드 본사에 직접 문의를 넣었다.
 
앰플리튜드를 통해서 정말 다양한 분석을 진행했다. 처음에는 세그멘테이션 차트를 사용해 간단한 조건만 걸어 unique 유저수를 보거나 이벤트수를 봤다면, 시간이 지날수록 복잡한 조건을 걸어 좀 더 구체적으로 유저를 분석할 수 있었다. 어떤 특정 집단의 유저를 코호트로 생성해, 해당 코호트를 다시 유저 모듈의 조건으로 걸어 코호트별 특징을 분석하기도 했다. 퍼널 차트를 통해 '가입한지 1일 이내 특정 이벤트를 수행한 유저/이탈한 유저'를 코호트로 만들어 두 개의 코호트를 비교하기도 했다. 또한, fomula라는 기능을 활용해 함수로 직접 수치를 계산할 수도 있기 때문에 ARPPU나 Revenue 같은 매출 관련 수치도 앰플리튜드를 통해 확인할 수 있었다. 이렇게 앰플리튜드로 요리조리 유저 데이터를 뜯어보며, 어떤 문제 상황에 부딪혔을 때(ex. 00 국가 유저의 앱 체류시간 감소 등) 그 원인을 분석하기도 했고, 특정 국가만이 수행하는 패턴(ex. 00 국가 유저는 특정 기념일에 ~하는 경향이 있다 등)을 찾아내 리포트를 작성하고 새롭게 제안할 내용이 있으면 제안드렸다.
 
또한, 여러 차트를 조합해 앰플리튜드 대시보드를 제작하기도 했다. 나의 경우는, 아무래도 제페토가 글로벌 서비스이기 때문에 앰플리튜드를 통해 유저들의 kpi 수치를 대륙별로 모니터링할 수 있는 대시보드를 만들었다. 그 외에도 체류시간, 세션 수, 유저 path 등 다양한 차트 기능을 활용해 인사이트를 발견할 수 있었으며, 팀에서 중요하게 보는 kpi를 앰플리튜드와 엑셀을 통해 자동화하여 매주 리포팅할 수 있도록 했다. 물론 100% 자동화는 아니고 어느 정도 수동적으로 작업해야하는 부분도 있지만, 업무 강도를 훨씬 줄여 매주 kpi 수치가 슬랙으로 전송될 수 있도록 했다. 6개월 동안 앰플리튜드를 사용하며 툴에 익숙해졌고 자신감이 생겼다. 앰플리튜드가 직접 쿼리를 쳐서 유저를 추출하는 것만큼 정교하진 않지만, 대부분의 상황에서는 정말 편리하고 유용한 툴인 것 같다. 내가 다룰 수 있는 툴이 하나 늘어서 정말 뿌듯했다.
 

5층 사내카페에서 바라본 풍경

 
 
 

2. 실무에서 SQL을 사용해보며 원하는 조건의 데이터를 추출

아쉽게도 이전 회사에서는 SQL을 사용할 일이 거의 없었다. 그래서 주로 프로그래머스나 해커랭크같은 코딩테스트 플랫폼에서 SQL을 연습할 수밖에 없었다. 하지만 네이버제트에서는 SQL을 실무에서 사용할 수 있는 기회가 많이 있었어서 실력을 향상시킬 수 있었다. 더불어, 실제 raw 데이터로 작업할 때 얼마나 복잡하고 고려해야될 사항이 많은지 뼈저리게 느낄 수 있었다.
 
예를 들면, 분명 쿼리를 맞게 친 것 같은데... 결과물을 보면 내가 생각한 게 아니라던가.. 근데 데이터가 워낙 방대하다보니 이걸 어디서부터 어떻게 확인해야하고 검증해야하는지 너무 어려웠다. 그래도 이런 과정을 계속 겪다보니 헷갈리지 않게 주석을 달기 시작했고, 처음에 쿼리를 칠 때부터 내가 원하는 결과를 도출할 수 있는 쿼리인지 한 번 더 고민했다. 그리고 row_number over과 같은 윈도우 함수를 맨날 코딩테스트 플랫폼에서만 써보다가.. 실제로 써보니까 너무 신기했다! 또한, 다른 분들이 기존에 아카이브 해둔 쿼리를 이해하고 내 것으로 만들어 다시 응용하는 과정이 재밌기도 했다. 
 
SQL과 더불어 파이썬도 활용했다. SQL을 통해 유저가 이벤트를 수행한 로그를 일자별로 추출해 파이썬으로 코호트 분석을 진행했다. 물론 이 작업은 SQL로도 가능하지만, 파이썬으로 작업하는 게 훨씬 더 쉽고 효율적이라고 생각했다.
 

SQL과 파이썬으로 진행한 월별 코호트 분석

 

내가 제일 좋아하던 미래도시 뷰

 


 

3. 좋은 리포트를 작성하는 법을 배우기 위해 노력

리포트를 작성하는 과제가 종종 주어졌었는데 과제를 수행하며 많은 것을 배울 수 있었다. 가장 인상깊었던 것은 당연한 분석을 하지 않는 것이다. 이게 무슨 말이냐 하면, 아무래도 처음 분석을 진행하면 당연한 내용을 인사이트로 착각하는 경우가 많다. 예를 들면, 00국가는 매년 3월 5일이 공휴일이라 당연히 앱 접속자가 많을 수밖에 없다. 하지만 이 사실을 모른다면, 3월 5일에 접속자가 급증한 것을 특이사항으로 착각하기 쉽다. 처음에 분석을 진행할 땐 이런 당연한 사실이 분석 결과로 나왔고 이와 관련해 피드백을 많이 받았다. 사실 이러한 부분은 내가 회사에 오래 재직한 사람이라면 자연스럽게 알 수밖에 없지만, 6개월만 일하는 인턴인 이상 자연스레 알기 어렵다. 따라서, 스스로 서비스에 대해 공부하고 이전엔 어떤 분석 인사이트들이 나왔는지 알기 위해 더욱 노력해야한다고 생각했다. 그래서 어떤 특이점이 발견되면 슬랙 히스토리를 검색해보며 해당 특이점이 매번 있는 일인지, 혹은 이번에만 발생한 특이사항인지 구별하고자 했다. 슬랙 히스토리를 검색해보는 것이 일하는 데 많은 도움이 되었는데, 내가 처음에 몰랐던 서비스의 특징(ex. 방학이 시작하면 서비스 체류시간이 증가한다 등)을 많이 알 수 있었다. 이렇게 '당연한 사실'을 인사이트로 착각하지 않으려고 노력함으로써 더욱 사람들에게 가치 있는 리포트를 작성하고자 했다.
 
더불어, 그래프가 소폭 상승/하락하고 있는 것을 항상 '추세 변동이 있다'고 여길 수 없다는 점도 배웠다. 기간을 길게 봤을 때는 평이한 추세지만 당장 이번달 추세만 봤을 때 상승/하락하고 있기 때문에 '우리 지표가 지금 엄청난 변화를 겪고 있어요!'라고 착각할 수 있기 때문이다. 따라서, 이번달 수치가 상승/하락했더라도 지난 추이를 보며 해당 수치 변동이 의미가 있는지 없는지 판단해야한다. 또한, 당연한 말일 수도 있지만, 현황에 대해 작성할 때는 기존에 내부에서 인지하고 있는 수치와 크게 차이가 없는지 확인해야한다. 예를 들어, '우리 서비스의 일평균 체류시간은 10분'이라는 사실에 대해 작성할 때, 기존에 발행되었던 리포트에서의 수치와 차이가 많이 나는지 확인한다. 몇몇 과거 보고서에서 일평균 체류시간이 17분~20분이라고 한다면, 일평균 체류시간 10분은 잘못된 수치일 가능성이 높다. 물론, 실제로 일평균 체류시간이 10분으로 급감한 것일 수도 있기 때문에 이러한 상황에 닥쳤을 때는 더블체킹하며 리포트를 작성해야한다.

판교테크노벨리의 밤

 

 

4. 아쉬웠던 점

늘 그렇듯이, 좋았던 점과 더불어 아쉬운 점도 항상 따르는 법이다. 태블로를 활용한 시각화 업무를 못 해본 것이 아쉬웠다. 앰플리튜드가 대부분의 시각화를 해주고 앰플리튜드로 대시보드를 만들 수 있기 때문에 시각화 툴의 필요성을 크게 느끼진 못했다. 하지만 DB와 태블로를 연동해 태블로로 대시보드를 만드는 과정을 직접 경험해보고 싶었다. 이전에 태블로 공부를 꾸준히 했었어서, 공부한 내용을 다시 리마인드 할 겸 실무에서 활용해보고 싶기도 했다. 내가 일했을 당시, 거의 끝무렵에 태블로와 DB를 연동하는 작업이 진행되었어서 내가 퇴사할 때까지 태블로를 다룰 수 있는 환경이 완전히 구축되지 못해 툴을 사용해보지는 못했다.
 
또한, 분석 내용이 실제로 이행되지 못한 점이 아쉬웠다. 프로덕트 데이터 분석가로 이직을 하면서 기대했던 부분 중 하나가 '실험'이었다. 하지만 아무래도 인턴이라는 제한적인 포지션에 있기도 했고 다른 우선 순위가 높은 것들이 먼저 실행되다 보니, 내가 분석한 내용/제안한 내용이 실제로 반영되는 경우는 없었다. 인턴으로서는 분석과 실행이 빠른 소규모 스타트업에서 일을 하거나, 정규직 포지션으로 데이터 분석 일을 한다면 좀 더 실행할 수 있는 기회가 많지 않을까 싶다.
 
 
 

글을 마치며

6개월 동안 네이버제트에서 인턴을 하며 다양한 측면에서 데이터 분석가로서의 역량을 기를 수 있었다. 이전에 데이터 분석 컨설턴트로서의 경험도 있다 보니 어떤 점이 다른지 비교하면서 업무를 할 수 있었고, 어떤 점이 부족한지 스스로 돌아보는 시간도 가질 수 있었다. 또한, 두 개의 회사를 거치며 앞으로 회사를 선택할 때 필요한 나만의 기준도 정립할 수 있었다. 네이버제트는 대부분 재택으로 업무가 이루어지기 때문에, 비대면 환경에서 효과적으로 커뮤니케이션하는 법과 나의 의사를 분명하게 전달하는 법 등 업무적인 측면도 많이 배울 수 있었다. 더불어, 회사의 관점에서 분석 결과를 어떻게 활용할 수 있을지, 그리고 서비스에 어떻게 적용시킬 수 있을지 고민해봤던 값진 경험이었다.6개월이 지난 지금 다음 커리어를 고민하고 있는 단계이지만, 어떤 일을 하든 지금까지의 경험이 훗날 나를 성장시키는 발판이 되길 바라며 글을 마친다.

내 제페토 캐릭터