데이터리안 SQL 데이터 분석 캠프 실전반 2기 2주차 수업에서는 AARRR과 코호트 분석에 대해 공부했다.
AARRR이란?
먼저, AARRR 프레임워크는 Dave McClure 라는 벤처투자자가 만든 분석 프레임워크이다. 기업이 제품 마케팅을 개선하고 제품 관리를 간소화하기 위해 고객 라이프사이클 내에서 추적할 수 있는 일련의 사용자 행동을 나타낸 것이다. 빠르고 지속 가능한 방식으로 비즈니스를 성장시킬 수 있도록 개발된 5가지 주요 지표(Acquisition, Activation, Retention, Revenue, Referral)를 나타내는 약어이다.
AARRR별로 다음과 같이 정리할 수 있다.
AARRR | 내용 | 지표 | 예시 |
Acquisition(사용자 획득) | 사용자는 우리 서비스를 어떻게 접하게 되었을까? | 웹사이트 방문, 모바일 앱 다운로드, 회원가입, CPA, CAC 등 | 페이스북 광고 소재 중 가장 사람들이 좋아하는 광고는 뭘까? |
Activation(사용자 활성화) | 사용자가 서비스를 이용시 긍정적인 경험을 했을까? | 콘텐츠 조회, 상품 상세 페이지 조회, 장바구니에 담기, MAU, DAU, PV 등 | 가입을 시도 한 사람 중에 공인인증서를 등록하고 가입 절차를 모두 마친 사람은 30% 이다. |
Revenue(매출) | 어떻게 돈을 버는가? | 매출, 구매 전환율, PU(Paying User) Rate, ARPU, ARPPU등 | 저번 달 고객 인당 결제 금액 (ARPU)은 1,000원이었고 이번 달은 1,100원이다. |
Retention (사용자 유지) |
사용자가 우리 서비스를 계속 이용하는가? | 재결제, 재구매, 재접속 등 | 지난 달 가입한 고객 중 이번 달에도 서비스에 방문한 고객은 5%이다. |
Referral(추천) | 사용자가 자발적으로 서비스를 공유하고 추천하는가? | 친구 초대, 공유, 후기 등 | 우리 서비스의 바이럴 계수는 1.1이다. |
** ARPU : Average Revenue Per User
** ARPPU : Average Revenue Per Paying User
AARRR 다섯 단계 중에서 가장 먼저 개선해야되는 부분은 Retention이다. 단순 가입과 트래픽은 비용을 많이 들이면 증가시킬 수 있지만, 서비스가 만족스럽지 못하다면 금방 이탈할 것이다. 이렇게 되면 오히려 서비스를 모르는 것보다 안좋을 수 있다. 왜냐하면 서비스가 안좋게 알려졌다고 볼 수 있기 때문이다.
따라서, 무턱대고 유입을 늘리기 전에, 리텐션 지표를 먼저 개선하는 것이 중요하다. 그래서 가장 먼저 개선해야할 지표들 순서대로 RARRA(Retention, Activation, Referral, Revenue, Acquisition)이라고 부르기도 한다.
코호트 분석이란?
고객을 전체 고객으로 보지 않고 사용자를 그룹(코호트)으로 나누어서 보는 것, 일반적으로 가입 시기 별로 나누어서 보는 것을 말한다. 이렇게 말하면 이해가 안가니 예시를 통해 살펴보자.
1월 | 2월 | 3월 | 4월 | 5월 | |
전체 고객 | 1,000 | 2,000 | 3,000 | 4,000 | 5,000 |
고객 당 평균 구매액 | $5.00 | $4.5 | $4.3 | $4.25 | $4.50 |
출처 : 린 분석 p.60
위 표를 보면 1월에서 5월까지 전체 고객이 증가하고 있고, 고객 당 평균 구매액도 4월까지 줄어들었다가 점차 회복되고 있는 것을 확인할 수 있다. 그렇다면 이 기업은 잘 하고 있는 걸까..? 아니면 3월 달에 잠깐 주춤했으니까 못하고 있는 걸까?
전체 고객 안에는 신규 고객과 기존 고객이 섞여 있기 때문에 상황이 어떻게 변하고 있는지 구체적으로 알기 어렵다. 따라서, 고객들을 가입 시기별로 나누어 데이터를 다시 보자.
코호트 | 고객 수 | 1개월 후 | 2개월 후 | 3개월 후 | 4개월 후 | 5개월 후 |
1월 가입 고객 | 1,000명 | $5 | $3 | $2 | $1 | $0.5 |
2월 가입 고객 | 1,000명 | $6 | $4 | $2 | $1 | |
3월 가입 고객 | 1,000명 | $7 | $6 | $5 | ||
4월 가입 고객 | 1,000명 | $8 | $7 | |||
5월 가입 고객 | 1,000명 | $9 |
출처 : 린 분석 p.60
위 표를 보고 어떤 걸 알 수 있을까? 수업에서는 위 표를 보고 해석하는 시간을 가졌다.
내 주관적인 해석을 적어보자면,
1월에서 5월로 갈수록 신규 고객 당 평균 구매액은 증가했다.
그러나 1월에서 5월로 갈수록 기존 고객의 평균 구매액은 감소하고 있다.
따라서, 이 서비스는 신규 고객을 잘 유치하고 처음에 돈을 많이 쓰게끔 유도하고 있지만,
기존 고객들이 지속해서 돈을 쓰도록 유지시키는 것은 잘 못하고 있는 것 같다.
이렇게 동질 집단별로 사용자를 나누어 분석하는 것을 Cohort 분석이라고 하고, 이를 리텐션 분석에 응용한 것이 리텐션 분석이다. 코호트 분석은 리텐션 분석 뿐만 아니라 퍼널 분석, 매출 분석, 이탈 분석 등 어떤 지표에든 적용할 수 있다.
표 안에 있는 숫자는 절대적인 숫자(유저 수, 매출액 등), 비율(잔존율 등) 혹은 절대적인 숫자와 비율을 섞어서 나타낼 수 있다.
그런데, 이러한 일반적인 코호트 분석(리텐션 분석)에는 한계점이 있다. 이에 따라 '롤링 리텐션'이라는 개념이 등장했다.
롤링 리텐션이란?
만약 사용자가 Day 0에 방문을 하고 Day 1에는 방문을 하지 않았다가 Day2에 방문을 했다면, 일반적인 리텐션 분석에서는 이 사용자를 이탈했다고 간주한다. 하지만 롤링 리텐션은 이러한 점을 보완하기 위해 '사용자가 이탈하지 않고 남아있는가?'에 초점을 맞춘다. 따라서, 사용자의 마지막 방문 이전에는 방문하지 않았더라도 방문으로 간주한다. 롤링 리텐션은 계산일(오늘)에 따라 달라지므로 확인할 때마다 달라진다는 특징이 있다.
사용자 | Day 0 | Day 1 | Day 2 | Day 3 | Day 4 | Day 5 |
A | 방문 | (방문으로 간주) | 방문 | 방문 | (방문으로 간주) | 방문 |
B | 방문 | 방문 | (방문으로 간주) | 방문 | 방문 | |
C | 방문 | |||||
D | 방문 | 방문 | (방문으로 간주) | 방문 | ||
E | 방문 | (방문으로 간주) | 방문 |
Day 0 | Day 1 | Day 2 | Day 3 | Day 4 | Day 5 | |
이탈하지 않은 유저 수 | 5 | 3 | 3 | 3 | 2 | 1 |
롤링 리텐션 % | 100% | 60% | 60% | 60% | 40% | 20% |
배운 점
사실, AARRR과 코호트 분석의 개념은 이미 알고 있었기에 엄청 새롭지는 않았지만 다시 한 복습할 수 있었고, 확실히 아는 내용을 다시 들으니까 더 이해가 잘 되고 내 것으로 만들 수 있었던 것 같다.
롤링 리텐션 같은 경우는 처음 공부해봐서 신박했다. DAU가 높지 않고 굳이 매일 매일 사용하지 않는 서비스에 롤링 리텐션 분석을 활용하면 더욱 효과적일 것 같다. 예를 들어, 내가 에어비엔비를 사용하는데 3월 26일에 부산 여행갈 때 사용하고, 6월 3일날 제주도 여행갈 때 사용했다면, 3월 26일 다음 날에 에어비엔비 앱에 접속하지 않았다고 이탈한 것은 아니다. 이처럼 서비스의 활용 빈도가 그렇게 높지 않다면 롤링 리텐션이 아주 유용할 것 같다.
본 내용은 데이터리안 'SQL 데이터 분석 캠프 실전반' 을 수강하며 작성한 내용입니다.
'SQL > SQL 데이터 분석 캠프' 카테고리의 다른 글
3주차 - 퍼널 분석(Funnel Analysis) (0) | 2022.03.27 |
---|---|
2주차 - SQL로 코호트 분석 해보기(MySQL) (7) | 2022.03.27 |
1주차 - SQL로 피봇테이블 만들기, 다중컬럼 서브쿼리, 조인 (0) | 2022.03.26 |