제 5 강 - 정량적 데이터 분석
사전 질문
- 정량적 데이터에서 고객의 행동을 이해하기 위해서는 어떤 점들을 중요하게 분석해야 할까요?
- 반복적으로 일어나는 행동의 수치를 분석
- 어떠한 코호트에서 많은 행동이 일어나는지 분석
- 자주 사용하게 되는 제품과 그렇지 않은 제품은 어떤 차이가 있을까요? 실제 자신의 경험을 통해 생각해 봅니다.
- 주방용 가위가 두개 있는데 거의 하나만 사용하고 있음. 둘다 잘 드는 가위인데 손잡이의 모양의 차이
- 나에게 좀 더 핏한 것(편안함)을 더 선호하는 것 같음.
정량적 데이터 분석 방법
1. 기술 통계 분석 (Descriptive Statistics)
- 평균, 중앙값, 최빈값: 데이터의 중심 경향 파악
- 표준편차, 분산: 데이터의 분산 정도 측정
- 빈도 분석: 특정 행동이나 이벤트의 발생 빈도 확인
- 활용: 사용자의 평균 세션 시간, 방문 빈도, 전환율 등의 기본 지표 파악
2. 코호트 분석 (Cohort Analysis)
- 정의: 특정 기간에 공통된 특성을 가진 사용자 그룹의 행동 추적
- 분석 방법:
- 시간 기반 코호트: 가입 시기별 사용자 그룹화
- 행동 기반 코호트: 특정 액션을 수행한 사용자 그룹화
- 활용: 리텐션율, 이탈률, 생애 가치(LTV) 분석
3. 퍼널 분석 (Funnel Analysis)
- 정의: 사용자가 목표 달성까지 거치는 단계별 전환율 분석
- 주요 지표:
- 단계별 전환율 (Conversion Rate)
- 이탈률 (Drop-off Rate)
- 병목 지점 (Bottleneck) 파악
- 활용: 회원가입, 구매, 온보딩 프로세스 최적화
4. RFM 분석 (Recency, Frequency, Monetary)
- Recency: 최근 구매/방문 시점
- Frequency: 구매/방문 빈도
- Monetary: 구매 금액/가치
- 활용: 고객 세그먼트 분류 및 타겟 마케팅 전략 수립
5. A/B 테스트 및 다변량 테스트
- A/B 테스트: 두 가지 버전을 비교하여 우수한 버전 선택
- 다변량 테스트: 여러 요소를 동시에 테스트
- 통계적 유의성: p-value, 신뢰구간 등으로 결과 검증
- 활용: UI/UX 개선, 기능 추가, 메시지 최적화
6. 회귀 분석 (Regression Analysis)
- 선형 회귀: 변수 간 선형 관계 분석
- 로지스틱 회귀: 이진 결과 예측 (이탈 여부, 구매 여부 등)
- 활용: 사용자 행동 예측 모델 구축
7. 세그멘테이션 분석
- K-means 클러스터링: 유사한 특성을 가진 사용자 그룹화
- 의사결정 트리: 사용자 분류 규칙 도출
- 활용: 개인화된 경험 제공, 타겟 마케팅
8. 상관 관계 분석 (Correlation Analysis)
- 피어슨 상관계수: 선형 관계 측정
- 스피어만 상관계수: 순위 기반 관계 측정
- 활용: 특정 행동과 리텐션의 관계, 기능 사용과 만족도의 관계 파악
9. 시계열 분석 (Time Series Analysis)
- 트렌드 분석: 장기적인 변화 패턴 파악
- 계절성 분석: 주기적인 패턴 식별
- 활용: 사용자 행동의 시간대별, 요일별 패턴 분석
10. 생존 분석 (Survival Analysis)
- 카플란-마이어 곡선: 시간에 따른 생존률(리텐션) 분석
- Cox 비례 위험 모델: 이탈에 영향을 미치는 요인 분석
- 활용: 사용자 이탈 예측 및 리텐션 전략 수립
11. 핵심가치 경험(Aha Moment) 분석
- 정의: 사용자가 제품의 핵심 가치를 체험하는 결정적 순간 파악
- 분석 방법:
- 리텐션 기반 역분석: 장기 사용자들의 초기 행동 패턴 분석
- 7일/30일 리텐션이 높은 사용자 그룹 식별
- 해당 그룹의 첫 3-7일간 공통 행동 추출
- 이벤트 상관관계 분석: 특정 행동과 리텐션의 상관관계 측정
- 예: “7일 내 친구 10명 추가” vs 리텐션율
- 임계값 분석: 리텐션을 급격히 높이는 행동의 최소 기준 탐색
- 예: Facebook - “10일 내 7명의 친구 추가”
- 예: Twitter - “30명 팔로우”
- 예: Dropbox - “1개 이상의 파일을 1개 디바이스에 저장”
- 리텐션 기반 역분석: 장기 사용자들의 초기 행동 패턴 분석
- 주요 지표:
- 도달률(Activation Rate): 핵심가치 경험에 도달한 사용자 비율
- 도달 소요 시간(Time to Aha): 가입 후 핵심가치 경험까지 걸린 시간
- 리텐션 차이: 핵심가치 경험 그룹 vs 미경험 그룹의 리텐션 격차
- 분석 프로세스:
- 장기 활성 사용자(예: 8주 이상 사용) 정의
- 해당 사용자들의 초기 행동 패턴 분석
- 단기 이탈 사용자와 행동 차이 비교
- 통계적으로 유의미한 행동 식별
- A/B 테스트로 인과관계 검증
- 활용: 온보딩 프로세스 최적화, 리텐션 개선, 제품 핵심 기능 강화
12. 행동 흐름 분석 (User Flow Analysis)
- 정의: 사용자가 제품 내에서 이동하는 경로와 순서 분석
- 분석 방법:
- 산케이 다이어그램(Sankey Diagram)으로 이동 경로 시각화
- 세션별 행동 시퀀스 패턴 마이닝
- 핵심가치 경험 도달 경로 vs 이탈 경로 비교
- 활용: 핵심가치 경험으로 가는 최적 경로 설계, 마찰 지점 제거
Hook 모델 (Hook Model)
개요
Hook 모델은 니르 이얄(Nir Eyal)이 저서 『Hooked: 훅, 사용자의 마음을 사로잡는 제품의 비밀』에서 제시한 프레임워크로, 사용자가 제품을 습관적으로 반복 사용하게 만드는 4단계 순환 구조를 설명합니다.
Hook 모델의 4단계
1. 트리거 (Trigger) - 행동의 시작점
사용자의 행동을 촉발하는 신호
외부 트리거 (External Trigger)
- 유형: 푸시 알림, 이메일, SMS, 광고, 앱 아이콘, 타인의 권유
- 예시:
- Instagram: “친구가 게시물에 좋아요를 눌렀습니다” 알림
- LinkedIn: “프로필 조회수가 증가했습니다” 이메일
- YouTube: “구독 채널이 새 영상을 올렸습니다” 푸시
내부 트리거 (Internal Trigger)
- 유형: 감정, 상황, 생각 (지루함, 외로움, 불안, 호기심 등)
- 목표: 사용자가 특정 감정이나 상황에서 자동으로 제품을 떠올리게 만듦
- 예시:
- 지루할 때 → Instagram 스크롤
- 궁금할 때 → Google 검색
- 외로울 때 → Facebook 접속
트리거 진화 과정: 외부 트리거로 시작 → 반복 사용 → 내부 트리거로 내재화
2. 액션 (Action) - 보상을 기대하며 하는 행동
트리거에 반응하여 사용자가 취하는 가장 간단한 행동
Fogg의 행동 모델 (B = MAT)
- B (Behavior): 행동
- M (Motivation): 동기 (보상에 대한 기대)
- A (Ability): 능력 (행동의 용이성)
- T (Trigger): 트리거
행동 발생 조건: 충분한 동기 + 수행하기 쉬운 행동 + 적절한 트리거
행동의 용이성을 높이는 6가지 요소:
- 시간 (Time): 얼마나 빨리 완료할 수 있는가
- 돈 (Money): 비용이 얼마나 드는가
- 물리적 노력 (Physical Effort): 신체적으로 얼마나 힘든가
- 두뇌 활동 (Brain Cycles): 정신적으로 얼마나 복잡한가
- 사회적 일탈 (Social Deviance): 사회적으로 수용 가능한가
- 비일상성 (Non-Routine): 기존 습관과 얼마나 다른가
예시:
- Google 검색: 검색창 클릭 → 키워드 입력 (1초)
- Instagram: 앱 아이콘 터치 → 피드 자동 로딩 (즉시)
- Twitter: 아래로 스와이프 → 새로고침 (즉시)
3. 보상 (Variable Reward) - 예측 불가능한 보상
사용자의 갈망을 해소하되, 다음 방문에 대한 기대감을 높이는 가변적 보상
가변적 보상의 3가지 유형:
사냥의 보상 (Rewards of the Hunt) - 물질적/정보적 자원
- 정의: 유용한 정보나 자원을 찾는 보상
- 예시:
- Google: 검색할 때마다 다른 결과
- Pinterest: 스크롤할 때마다 새로운 이미지 발견
- Twitter 피드: 매번 다른 트렌딩 뉴스
부족의 보상 (Rewards of the Tribe) - 사회적 연결
- 정의: 타인으로부터 받는 인정, 수용, 소속감
- 예시:
- Facebook 좋아요/댓글 (받을지 안 받을지 불확실)
- LinkedIn 프로필 조회, 연결 요청
- Stack Overflow 평판 점수, 배지
자아의 보상 (Rewards of the Self) - 성취감과 역량 강화
- 정의: 숙련도 향상, 완료감, 일관성 유지의 만족감
- 예시:
- Duolingo: 연속 학습일 스트릭, 레벨업
- GitHub: Contribution 그래프 채우기
- 게임: 레벨업, 업적 달성
핵심 원리:
- 보상이 예측 가능하면 지루해짐 → 습관 형성 실패
- 보상이 가변적이면 도파민 분비 → 다음 보상을 기대하며 재방문
주의사항: 보상이 사용자의 자율성을 침해하거나 기대에 못 미치면 역효과
4. 투자 (Investment) - 다음 사이클을 강화하는 투자
사용자가 제품에 시간, 노력, 데이터, 돈을 투입하여 다음 사용을 더욱 용이하게 만드는 단계
투자의 특징:
- 즉각적 보상이 아님: 미래의 보상을 기대하며 투자
- 다음 트리거 장전: 투자가 다음 외부 트리거를 발생시킴
- 저장된 가치 증가: 사용할수록 제품의 가치가 높아짐
투자의 5가지 유형:
- 콘텐츠 투자
- 예: Twitter 팔로워, Instagram 사진, Spotify 플레이리스트
- 효과: 콘텐츠가 많을수록 떠나기 어려움
- 데이터 투자
- 예: Netflix 시청 기록 → 맞춤 추천, Spotify 재생 기록 → 개인화
- 효과: 데이터가 쌓일수록 서비스 품질 향상
- 팔로워/네트워크 투자
- 예: LinkedIn 연결, Facebook 친구
- 효과: 네트워크 효과로 이탈 비용 증가
- 평판 투자
- 예: Airbnb 호스트 평점, Uber 드라이버 별점
- 효과: 쌓아온 평판을 잃고 싶지 않음
- 학습 투자
- 예: Photoshop 숙련도, Excel 매크로 작성 능력
- 효과: 학습 곡선을 다시 거치고 싶지 않음
투자가 다음 트리거를 장전하는 방식:
- Twitter 팔로우 → 팔로워의 트윗 알림 (다음 트리거)
- Instagram 친구 태그 → 친구의 게시물 알림
- Pinterest 보드 저장 → 유사 콘텐츠 추천
Hook 모델 순환 구조
트리거 → 액션 → 보상 → 투자 → (새로운 트리거) → ...
습관 형성 과정:
- 초기: 외부 트리거에 의존
- 반복: 보상을 경험하며 사이클 반복
- 습관화: 내부 트리거로 자동화
- 중독: 특정 감정/상황 = 제품 사용
성공적인 Hook의 조건
- 빈도: 사용 주기가 짧을수록 습관 형성 용이
- 고빈도 (일 1회 이상): SNS, 메신저
- 저빈도 (주 1회 미만): 부동산 앱, 여행 예약
인지된 유용성: 사용자가 실제 가치를 느껴야 함
보상의 가변성: 예측 불가능하면서도 만족스러운 보상
- 투자의 용이성: 투자가 너무 어렵거나 부담스러우면 이탈
Hook 모델 분석 방법
제품을 분석할 때 질문해야 할 것들:
트리거
- 어떤 외부 트리거가 사용자를 제품으로 끌어들이는가?
- 어떤 내부 트리거(감정)와 연결되어 있는가?
액션
- 사용자가 취하는 가장 간단한 행동은 무엇인가?
- 이 행동이 충분히 쉬운가?
보상
- 어떤 종류의 보상을 제공하는가? (사냥/부족/자아)
- 보상이 가변적인가, 예측 가능한가?
투자
- 사용자가 무엇을 투자하는가? (시간/데이터/콘텐츠/돈)
- 이 투자가 다음 트리거를 어떻게 장전하는가?
- 사용할수록 제품의 가치가 증가하는가?
과제
연구과제
- 남들은 잘 모르지만 나는 습관적으로 쓰는 앱을 Hook 모델 4단계로 분석한 뒤, “왜 이 Hook이 나에게 동작하는가?”를 설명해 보십시오. 설명이 막히는 지점을 발견하고 이유를 생각해 봅니다.
- 실제로 설치했다가 삭제한 앱의 이탈 이유를 먼저 적어본 뒤에, 오늘 배운 “이탈 유저 특징” 프레임으로 다시 분석해 봅니다. 두 답이 다르다면 그 이유는 무엇일까요?
- 자신이 오래 사용한 제품을 선택해 핵심 가치를 정의하고, 이를 검증할 행동 지표를 설계해 봅니다. 설계 중 막히는 순간을 관찰하고 어떤 단계를 건너뛰게 되는지 확인해 봅니다.
실전 과제
- 관심있는 앱의 앱스토어에서 별점이 낮은 리뷰를 수집합니다.
- 각 리뷰를 오늘 배운 “이탈 유저 특징”으로 분류합니다. (즉각적 이탈 / 점진적 이탈 / 기대와 다른 행동 등)
- 분류 결과를 보고, 이 앱의 Hook 모델에서 어느 단계가 가장 약한지 판단하십시오. 그 근거는 무엇인가요?
- PM이라면 어떤 행동 지표를 모니터링해야 이 문제를 발견할 수 있었을지 제안합니다.