제 5 강 - 정량적 데이터 분석

사전 질문

정량적 데이터에서 고객의 행동을 이해하기 위해서는 어떤 점들을 중요하게 분석해야 할까요?
- 반복적으로 일어나는 행동의 수치를 분석
- 어떠한 코호트에서 많은 행동이 일어나는지 분석
자주 사용하게 되는 제품과 그렇지 않은 제품은 어떤 차이가 있을까요? 실제 자신의 경험을 통해 생각해 봅니다.
- 주방용 가위가 두개 있는데 거의 하나만 사용하고 있음. 둘다 잘 드는 가위인데 손잡이의 모양의 차이
- 나에게 좀 더 핏한 것(편안함)을 더 선호하는 것 같음.

정량적 데이터 분석 방법

1. 기술 통계 분석 (Descriptive Statistics)

평균, 중앙값, 최빈값: 데이터의 중심 경향 파악
표준편차, 분산: 데이터의 분산 정도 측정
빈도 분석: 특정 행동이나 이벤트의 발생 빈도 확인
활용: 사용자의 평균 세션 시간, 방문 빈도, 전환율 등의 기본 지표 파악

2. 코호트 분석 (Cohort Analysis)

정의: 특정 기간에 공통된 특성을 가진 사용자 그룹의 행동 추적
분석 방법:
- 시간 기반 코호트: 가입 시기별 사용자 그룹화
- 행동 기반 코호트: 특정 액션을 수행한 사용자 그룹화
활용: 리텐션율, 이탈률, 생애 가치(LTV) 분석

3. 퍼널 분석 (Funnel Analysis)

정의: 사용자가 목표 달성까지 거치는 단계별 전환율 분석
주요 지표:
- 단계별 전환율 (Conversion Rate)
- 이탈률 (Drop-off Rate)
- 병목 지점 (Bottleneck) 파악
활용: 회원가입, 구매, 온보딩 프로세스 최적화

4. RFM 분석 (Recency, Frequency, Monetary)

Recency: 최근 구매/방문 시점
Frequency: 구매/방문 빈도
Monetary: 구매 금액/가치
활용: 고객 세그먼트 분류 및 타겟 마케팅 전략 수립

5. A/B 테스트 및 다변량 테스트

A/B 테스트: 두 가지 버전을 비교하여 우수한 버전 선택
다변량 테스트: 여러 요소를 동시에 테스트
통계적 유의성: p-value, 신뢰구간 등으로 결과 검증
활용: UI/UX 개선, 기능 추가, 메시지 최적화

6. 회귀 분석 (Regression Analysis)

선형 회귀: 변수 간 선형 관계 분석
로지스틱 회귀: 이진 결과 예측 (이탈 여부, 구매 여부 등)
활용: 사용자 행동 예측 모델 구축

7. 세그멘테이션 분석

K-means 클러스터링: 유사한 특성을 가진 사용자 그룹화
의사결정 트리: 사용자 분류 규칙 도출
활용: 개인화된 경험 제공, 타겟 마케팅

8. 상관 관계 분석 (Correlation Analysis)

피어슨 상관계수: 선형 관계 측정
스피어만 상관계수: 순위 기반 관계 측정
활용: 특정 행동과 리텐션의 관계, 기능 사용과 만족도의 관계 파악

9. 시계열 분석 (Time Series Analysis)

트렌드 분석: 장기적인 변화 패턴 파악
계절성 분석: 주기적인 패턴 식별
활용: 사용자 행동의 시간대별, 요일별 패턴 분석

10. 생존 분석 (Survival Analysis)

카플란-마이어 곡선: 시간에 따른 생존률(리텐션) 분석
Cox 비례 위험 모델: 이탈에 영향을 미치는 요인 분석
활용: 사용자 이탈 예측 및 리텐션 전략 수립

11. 핵심가치 경험(Aha Moment) 분석

정의: 사용자가 제품의 핵심 가치를 체험하는 결정적 순간 파악
분석 방법:
- 리텐션 기반 역분석: 장기 사용자들의 초기 행동 패턴 분석
  - 7일/30일 리텐션이 높은 사용자 그룹 식별
  - 해당 그룹의 첫 3-7일간 공통 행동 추출
- 이벤트 상관관계 분석: 특정 행동과 리텐션의 상관관계 측정
  - 예: “7일 내 친구 10명 추가” vs 리텐션율
- 임계값 분석: 리텐션을 급격히 높이는 행동의 최소 기준 탐색
  - 예: Facebook - “10일 내 7명의 친구 추가”
  - 예: Twitter - “30명 팔로우”
  - 예: Dropbox - “1개 이상의 파일을 1개 디바이스에 저장”
주요 지표:
- 도달률(Activation Rate): 핵심가치 경험에 도달한 사용자 비율
- 도달 소요 시간(Time to Aha): 가입 후 핵심가치 경험까지 걸린 시간
- 리텐션 차이: 핵심가치 경험 그룹 vs 미경험 그룹의 리텐션 격차
분석 프로세스:
1. 장기 활성 사용자(예: 8주 이상 사용) 정의
2. 해당 사용자들의 초기 행동 패턴 분석
3. 단기 이탈 사용자와 행동 차이 비교
4. 통계적으로 유의미한 행동 식별
5. A/B 테스트로 인과관계 검증
활용: 온보딩 프로세스 최적화, 리텐션 개선, 제품 핵심 기능 강화

12. 행동 흐름 분석 (User Flow Analysis)

정의: 사용자가 제품 내에서 이동하는 경로와 순서 분석
분석 방법:
- 산케이 다이어그램(Sankey Diagram)으로 이동 경로 시각화
- 세션별 행동 시퀀스 패턴 마이닝
- 핵심가치 경험 도달 경로 vs 이탈 경로 비교
활용: 핵심가치 경험으로 가는 최적 경로 설계, 마찰 지점 제거

Hook 모델 (Hook Model)

개요

Hook 모델은 니르 이얄(Nir Eyal)이 저서 『Hooked: 훅, 사용자의 마음을 사로잡는 제품의 비밀』에서 제시한 프레임워크로, 사용자가 제품을 습관적으로 반복 사용하게 만드는 4단계 순환 구조를 설명합니다.

Hook 모델의 4단계

1. 트리거 (Trigger) - 행동의 시작점

사용자의 행동을 촉발하는 신호

외부 트리거 (External Trigger)

유형: 푸시 알림, 이메일, SMS, 광고, 앱 아이콘, 타인의 권유
예시:
- Instagram: “친구가 게시물에 좋아요를 눌렀습니다” 알림
- LinkedIn: “프로필 조회수가 증가했습니다” 이메일
- YouTube: “구독 채널이 새 영상을 올렸습니다” 푸시

내부 트리거 (Internal Trigger)

유형: 감정, 상황, 생각 (지루함, 외로움, 불안, 호기심 등)
목표: 사용자가 특정 감정이나 상황에서 자동으로 제품을 떠올리게 만듦
예시:
- 지루할 때 → Instagram 스크롤
- 궁금할 때 → Google 검색
- 외로울 때 → Facebook 접속

트리거 진화 과정: 외부 트리거로 시작 → 반복 사용 → 내부 트리거로 내재화

2. 액션 (Action) - 보상을 기대하며 하는 행동

트리거에 반응하여 사용자가 취하는 가장 간단한 행동

Fogg의 행동 모델 (B = MAT)

B (Behavior): 행동
M (Motivation): 동기 (보상에 대한 기대)
A (Ability): 능력 (행동의 용이성)
T (Trigger): 트리거

행동 발생 조건: 충분한 동기 + 수행하기 쉬운 행동 + 적절한 트리거

행동의 용이성을 높이는 6가지 요소:

시간 (Time): 얼마나 빨리 완료할 수 있는가
돈 (Money): 비용이 얼마나 드는가
물리적 노력 (Physical Effort): 신체적으로 얼마나 힘든가
두뇌 활동 (Brain Cycles): 정신적으로 얼마나 복잡한가
사회적 일탈 (Social Deviance): 사회적으로 수용 가능한가
비일상성 (Non-Routine): 기존 습관과 얼마나 다른가

예시:

Google 검색: 검색창 클릭 → 키워드 입력 (1초)
Instagram: 앱 아이콘 터치 → 피드 자동 로딩 (즉시)
Twitter: 아래로 스와이프 → 새로고침 (즉시)

3. 보상 (Variable Reward) - 예측 불가능한 보상

사용자의 갈망을 해소하되, 다음 방문에 대한 기대감을 높이는 가변적 보상

가변적 보상의 3가지 유형:

사냥의 보상 (Rewards of the Hunt) - 물질적/정보적 자원

정의: 유용한 정보나 자원을 찾는 보상
예시:
- Google: 검색할 때마다 다른 결과
- Pinterest: 스크롤할 때마다 새로운 이미지 발견
- Twitter 피드: 매번 다른 트렌딩 뉴스

부족의 보상 (Rewards of the Tribe) - 사회적 연결

정의: 타인으로부터 받는 인정, 수용, 소속감
예시:
- Facebook 좋아요/댓글 (받을지 안 받을지 불확실)
- LinkedIn 프로필 조회, 연결 요청
- Stack Overflow 평판 점수, 배지

자아의 보상 (Rewards of the Self) - 성취감과 역량 강화

정의: 숙련도 향상, 완료감, 일관성 유지의 만족감
예시:
- Duolingo: 연속 학습일 스트릭, 레벨업
- GitHub: Contribution 그래프 채우기
- 게임: 레벨업, 업적 달성

핵심 원리:

보상이 예측 가능하면 지루해짐 → 습관 형성 실패
보상이 가변적이면 도파민 분비 → 다음 보상을 기대하며 재방문

주의사항: 보상이 사용자의 자율성을 침해하거나 기대에 못 미치면 역효과

4. 투자 (Investment) - 다음 사이클을 강화하는 투자

사용자가 제품에 시간, 노력, 데이터, 돈을 투입하여 다음 사용을 더욱 용이하게 만드는 단계

투자의 특징:

즉각적 보상이 아님: 미래의 보상을 기대하며 투자
다음 트리거 장전: 투자가 다음 외부 트리거를 발생시킴
저장된 가치 증가: 사용할수록 제품의 가치가 높아짐

투자의 5가지 유형:

콘텐츠 투자
- 예: Twitter 팔로워, Instagram 사진, Spotify 플레이리스트
- 효과: 콘텐츠가 많을수록 떠나기 어려움
데이터 투자
- 예: Netflix 시청 기록 → 맞춤 추천, Spotify 재생 기록 → 개인화
- 효과: 데이터가 쌓일수록 서비스 품질 향상
팔로워/네트워크 투자
- 예: LinkedIn 연결, Facebook 친구
- 효과: 네트워크 효과로 이탈 비용 증가
평판 투자
- 예: Airbnb 호스트 평점, Uber 드라이버 별점
- 효과: 쌓아온 평판을 잃고 싶지 않음
학습 투자
- 예: Photoshop 숙련도, Excel 매크로 작성 능력
- 효과: 학습 곡선을 다시 거치고 싶지 않음

투자가 다음 트리거를 장전하는 방식:

Twitter 팔로우 → 팔로워의 트윗 알림 (다음 트리거)
Instagram 친구 태그 → 친구의 게시물 알림
Pinterest 보드 저장 → 유사 콘텐츠 추천

Hook 모델 순환 구조

트리거 → 액션 → 보상 → 투자 → (새로운 트리거) → ...

습관 형성 과정:

초기: 외부 트리거에 의존
반복: 보상을 경험하며 사이클 반복
습관화: 내부 트리거로 자동화
중독: 특정 감정/상황 = 제품 사용

성공적인 Hook의 조건

빈도: 사용 주기가 짧을수록 습관 형성 용이
- 고빈도 (일 1회 이상): SNS, 메신저
- 저빈도 (주 1회 미만): 부동산 앱, 여행 예약
인지된 유용성: 사용자가 실제 가치를 느껴야 함
보상의 가변성: 예측 불가능하면서도 만족스러운 보상
투자의 용이성: 투자가 너무 어렵거나 부담스러우면 이탈

Hook 모델 분석 방법

제품을 분석할 때 질문해야 할 것들:

트리거

어떤 외부 트리거가 사용자를 제품으로 끌어들이는가?
어떤 내부 트리거(감정)와 연결되어 있는가?

액션

사용자가 취하는 가장 간단한 행동은 무엇인가?
이 행동이 충분히 쉬운가?

보상

어떤 종류의 보상을 제공하는가? (사냥/부족/자아)
보상이 가변적인가, 예측 가능한가?

투자

사용자가 무엇을 투자하는가? (시간/데이터/콘텐츠/돈)
이 투자가 다음 트리거를 어떻게 장전하는가?
사용할수록 제품의 가치가 증가하는가?

과제

연구과제

남들은 잘 모르지만 나는 습관적으로 쓰는 앱을 Hook 모델 4단계로 분석한 뒤, “왜 이 Hook이 나에게 동작하는가?”를 설명해 보십시오. 설명이 막히는 지점을 발견하고 이유를 생각해 봅니다.
실제로 설치했다가 삭제한 앱의 이탈 이유를 먼저 적어본 뒤에, 오늘 배운 “이탈 유저 특징” 프레임으로 다시 분석해 봅니다. 두 답이 다르다면 그 이유는 무엇일까요?
자신이 오래 사용한 제품을 선택해 핵심 가치를 정의하고, 이를 검증할 행동 지표를 설계해 봅니다. 설계 중 막히는 순간을 관찰하고 어떤 단계를 건너뛰게 되는지 확인해 봅니다.

실전 과제

관심있는 앱의 앱스토어에서 별점이 낮은 리뷰를 수집합니다.
각 리뷰를 오늘 배운 “이탈 유저 특징”으로 분류합니다. (즉각적 이탈 / 점진적 이탈 / 기대와 다른 행동 등)
분류 결과를 보고, 이 앱의 Hook 모델에서 어느 단계가 가장 약한지 판단하십시오. 그 근거는 무엇인가요?
PM이라면 어떤 행동 지표를 모니터링해야 이 문제를 발견할 수 있었을지 제안합니다.

참고 자료

5강 실전 과제