3강 데이터의 유형
정성적 데이터(Qualitative Data)
비수치적인 정보로 사람의 경험, 관점, 태도와 같은 주관적인 요소를 포함
대부분 텍스트, 비디오, 오디오 형태로 존재
정형되지 않고 구조화 되어있지 않음
데이터를 구조화하기 어렵다
새로운 현상이나 개념에 대한 이해를 심화하는데 사용
정량적 데이터(Quantitative Data)
수치적으로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있음.
데이터가 숫자형태로 존재하기 때문에 통계적으로 분석하기 쉬움.
개인의 해석이나 주관이 적게 작용하는 객관성을 가지고 있음.
지표로 만들기에 용이함
설문조사, 실험, 인구 통계, 지표 분석 등에 활용함.
데이터 유형별 비교
정량적 | 정성적 | |
유형 | 정형 데이터, 반정형 데이터 | 비정형 데이터 |
특징 및 관점 | 여러 요소의 결합으로 의미 부여. 주로 객관적 내용 | 객체 하나가 함축된 의미 내포. 주로 주관적 내용 |
구성 및 형태 | 수치나 기호. 데이터베이스, 스프레드 시트 | 문자나 언어. 웹 로그, 텍스트파일 |
위치 | DBMS, 로컬 시스템 등 내부 | 웹사이트, 모바일 플랫폼 등 외부 |
분석 | 통계 분석 시 용이 | 통계 분석 시 어려움 |
비즈니스 목표를 위해서 두 가지 데이터를 적절하게 활용해야 함
지표설정과 분석에 활용하기 위한 정량적 데이터를 중점적으로 살펴볼 예정
정량적 데이터 사례
인구 통계 데이터, 수치형 설문조사 데이터, 비즈니스 데이터, 행동 로그 데이터, 마케팅 데이터
정량적 데이터의 활용
정량적 데이터는 객관적이고 측정가능한 지표를 만들기에 적합
일일 활성 사용자수(DAU - Daily Active User) 재방문 비율(Retention) 등 서비스의 건강 상태를 나타내는 중요한 지표들을 확인 가능
수치형 설문조사 데이터를 정량적인 기준으로 나눈 사례
추천 지수(NPS)를 만들 수 있음
통계적 분석 적용
분포, 평균, 중앙값 등을 계산해서 데이터의 경향성과 패턴을 파악
해당 내용을 근거로 의사결정 과정에서 중요한 판단을 내림
다양한 데이터 분석 방법 적용
비즈니스 분석, 예측 모델링, 추세 분석을 포함한 머신러닝과 같은 현대적 데이터 분석 기법에 활용할 수 있다.
이를 통해 미래 예측, 효율적 자원 배분, 시장 변화에 대한 적응이 가능해진다.
->다음의 물음에 답변할 수 있음
한 달 동안 우리 회사가 벌어들이는 매출은 얼마인가??
하루 평균 우리 플랫폼에 접속하는 고객 수는?
지난 달에 방문한 유저 중 얼만큼이 다시 우리 서비스를 이용했는가?
4강 지표설정
지표란?
특정 목표나 성과를 측정하기 위한 구체적이고 측정가능한 기준
목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
정의한 문제에 대해 정확하게 파악하기 위해서 필요
문제정의를 통해서 ‘어떤 문제를 풀고자 하는가?’를 정의
-둘 이상의 해석이 나오지 않도록 구체적으로 표현하고 정의하였는가?
지표는 ‘어떤 결과를 기대하는가?’에 대한 정량화된 기준
-정의한 문제를 확인하는데 적합한가?
지표설정 예제
목표 : 날씬해지기
-‘날씬’을 정의 (BMI, 체지방률)
핵심지표 : BMI, 체지방률
수단: 주 5회 이상 운동(운동이행률), 매일 7이 이후 금식(식단달성율)
목표 : 사용자 성장
지표 : 사이트 방문자 수
-방문자 수는 증가할 수 있지만, 실제 사용자 참여나 수익 창출과는 크게 관련이 없을 수 있음
-‘사용자 성장’을 명확하게 정의하지 않음
-ex)객단가 증가, 재방문율 증가,…
목표: 유투브 광고에 대한 반응이 적다
지표 : 문의 수?
-문의 수가 광고에 대한 반응을 대표하지 못할 가능성이 큼
-‘반응이 적다’를 정의 : 매출이 크게 늘지 않았다, 유입 수가 크게 늘지 않았다.
-지표 : 매출, 유입 수
주요 지표 이해하기
- Active User(활성유저)
- Active User에 대한 정의에 따라 전략과 방향이 달라짐
- Active User에 대한 정의로 ‘이탈 유저’가 정의됨
- 서비스 지표에 중요한 역할을 하게 됨
Active User 설정 사례
- 사이트 진입 유저
- 사이트 진입 후 추가 행동을 한 유저
- 서비스의 최종 액션까지 수행한 유저
Active User 설정
우리 서비스만의 Active User 찾기
어디까지 경험한 유저가 우리의 활성유저일까?
일반 유저와 활성유저를 나누는 기준은?
유저는 어디서 우리 서비스의 효용성을 느낄까?
우리가 핸들링할 수 있는 유저의 사이즈는 얼마나 될까?
주요 지표 이해하기
지표 | 정의 |
전체 Active User | 앱 접속 이력이 있는 유저 |
서비스별 Active User | 서비스별 서비메인 이하 추가 액션이 있는 유저 |
DAU | Daily Active User |
WAU | Weekly Active User |
MAU | Monthly Active User |
이탈유저(이탈율) | 전체 DAU로 잡혔지만, 각 서비스의 ㅇ며로 잡히지 않은 유저(비율) |
CVR(Conversion Rate) | 특정행동을 한 후, 전환된 비율 |
CTR(Click Through Rate) | 어떤 페이지에 접근한 후, 특정 요소를 클릭한 비율 |
Retention Ratio(재방문율) : 몇 %의 유저가 우리 서비스를 다시 이용하는가?
정의: 서비스를 사용한 사람이 다시 서비스를 사용하는 비율%
리텐션이란 한번 획득한 유저가 서비스로 다시 돌아왔는가?에 대한 지표
리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음
리텐션은 서비스(특히 앱서비스) 성장에 있어서 매우 중요한 지표
리텐션은 기본적으로는 방문을 기준으로 측정하지만, Active User에서 활성의 기준을 정해줬던 것과 같이, 서비스의 특성에 따라 ‘활성’의 기준을 다르게 정의할 수 있음
일반적으로 리텐션은 시간이 지남에 따라 자연스럽게 감소(Product B)
기울기가 점점 완만해지며 안정화 되는 그래프를 가지고 있다면, 시장에 적합한 서비스라고 할 수 있음(Product A)
'내배캠_Data_3기 > TIL' 카테고리의 다른 글
240828_데이터 전처리_인덱스(Index) (1) | 2024.08.28 |
---|---|
240827_데이터 전처리(Pandas) (3) | 2024.08.27 |
240826_데이터 분석가란? (1) | 2024.08.27 |
240812_머신러닝 기초 1. 머신러닝의 기초 (0) | 2024.08.12 |
240809_통계학 기초 5주차 상관관계 (0) | 2024.08.09 |