
2023-1. 빅데이터 애널리틱스 통계분석 1주차. 기초통계 (t.test)
1. 독립표본 T검정
- 정의
T-Test는 모집단의 분산, 표준편차를 알지 못할 때 모집단을 대표하는 표본의 분산, 표준편차를 통해 모집단의 평균을 비교하는 통계 방법으로, 표본이 정규성, 등분산성, 독립성 등을 만족할 때 사용 가능하다.
T-Test는 아래와 같은 가설을 세우고 검정을 진행한다.
- 귀무가설: 두 집단의 평균이 같다. (μ1 = μ2)
- 대립가설: 두 집단의 평균이 다르다. (μ1 ≠ μ2)
T-Test의 결과는 t값과, p값이 나오는데, p값은 검정 결과의 유의성을 나타낸다. p값이 유의수준(0.05)보다 작으면 귀무가설을 기각하고, 대립가설을 채택한다. 이를 통하여 두 집단의 평균값이 통계적으로 유의하게 차이가 있다는 것을 확인할 수 있다.
- 독립변수(원인) - 종속변수(결과) 존재
· 두 집단 : 독립변수, 평균 : 종속변수
· 독립변수 : 응답변수가 2개인 명목척도 (예) 남자 : 1, 여자 : 2
· 종속변수 : 등간척도/비율척도
2. SPSS 분석 방법
- 분석 > 평균비교 > 독립표본 T검정
· 검정변수 : 종속변수, 집단변수 : 독립변수 입력
· 집단변수 - 집단 정의하기 (예) 남자 : 1, 여자 : 2
· 옵션 - 신뢰구간 : 95% (default 값)
3. 결과해석
1) 집단통계량
- N : 모수. N > 30이면 정규성을 만족
- 평균, 표준화 편차, 표준오차 평균 등

2) 독립표본 검정
① 등분산 가정여부 확인
- Levene의 등분산 검정 : 유의확률 p < 0.05 → 《등분산을 가정하지 않음》 확인
- Levene의 등분산 검정 : 유의확률 p > 0.05 → 《등분산을 가정함》 확인
② 유의확률 p < 0.05 → 귀무가설(두 집단 평균의 차이가 없다) 기각, 대립가설 채택
- 예시: 귀무가설) 성별에 따라 서비스에 차이가 없을 것이다.
대립가설) 성별에 따라 서비스에 차이가 있을 것이다.
- t가 음수 : 평균이 더 작다. (1세대가구의 월평균 가구 통신료가 더 작다)

'빅데이터 대학원 > 2023-1. 빅데이터애널리틱스통계분석' 카테고리의 다른 글
2023-1. 빅데이터 애널리틱스 통계분석 4주차. 로지스틱 회귀분석 (0) | 2023.04.06 |
---|---|
2023-1. 빅데이터 애널리틱스 통계분석 3주차. 회귀분석 (0) | 2023.04.05 |
2023-1. 빅데이터 애널리틱스 통계분석 2주차. ANOVA, 상관분석 (0) | 2023.04.04 |