2023-1. 빅데이터 애널리틱스 통계분석 1주차. 기초통계 (t.test)

1. 독립표본 T검정

- 정의

T-Test는 모집단의 분산, 표준편차를 알지 못할 때 모집단을 대표하는 표본의 분산, 표준편차를 통해 모집단의 평균을 비교하는 통계 방법으로, 표본이 정규성, 등분산성, 독립성 등을 만족할 때 사용 가능하다.

T-Test는 아래와 같은 가설을 세우고 검정을 진행한다.

- 귀무가설: 두 집단의 평균이 같다. (μ1 = μ2)

- 대립가설: 두 집단의 평균이 다르다. (μ1 ≠ μ2)

T-Test의 결과는 t값과, p값이 나오는데, p값은 검정 결과의 유의성을 나타낸다. p값이 유의수준(0.05)보다 작으면 귀무가설을 기각하고, 대립가설을 채택한다. 이를 통하여 두 집단의 평균값이 통계적으로 유의하게 차이가 있다는 것을 확인할 수 있다.

- 독립변수(원인) - 종속변수(결과) 존재
  · 두 집단 : 독립변수, 평균 : 종속변수
  · 독립변수 : 응답변수가 2개인 명목척도 (예) 남자 : 1, 여자 : 2
  · 종속변수 : 등간척도/비율척도

2. SPSS 분석 방법

- 분석 > 평균비교 > 독립표본 T검정
   · 검정변수 : 종속변수, 집단변수 : 독립변수 입력
   · 집단변수 - 집단 정의하기 (예) 남자 : 1, 여자 : 2
   · 옵션 - 신뢰구간 : 95% (default 값)

3. 결과해석

1) 집단통계량
- N : 모수. N > 30이면 정규성을 만족
- 평균, 표준화 편차, 표준오차 평균 등

2) 독립표본 검정
① 등분산 가정여부 확인

- Levene의 등분산 검정 : 유의확률 p < 0.05 → 《등분산을 가정하지 않음》 확인
- Levene의 등분산 검정 : 유의확률 p > 0.05 → 《등분산을 가정함》 확인

② 유의확률 p < 0.05 → 귀무가설(두 집단 평균의 차이가 없다) 기각, 대립가설 채택
- 예시: 귀무가설) 성별에 따라 서비스에 차이가 없을 것이다.
대립가설) 성별에 따라 서비스에 차이가 있을 것이다.
- t가 음수 : 평균이 더 작다. (1세대가구의 월평균 가구 통신료가 더 작다)

저작자표시 비영리 변경금지

'빅데이터 대학원 > 2023-1. 빅데이터애널리틱스통계분석' 카테고리의 다른 글

2023-1. 빅데이터 애널리틱스 통계분석 4주차. 로지스틱 회귀분석 (0)	2023.04.06
2023-1. 빅데이터 애널리틱스 통계분석 3주차. 회귀분석 (0)	2023.04.05
2023-1. 빅데이터 애널리틱스 통계분석 2주차. ANOVA, 상관분석 (0)	2023.04.04

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

노니의 솔직 블로그

2023-1. 빅데이터 애널리틱스 통계분석 1주차. 기초통계 (t.test)