본문 바로가기

빅데이터 대학원/2023-1. 빅데이터애널리틱스통계분석

2023-1. 빅데이터 애널리틱스 통계분석 1주차. 기초통계 (t.test)

반응형

독립표본 t검정

2023-1. 빅데이터 애널리틱스 통계분석 1주차. 기초통계 (t.test)

1. 독립표본 T검정

 - 정의

T-Test는 모집단의 분산, 표준편차를 알지 못할 때 모집단을 대표하는 표본의 분산, 표준편차를 통해 모집단의 평균을 비교하는 통계 방법으로, 표본이 정규성, 등분산성, 독립성 등을 만족할 때 사용 가능하다.

 

T-Test는 아래와 같은 가설을 세우고 검정을 진행한다.

 - 귀무가설: 두 집단의 평균이 같다. (μ1 = μ2)

 - 대립가설: 두 집단의 평균이 다르다. (μ1 ≠ μ2)

 

T-Test의 결과는 t값과, p값이 나오는데, p값은 검정 결과의 유의성을 나타낸다. p값이 유의수준(0.05)보다 작으면 귀무가설을 기각하고, 대립가설을 채택한다. 이를 통하여 두 집단의 평균값이 통계적으로 유의하게 차이가 있다는 것을 확인할 수 있다.

 

 - 독립변수(원인) - 종속변수(결과) 존재
  · 두 집단 : 독립변수, 평균 : 종속변수
  · 독립변수 : 응답변수가 2개인 명목척도 (예) 남자 : 1, 여자 : 2
  · 종속변수 : 등간척도/비율척도


2.  SPSS 분석 방법

 - 분석 > 평균비교 > 독립표본 T검정
   · 검정변수 : 종속변수, 집단변수 : 독립변수 입력
   · 집단변수 - 집단 정의하기 (예) 남자 : 1, 여자 : 2
   · 옵션 - 신뢰구간 : 95% (default 값)


3. 결과해석

 1) 집단통계량
  - N : 모수. N > 30이면 정규성을 만족
  - 평균, 표준화 편차, 표준오차 평균 등

 

독립표본 t검정


 2) 독립표본 검정
  ① 등분산 가정여부 확인 

    - Levene의 등분산 검정 : 유의확률 p < 0.05 → 《등분산을 가정하지 않음》 확인
    - Levene의 등분산 검정 : 유의확률 p > 0.05 → 《등분산을 가정함》 확인


  ② 유의확률 p < 0.05 → 귀무가설(두 집단 평균의 차이가 없다) 기각, 대립가설 채택
    - 예시: 귀무가설) 성별에 따라 서비스에 차이가 없을 것이다.
              대립가설) 성별에 따라 서비스에 차이가 있을 것이다.
    - t가 음수 : 평균이 더 작다. (1세대가구의 월평균 가구 통신료가 더 작다)

 

독립표본 t검정

반응형