본문 바로가기

빅데이터 대학원/2023-1. 빅데이터애널리틱스통계분석

2023-1. 빅데이터 애널리틱스 통계분석 2주차. ANOVA, 상관분석

반응형

ANOVA

2023-1. 빅데이터 애널리틱스 통계분석 2주차. ANOVA, 상관분석

 

1. ANOVA 분석

 - 정의 : 세 집단 이상의 평균 차이를 비교하고자 할 때 사용하는 통계적 분석 방법

 - 구성 : 독립변수(명목척도), 종속변수(등간 or 비율척도)
  · 가설) 귀무가설 : 모든 집단의 평균은 같다.
             대립가설 : 모든 집단의 평균이 모두 같지는 않다. (적어도 두 집단 간의 평균 차이는 있다.)
              예) 직업 간 디자인 만족접수 평균이 모두 같지는 않다.

 

1-1. SPSS 분석

 - 분석 > 평균비교(M) > 일원배치 분산분석(O)
   · 독립변수 → '요인' 입력
   · 종속변수 → '종속변수' 입력
   · 옵션 - 기술통계(D), 분산 동질성 검정(H) 체크 후 확인


1-2. 결과해석

1) [기술통계]표 : N 확인 (N > 30이면 정규성 만족)

2) [분산의 동질성 검정]표 : 등분산 검정
  - Levene 통계량) 평균을 기준으로 합니다 - 유의확률 p > 0.05 → 귀무가설(모든 집단은 등분산이다) 채택
                                                                                  : 사후분석 시 「등분산을 가정」함

ANOVA


3) [ANOVA]표 : 유의확률 p < 0.05 → 귀무가설(모든 집단의 평균은 같다) 기각

ANOVA



   → 그래서 집단 누구랑 누가 평균 차이가 있는데?! → 사후분석을 통한 집단 간 차이 확인

 


2. 사후 분석 (post-hoc test)

 - 정의 : 집단 간 차이를 사후적으로 검증
 - 조건별 분석방법 선택 : 1) 샘플 수 동일 여부, 2) 등분산 가정 여부


2-1. SPSS 분석

 - 분석 > 평균비교(M) > 일원배치 분산분석(O)
 · 사후분석 : Bonferroni, Scheffe, Turkey, Duncan, Dunnett, Games-Howell 선택   후 확인

 

 

2-2. 결과해석

1. [다중비교] : 집단 간 평균 차이를 모든 경우의 수로 보여줌
  - 유의확률로 집단 간 차이 확인 가능
   · 유의확률 p > 0.05 → 집단 간 평균 차이가 없다.
                p < 0.05 → 집단 간 평균 차이가 있다.

사후분석


2. [동질적 부분집합] : 어느 집단에 응답범주가 속해있는 지 확인

사후분석

 

3. Pearson 상관분석

 - 정의 : 양적인 두 변수 간의 관계가 유의한지 확인하는 분석 (인과관계 확인 X)
 - 가설 : 귀무가설) 두 변수 간의 상관관계가 없다. (두 변수는 차이가 없다)
            대립가설) 두 변수 간의 상관관계가 있다.


3-1. SPSS 분석

 - 분석 > 상관분석(C) > 이변량 상관(B)
  · 변수 칸에 확인하고자 하는 변수 이동
  · 상관관계 : Pearson 체크
  · 유의성 검정 : 양측 선택
  · 유의한 상관계수 플래그 체크 후 확인

 


3-2. 결과해석

1. [상관관계]표
  1) pearson 상관계수(r) : 두 변수의 상관관계 확인
    r의 범위 : -1 ~ 1, 0에 가까울수록 상관관계가 없다.
  2) 유의확률(양측) : 두 변수가 실제로 선형을 이루는 관계인지 확인 
    p < 0.05 → 귀무가설(두 변수 간 상관관계가 없다) 기각 

 

Pearson 상관분석


 참고) 그래프 > 래거시 대화상자(L) > 산점도/점도표(S)
   · 단순 산점도 - 정의 선택, X축, Y축 입력2

반응형