본문 바로가기

빅데이터 대학원/2023-1. 빅데이터애널리틱스통계분석

2023-1. 빅데이터 애널리틱스 통계분석 3주차. 회귀분석

반응형

회귀분석

2023-1. 빅데이터 애널리틱스 통계분석 3주차. 회귀분석

1. 회귀분석

 - 정의 : 독립변수가 종속변수에 영향을 미치는가 확인하고자 할 때 (인과관계 분석)
  · 가설) 귀무가설 : 독립변수는 종속변수에 영향을 미치지 않는다.
           대립가설 : 독립변수는 종속변수에 영향을 미친다.
  · 다중회귀분석 : 독립변수가 2개 이상인 경우


1-1. SPSS 분석

 - 분석 > 회귀분석(R) > 선형(L)
   · 종속변수, 독립변수 입력
   · 방법 : 단계적 선택
   · 통계량 > 추정값, 모형적합, (R제곱 변화랑), 기술통계, 공선성 진단, (Durbin-watson) 선택 후 확인

 

1-2. 결과 해석

1. [기술통계량]표 : N 확인 (N > 30이면 정규성 만족)

 

기술통계량


2. [상관계수]표

 

상관계수


3. [입력/제거된 변수]표 : 첫번째 항목 - 종속변수에 가장 유의한 영향을 미치는 순서대로 정렬

 

회귀분석


4. [모형요약]표 : 수정된 R제곱이 가장 큰 모형의 결과만 확인하면 된다.
 - 수정된 R제곱 : 해당 모형이 ~% 설명력을 가지고 있다.는 의미

 

SPSS 회귀분석

 


5. [ANOVA]표  
 - F, 유의확률 p < 0.05 → 귀무가설 기각 (회귀모형은 적합하다) …..... 귀무가설 : 회귀모형은 적합하지 않다.

 

SPSS 회귀분석


6. [계수]표 : 연구가설의 유의성을 보여주는 표, 가장 마지막 모형 확인
  1) t 통계량에 따른 유의확률 p < 0.05 → 귀무가설 기각 (독립변수는 종속변수에 영향을 미친다)
  2) 비표준화 계수 β → 회귀식을 만들 수 있음
    · β 양수 → 증가, β 음수 → 감소
   ※ 다중회귀분석은 각각의 독립변수를 떼어내서 해석하는 것이 아닌,
      여러 독립변수가 하나의 회귀식 안에 모두 들어가있어 유기적으로 표현해야 한다.
  3) 표준화계수 베타 : 독립변수 간 상대적 영향력 비교 (표준화 계수 : 평균 0, 표준편차 1로 통일)
    · β 양수 → 정적(+) 영향, β 음수 → 부적(-) 영향
  4) VIF : 10 이상이면 공선성에 문제가 있는 것으로 판정하여 제외

 

SPSS 회귀분석

반응형