2023-1. 빅데이터 애널리틱스 통계분석 3주차. 회귀분석
1. 회귀분석
- 정의 : 독립변수가 종속변수에 영향을 미치는가 확인하고자 할 때 (인과관계 분석)
· 가설) 귀무가설 : 독립변수는 종속변수에 영향을 미치지 않는다.
대립가설 : 독립변수는 종속변수에 영향을 미친다.
· 다중회귀분석 : 독립변수가 2개 이상인 경우
1-1. SPSS 분석
- 분석 > 회귀분석(R) > 선형(L)
· 종속변수, 독립변수 입력
· 방법 : 단계적 선택
· 통계량 > 추정값, 모형적합, (R제곱 변화랑), 기술통계, 공선성 진단, (Durbin-watson) 선택 후 확인
1-2. 결과 해석
1. [기술통계량]표 : N 확인 (N > 30이면 정규성 만족)
2. [상관계수]표
3. [입력/제거된 변수]표 : 첫번째 항목 - 종속변수에 가장 유의한 영향을 미치는 순서대로 정렬
4. [모형요약]표 : 수정된 R제곱이 가장 큰 모형의 결과만 확인하면 된다.
- 수정된 R제곱 : 해당 모형이 ~% 설명력을 가지고 있다.는 의미
5. [ANOVA]표
- F, 유의확률 p < 0.05 → 귀무가설 기각 (회귀모형은 적합하다) …..... 귀무가설 : 회귀모형은 적합하지 않다.
6. [계수]표 : 연구가설의 유의성을 보여주는 표, 가장 마지막 모형 확인
1) t 통계량에 따른 유의확률 p < 0.05 → 귀무가설 기각 (독립변수는 종속변수에 영향을 미친다)
2) 비표준화 계수 β → 회귀식을 만들 수 있음
· β 양수 → 증가, β 음수 → 감소
※ 다중회귀분석은 각각의 독립변수를 떼어내서 해석하는 것이 아닌,
여러 독립변수가 하나의 회귀식 안에 모두 들어가있어 유기적으로 표현해야 한다.
3) 표준화계수 베타 : 독립변수 간 상대적 영향력 비교 (표준화 계수 : 평균 0, 표준편차 1로 통일)
· β 양수 → 정적(+) 영향, β 음수 → 부적(-) 영향
4) VIF : 10 이상이면 공선성에 문제가 있는 것으로 판정하여 제외
'빅데이터 대학원 > 2023-1. 빅데이터애널리틱스통계분석' 카테고리의 다른 글
2023-1. 빅데이터 애널리틱스 통계분석 4주차. 로지스틱 회귀분석 (0) | 2023.04.06 |
---|---|
2023-1. 빅데이터 애널리틱스 통계분석 2주차. ANOVA, 상관분석 (0) | 2023.04.04 |
2023-1. 빅데이터 애널리틱스 통계분석 1주차. 기초통계 (t.test) (0) | 2023.04.03 |