빅데이터 대학원/2023-1. 빅데이터애널리틱스통계분석 (4) 썸네일형 리스트형 2023-1. 빅데이터 애널리틱스 통계분석 4주차. 로지스틱 회귀분석 2023-1. 빅데이터 애널리틱스 통계분석 4주차. 로지스틱 회귀분석 1. 로지스틱 회귀분석 - 정의 : 종속변수가 0 또는 1, 참 또는 거짓 등 두가지 값 중 하나만 취할 수 있는 경우, 로지스틱 회귀분석을 사용하여 분석/예측 - 조건 : 종속변수 (명목 or 서열척도) ex) Y/N 독립변수(등간 or 비율척도) - 연속형 변수 1-1. SPSS 분석 - 분석 > 회귀분석(R) > 이분형 로지스틱(G) · 0, 1 코딩변수 → 종속변수 · 독립변수들 → 공변량 입력 · 옵션 > hosmer-Lemeshow 적합도, exp(B) : 신뢰구간 : 95% 체크 · 방법 : 입력 1-2. 결과해석 (블록1 확인) 0. 종속변수 인코딩 값 확인 1. [모형계수의 총괄검정] : 모형 - 유의확률 p 0.05 .. 2023-1. 빅데이터 애널리틱스 통계분석 3주차. 회귀분석 2023-1. 빅데이터 애널리틱스 통계분석 3주차. 회귀분석 1. 회귀분석 - 정의 : 독립변수가 종속변수에 영향을 미치는가 확인하고자 할 때 (인과관계 분석) · 가설) 귀무가설 : 독립변수는 종속변수에 영향을 미치지 않는다. 대립가설 : 독립변수는 종속변수에 영향을 미친다. · 다중회귀분석 : 독립변수가 2개 이상인 경우 1-1. SPSS 분석 - 분석 > 회귀분석(R) > 선형(L) · 종속변수, 독립변수 입력 · 방법 : 단계적 선택 · 통계량 > 추정값, 모형적합, (R제곱 변화랑), 기술통계, 공선성 진단, (Durbin-watson) 선택 후 확인 1-2. 결과 해석 1. [기술통계량]표 : N 확인 (N > 30이면 정규성 만족) 2. [상관계수]표 3. [입력/제거된 변수]표 : 첫번째 .. 2023-1. 빅데이터 애널리틱스 통계분석 2주차. ANOVA, 상관분석 2023-1. 빅데이터 애널리틱스 통계분석 2주차. ANOVA, 상관분석 1. ANOVA 분석 - 정의 : 세 집단 이상의 평균 차이를 비교하고자 할 때 사용하는 통계적 분석 방법 - 구성 : 독립변수(명목척도), 종속변수(등간 or 비율척도) · 가설) 귀무가설 : 모든 집단의 평균은 같다. 대립가설 : 모든 집단의 평균이 모두 같지는 않다. (적어도 두 집단 간의 평균 차이는 있다.) 예) 직업 간 디자인 만족접수 평균이 모두 같지는 않다. 1-1. SPSS 분석 - 분석 > 평균비교(M) > 일원배치 분산분석(O) · 독립변수 → '요인' 입력 · 종속변수 → '종속변수' 입력 · 옵션 - 기술통계(D), 분산 동질성 검정(H) 체크 후 확인 1-2. 결과해석 1) [기술통계]표 : N 확인 (N .. 2023-1. 빅데이터 애널리틱스 통계분석 1주차. 기초통계 (t.test) 2023-1. 빅데이터 애널리틱스 통계분석 1주차. 기초통계 (t.test) 1. 독립표본 T검정 - 정의 T-Test는 모집단의 분산, 표준편차를 알지 못할 때 모집단을 대표하는 표본의 분산, 표준편차를 통해 모집단의 평균을 비교하는 통계 방법으로, 표본이 정규성, 등분산성, 독립성 등을 만족할 때 사용 가능하다. T-Test는 아래와 같은 가설을 세우고 검정을 진행한다. - 귀무가설: 두 집단의 평균이 같다. (μ1 = μ2) - 대립가설: 두 집단의 평균이 다르다. (μ1 ≠ μ2) T-Test의 결과는 t값과, p값이 나오는데, p값은 검정 결과의 유의성을 나타낸다. p값이 유의수준(0.05)보다 작으면 귀무가설을 기각하고, 대립가설을 채택한다. 이를 통하여 두 집단의 평균값이 통계적으로 유의하게.. 이전 1 다음