빅데이터 대학원/2023-1. 빅데이터 분석론
2023. 3. 12.
2023-1. 빅데이터 분석론 2주차. R and Basic Statistical Testing
이번 수업은 R studio 활용하여 통계를 진행했다. 과거 SPSS, SAS 등을 많이 사용했으나, 최근 범용성이 뛰어난 오픈 라이브러리(R, 파이썬)을 대부분 사용한다. 1. t-statistics (t검정) - 정의 : 모집단의 분산이나 표준편차를 알지 못할 때, 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 검정하는 방법으로 “두 모집단의 평균간의 차이는 없다”라는 귀무가설과 “두 모집단의 평균 간에 차이가 있다”라는 대립가설 중에 하나를 선택할 수 있도록 하는 통계적 검정방법이다. ※ p-value < 0.05 → 귀무가설을 기각한다. (두 모집단의 평균은 통계적으로 같지 않다.) - rnorm : 정규분포로부터 랜덤 추출 · a t.test(data2$weight ~ data..