본문 바로가기

반응형

빅데이터 대학원/2023-1. 빅데이터 분석론

(2)
2023-1. 빅데이터 분석론 2주차. R and Basic Statistical Testing 이번 수업은 R studio 활용하여 통계를 진행했다. 과거 SPSS, SAS 등을 많이 사용했으나, 최근 범용성이 뛰어난 오픈 라이브러리(R, 파이썬)을 대부분 사용한다. 1. t-statistics (t검정) - 정의 : 모집단의 분산이나 표준편차를 알지 못할 때, 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 검정하는 방법으로 “두 모집단의 평균간의 차이는 없다”라는 귀무가설과 “두 모집단의 평균 간에 차이가 있다”라는 대립가설 중에 하나를 선택할 수 있도록 하는 통계적 검정방법이다. ※ p-value < 0.05 → 귀무가설을 기각한다. (두 모집단의 평균은 통계적으로 같지 않다.) - rnorm : 정규분포로부터 랜덤 추출 · a t.test(data2$weight ~ data..
2023-1. 빅데이터 분석론 1주차. 빅데이터와 적용 1. 각종 매체에서의 빅데이터, 인공지능의 중요성 - 데이터는 21세기의 원유이다. (2011, 가트너) - Data Scientist는 21세기 가장 매력적인 직업이 될 것이다. (2012, HBR) - 2030년까지 인공지능이 글로벌 경제에 기여하는 규모는 15조 7000억 달러가 될 것이다. (2017, PwC) - 가장 수요가 증가하는 직업 (2020, World Economic Forum) 1위. Data Analysts and Scientists 2위. AI and Machine Learning Speciallists 3위. Big Data Specialists 2. 왜 빅데이터, 인공지능인가? 1) 새로운 시각 - 모든 것의 데이터화 → 현실 세계를 새로운 시각으로 해석, 관점의 변화 - A..

반응형