본문 바로가기

빅데이터 대학원

Python 프로그래밍 초급 교육 (1) Introduction to Data Science

반응형

파이썬 프로그래밍 초급 교육

Python 프로그래밍 초급 교육 (1) Introduction to Data Science 

빅데이터 대학원 합격 후 사전강의로 파이썬 프로그래밍 초급과 파이썬을 활용한 텍스트 마이닝 교육이 온라인으로 진행 중이다. 앞으로 2년 동안 주구장창 사용할 파이썬 프로그래밍의 기초 이론부터 기본 문법, 수업 내용까지 블로그에 하나씩 정리하고자 한다. 그 중 가장 첫번째 수업 내용인 「Introduction to Data Science 」을 정리하고자 한다.

 

 

목차
#1. Introduction to Data Science
#2. Python
#3. 예측분석

#4. 강의 후 느낀점

 

 

파이썬 프로그래밍 초급 교육

 

 

Ⅰ. Introduction to Data Science 

1.  왜 Data Science를 배워야하는가? 

 1) 시간이 지날수록 데이터 생산 증가, 저장능력 향상 → 누군가는 활용하여 가치를 창출, 의미있는 서비스 제공

 2) 새로운 서비스 개발    예) 마켓컬리의 수요예측을 통한 샛별배송

 

2. Data Science : 데이터 분석을 통해 현상을 이해하는 원리, 절차, 기법을 통칭

  - 종류 : 텍스트 마이닝, 데이터 마이닝, 소셜 네트워크 분석, 데이터 시각화, 머신러닝, 딥러닝

  - Data Science의 최종 목표 : 더 나은 의사결정

  - Data Science ≠ Big Data

   · Data Science는 데이터분석을 통해 현상을 이해, 활용성까지 강조하는 단어 (Insight)

   · Big Data : Information

빅데이터 데이터 사이언스 차이

 

  - Data Science의 3요소

   1) 프로그래밍 : 도구로서의 가치 (모르면 진행이 불가능)

   2) 통계 : 어떤 분석기법 적용하는지? 어떻게 처리? (통계를 모르면 프로그래밍으로 뭘 해야하는지 모름)

   3) 도메인 지식 : Data Science가 적용되는 분야의 지식    예) 야구 Data : 야구에 대한 지식이 있어야 함

데이터 사이언스 3요소

 

Ⅱ. Python

1. Python의 특징

  - 쉽고 간단한 문법

  - 초보자도 배우기 쉬운 언어

  - 객체지향적 언어 : 「A」라는 객체에 「숫자 5」를 할당한다.

  - 다양한 패키지 :  「Python으로 할 수 있는 것은 많다. 그러나 Python만으로 할 수 있는 것은 적다」

  - 오픈소스

파이썬 장점파이썬 장점

 

 

Ⅲ. 예측분석 

1. 예측분석의 유형

 - Descriptive Analytics(서술적 분석) : 어떤 일이 일어나고 있는가?

 - Predictive Analytics(예측) : 어떤 일이 일어날 것인가?

 - Prescriptive Analytics(처방) : 어떤 일을 해야 하는가?  - 추천 시스템, 자동 완성 등

  ※ 아래 단계로 갈수록 가치가 높아지는 것은 아니다.

 

 

Ⅳ. 강의 후 느낀점 

수업에서 Data Science와 Big Data의 차이점과 앞으로의 지향점에 대해서 설명하는 시간이었는데, 그동안 「빅데이터 학습 = 파이썬을 통한 데이터 추출, 가공하여 원하는 결과값 얻기」라고 단순하게 생각한 나 자신을 돌아보게 되었다. 더 나은 의사결정을 하기 위한 도구로서 활용할 수 있도록 앞으로 학업을 진행해야겠다. 

 

초급 파이썬 프로그래밍 수업이다보니, 개론 수준의 내용과 기초 파이썬 문법에 대해 학습할 예정인데, 기초라 하더라도 돌다리도 두들겨보고 건너듯이 하나씩 차근차근 복습하며 내용을 숙지할 수 있도록 해야겠다. 아무래도 평소 사용하는 언어, 프로그램이 아니고 대학교 졸업 이후 새로운 공부를 하게 되는 것이기 때문에, 초심자의 마음으로 파이썬을 공부해야겠다.

반응형