본문 영역으로 바로가기

데이터사이언스를 위한 통계학입문Ⅱ


POSTECH
수강신청하실 수 없습니다.

강좌 소개

빅데이터와 4차산업혁명 시대에 데이터애널리틱스 혹은 데이터사이언티스트로 입문하고자 하는 분들이 ‘왜 통계의 개념이 필요한지’를 배울 수 있는 통계학 입문 코스입니다. 인문학 및 경영, 수학, 컴퓨터공학, 산업공학, 의생명과학 등 학계 혹은 현업(금융, 엔지니어, 제조업 등)에서 데이터분석이 필요한 분들에게 어떤 시각을 갖고 데이터를 분석해야 하는지 매일 일상에서 접하게 되는 통계치 혹은 통계 그래프(시각화)를 통해 설명하고자 합니다. 대학에서 강의하는 교재 중심의 강의가 아닌 현업 혹은 실제 데이터 중심으로 ‘통계학’을 접근하고자 합니다.


*선수과목 없음

본 강의는 통계학을 한번도 접해보지 않은 분들에게 통계적 안목을 갖게 하는 입문 강의입니다. 비전공자 일반인을 대상으로 하며, 미디어에서 매일 보도되는 통계 관련 정보와 데이터결과를 객관적으로 해석할 수 있는 시각을 제공하고자 합니다.


[미리보기]
통계검정-신뢰구간의 의미(week 5-1)
데이터수집-random의 의미(week 6-1)
차원축소- 데이터 탐색과 정제 (week 7-1)




강좌 목차

주차차시
1Week 5: 통계검정방법
신뢰구간의 의미
통계적 검정은 왜 필요한가
두집단 t-검정
p-value의 실제의미
2Week 6: 현업 데이터 특성과 예측모형
데이터수집-random의 의미
예측모형에서 training 과 Test set
예측모형의 과적합(overfitting)
over & under sampling문제
3
Week 7: 빅데이터 차원축소와 예측모형
데이터탐색과 정제
빅데이터의 차원축소
데이터변환에 의한 저차원 시각화
데이터와 예측모형
4Week 8: 회귀분석을 이용한 예측모형선형모형의 특성과 상관분석
실제데이터 예측모형구현
회귀모형의 적합조건
예측모형의 핵심과 고려사항


교수자

이혜선

포스텍 산업경영공학과 교수

경북대학교 통계학과 박사

코넬대학교 통계학과 석사

서울대학교 소비자학과 학사

경력 : 시카고대학교 경제연구소, 미국국립여론조사연구소, UC샌디에고 의과대학