이혜선
포스텍 산업경영공학과 교수
경북대학교 통계학과 박사
코넬대학교 통계학과 석사
서울대학교 소비자학과 학사
경력 : 시카고대학교 경제연구소, 미국국립여론조사연구소, UC샌디에고 의과대학
빅데이터시대와 4차산업혁명 시대에 데이터애널리틱스 혹은 데이터사이언티스트로 입문하고자 하는 분들이 ‘왜 통계의 개념이 필요한지’를 배울 수 있는 통계학 입문 코스입니다. 인문학 및 경영, 수학, 컴퓨터공학, 산업공학, 의생명과학 등 학계 혹은 현업(금융, 엔지니어, 제조업 등)에서 데이터분석이 필요한 분들에게 어떤 시각을 갖고 데이터를 분석해야 하는지 매일 일상에서 접하게 되는 통계치 혹은 통계 그래프(시각화)를 통해 설명하고자 합니다. 대학에서 강의하는 교재 중심의 강의가 아닌 현업 혹은 실제 데이터 중심으로 ‘통계학’을 접근하고자 합니다.
*선수과목 없음
본 강의는 통계학을 한번도 접해보지 않은 분들에게 통계적 안목을 갖게 하는 입문 강의입니다. 비전공자 일반인을 대상으로 하며, 미디어에서 매일 보도되는 통계 관련 정보와 데이터 결과를 객관적으로 해석할 수 있는 시각을 제공하고자 합니다.
[미리보기] |
데이터과학과 통계 (week 1-1) |
그래프의 유용성과 오류 (week 3-2) |
주차 | 학습내용 | |
---|---|---|
1 | Week 1: 데이터과학과 통계 | 데이터과학이란 무엇인가 |
통계가 상식이 된 사회 | ||
데이터분석과 윤리 | ||
공유데이터와 오픈소스 (github) | ||
2 | Week 2: 빅데이터 탐색의 첫걸음 | 데이터의 평균 (중심위치) |
데이터의 분산 (산포정도) | ||
데이터와 빅데이터 | ||
데이터탐색의 첫걸음 | ||
3 | Week 3: 데이터시각화와 통계적 해석 | 데이터시각화 |
그래프의 유용성과 오류 | ||
상자그림이 주는 정보와 해석 | ||
산점도와 상관관계-트렌드분석 | ||
4 | Week 4: 빅데이터분석에서 확률과 분포 | 확률의 기초개념 |
조건부확률과 베이즈확률 | ||
정규분포(연속형)와 포아송분포(이산형) | ||
확률과 분포는 반드시 알아야하나 |
5 | Week 5: 통계검정방법 | 신뢰구간의 의미 |
통계적 검정은 왜 필요한가 | ||
두집단 t-검정 | ||
p-value의 실제의미 | ||
6 | Week 6: 현업 데이터 특성과 예측모형 | 데이터수집-random의 의미 |
예측모형에서 training 과 Test set | ||
예측모형의 과적합(overfitting) | ||
over & under sampling문제 | ||
7 | Week 7: 빅데이터 차원축소와 예측모형 | 데이터탐색과 정제 |
빅데이터의 차원축소 | ||
데이터변환에 의한 저차원 시각화 | ||
데이터와 예측모형 | ||
8 | Week 8: 회귀분석을 이용한 예측모형 | 선형모형의 특성과 상관분석 |
실제데이터 예측모형구현 | ||
회귀모형의 적합조건 | ||
예측모형의 핵심과 고려사항 |
포스텍 산업경영공학과 교수
경북대학교 통계학과 박사
코넬대학교 통계학과 석사
서울대학교 소비자학과 학사
경력 : 시카고대학교 경제연구소, 미국국립여론조사연구소, UC샌디에고 의과대학