이혜선
포스텍 산업경영공학과 교수
경북대학교 통계학과 박사
코넬대학교 통계학과 석사
서울대학교 소비자학과 학사
경력 : 시카고대학교 경제연구소, 미국국립여론조사연구소, UC샌디에고 의과대학
R은 데이터분석을 위한 프로그램이며 오픈소스입니다. 오픈소스는 누구나 어디서나 사용가능한 프로그램입니다. 본 강좌는 데이터를 처음 다루는 수강생들을 기준으로 R 프로그램의 기초 스크립트부터 그래픽, 기초 통계분석, 텍스트 마이닝을 학습하고, 예제 프로그램을 이용하여 프로그램밍을 직접 수행하고 분석하는 능력을 키우는 것을 목적으로 합니다. 전공 영역이 인문학, 사회과학, 이공계 어느 분야이든 수강할 수 있는 강좌로 단계별로 프로그램밍을 학습할 수 있습니다. 본 강좌를 수강하여 프로그램밍 스크립트를 이해하고, 데이터 분석의 과학적 과정을 학습하여 빅데이터 산업 및 소프트웨어 개발에 대한 기초지식을 갖출 수 있기를 기대합니다.
[미리보기] |
R 설치 (W1-1) 강좌 미리보기 |
R 데이터생성 (W3-1) 강좌 미리보기 |
주차 | 주차 | |
---|---|---|
1 | Ⅰ. R의 기초와 기본 스크립트 (Rstudio 설치) | R 소개 및 설치 |
Rstudio 레이아웃과 실행 | ||
기본 스크립트와 함수 | ||
R 추가 패키지 사용 | ||
주차별 질문 관련 공지사항 | ||
2 | Ⅱ. 벡터, 행렬의 연산 및 함수 | 벡터 및 행렬 생성 |
객체이름정의와 데이터프레임 | ||
벡터와 행렬의 연산 | ||
간단한 함수생성 및 루프(for, while) | ||
3 | Ⅲ. R 데이터구조 (생성, 추출) | R 데이터생성 (불러들이기) |
R 데이터 활용 I (subset, 내보내기) | ||
R 데이터 활용 II | ||
여러형태의 DB다루기(SQL, DBF 등) | ||
4 | Ⅳ. R 그래픽 Ⅰ | R 그래픽: 히스토그램 |
R 그래픽: 상자그림, 파이차트 | ||
R 그래픽: 산점도 | ||
그래픽과 레이아웃 | ||
5 | Ⅴ. R 그래픽 Ⅱ | R 그래픽: lattice와 gglpot2 |
R 그래픽: ggplot2의 활용 | ||
R 그래픽: 3D와 히트맵 | ||
R 그래픽: 공간지도 분석 | ||
6 | Ⅵ. 데이터 탐색 | 데이터 다루기 |
데이터 기술통계치 요약 | ||
그래프를 이용한 데이터 탐색 | ||
데이터의 정규성검정과 신뢰구간 | ||
7 | Ⅶ. R을 이용한 통계분석 | 두 그룹간 평균비교 (t-test) |
짝을 이룬 그룹간 비교 | ||
분산분석 (ANOVA) | ||
이원분산분석 (two-way ANOVA) | ||
8 | Ⅷ. 선형 회귀모형과 텍스트 마이닝 | 상관분석 |
회귀분석 | ||
텍스트 마이닝 I | ||
텍스트 마이닝 II |
포스텍 산업경영공학과 교수
경북대학교 통계학과 박사
코넬대학교 통계학과 석사
서울대학교 소비자학과 학사
경력 : 시카고대학교 경제연구소, 미국국립여론조사연구소, UC샌디에고 의과대학