Skip to main content

빅데이터분석과 R프로그래밍


POSTECH
Enrollment in this course is by invitation only

강좌 소개

R은 데이터분석을 위한 프로그램이며 오픈소스입니다. 오픈소스는 누구나 어디서나 사용가능한 프로그램입니다. 본 강좌는 데이터를 처음 다루는 수강생들을 기준으로 R 프로그램의 기초 스크립트부터 그래픽, 기초 통계분석, 텍스트 마이닝을 학습하고, 예제 프로그램을 이용하여 프로그램밍을 직접 수행하고 분석하는 능력을 키우는 것을 목적으로 합니다. 전공 영역이 인문학, 사회과학, 이공계 어느 분야이든 수강할 수 있는 강좌로 단계별로 프로그램밍을 학습할 수 있습니다. 본 강좌를 수강하여 프로그램밍 스크립트를 이해하고, 데이터 분석의 과학적 과정을 학습하여 빅데이터 산업 및 소프트웨어 개발에 대한 기초지식을 갖출 수 있기를 기대합니다. 


[미리보기]
R 설치 (W1-1) 강좌 미리보기
R 데이터생성 (W3-1) 강좌 미리보기



강좌 목차

주차주차
1Ⅰ. R의 기초와 기본 스크립트 (Rstudio 설치)R 소개 및 설치
Rstudio 레이아웃과 실행
기본 스크립트와 함수
R 추가 패키지 사용
주차별 질문 관련 공지사항
2Ⅱ. 벡터, 행렬의 연산 및 함수벡터 및 행렬 생성
객체이름정의와 데이터프레임
벡터와 행렬의 연산
간단한 함수생성 및 루프(for, while)
3Ⅲ. R 데이터구조 (생성, 추출)R 데이터생성 (불러들이기)
R 데이터 활용 I (subset, 내보내기)
R 데이터 활용 II
여러형태의 DB다루기(SQL, DBF 등)
4Ⅳ. R 그래픽 ⅠR 그래픽: 히스토그램
R 그래픽: 상자그림, 파이차트
R 그래픽: 산점도
그래픽과 레이아웃
5Ⅴ. R 그래픽 ⅡR 그래픽: lattice와 gglpot2
R 그래픽: ggplot2의 활용
R 그래픽: 3D와 히트맵
R 그래픽: 공간지도 분석
6Ⅵ. 데이터 탐색데이터 다루기
데이터 기술통계치 요약
그래프를 이용한 데이터 탐색
데이터의 정규성검정과 신뢰구간
7Ⅶ. R을 이용한 통계분석두 그룹간 평균비교 (t-test)
짝을 이룬 그룹간 비교
분산분석 (ANOVA)
이원분산분석 (two-way ANOVA)
8Ⅷ. 선형 회귀모형과 텍스트 마이닝상관분석
회귀분석
텍스트 마이닝 I
텍스트 마이닝 II


Instructor

이혜선

포스텍 산업경영공학과 교수

경북대학교 통계학과 박사

코넬대학교 통계학과 석사

서울대학교 소비자학과 학사

경력 : 시카고대학교 경제연구소, 미국국립여론조사연구소, UC샌디에고 의과대학