@@@ 데이터분석/데이터 분석의 모든 것

Part 1. 비전공자를 위한 기초 지식 (통계, R)

HTG 2021. 9. 6. 18:00
728x90

Chapter 1. 기초 통계

1.1 통계 개요

1.1.1 통계학의 중요 용어와 개념

1.1.1.1 모집단과 표본

1.1.1.2 모수와 통계량

1.1.1.3 변수와 관측값

1.1.1.4 양적 변수와 질적 변수

1.1.1.5 측정 수준

 

1.1.2 통계 자료의 획득 방법

1.1.2.1 단순랜덤추출

1.1.2.2 계통추출

1.1.2.3 층화추출

1.1.2.4 집락추출

 

1.2 기초 통계량과 확률

1.2.1 집중화 경향 대표값

1.2.1.1 평균

1.2.1.2 중앙값

1.2.1.3 최빈값

 

1.2.2 분산도

1.2.2.1 범위

1.2.2.2 평균편차

1.2.2.3 분산

1.2.2.4 표준편차

 

1.2.3 확률 이론

1.2.3.1 확률 개념

1.2.3.2 조건부 확률

1.2.3.3 독립사건과 종속사건

1.2.3.4 이산확률변수와 연속확률변수

1.2.3.5 확률분포와 확률함수

1.2.3.6 기대값

 

1.3 정규분포와 표준화

1.3.1 정규분포

1.3.1.1 정규분포

1.3.1.2 중심극한정리

 

1.3.2 표준화

1.3.2.1 표준화의 필요성

1.3.2.2 표준정규분포

 

1.4 가설 검정

1.4.1 통계적 가설

1.4.1.1 귀무가설과 대립가설

1.4.1.2 유의확률

 

1.4.2 가설 검정

1.4.2.1 t-검정

1.4.2.2 ANOVA

1.4.2.3 가설 검정의 결과와 오류

 

■ 연습 문제

 

Charter 2. R 프로그래밍

2.1 프로그래밍 환경 만들기

2.1.1 프로그래밍 언어, R

2.1.1 R 설치

 

2.1.1 R Studio 설치

 

2.1.1 R 패키지 설치

 

2.2 변수와 데이터 타입

2.2.1 변수

2.2.1.1 변수에 데이터를 저장하고, 불러오기

 

2.2.2 데이터 타입

2.2.2.1 숫자타입

2.2.2.2 문자타입

2.2.2.3 논리타입

2.2.2.4 펙터타입

 

2.3 데이터 구조

2.3.1 벡터

2.3.1.1 일부 데이터만 접근

2.3.1.2 벡터의 구조

2.3.1.3 벡터 데이터 추가, 갱신, 삭제

2.3.1.4 벡터의 데이터 타입

2.3.1.5 벡터 데이터 생성

 

2.3.2 매트릭스(행렬)

2.3.2.1 일부 데이터만 접근

2.3.2.2 행렬에 데이터 추가

 

2.3.3 데이터프레임

2.3.3.1 일부 데이터만 접근

2.3.3.2 데이터프레임의 데이터 타입

2.3.3.3 데이터프레임의 구조

2.3.3.4 데이터프레임 데이터 추가

 

2.3.4 배열

 

2.3.5 리스트

 

2.4 R 기초 프로그래밍

2.4.1 연산

2.4.1.1 벡터 연산

2.4.1.2 행렬 연산

 

2.4.2 흐름 제어문

2.4.2.1 if ~ else 문

2.4.2.2 ifelse() 함수

2.4.2.3 for 문

2.4.2.4 while 문

2.4.2.5 break 문

2.4.2.6 next 문

2.4.2.7 repeat 문

 

2.4.3 함수

2.4.3.1 함수 생성과 호출

2.4.3.2 매개변수가 있는 함수

2.4.3.3 두 개 이상의 매개변수가 있는 함수

2.4.3.4 디폴트값이 있는 매개변수

2.4.3.5 가변길이 매개변수

2.4.3.6 리턴 데이터가 있는 변수

 

2.4.4 유용한 함수와 상수

2.4.4.1 NULL과 NA

2.4.4.2 inf 와 NaN

2.4.4.3 데이터 타입 변환과 타입 확인

2.4.4.4 변수 삭제

 

2.5 R을 이용한 데이터 조작 방법

2.5.1 데이터의 대략적인 특징 파악에 유용한 함수

2.5.1.1 head() 함수

2.5.1.2 tail() 함수

2.5.1.3 str() 함수

2.5.1.4 summary() 함수

2.5.1.5 dim() 함수

 

2.5.2 외부 파일 읽기

2.5.2.1 CSV 파일 불러오기

2.5.2.2 엑셀 파일 불러오기

2.5.2.3 빅데이터 파일 불러오기

 

2.5.3 데이터 추출

2.5.3.1 행 제한

2.5.3.2 열 제한

2.5.3.3 행과 열 제한

2.5.3.4 정렬

2.5.3.5 그룹별 집계

2.5.3.6 plyr 패키지

2.5.3.7 dplyr 패키지

2.5.3.8 sqldf 패키지

 

2.5.4 데이터 구조 변경

2.5.4.1 데이터 병합

2.5.4.2 데이터 구조 변환

 

■ 연습 문제