R의 기본 데이터 구조

R의 기본

1. 기본 데이터 구조
1) 벡터 = Vector
  - 논리형 벡터, 문자형 벡터, 숫자형 벡터
구성인자가 1개 이상인 1차원 구조의 데이터

2) 스칼라 = Scalar
구성인자가 1개인 벡터

3) 요인 = Factor
범주형의 데이터 구조

요인이 가질 수 있는 값들: 수준 (level)

Example
f <- c("Low", "Middle", "High")
f1 <- factor(f, order = TRUE, level = c("Low", "Middle", "High") )
     라고 지정하면 문자열을 요인으로 바꾸고, 순서도 지정할 수 있음


4) 행렬 = Matrix
동일한 유형의 2차원 구조의 데이터

5) 배열 = Array
동일한 유형의 2차원 이상의 구조의 데이터

6) 데이터 프레임 = Data Frame
데이터 유형에 상관없이 그냥 2차원 구조의 데이터
단, 길이가 같아야 한다.

7) 리스트 = List
벡터, 행렬, 배열, 데이터프레임과 같은 서로 다른 구조의 데이터를 모두 묶은 객체



2. 추정과 검정
1) 일표본 평균
t.test(x)

2) 이표본 평균
(1) 독립 2표본 / (2) Paired 2표본
t.test(x, paired = TRUE/FALSE, var.equal = TRUE, data = D)

3) 일표본 비율
prop.test(42, 100) / binom.test(42,100)

4) 이표본 비율
prop.test( c(42,100), c(49, 100) )

5) 상관계수 검정, 이분산 검정, 독립성 검정
cor.test( c1, c2, method = "pearson")
var.test( c1, c2)
chisq.test( tab, data = D )


3. 자료의 요약
1) 질적자료
(1) 도수분포표 Frequency Table
table(survey$Smoke)

(2) 원그래프 Pie Chart
smoke <- table(survey $ Smoke)
pie(smoke)

(3) 막대그래프 Bar Chart
barplot(smoke)

(4) 분할표 Contingency Table
table(survey$Sex, survey$Smoke)

2) 양적자료
1) 히스토그램 Histogram
hist( mtcars $ mpg)

2) 줄기 잎 그림 Stem and Leaf
stem( mtcars $ hp)

3) 선그래프 (Line Graph)
library(ggplot2)
ggplot(BOD, aes ( x = , y = )) + geom_line( )

참고: https://rpubs.com/kimwoohyung/ggplot2

4) 산점도
plot( )


4.







댓글

가장 많이 본 글