R의 기본 데이터 구조
R의 기본
1) 벡터 = Vector
- 논리형 벡터, 문자형 벡터, 숫자형 벡터
구성인자가 1개 이상인 1차원 구조의 데이터
2) 스칼라 = Scalar
구성인자가 1개인 벡터
3) 요인 = Factor
범주형의 데이터 구조
요인이 가질 수 있는 값들: 수준 (level)
Example
f <- c("Low", "Middle", "High")
f1 <- factor(f, order = TRUE, level = c("Low", "Middle", "High") )
라고 지정하면 문자열을 요인으로 바꾸고, 순서도 지정할 수 있음
4) 행렬 = Matrix
동일한 유형의 2차원 구조의 데이터
5) 배열 = Array
동일한 유형의 2차원 이상의 구조의 데이터
6) 데이터 프레임 = Data Frame
데이터 유형에 상관없이 그냥 2차원 구조의 데이터
단, 길이가 같아야 한다.
7) 리스트 = List
벡터, 행렬, 배열, 데이터프레임과 같은 서로 다른 구조의 데이터를 모두 묶은 객체
2. 추정과 검정
1) 일표본 평균
t.test(x)
2) 이표본 평균
(1) 독립 2표본 / (2) Paired 2표본
t.test(x, paired = TRUE/FALSE, var.equal = TRUE, data = D)
3) 일표본 비율
prop.test(42, 100) / binom.test(42,100)
4) 이표본 비율
prop.test( c(42,100), c(49, 100) )
5) 상관계수 검정, 이분산 검정, 독립성 검정
cor.test( c1, c2, method = "pearson")
var.test( c1, c2)
chisq.test( tab, data = D )
3. 자료의 요약
1) 질적자료
(1) 도수분포표 Frequency Table
table(survey$Smoke)
(2) 원그래프 Pie Chart
smoke <- table(survey $ Smoke)
pie(smoke)
(3) 막대그래프 Bar Chart
barplot(smoke)
(4) 분할표 Contingency Table
table(survey$Sex, survey$Smoke)
2) 양적자료
1) 히스토그램 Histogram
hist( mtcars $ mpg)
2) 줄기 잎 그림 Stem and Leaf
stem( mtcars $ hp)
3) 선그래프 (Line Graph)
library(ggplot2)
ggplot(BOD, aes ( x = , y = )) + geom_line( )
참고: https://rpubs.com/kimwoohyung/ggplot2
4) 산점도
plot( )
4.
댓글
댓글 쓰기