Practice makes perfect
[R] 교차분석(Cross Table Analyze) 본문
728x90
반응형
SMALL
교차 분석
: 범주형 자료의 두 개 이상 변수들 사이의 "관련성"을 알아보기 위한 분석입니다.
특징
1) 범주형 자료(명목척도 또는 서열척도)를 대상으로 두 개 이상의 변수들에 대핚 관련성 체크
2) 결합분포를 나타내는 교차분핛표를 작성.
3) 변수 상호간의 관랸성 여부를 분석하는 방법.
4) 빈도분석의 특성별 차이를 분석하기 위해 수행하는 분석 방법.
5) 빈도분석결과에 대핚 보충자료를 제시하는 데 효과적.
6) 빈도분석과 함께 고급 통계 분석의 기초 정보를 제공
교차 분석시 고려사항
교차 분석에 사용되는 변수는 값이 10 미만인 범주형 변수여야 함
비율척도인 경우는 코딩변경(리코딩)을 통해서 범주형 자료로 변환하여 적용 가능
- ex) 나이: 10~19세는 1, 20~29세는 2, 30~39세는 3 ...
위의 데이터를 사용하여 살펴보도록 하겠습니다.
- 데이터 가져오기
data <- read.csv("C:/workspaces/R/data/cleanDescriptive.csv", header = T)
head(data) # 변수 확인
- 변수 리코딩
x <- data$level2 # 리코딩 변수 이용(학력수준)
y <- data$pass2 # 리코딩 변수 이용(합격/불합격)
x; y # 부모학력수준(x) -> 자녀대학진학여부(y)
- 데이터프레임 생성
result <- data.frame(Level=x, Pass=y) # 데이터 프레임 생성 - 데이터 묶음
dim(result) 출력값 : 248 2
head(result)
- 출력값 -
Level Pass
1 고졸 실패
2 대졸 실패
3 대졸 합격
4 <NA> 합격
5 고졸 합격
6 대졸 <NA>
부모님의 최종학력이 자식에 영향이 미치는가?
- 교차 분학표 작성
table(result) # 빈도보기
-출력값-
Pass
Level 실패 합격
고졸 40 49
대졸 27 55
대학원졸 23 31
- 교차분할표 생성을 위한 패키지 설치
install.packages("gmodels")
library(gmodels)
- 패키지를 이용한 교차 분할표 생성
CrossTable(x, y)
- 교차테이블에 카이검정 적용
CrossTable(x, y, chisq = T)
728x90
반응형
LIST
'빅데이터 > R' 카테고리의 다른 글
[R] 추정(estimation) + (표본크기 결정) (0) | 2020.07.15 |
---|---|
[R] 카이제곱(chi-square 검정) (1) | 2020.07.15 |
[R] 척도별 기술 통계량 구하기 (0) | 2020.07.14 |
[R] 평균, 분산, 표준변차 (0) | 2020.07.13 |
[R] 텍스트 마이닝 분석 - 실시간 뉴스 수집과 분석 (1) | 2020.07.13 |