Practice makes perfect
[R] 코딩 변경 본문
728x90
반응형
SMALL
위의 데이터를 토대로 설명하겠습니다.
1) 가독성을 위한 코딩 변경
① resident 컬럼을 대상으로 코딩 변경하기
table(dataset2$resident)
- 출력값 -
1 2 3 4 5 (거주지)
111 47 27 15 34 (빈도수)
# 거주의 값이 n일 때, n. ~시 저장
dataset2$resident2[dataset2$resident == 1] <- '1. 서울 특별시'
dataset2$resident2[dataset2$resident == 2] <- '2. 인천 광역시'
dataset2$resident2[dataset2$resident == 3] <- '3. 대구 광역시'
dataset2$resident2[dataset2$resident == 4] <- '4. 광주 광역시'
dataset2$resident2[dataset2$resident == 5] <- '5. 부산 광역시'
② job 컬럼을 대상으로 코딩 변경하기
dataset2$job2[dataset2$job == 1] <- '공무원'
dataset2$job2[dataset2$job == 2] <- '회사원'
dataset2$job2[dataset2$job == 3] <- '개인사업'
2) 척도 변경을 위한 코딩 변경
- 나이(age) 변수를 청년층, 중년층 , 장년층 으로 코딩 변경하기
dataset2$age2[dataset2$age <= 30] <- "청년층"
dataset2$age2[dataset2$age > 30 & dataset2$age <=55] <- "중년층"
dataset2$age2[dataset2$age > 55] <- "장년층 "
3) 역코딩을 위한 코딩 변경 (survey) 활용.
- survey 에서 가장 만족한 것이 1 , 가장 불만족이 5이므로 평균을 내면 문제가 생기므로 변경해줍니다.
survey <- dataset2$survey
rsurvey <- 6-survey # 역코딩 (5까지의 숫자이므로 6-n)
dataset2$survey2 <- rsurvey
mean(dataset2$survey2, na.rm = T)
출력값 : 3.358566
728x90
반응형
LIST
'빅데이터 > R' 카테고리의 다른 글
[R] 기하학적 기법 시각화 - ggplot2 패키지 (0) | 2020.07.07 |
---|---|
[R] lattice 패키지 (0) | 2020.07.06 |
[R] 이상치(극단치) (0) | 2020.07.06 |
[R] 결측치(NA) 처리 (0) | 2020.07.06 |
[R] 데이터 셋 보기 (0) | 2020.07.06 |