Practice makes perfect

[R] 코딩 변경 본문

빅데이터/R

[R] 코딩 변경

kerpect 2020. 7. 6. 16:07

위의 데이터를 토대로 설명하겠습니다.

 

 

1) 가독성을 위한 코딩 변경

 

① resident 컬럼을 대상으로 코딩 변경하기

table(dataset2$resident)

- 출력값 - 
 1   2   3   4   5   (거주지)
111  47  27  15  34  (빈도수)


# 거주의 값이 n일 때, n. ~시 저장
dataset2$resident2[dataset2$resident == 1] <- '1. 서울 특별시' 
dataset2$resident2[dataset2$resident == 2] <- '2. 인천 광역시'
dataset2$resident2[dataset2$resident == 3] <- '3. 대구 광역시'
dataset2$resident2[dataset2$resident == 4] <- '4. 광주 광역시'
dataset2$resident2[dataset2$resident == 5] <- '5. 부산 광역시'

 

② job 컬럼을 대상으로 코딩 변경하기 

dataset2$job2[dataset2$job == 1] <- '공무원'
dataset2$job2[dataset2$job == 2] <- '회사원'
dataset2$job2[dataset2$job == 3] <- '개인사업'

 

 

 

 

2) 척도 변경을 위한 코딩 변경

- 나이(age) 변수를 청년층, 중년층 , 장년층 으로 코딩 변경하기 

dataset2$age2[dataset2$age <= 30] <- "청년층"
dataset2$age2[dataset2$age > 30 & dataset2$age <=55] <- "중년층"
dataset2$age2[dataset2$age > 55] <- "장년층 "

 

 

 

 

3) 역코딩을 위한 코딩 변경 (survey) 활용.

- survey 에서 가장 만족한 것이 1 , 가장 불만족이 5이므로 평균을 내면 문제가 생기므로 변경해줍니다. 

survey <- dataset2$survey

rsurvey <- 6-survey # 역코딩 (5까지의 숫자이므로 6-n)

dataset2$survey2 <- rsurvey
mean(dataset2$survey2, na.rm = T) 
출력값 : 3.358566 

 

'빅데이터 > R' 카테고리의 다른 글

[R] 기하학적 기법 시각화 - ggplot2 패키지  (0) 2020.07.07
[R] lattice 패키지  (0) 2020.07.06
[R] 이상치(극단치)  (0) 2020.07.06
[R] 결측치(NA) 처리  (0) 2020.07.06
[R] 데이터 셋 보기  (0) 2020.07.06