Practice makes perfect
[R] 주요 자료 구조(객체 타입 Part_1 : Vector 구조) 본문
R에서 제공하는 주요자료 구조(객체타입)
- Vector : 동일 데이터 타입을 갖는 1차원 배열
- Matrix : 동일 데이터 타입을 갖는 2차원 배열
- Array : 동일 데이터 타입을 갖는 다차원 배열
- List : 서로 다른 데이터 구조 (Vector, Data Frame, Array, List) 중첩
-> 데이터셋으로 묶음으로 관리하는 것이다. 가장 광범위하게 관리 방법입니다.
- Data Frame : 열 단위로 서로 다른 데이터 타입을 갖는 배열 – 가장 많이 사용합니다.
-> 2차원 테이블 구조(DB 테이블 과 유사)
서로 다른 자료형 일 때, 배열로 관리할 수 없고, 테이블의 형태로 관리할 때 자료형이 달라도 같이 관리할 수 있다. R에서 이러한 개념을 Data Frame이라고 합니다. 배열이라고 보기 보다는 table형태의 포맷으로 보는 것이 좋습니다.
R의 변수 1) 스칼라 변수(1개)
2) 벡터 변수(2개 이상)
R의 주요자료형 vs Java의 배열
| R에서 제공하는 주요자료 구조(객체타입) : 동일한 자료형 | Java 배열(참조자료형) : 동일한 자료형 |
| 1차원 배열 : Vector | 1차원 배열 : 연속적으로 메모리 할당, int[ ] |
| 2차원 배열 : Matrix | 2차원 : 행과 열의 형태 int[ ][ ] |
| 3차원 이상의 배열 : Array | 3차원 : int[ ][ ][ ] |
1)Vector 자료구조
- R의 기본 데이터 구조
- 1차원 배열 형태 -- 접근: [index] : 1부터시작
- 동일한 타입의 데이터만 저장 가능 (숫자와 문자가 같이 입력되어 저장될 때, 모두 문자열화 시켜서 저장한다)
- 벡터데이터생성함수: c() : combine 함수, seq() : sequence 함수, rep() : replicate 함수
- 벡터데이터처리함수: setdiff(), intersect()
2) 벡터 데이터 생성 함수 : c(), seq(), rep()
# Combine 함수 : c()

c() 생략이 가능 합니다.
# sequence 함수 : 임의의 간격을 자기고 싶을 때 사용하는 함수 입니다.

# replicate 함수 : 인자(대상, 반복수)

3) 벡터의 처리 함수 : union(), setdiff(), intersect() 함수

한 줄씩 처리하 수 있고, 블록으로 묶어서 한번에 처리 할 수 있습니다. = 배치성 처리 방식
( ; ) 을 이용하면 한번에 여러가지를 처리 할 수 있게 합니다.
+) 기타

숫자열과 문자열이 함꼐 있으면 모두 문자열로 변환합니다.

( ; ) 을 이용하면 한번에 처리가 가능합니다.

1)Vector 자료구조
•R의 기본 데이터 구조
•1차원 배열 형태
접근: [index] : 1부터시작
•동일한 타입의 데이터만 저장 가능
(숫자와 문자가 같이 입력되어 저장될 때, 모두 문자열화 시켜서 저장한다)
•벡터데이터생성함수: c() : combine 함수, seq() : sequence 함수, rep() : replicate 함수
•벡터데이터처리함수: setdiff(), intersect()
R의 인덱스는 1부터 시작된다.
모든 값을 삭제 할 때, null 값을 넣습니다. 모든 변수드이 참수변수(주소값을 담고 있음)입니다.
- 주소값에 null 을 넣어서 heap영역의 할당 되어 있는 값이 사라지게 하는 것입니다.
- 참조 변수 초기화 = null 값을 넣습니다.
1)Vector 자료구조
•R의 기본 데이터 구조
•1차원 배열 형태
접근: [index] : 1부터시작
•동일한 타입의 데이터만 저장 가능
(숫자와 문자가 같이 입력되어 저장될 때, 모두 문자열화 시켜서 저장한다)
•벡터데이터생성함수: c() : combine 함수, seq() : sequence 함수, rep() : replicate 함수
•벡터데이터처리함수: setdiff(), intersect()
R의 인덱스는 1부터 시작된다.

최종적으로 숫자형으로 결과가 나타난다면 어떤 코드를 사용 가능합니다.

combine 함수를 이용해야 가능합니다.

combine 함수 안에서 사용하면 ( , ) 를 사용해하면 error 나지 않습니다.

( - ) 는 해당 위치의 원소를 제외한 값을 출력합니다.
1)Vector 자료구조
•R의 기본 데이터 구조
•1차원 배열 형태
접근: [index] : 1부터시작
•동일한 타입의 데이터만 저장 가능
(숫자와 문자가 같이 입력되어 저장될 때, 모두 문자열화 시켜서 저장한다)
•벡터데이터생성함수: c() : combine 함수, seq() : sequence 함수, rep() : replicate 함수
•벡터데이터처리함수: setdiff(), intersect()
R의 인덱스는 1부터 시작된다.

*** 벡터 데이터 생성 함수 : c(), seq(), rep()
마지막 검증 테스트 과정에서 사용하는 함수로 버그를 분류해서 데이터를 담아주는 함수입니다.
'빅데이터 > R' 카테고리의 다른 글
| [R] 주요 자료 구조(객체 타입 Part_3 : Array구조) (0) | 2020.06.24 |
|---|---|
| [R] 주요 자료 구조(객체 타입 Part_2 : Matrix구조) (0) | 2020.06.24 |
| [R] 개요3 (변수2 , factor 함수) (0) | 2020.06.23 |
| [R] 개요2 (변수) (0) | 2020.06.23 |
| [R] R 개요 (0) | 2020.06.22 |