R에서 제공하는 주요자료 구조(객체타입)
- Vector : 동일 데이터 타입을 갖는 1차원 배열
- Matrix : 동일 데이터 타입을 갖는 2차원 배열
- Array : 동일 데이터 타입을 갖는 다차원 배열
- List : 서로 다른 데이터 구조 (Vector, Data Frame, Array, List) 중첩
-> 데이터셋으로 묶음으로 관리하는 것이다. 가장 광범위하게 관리 방법입니다.
- Data Frame : 열 단위로 서로 다른 데이터 타입을 갖는 배열 – 가장 많이 사용합니다.
-> 2차원 테이블 구조(DB 테이블 과 유사)
서로 다른 자료형 일 때, 배열로 관리할 수 없고, 테이블의 형태로 관리할 때 자료형이 달라도 같이 관리할 수 있다. R에서 이러한 개념을 Data Frame이라고 합니다. 배열이라고 보기 보다는 table형태의 포맷으로 보는 것이 좋습니다.
R의 변수 1) 스칼라 변수(1개)
2) 벡터 변수(2개 이상)
R의 주요자료형 vs Java의 배열
R에서 제공하는 주요자료 구조(객체타입) : 동일한 자료형 | Java 배열(참조자료형) : 동일한 자료형 |
1차원 배열 : Vector | 1차원 배열 : 연속적으로 메모리 할당, int[ ] |
2차원 배열 : Matrix | 2차원 : 행과 열의 형태 int[ ][ ] |
3차원 이상의 배열 : Array | 3차원 : int[ ][ ][ ] |
1)Vector 자료구조
- R의 기본 데이터 구조
- 1차원 배열 형태 -- 접근: [index] : 1부터시작
- 동일한 타입의 데이터만 저장 가능 (숫자와 문자가 같이 입력되어 저장될 때, 모두 문자열화 시켜서 저장한다)
- 벡터데이터생성함수: c() : combine 함수, seq() : sequence 함수, rep() : replicate 함수
- 벡터데이터처리함수: setdiff(), intersect()
2) 벡터 데이터 생성 함수 : c(), seq(), rep()
# Combine 함수 : c()
c() 생략이 가능 합니다.
# sequence 함수 : 임의의 간격을 자기고 싶을 때 사용하는 함수 입니다.
# replicate 함수 : 인자(대상, 반복수)
3) 벡터의 처리 함수 : union(), setdiff(), intersect() 함수
한 줄씩 처리하 수 있고, 블록으로 묶어서 한번에 처리 할 수 있습니다. = 배치성 처리 방식
( ; ) 을 이용하면 한번에 여러가지를 처리 할 수 있게 합니다.
+) 기타
숫자열과 문자열이 함꼐 있으면 모두 문자열로 변환합니다.
( ; ) 을 이용하면 한번에 처리가 가능합니다.
1)Vector 자료구조
•R의 기본 데이터 구조
•1차원 배열 형태
접근: [index] : 1부터시작
•동일한 타입의 데이터만 저장 가능
(숫자와 문자가 같이 입력되어 저장될 때, 모두 문자열화 시켜서 저장한다)
•벡터데이터생성함수: c() : combine 함수, seq() : sequence 함수, rep() : replicate 함수
•벡터데이터처리함수: setdiff(), intersect()
R의 인덱스는 1부터 시작된다.
모든 값을 삭제 할 때, null 값을 넣습니다. 모든 변수드이 참수변수(주소값을 담고 있음)입니다.
- 주소값에 null 을 넣어서 heap영역의 할당 되어 있는 값이 사라지게 하는 것입니다.
- 참조 변수 초기화 = null 값을 넣습니다.
1)Vector 자료구조
•R의 기본 데이터 구조
•1차원 배열 형태
접근: [index] : 1부터시작
•동일한 타입의 데이터만 저장 가능
(숫자와 문자가 같이 입력되어 저장될 때, 모두 문자열화 시켜서 저장한다)
•벡터데이터생성함수: c() : combine 함수, seq() : sequence 함수, rep() : replicate 함수
•벡터데이터처리함수: setdiff(), intersect()
R의 인덱스는 1부터 시작된다.
최종적으로 숫자형으로 결과가 나타난다면 어떤 코드를 사용 가능합니다.
combine 함수를 이용해야 가능합니다.
combine 함수 안에서 사용하면 ( , ) 를 사용해하면 error 나지 않습니다.
( - ) 는 해당 위치의 원소를 제외한 값을 출력합니다.
1)Vector 자료구조
•R의 기본 데이터 구조
•1차원 배열 형태
접근: [index] : 1부터시작
•동일한 타입의 데이터만 저장 가능
(숫자와 문자가 같이 입력되어 저장될 때, 모두 문자열화 시켜서 저장한다)
•벡터데이터생성함수: c() : combine 함수, seq() : sequence 함수, rep() : replicate 함수
•벡터데이터처리함수: setdiff(), intersect()
R의 인덱스는 1부터 시작된다.
*** 벡터 데이터 생성 함수 : c(), seq(), rep()
마지막 검증 테스트 과정에서 사용하는 함수로 버그를 분류해서 데이터를 담아주는 함수입니다.
'빅데이터 > R' 카테고리의 다른 글
[R] 주요 자료 구조(객체 타입 Part_3 : Array구조) (0) | 2020.06.24 |
---|---|
[R] 주요 자료 구조(객체 타입 Part_2 : Matrix구조) (0) | 2020.06.24 |
[R] 개요3 (변수2 , factor 함수) (0) | 2020.06.23 |
[R] 개요2 (변수) (0) | 2020.06.23 |
[R] R 개요 (0) | 2020.06.22 |