목록전체 글 (216)
Practice makes perfect
if 조건문 : 조건문은 if로 시작합니다. if 뒤의 괄호에 조건이 오고, 조건이 될 수 있는 값는 Boolean입니다. Boolean의 값이 true라면 조건이 담겨진 괄호 다음의 중괄호 구문이 실행됩니다. java와 동일하게 사용합니다 . else : if문의 조건이 true라면 if의 중괄호 구간이 실행되고, false라면 else 이후의 중괄호 구간이 실행됩니다. 즉 else는 주어진 조건이 거짓일 때 실행할 구간을 정의하는 것입니다. else if : else if는 좀 더 다양한 케이스의 조건을 검사할 수 있는 기회를 제공합니다. else if의 특징은 if나 else와는 다르게 여러개가 올 수 있습니다. else if의 모든 조건이 false라면 else가 실행됩니다. else는 생략 가능..
undefined 자료형 1. 존재하지 않는 것을 표현하는 자료형 - 한번도 사용하지 않는 자료형 2. 변수를 선언했지만 초기화 하지 않았을 때. - 값을 저장하지 않은 자료형 ( 데이터를 담기 전까지 자료형이 정해지지 않습니다.) * 동적 언어 : 값을 넣을 때까지 자료형이 결정되지 않는 언어( R, Python, JavaScript...) * 정적 언어 : 자료형이 미리 결정되어 있는 언어(Java, DataBase...) 연산자 산술 연산자 : +, -, *, /,% 비교 연산자 : , =, ==, != (결과값 : boolean) 논리 연산자 : &&, ||, ! (결과값 : boolean) 복합 대입 연산자 : += , -=, *=, /=, %= (누적) 증감 연산자 : ++, -- - Java..
Lattice : 래티스 시스템은 직교형태의 그래픽(Trellis graphic)을 생성하는 코드를 포함하고 있습니다. 여기서 말하는 기능은 R의 기본그래픽 시스템와는 다른 독립적인 것입니다. 주어지는 데이터 셋을 하나의 특징만 보여주는 것이 아니라 조건을 걸어서 조건별 데이터를 추가적으로 살펴볼 수 있도록 제공합니다. Lattice Plotting System 특징 - 다차원 데이터를 사용할 경우, 한번에 여러개의 plot 생성 가능 - 높은 밀도의 plot를 효과적으로 그림 - 직교형태의 그래픽(Trellis graphic) 생성 R 고급 시각화 도구 - 제공 패키지 - graphics / lattice / ggplot2 등... 1) 패키지 설치와 실습 데이터 셋 가져오기 install.packag..
위의 데이터를 토대로 설명하겠습니다. 1) 가독성을 위한 코딩 변경 ① resident 컬럼을 대상으로 코딩 변경하기 table(dataset2$resident) - 출력값 - 1 2 3 4 5 (거주지) 111 47 27 15 34 (빈도수) # 거주의 값이 n일 때, n. ~시 저장 dataset2$resident2[dataset2$resident == 1]
이상치(극단치) 이상치(Outlier)란 관측된 데이터의 범위에서 많이 벗어나 아주 작은 값이나 아주 큰 값을 말합니다. - 이상치의 유무는 데이터 분석에서 중요하게 작용하기 때문에 데이터 전처리에서 이상치를 찾는 것은 중요한 작업 중 하나입니다. - 보통 이상치는 제거하는 것이 일반적이지만 분석 목적에 따라 이상치만 따로 모아서 케이스 분석을 실시하는 경우도 있습니다. - 이상치 찾는 방법은 일반적으로 데이터 분포도를 이용하지만 분석분야(특히, 공장 및 제조)에 따라 관리범위로 찾는 경우도 많이 존재합니다. * 밑의 데이터를 활용하여 설명하겠습니다. 1) 범주형 변수 극다치 처리 - 이산변수 (정수형 변수) table(dataset$gender) - 출력값 - 0 1 2 5 (요인-범주) / 1,2 =..
분석을 위한 데이터셋을 확보했다 하더라도 바로 분석을 할 수 없는 경우가 많습니다. 그 이유는 바로 결측값, 이상치, 오입력 등이 있습니다. 따라서 데이터 분석에 적합하도록 데이터셋을 정제해야 합니다. 바로 이것을 전처리(data preprocessing)라고 합니다. 결측값(missing value) 결측값은 입력이 누락된 값을 의미합니다. 보통 NA로 출력됩니다. 결측값이 포함되면 산술 연산에 문제가 생깁니다. 대부분의 산술 연산 함수는 결측값을 제외할 수 있는 옵션을 제공합니다. 밑의 데이터를 토대로 설명하겠습니다 . 1) 결측치 확인 summary(dataset$price) - 출력값 - Min 1st Qu. Median Mean 3rd Qu. Max. NA's -457.200 4.425 5.40..
위 데이터를 활용하여서 설명하도록 하겠습니다. 1) 데이터 조회 - 탐색적 데이터 분석을 위한 데이터 조회 ① 전체 데이터 보기 1. print(dataset) # 콘솔창 출력 2. View(dataset) # utils pakage, 뷰어창 출력 1. print() 2. View() ② 데이터의 앞부분과 뒷부분 보기 head(dataset) - 출력값 - resident gender job age position price survey 1 1 1 1 26 2 5.1 1 2 2 1 2 54 5 4.2 2 3 NA 1 2 41 4 4.7 4 4 4 2 NA 45 4 3.5 2 5 5 1 3 62 5 5.0 1 6 3 1 2 57 NA 5.4 2 tail(dataset) - 출력값 - resident gen..
JavaScript 자바스크립트는 크로스 플랫폼(cross platform), 객체지향 스크립트 언어로 웹페이지의 동작을 담당하는 문법언어 입니다. 자바스크립트를 이용하면 웹에 풍부한 효과를 넣을 수 있지만, 2000년대 초반만 해도 자바스크립트는 개발자들에게 무시당하는 언어였습니다. 별다른 기능도 없고, 성능도 별로 좋지 않았아서 화면의 동적인 효과를 문법요소를 이요하지 않아도 Adobe를 활용하여 추가적인 요소를 사용할 수 있었기 때문입니다. 하지만 최근 몇 년 사이에 다양한 자바스크립트 프레임워크와 라이브러리가 생기면서 자바스크립트 생태계는 크게 확장되고 있으며, 그 위상도 점점 높아지고 있습니다. 추가적으로 스마트폰에서 웹을 사용하는 경우가 많이 생기면서 웹 사이트에서 javascript 이외에는..