목록전체 글 (216)
Practice makes perfect
데이터 입력 Excel은 계산을 하기 위해 사용하는 프로그램입니다. 계산을 하기 위해서는 해당 데이터가 계산이 되는 데이터인지 되지 않는 데이터인지 구분해서 입력할 수 있어야합니다. 셀 단위로 입력되는 데이터는 문자, 숫자, 날짜 등으로 구성 되고, 숫자와 날짜는 계산이 되는 데이터 입니다. 이런 데이터를 엑셀에서 어떻게 입력하는지 기본적은 내용을 알아보도록 하겠습니다. ● 문자 데이터 ① 입력한 문자의길이가 셀 너비보다 길면 오른쪽 반 셀을 넘어 화면에 표시, 오른쪽 셀에 데이터가 있으면 셀 너비 만큼만 화면에 표시 → 열 너비를 조정 ② 0 으로 시작하는 학번, 고객번호 등을 유효하지 않는 값으로 인식해서 0이 안됨 → 숫자 앞에 ' (작은 따옴표)를 입력 → 숫자가 문자형식으로 변경되어 정상적으로 ..
Microsoft Excel 이란? 마이크로소프트사에서 만든 스프레드시트 프로그램으로 Microsoft Office의 구성 요소 중 하나로 가장 많이 사용되는 프로그램이라고 할 수 있습니다. 또한 회계 및 각종 데이터베이스 관리에 주로 사용됩니다. 기능 설명 데이터를 분석하고 보다 풍부한 정보를 바탕으로 비즈니스 결정을 내리기 위해 통합 문서(스프레드시트 모음)를 만들고 해당 서식을 지정합니다. 마이크로소프트 엑셀을 사용하면 데이터를 추적하고, 데이터 분석을 위한 모델을 만듭니다. 해당 데이터에 대한 계산을 실행하기 위한 수식을 작성하고, 다양한 방식으로 데이터를 피벗합니다. 다양한 전문가 수준의 차트에 데이터를 나타내는 등의 작업을 실행합니다. 추가 활용 기술 ① 그래프 : 데이터를 마우스로 긁은 후 ..
이번주도 코로나가 심해져서 비대면으로 진행되었습니다. - 저희 조는 여유가 있는 사람들은 모이는 장소에서 담당자와 멘토를 만나서 직접 진행하였고 참석하기 어려운 사람들은 집에서 진행했습니다. 1. 시작 방송 - 팀별 20분씩 - 피피티 형태 16:9 - 분량 제한 없으나 20분 안에 발표 해야 함 - 발표자료는 피피티 원본과 pdf함께 제출 할 것 - 제출 날짜는 12/3 목요일 18시까지(기한 필수) - 발표일: 발표자만 발표장으로(현장) 들어와서 발표 진행 - 4주차 전체 발표는 11시-18시 - 기업별 세부 발표 시간은 다음주 카페를 통해 공지함. 2. 페어플레이스 담당자 피드백 저희가 일주일동안 준비해서 모은 정보를 토대로 페어플레이의 담당자님께서 피드백을 해주셨습니다. 2가지 주제 1. 웨딩사업..
갑작스럽게 코로나 확진자가 늘어나게 되면서 를 활용하여 비대면으로 회의가 진행되었습니다. 1. 진행 상황 보고 를 통해서 프로젝트에 참여한 사람 모두가 모여서 간략적인 오리엔테이션으로 1주차 동안 어떻게 진행되었는지 간단하게 이야기를 나누었습니다. 2. 팀 회의 통해서 팀원만 모여서 함께 추가적인 아이디어를 이야기 나눴습니다. 추려낸 기획안 주제 1. 청첩장 2. 장례사업 3. 여행 가이드 현재 무빙키에서 가지고 있는 기술을 통해서 실행 가능하다고 판단되는 기획들을 남겨두고 피드백을 통해서 추가적으로 좁힐 것인지 아니면 아니면 그대로 진행 할 것이지 결정하기로 하고 팀회의를 마치고 멘토님을 기다렸습니다. 3. 멘토님 소개 및 직무 및 취업전략 교육과 피드백 을 통해서 3~4주 동안 같이 도와주시는 박명근..
합성곱 신경망 (Convolutional Neural Network, CNN) : CNN은 이미지, 동영상 등을 분석하는데 사용하는 알고리즘입니다. 완전연결 계층의 문제점 - 기존에 구현했던 완전 계측, 즉 기존 신경망은 데이터의 형상이 무시됩니다. 글자의 크기가 달라지거나 글자의 회전이 생기면 글자에 변형과 같이 글자에 변형이 조금만 생기더라도 다른 글자로 인식하기 때문에 새로운 학습 데이터를 넣어주지 않으면 좋은 결과 얻을 수 없습니다(패턴을 읽지 못하므로 인식을 위해 다양한 데이터 필요) - 입력 데이터가 이미지인 경우, 이미지는 3차원(가로, 세로, 채널(색상))으로 구성된 데이터이나 1차원으로 평탄화해줘야 합니다. 합성곱 계층의 특징 - 원본 이미지를 가지고 여러개 특징 맵(feature map..
k-최근접 이웃(k-Nearest Neighbor, kNN) : 특정 공간 내에서 입력과 제일 근접한 k개의 요소를 찾아, 더 많이 일치하는 것으로 분류 하는 알고리즘 입니다. k - 최근접 이웃 특징 ① 데이터 분류에 사용되는 아주 간단한 지도학습 알고리즘 - 지도학습 : 머신러닝 학습 시 데이터와 함께 데이터에 대한 레이블(정답)을 함께 부여하는 학습 방식. - 데이터 분류 : 새로운 데이터를 기존 데이터의 레이블 중 하나로 분류하는 작업. ② 유사한 특성을 가진 데이터들끼리는 거리가 가깝고, 거리 공식을 사용하여 데이터 사이의 거리를 구함 ③ 분류기의 효과를 높이기 위해 파라미터를 조정 ④ K-Nearest Neighbors의 경우 k 값을 변경 ⑤ 분류기가 부적절하게 학습되면 overfitting..
서포트 벡터머신(Support Vector Machine, SVM) : 사용하기 편하면서도 높은 정확도를 보이는 데이터 분류를 위한 지도학습 머신러닝 알고리즘. ① 서포트 벡터를 사용해서 결정 경계를 정의하고, 분류되지 않은 점을 해당 결정 경계와 비교해서 분류. ② SVM의 중요 용어 - 결정 경계(Decision Boundary) : 서로 다른 분류 값을 결정하는 경계 데이터에 2개 속성(feature)만 있다면 결정 경계는 이렇게 간단한 선 형태 속성이 3개로 늘어난다면 이렇게 3차원으로 그려야 한다. - 이때의 결정 경계는 ‘선’이 아닌 ‘평면’이 된다. - 우리가 이렇게 시각적으로 인지할 수 있는 범위는 딱 3차원까지다. - 차원, 즉 속성의 개수가 늘어날수록 당연히 복잡 - 결정 경계도 단순한..
고정된 학습 데이터와 테스트 데이터로 평가를 하다 보면 테스트 데이터에서만 성능이 좋은 과적합 문제가 발생할 수 있습니다. 이러한 문제점을 개선하기 위해서 교차 검증을 이용합니다. 교차 데이터는 데이터 편중을 막기 위해서 별도의 여러 세트로 구성된 학습 데이터 세트와 검증 데이터 세트에서 학습과 평가르 수행하는 것입니다. 그리고 각 세트에서 수행한 평가 결과에 따라 하이퍼 파라미터 튜닝등의 모델 최적화를 더 손쉽게 할 수 있습니다. ● K 폴드 교차 검증 : 가장 보편적으로 사용되는 교차 검증 기법으로 먼저 K개의 폴트 세트를 만들어서 K번 만큼 각 폴트 세트에 학습과 검증 평가를 반복적으로 수행하는 방법입니다. 사이킷런에서 K 폴트 교차 검증 프로세스 구현하기 위해 KFold와 StratifiedKFo..