본문 바로가기

패스트캠퍼스

데이터 전처리 1일차(데이터 전처리의 개요) 1. 데이터 전처리의 중요성 및 개요 현실 데이터 중에 분석 목적에 맞게 정리된 데이터를 만날 수 없어, 데이터 분석 기법을 그래도 적용할 수 없다. 예시) 노이즈가 포함된 데이터, 결측치가 포함된 데이터, 파편화된 데이터. 현실데이터사례1(P 밸브사-주문서데이터를 통한 월별 수요예측) 이 사례는 파일명과 폴더가 정리되어 있지 않으며 포맷(셀 위치, 이름, 크기)이 달랐다 현실데이터사례2(M공업사- 설비 비가동 시점예측) 시간 순서가 뒤죽박죽, 결측치 존재, 이종데이터의 혼합, 제대로 기록되지 않은 알람. 데이터 타입이 특수함.(16진수) 현실데이터사례3(K홈쇼핑 - 기존 방송기록으로 상품별 매출 예측, 매출최대화하는 방향으로 방송편성) 불필요한 값이 많아서 데이터만 크고, 목표에 부합하지 않은 구조의 .. 더보기
DB 1일차(세팅) 1. PostgreSQL 소개 및 설치 PostgreSQL을 배우게 된다. PostgreSQL은 오픈소스이며 관계형 데이터베이스의 일종이고, 다양한 os 지원. - 특징 Multi-Version Concurrency Control을 지원. 기본적으로 데이터 베이스는 여러 사람이 같이 쓴다.(동시성 보장) 데이터의 일관성, 정확성도 보장해야함.(1번 사람이 수정하고 싸인을 하지 않았는데, 이때 다른 사람은 수정전의 데이터를 봐야한다. 1번이 싸인한 후에 다른사람도 수정된 것을 본다) -> Oracle이 최고의 DB가 된 이유. C/C++, Java의 프로그래밍 언어와 연동 지원. 확장성이 좋음(Data Types, Index Types, Function) 커뮤니티 활발(오픈소스) 2. PostgreSQL .. 더보기
[딥러닝올인원]주피터노트북사용법 실행중인 노트북 파일은 책표지가 초록색이고, Running이라고 파일명 옆에 적혀 있다. 노트북 파일은 셀들로 이뤄져 있다.셀은 2가지 모드와 2가지 종류로 나눌 수 있다.모드는 입력모드(Edit Mode)와 명령모드(Command Mode)가 있다.명령모드에서 클릭 또는 Enter를 치면 입력모드로 전환된다.입력모드에서 Esc를 치면 명령모드로 전환된다.초록색 테두리가 입력모드고, 파란색 테두리가 명령모드다. 셀의 2가지 종류는 코드와 마크다운이다.코드는 말 그대로 코드이며, 마크다운은 주석을 달 수 있는 공간이다.코드는 회색 배경이 존재하고, 마크다운은 배경이 없다.코드를 실행하면 셀 밑에 실행값이 나오며 [ ]안의 숫자는 실행한 횟수를 뜻한다. 명령모드에서 "h"를 누르면 단축키모음이 뜬다. 더보기