데이터 전처리 1일차(데이터 전처리의 개요)
1. 데이터 전처리의 중요성 및 개요 현실 데이터 중에 분석 목적에 맞게 정리된 데이터를 만날 수 없어, 데이터 분석 기법을 그래도 적용할 수 없다. 예시) 노이즈가 포함된 데이터, 결측치가 포함된 데이터, 파편화된 데이터. 현실데이터사례1(P 밸브사-주문서데이터를 통한 월별 수요예측) 이 사례는 파일명과 폴더가 정리되어 있지 않으며 포맷(셀 위치, 이름, 크기)이 달랐다 현실데이터사례2(M공업사- 설비 비가동 시점예측) 시간 순서가 뒤죽박죽, 결측치 존재, 이종데이터의 혼합, 제대로 기록되지 않은 알람. 데이터 타입이 특수함.(16진수) 현실데이터사례3(K홈쇼핑 - 기존 방송기록으로 상품별 매출 예측, 매출최대화하는 방향으로 방송편성) 불필요한 값이 많아서 데이터만 크고, 목표에 부합하지 않은 구조의 ..
더보기