데이터 전처리 데이터 분석 과정에서 데이터 전처리는 반드시 거쳐야 하는 과정 전처리 결과가 분석 결과에 직접적인 영향을 주고 있어서 반복적으로 수행함 데이터 분석의 단계 중 가장 많은 시간이 소요됨 데이터 정제 → 결측값 처리 → 이상값 처리 → 분석변수처리 순서로 진행 데이터 정제 데이터 정제(Data Cleansing)는 결측값을 채우거나 이상값을 제거하는 과정을 통해 데이터의 신뢰도를 높이는 작업 1. 데이터 정제 절차 ① 데이터 오류 원인 분석 데이터 오류는 원천 데이터의 오류로 인해서 발생하거나 빅데이터 플로우의 문제로부터 발생함 원인 설명 오류 처리 방법 결측값(Missing Value) ☞ 필수적인 데이터가 입력되지 않고 누락된 값 ☞ 평균값, 중앙값, 최빈값 같은 중심 경향값 넣기 ☞ 랜덤..