00. 데이터 전처리머신 러닝 알고리즘의 중요 요소: 데이터 품질 & 정보의 양데이터를 모델에 주입하기 전, 조사하고 전처리하는 과정이 필수01. 누락된 데이터 다루기NaN, NULL: RDB에서 모르는 값을 지칭하는데 사용누락된 값을 무시하고 학습할 경우 예상치 못한 결과가 발생, 따라서 분석을 하기 전 누락된 값을 처리하는 것이 중요방법(Python의 DataFrame으로 다룸)테이블 데이터에서 누락된 값 식별isnull()을 통해 셸이 수치 값을 가지고 있는지(false) 가지고 있지 않은지(true)를 불리언 값이 채워진 DataFrame으로 반환이를 sum()을 통해 각 특성마다 몇 개씩 보유하고 있는 지 확인누락된 데이터 다루는 전략들 활용전략 1: 누락된 값이 있는 훈련 샘플이나 특성 제외하..