Dataset 으로 무언가 시작하려고 할 때 반드시 체크 해야 되는 5가지

2019. 9. 25. 23:01Data Science

 

1. Check each column is a variable, and each row is an individual.

 - 각 열이 변수고, 각행이 개별 Data인지 여부

 

2. Look at the number of rows and columns in the dataset.

 - 열과 행이 총 얼마나 되는지 볼 것.

 

3. Check if there are missing values in any of the rows or columns

 - missing된 Data가 있는지 확인 할 것.

 

4. Check if any columns are of different data types than you would expect

 - 열의 Data가 예상된 Data Type과 같은지 다른지 확인 할 것.

 

5. Build exploratory plots like bar charts, histograms, and scatterplots to better understand the data.

 - 여러가지 그래프로 Visualize 해보고 Data를 이해할 것.