Dataset 으로 무언가 시작하려고 할 때 반드시 체크 해야 되는 5가지
2019. 9. 25. 23:01ㆍData Science
1. Check each column is a variable, and each row is an individual.
- 각 열이 변수고, 각행이 개별 Data인지 여부
2. Look at the number of rows and columns in the dataset.
- 열과 행이 총 얼마나 되는지 볼 것.
3. Check if there are missing values in any of the rows or columns
- missing된 Data가 있는지 확인 할 것.
4. Check if any columns are of different data types than you would expect
- 열의 Data가 예상된 Data Type과 같은지 다른지 확인 할 것.
5. Build exploratory plots like bar charts, histograms, and scatterplots to better understand the data.
- 여러가지 그래프로 Visualize 해보고 Data를 이해할 것.
'Data Science' 카테고리의 다른 글
분류형 Data만 가져오는 간단한 방법 (How to Identify the columns that are categorical in nature) (0) | 2019.10.03 |
---|---|
Missing Value에 대응하는 방법 1. Remove Value - (0) | 2019.09.29 |
JDBC 와 ODBC의 차이점은 무엇인가? (0) | 2019.09.25 |
당신이 만든 머신러닝 모델 괜찮은지 성능을 알고 싶나? 1편 (0) | 2019.09.04 |
Supervised Learning(지도학습) 에 대해.. [간단 짧음 주의] (0) | 2019.07.11 |