[pandas#1] Data는 정리하고 청소하는 것부터...
앞서서 posting한 numpy와 같이 pandas 라이브러리는 data를 다루는데 필수적인 라이브러리라고 볼수 있습니다. 오늘은 그 첫번째로 간단하게 raw data를 파악하고 정리?? /청소?? 하는 방법에 대해서 알아보고자 합니다. 일단 pandas를 불러봅시다. import pandas as pd 앞서 numpy 포스팅에서 설명했던 내용으로 계속적으로 pandas라는 full name을 type하기 귀찮기 때문에 위와같이 선언하는게 일반적입니다. 요리도구를 가져왔으니 이제 손질할 재료를 불러와야겠지오. kaggle에서 유명한 dataset인 Titanic Data set을 다운받아서 진행해보겠습니다. data_raw = pd.read_csv('E:/Titanic/input/train.csv') ..
2019. 4. 5. 10:56