Datascience(2)
-
Dataset 으로 무언가 시작하려고 할 때 반드시 체크 해야 되는 5가지
1. Check each column is a variable, and each row is an individual. - 각 열이 변수고, 각행이 개별 Data인지 여부 2. Look at the number of rows and columns in the dataset. - 열과 행이 총 얼마나 되는지 볼 것. 3. Check if there are missing values in any of the rows or columns - missing된 Data가 있는지 확인 할 것. 4. Check if any columns are of different data types than you would expect - 열의 Data가 예상된 Data Type과 같은지 다른지 확인 할 것. 5. Build ..
2019.09.25 -
pandas.DataFrame.reset_index 간단 사용법 1
보통 검색으로 우연히 keyword가 매칭되서 들어온 독자들이 대부분 이실 것으로 생각됩니다. 본론부터 들어가봅시다. 보통 Table 형식의 Data들은 아래와 같은 구조로 되어 있을 겁니다. 열 index 1 열 index 2 열 index 3 열 index 4 ..... *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** 일반적인 형태죠. 여기서 출발해봅시다. 여기서 한번 가정을 해보죠. 열 index 1이 핸드폰 브랜드를 나타낸다라고요. (삼성 or 애플) 그리고 열 index2 는 당일 판매 대수를 나타낸다고 합시다. 우리는 이제 해당 Data를 종합적으로 보고 싶을 것이고, 문득 궁금해졌습니다. 해당 DataSet에서 삼성 과 애플로 구분되..
2019.09.24