데이터 과학(4)
-
Supervised Learning(지도학습) 에 대해.. [간단 짧음 주의]
요즘 미래의 먹거리로 주목받고 있는 Machine learning은 크게 나누면 아래와 같이 3가지로 나눌수 있다. 1. Supervised Learning 2. Unsupervised Learning 3. Reinforcement Learning Supervised Learning에 대해서 먼저 이야기 해보자. 우리의 알고리즘은 라벨링된 데이터를 통해서 학습한다. 쉽게 이야기하면 요리재료와 완성된 요리의 맛정보를 토대로 계속 요리를 만들어보면서 학습을 하는거라고 볼수 있다. 학습이 끝나면 요리 재료만 봐도 무슨맛이 나올지 미리 예측을 할수 있게 될 것이다. 이러한 미래 예측은 이후 이어지는 선행적인 액션을 통해 가치를 만들어낼수 있겠다. 요약하면 Supervised = using Labeled Data..
2019.07.11 -
[통계] Box Plot은 처음이지?
Box Plot을 한번쯤 본사람은 있어도 해당 표식 하나하나가 어떠한 의미인지 알고 있는 사람들은 드물 것 같다. * Box & whisker plot이라고도함 전공자나 해당없게 종사자는 당연히 알것 같고.. 불특정 다수가 블로그에 들어온다는 가정하에 여기에 몇가지 필자가 이해한 설명을 추가해서 남기려고 한다. (출처 : OpenIntro Statistics, 3판 35p.) first Quartile : 25 %의 data가 해당 표시 아래에 있다는 의미이다. third quartile : 75%의 data가 해당 표시 아래에 있다는 의미.. median : 중간값. Box안은 25~75% 비율 사이의 data가 위치한다는 이야기이다. 이 사이간격이 중요해서 IQR이라고 일컷는다. (intel quar..
2019.04.16 -
[numpy #2] numpy의 기초에 대해서 알아보자!
필자는 Tutorial이라는 영어표현을 굉장히 즐겨쓰고 검색엔진에서 활용하는 편이다. (짧은 말끝 포스팅 첫시도..) 역시 오늘도 base를 쌓기 위해서 검색엔진을 활용해서 파이썬 사용시 핵심 라이브러리 중 하나인 numpy의 기초를 포스팅을 해보고자 한다. 1. numpy라는게 대체 머길래.. - 파이썬의 라이브러리 이다. - 파이썬에 LIST라는 자료형도 있으나 for문을 사용해야하는 등 효율적인 행렬 data 연산이 불가함. - numpy는 가능하다. Matlab 느낌이라고 보면 되겠다. 2. 그 좋다는 numpy 한번 수입?? 해보자 In [1]: import numpy In [2]: import numpy as np 첫번째 줄과 같이 직접 call하게 되면 우리는 numpy라는 full name..
2019.04.04 -
[numpy #1] "numpy.newaxis"는 무엇이고 언제사용하는가
필자의 소개는 다음으로 미루고 오후쯤인가 scikit learn이라는 machine learning library의 tutorial을 막 보기시작하다가 저도 궁금해서 찾아봤던 내용에 대해서 남겨볼까 합니다. 아주 잘 정리되어 있는 medium 블로그가 때마침 있기도 하니 겸사겸사.. (영어공부가 목적은 아닙니다.) 아마 이 글을 읽게 될 독자분들도 저와 비슷한 궁금증으로 유입되셨으리라 보고.. 본론으로 들어가지요. numpy라는 유명 라이브러리의 newaxis 요 표현은 무엇이냐? 간단히 이야기 해서 존재하는 numpy array의 차원을 늘려준다 보시면 되겠습니다. * 1D 는 2D가 되고 2D는 3D가 되고 3D는 4D .. 사실 간단한 Role이지만 여러가지 상황에서 적재적소 사용되더군요.. 3가지..
2019.04.02