machine learning(6)
-
One Hot Encoding 과 Label Encoding 을 비교해보자
One-Hot Encoding이란 무엇인가. 언제 우리는 Label Encoding 대신 One-Hot Encoding을 써야하는가? 데이터 과학에 일반적인 인터뷰 질문이며, 데이터 과학자는 반드시 알아야 하는 내용이다. 결론적으로 당신은 이 두가지중에 하나를 데이터 과제에 써야하는 선택의 기로에 서게 될 것이기 때문이다. 머신은 숫자를 이해하지 텍스트를 이해하진 못한다. 우리는 텍스트로 이루어진 개별 Category를 머신이 알아먹고 수학적인 식을 통해서 연산 할수 있도록 변환 해줘야 하는 것 이라고 이해하면 빠르겠다. 그렇다면 어떻게 이걸 할수 있고, 방법은 어떻게 다른지 보도록 하자!!~ Label Encoding과 One-Hot Encoding이 그림속에 있는 걸 알수 있다. 이번 포스트에서는 이..
2020.09.03 -
Epoch 과 Batch Size , Iterations 는 머냐?
dEpoch과 Batch Size, Iterations 의 개별 의미와 차이점을 알아보쟈. 일단 어디서 들어봤을 것이다. 일단 이런 용어들은 Machine Learning 용어들인데 일단 Machine Learning에서 가장 기본이 되는 Gradient Descent 알고리즘을 간략히 요약 해보자. Gradient Descent Machine learning에서 쓰이는 반복 학습방법이다. Gradient 기울기 / Descent 는 내림차순? 정도의 의미로 이해한다면 우리는 단순히 기울기 하강법과 같은 촌스러운 한국판 번역 이름을 만들어 낼수 있음과 동시에 직관적인 이해를 할수있을 것이다. 그리고 왜 반복학습이냐.. 머리나쁜 학생도 오랜 수련으로 스승을 뛰어넘을수 있듯이 반복적으로 정답에 근접하는 과정..
2020.04.05 -
당신이 만든 머신러닝 모델 괜찮은지 성능을 알고 싶나? 1편
Regression vs Classification에 대해서 잠깐 언급하고 가겠습니다. Regression은 예상 수치값을 알려주고 실제값과 얼마나 차이가 나느냐로 이야기 될수 있겠네요. Classification은 예상 상태를 알려주고 실제상태와 같냐 다르냐로 이야기 할수 있겠구요. 네. 한문장으로 보면 이러한 차이가 있습니다. 이제 우리가 Model을 만들었다고 했을때 Model이 좋다고 어떻게 표현 할수 있을까요? 이건 중요한 부분이 되겠네요. 아마도 의미있게 Model을 돌려보고 그 결과값을 평가할 겁니다. 하지만 학습시킨 Data만을 가지고 볼수는 없을겁니다. 예를 들면 아래와 같이 Data를 Regression한 2개의 예시입니다. 첫번째 그림과 두번째 그림.. 어떤 쪽이 더 값을 정확하게 예..
2019.09.04 -
Supervised Learning(지도학습) 에 대해.. [간단 짧음 주의]
요즘 미래의 먹거리로 주목받고 있는 Machine learning은 크게 나누면 아래와 같이 3가지로 나눌수 있다. 1. Supervised Learning 2. Unsupervised Learning 3. Reinforcement Learning Supervised Learning에 대해서 먼저 이야기 해보자. 우리의 알고리즘은 라벨링된 데이터를 통해서 학습한다. 쉽게 이야기하면 요리재료와 완성된 요리의 맛정보를 토대로 계속 요리를 만들어보면서 학습을 하는거라고 볼수 있다. 학습이 끝나면 요리 재료만 봐도 무슨맛이 나올지 미리 예측을 할수 있게 될 것이다. 이러한 미래 예측은 이후 이어지는 선행적인 액션을 통해 가치를 만들어낼수 있겠다. 요약하면 Supervised = using Labeled Data..
2019.07.11 -
[numpy #5] 열벡터를 만들어 봅시다. Making column vector
고등학교때 벡터를 접하거나, 혹은 대학에서 벡터를 접해보신 분들이 절반은 되실거라고 봅니다. 내적이라고 불리는 dot 연산(inner product)를 할때 조건이 있죠. 이런 조건때문에 우리는 벡터나 행렬을 전치해야될 경우가 간혹 선형대수학을 이용할때 생기곤 합니다. Because above condition for dot product, when we use linear algebra, we have to using transpose the vector or metrix. 그럼 간단하기 numpy를 이용한 전치방법을 알아보도록 하겠습니다. print(arr_num) > arr([1, 2, 3, 4]) print(arr_num.T) > arr([1, 2, 3, 4]) print(arr_num[:, No..
2019.06.05 -
[numpy #2] numpy의 기초에 대해서 알아보자!
필자는 Tutorial이라는 영어표현을 굉장히 즐겨쓰고 검색엔진에서 활용하는 편이다. (짧은 말끝 포스팅 첫시도..) 역시 오늘도 base를 쌓기 위해서 검색엔진을 활용해서 파이썬 사용시 핵심 라이브러리 중 하나인 numpy의 기초를 포스팅을 해보고자 한다. 1. numpy라는게 대체 머길래.. - 파이썬의 라이브러리 이다. - 파이썬에 LIST라는 자료형도 있으나 for문을 사용해야하는 등 효율적인 행렬 data 연산이 불가함. - numpy는 가능하다. Matlab 느낌이라고 보면 되겠다. 2. 그 좋다는 numpy 한번 수입?? 해보자 In [1]: import numpy In [2]: import numpy as np 첫번째 줄과 같이 직접 call하게 되면 우리는 numpy라는 full name..
2019.04.04