머신러닝, Cost function에 대하여

2022. 12. 27. 10:42카테고리 없음

1 2 m i = 1 m ( y ( i ) - y ( i ) ) 2

 

 

m은 training set에 있는 총 샘플 갯수를 뜻합니다.

i=1은 첫번째 샘플부터 센다는 뜻입니다.

sigma는 sigma 오른쪽에 있는 값을 모두 합친다는 뜻입니다.

ŷ은 우리가 만들게될 ML function이 우리에게 줄 결과값(예측값)을 뜻합니다.

 

ŷ에서 실제 y값을 빼면 실제 '정답'과 예측 값 간의 간격을 계산하게 됩니다.

각 샘플에 대해 제곱한 값들을 전부 합치면 비용이 나오게 됩니다.

 

여기까지만 보면 샘플수가 많아질 수록 합이 커지니 비용을 계산할 수가 없어집니다.

따라서 앞에 m으로 나누게 됩니다.

 

마지막으로 전체 값을 2로 나누게 되는데요, 더 '깔끔한 숫자'를 위해서 나누는 것입니다. 물론 2로 나누지 않아도 기능은 작동합니다.

 

제곱을 해서 비용을 계산하기에 이 Cost funciton은 Squarred error cost function이라고도 불립니다.

 

 

이상으로 ML에 있어서 Cost function이 어떻게 표현되는지 알아보았습니다.