Parametric models: Linear model
포스트 난이도: HOO_Senior
# Parametric models: Linear model
Parametric models(매개변수 모델)에서 Linear model(선형 모델)은 대표적이면서도 중요한 모델에 해당된다. 매개변수 모델을 배우는 데 있어서 가장 우선적으로 배우는 모델임에 동시에 비교 분석에서 가장 많이 사용되는 모델이기도 하다. 선형 모델을 식으로 표현하면 아래와 같이 표현이 가능하다.
여기서 베타가 의미하는 바가 바로 매개변수이다. 매개변수라고 해서 어색할 수는 있지만 파라미터(Parameters)를 의미한다. 파라미터는 p+1로 선형 모델에 나타내지며, 우리는 파라미터를 예측할 수가 있다. 파라미터를 예측하기 위해서는 주어진 모델에 데이터를 넣어서 훈련을 시켜주면 된다.
또한 앞서서 말했듯이 선형 모델이 비교 분석에 가장 많이 사용된다고 했는데 그 이유는 실질적인 값을 찾는데 도움이 되기 때문이다. 다른 말로 하면 선형 모델은 대부분 실제 데이터 분석에서 적합한 모델이 아니라는 것이다. 틀린 답이란 걸 알면서도 선형 모델을 사용하는 이유는 틀린 답을 토대로 정답을 유추해 낼 수 있기 때문이다. SML에서 하는 데이터 분석은 정답을 모를뿐더러 틀린 답마저도 모르는 경우가 허다하다. 그렇기에 처음부터 데이터 분석을 통해 원하는 값을 산출해 낼 수 없고 어떻게 해야 할지 모르기에 우리는 틀린 답이라도 결과를 산출해 내서 원하는 값을 추정해 나가는 것이다. 이때 비교 분석에 많이 사용되는 모델이 가장 기본적인 모델 중 하나인 선형 모델인 셈이다.
# Interpret
예측을 하는데 있어서 Accuracy와 Interpretability가 비교되는데 Linear models 같은 경우에는 interpret가 쉬운 편이다. 하지만 Thin-plate splines가 들어가게 된다면 복잡해짐에 따라 interpret가 쉽지 않다.
댓글