An Overview of Classification

데이터는 정량적, 정성적으로 나뉜다. 이는 수치형과 범주형이라고도 하며 양적 질적이라고도 한다.

대체로 타겟 변수가 정량적일 때는 회귀 문제로 정성적일 때는 분류 문제로 해결을 진행한다.

분류 : 관측치에 대한 질적(범주형) 반응 변수를 예측하는 것

Untitled

Why Not Linear Regression?

반응 변수가 정성적인 경우 선형회귀가 적절하지 않은 이유에 대해 알아본다. 환자의 증상을 근거로 읍글실에 와 있는 환자의 의료 상태를 예측해본다. 타겟 변수로는 뇌졸증, 약물 과다, 간질성 발작 이다. 이를 순서를 가지는 변수로 변환해본다.