3. Linear Regression
- 본 장에서는 지도 학습을 위한 간단한 접근 방식인 선형 회귀에 대한 방식을 설명한다.
- 통계 컨설턴트로써 데이터를 기반하여 계획을 제안할 때 선형 회귀를 사용하면 답할 수 있는 질문이다.
3.1 Simple Linear Regression
- 단순 선형 회귀는 단일 예측 변수 X를 기반으로 Y를 예측하는 간단한 접근 방식이다.
- 이는 X와 Y사이에 선형 관계가 있다고 가정했을 때 수학적으로 아래와 같은 식으로 나타낼 수 있다.
$$
Y\approx β_0+β_1X.
$$
- 식에서 $\approx$ 해당 기호는 대략적으로 오른쪽과 같이 모델링 됨을 뜻한다.
$$
sales \approx β_0 + β_1 × TV.
$$
- 위의 식에서 $β_0$과 $β_1$은 선형 모델에서 절편과 기울기를 나타내는 미지의 상수이다. 또한 각각의 모델 계수 및 매계 변수를 뜻하기도 한다.
- 따라서, 해당 매개변수를 데이터에 기반하여 추정하게 되면 TV광고의 특정 값을 통해 미래의 판매액 예측이 가능하다.
$$
\hat{y} = \hat{β_0}+\hat{β_1}x,
$$
- $\hat{y}$는 $X = x$에 기반하여 $Y$의 예측을 나타낸다. 여기서$\quad\hat{}\quad$는 미지의 매개변수 또는 계수에 대한 추정값을 나타내거나 예측값을 나타낸다.