본문 바로가기
데이터마이닝

[데이터마이닝] 회귀 분석에 대하여

by LSB98 2024. 4. 19.
728x90
반응형

* 회귀분석

- 회귀(Regress)는 도로 돌아온다는 것을 뜻함

- 평균으로 회귀 :

예시) 평균적으로 자녀들은 부모의 키가 클수록 큰 키를 갖는 것을 볼 수 있었음

이는 부모와 자녀의 키 사이의 양의 상관관계를 기대할 수 있다는 것을 나타냄

-> 부모의 키가 클 경우 자녀의 키는 부모에 비해 작은 것

-> 부모의 키가 작을 경우 자녀의 키는 부모에 비해 큰 것

- 단일 입력변수일 경우 입력과 출력 간의 선형관계를 뜻함

𝑌𝑖 : 𝑖 번째 출렵 값,  𝛽0, 𝛽1: 회귀 계수; 𝑋𝑖 : 𝑖 번째 고정입력 값,  𝜖𝑖 : 𝑖 번째 출력 값에 대한 에러

 

회귀 분석 그래프

 

* 상관성에 대한 예측값

 

관련되어 예제 문제를 한번 풀어보겠습니다.

문제 : 다음은 월 수입과 이에 따르는 카드사용량에 대한 데이터이다. 아래의 데이터를 활용하여 월 수입과 카드 사용량 사이의 회귀식을 구하여라. 또한 월 수입이 250일 때 카드 사용량을 예측하여라

월 수입(X) 100 200 300 400 500
카드 사용량(Y) 30 57 76 140 197

 

1번) X의 평균과 Y의 평균을 구한다.

 

2번) B0와 B1의 회귀계수를 구한다.

 

3번) 표를 만들어서 상관계수 B0,B1을 구할 수 있도록 준비한다.

 

4번) B0,B1의 상관계수를 구한다.

 

5번) 회귀식에 대입한다.

 

이를 통해 우리는 선형 회귀그래프를 그릴 수가 있다!

표에 나오지 않는 월수입에도 카드사용량 예측이 가능하다.

 

* 선형 회귀 모델

X=예측변수, Y=종속변수

 

행렬로 표현시에는 다음과 같다.

 

예시) 집에 대한 시장 가격

𝑿1,𝑿2, … , 𝑿𝑟 는 𝑟 = 4 개의 예측변수로서 종속변수 𝒚와 관련이 있다고 함

𝒚: 주택 시가 𝑿1: 거실 평방 피트 𝑿2: 지역 (도시 구역 지표) 𝑿3: 작년 감정 평가 가격 𝑿4: 건축 품질 (평방 피트 당 가격)

 

* 에러항에 대한 가정

728x90
반응형