* 회귀분석
- 회귀(Regress)는 도로 돌아온다는 것을 뜻함
- 평균으로 회귀 :
예시) 평균적으로 자녀들은 부모의 키가 클수록 큰 키를 갖는 것을 볼 수 있었음
이는 부모와 자녀의 키 사이의 양의 상관관계를 기대할 수 있다는 것을 나타냄
-> 부모의 키가 클 경우 자녀의 키는 부모에 비해 작은 것
-> 부모의 키가 작을 경우 자녀의 키는 부모에 비해 큰 것
- 단일 입력변수일 경우 입력과 출력 간의 선형관계를 뜻함
* 상관성에 대한 예측값
관련되어 예제 문제를 한번 풀어보겠습니다.
문제 : 다음은 월 수입과 이에 따르는 카드사용량에 대한 데이터이다. 아래의 데이터를 활용하여 월 수입과 카드 사용량 사이의 회귀식을 구하여라. 또한 월 수입이 250일 때 카드 사용량을 예측하여라
월 수입(X) | 100 | 200 | 300 | 400 | 500 |
카드 사용량(Y) | 30 | 57 | 76 | 140 | 197 |
1번) X의 평균과 Y의 평균을 구한다.
2번) B0와 B1의 회귀계수를 구한다.
3번) 표를 만들어서 상관계수 B0,B1을 구할 수 있도록 준비한다.
4번) B0,B1의 상관계수를 구한다.
5번) 회귀식에 대입한다.
이를 통해 우리는 선형 회귀그래프를 그릴 수가 있다!
* 선형 회귀 모델
행렬로 표현시에는 다음과 같다.
예시) 집에 대한 시장 가격
𝑿1,𝑿2, … , 𝑿𝑟 는 𝑟 = 4 개의 예측변수로서 종속변수 𝒚와 관련이 있다고 함
𝒚: 주택 시가 𝑿1: 거실 평방 피트 𝑿2: 지역 (도시 구역 지표) 𝑿3: 작년 감정 평가 가격 𝑿4: 건축 품질 (평방 피트 당 가격)
* 에러항에 대한 가정
'데이터마이닝' 카테고리의 다른 글
[데이터마이닝] 회귀 모델 적합도 측정 (0) | 2024.04.22 |
---|---|
[데이터마이닝] 최소 제곱 추정 구하기 (+행렬 포함) (1) | 2024.04.20 |
[데이터마이닝] 가설 검정과 상관 관계에 대하여 (0) | 2024.04.19 |
[데이터 마이닝] 피어슨(pearson) 상관 분석에 대하여 1_상관행렬 구하기 (0) | 2024.03.28 |
[데이터 마이닝] 모집단, 표본 및 표본 추출법, 모델링 작업 (1) | 2024.03.27 |