[데이터 마이닝] 모집단, 표본 및 표본 추출법, 모델링 작업
* 모집단 - 구성 요소의 총 집합(기록, 관측치 등) - 조사하기에는 너무 큰 수치 - 자주 데이터 수집 중에 변경되는 항목 * 표본 - 모집단의 부분 그룹 - 무작위 추출 시 전체 모집단을 대표한다. - 하지만 본질적으로 실무에서 일부 데이터 값에 편향된 값 * 무작위 표본 추출법(Random Sampling) • 단순 무작위 표본 추출법 (Simple Random Sampling) • 계통 표본 추출법 (Systematic Random Sampling) (N: 모집단 요소 수, k: 표본 추출 간격) 1에서 k 사이의 숫자를 랜덤하게 선택하여 표본 세트에 포함 또한 샘플 세트에 각 k번째 요소를 포함 Ex) 모집단: {1,2,3,…,100}, N=100, k=10, 선택된 숫자=3 표본: {3, 1..
2024. 3. 27.