STATISTICS

STATISTICS

[STATISTICS] 2장 모집단과 표본추출

목차 1. 모집단과 표본, 전수조사와 표본조사 2. 표본추출에서 나타나는 편향의 종류 3. 인지적 편향의 종류(확증 편향, 기준점 편향, 선택 지원 편향, 분모 편향, 생존자 편향) 4. 머신러닝 모델 측면의 편향과 분산 5. 표본 편향을 최소화하기 위한 표본 추출 방법 1. 모집단과 표본, 전수조사와 표본조사 통계 분석에서 분석하고자 하는 대상의 전체 집합을 모집단이라고 한다. 그리고 모집단의 부분집합, 즉 모집단의 일부를 추출한 것을 표본이라고 한다. 모집단의 자료 전체를 조사 및 분석하여 정보를 추출하는 것을 전수조사라고 하며, 모집단에서 추출한 표본을 통해 모집단의 정보(평균, 표준편차 등)를 추정하고 검정하는 것을 표본조사라고 한다. 1장에서 다룬 기술 통계, 추론 통계와 연관이 깊은 개념이다...

STATISTICS

[STATISTICS] 1장 통계학 이해하기

목차 1. 머신러닝과 전통 통계학의 차이 2. 기술 통계와 추론 통계 1. 머신러닝과 전통 통계학의 차이 머신러닝의 기본은 통계학으로 이루어졌지만 머신러닝과 전통 통계학은 분명한 차이가 있다. 머신러닝은 예측력이 얼마나 높은가에 집중한다. 그렇기 때문에 분석 모형의 복잡성이 높으며, 고질적인 문제인 과적합 해결에 집중한다. 데이터 과학의 분야는 통계학, 머신러닝, AI 등의 영역이 미묘하게 뒤섞여 있다. 전통적 통계학과 머신러닝 교집합의 관계를 가지고 있다. 머신러닝은 통계학의 일부 특성을 활용한 응용과학 분야이다. 그림 1.1 은 SAS institute에서 정의한 데이터 과학 분야의 영역 다이어그램이다. 통계학은 각 변수의 영향력에 대한 해석과 모집단에서 추출한 샘플의 가정과 통계적 적합성에 집중한다..

clm_bonny
'STATISTICS' 카테고리의 글 목록