2025년 5월 26일부터 6월 20일까지 약 4주간, BDA에서 함께 활동 중인 조원들과 빅데이터 분석기사 실기 대비 스터디를 진행하게 되었습니다.
한 번에 자격증을 취득할 수 있도록 체계적으로 준비하고 부족한 부분은 서로 도우며 최선을 다해 공부할 계획입니다.
이 블로그에는 주차별 스터디 내용을 정리하며 배운 점을 차근차근 기록해보려 합니다.
📘 스터디 교재
이번 스터디의 교재는 BDA와 영진닷컴에서 지원을 해주셔서 2025 이기적 빅데이터분석기사 실기 Python 도서로 진행하게 되었습니다.

📌 스터디 개요
- 주차: 3주차
- 날짜: 6월 9일 (월)
- 범위: Part 05 통계적 추정과 검정 ~ Part 06 선형 모형
📋 스터디 내용
'Part 05 통계적 추정과 검정'부터 'Part 06 선형 모형' 먼저 책을 한 번 정독한 후에 각 파트 별로 다른 방식으로 학습했습니다. Part 05의 내용은 개념을 정리하는 방향으로, Part 06의 내용은 연습문제와 답안을 익히는 방향으로 학습했습니다.
[Part 05 통계적 추정과 검정] 개념
SECTION 01. 통계적 추정과 가설 검정
01. 구간추정
- 모평균이나 모비율 등을 일정한 신뢰수준(예: 95%)으로 추정하는 방법
- 신뢰구간 = 점추정값 ± 오차 한계
02. 통계적 검정
- 가설(H₀: 귀무가설, H₁: 대립가설)을 세우고, 표본 데이터를 바탕으로 이를 기각할 수 있는지를 판단
- 유의수준(α)을 기준으로 판단
03. 검정통계량
- 가설 검정에서 사용하는 계산 값 (예: t값, z값 등)
- 검정통계량의 값과 임계값을 비교해 귀무가설 기각 여부 결정
SECTION 02. t-검정과 분산 비교
01. t-검정의 자료형
- t-검정은 보통 연속형 변수가 필요하며, 정규성을 가정
02. t-검정의 종류
- 단일표본 t-검정
- 독립표본 t-검정
- 대응표본 t-검정
03. 데이터 분석에서 t-검정 적용
- 두 그룹의 평균 차이를 비교할 때 사용 (예: A/B 테스트)
04. Python에서 t-검정 수행
- scipy.stats.ttest_ 시리즈 함수 사용
- ttest_ind(), ttest_rel() 등
05. t-검정 종류에 따른 검정 통계량
- 검정 방식에 따라 자유도 및 공식이 달라짐
06. 두 그룹의 분산이 같음을 체크하는 방법
- 등분산 검정: Levene test, F-test 등을 사용
SECTION 03. 데이터가 분포를 따르는지 확인하는 방법
01. 다섯 숫자 요약과 IQR
- 최소, 1사분위수, 중앙값, 3사분위수, 최대값
- 이상치 탐지 및 분포 형태 파악
02. Quantile-Quantile plot
- 실제 분포와 정규분포의 분위수를 비교해 시각적으로 정규성 검정
03. Shapiro-Wilk 검정
- 정규성을 검정하는 대표적인 통계 검정 방법
- p-value가 작으면 정규성을 따르지 않음
04. 앤더슨-달링(Anderson-Darling) 검정
- 다양한 분포(정규, 지수 등)에 대해 적합도 검정 가능
- 정규성뿐 아니라 분포 적합 여부도 평가
05. 카이제곱 검정
- 범주형 변수의 분포 적합성이나 독립성 검정에 사용
- 예: 관측값과 기대값 비교
SECTION 04. 분산 분석
01. 분산 분석(ANOVA, Analysis of Variance)
- 세 개 이상의 그룹 간 평균 차이를 검정
- 그룹 간 분산 vs 그룹 내 분산 비교
02. 일원 분산 분석(One-way ANOVA)
- 하나의 독립변수(범주형)에 따른 종속변수(연속형) 평균 차이 검정
03. 가정 체크와 사후 검정
- 정규성, 등분산성 등 가정이 충족되는지 확인
- 유의한 차이가 있을 경우 Tukey HSD 등의 사후 검정 진행
SECTION 05. 비모수 검정
01. 비모수 검정
- 정규성을 가정하지 않고 순위 기반으로 검정
- 데이터 분포가 자유롭거나 표본 수가 적을 때 사용
02. 비모수 분산 검정(Levene test)
- 집단 간 분산의 동일성(등분산성) 검정
- 정규분포 가정 없이도 사용 가능
03. 표본 부호 검정(Sign test)
- 두 관련된 표본의 중앙값 차이를 비교
- 데이터가 정규분포를 따르지 않을 때 대안으로 사용
[Part 06 통계적 추정과 검정] 연습문제







💬 느낀점
통계적 추정과 검정 파트는 개념과 용어의 양이 많고 서로 헷갈리는 부분이 많아 개인적으로 어려움을 느끼는 영역이었는데 이번 기회를 통해 핵심 개념들을 체계적으로 정리하며 제대로 공부할 수 있었던 것 같습니다. 아직은 코드 활용이 익숙하지 않은 부분도 있어 관련 함수와 검정 절차를 직접 구현해보며 복습할 필요성을 느꼈습니다. 선형 모형 파트는 이전에도 자주 접했던 내용이라 비교적 익숙했지만 이제는 설명 없이도 코드를 자연스럽게 작성할 수 있도록 반복 연습을 해두려 합니다.
'CERTIFICATE > 빅데이터분석기사' 카테고리의 다른 글
| [BDA x 영진닷컴] 빅분기 실기 스터디 후기(스터디, 교재, 시험) (5) | 2025.06.29 |
|---|---|
| [BDA x 영진닷컴] 빅분기 실기 스터디 4주차 (기출문제 9회, 8회, 7회, 6회, 5회 풀이) (5) | 2025.06.20 |
| [BDA x 영진닷컴] 빅분기 실기 스터디 2주차 (Part 03 머신러닝과 모델링 ~ Part 04 통계와 확률) (4) | 2025.06.08 |
| [BDA x 영진닷컴] 빅분기 실기 스터디 1주차 (PART 01 Python 기초와 데이터 구조 ~ Part 02 데이터 처리) (0) | 2025.06.08 |