[강의 요약]
[Part 08 통계. Ch 02. 기초통계_심화과정] 강의 수강
클립 1~2 수강
🐢 100일 챌린지 🔥 : [▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰░ ] 97/100일 (97%)
토요일은 본가에 당일치기로 왕복해야 해서 잠을 버티면서 강의 수강 후 정리함
3일만... 3일만 더
[가설검정과 유의수준 정의]
▶ 가설의 종류
가설검정에서는 두 가지 상반된 가설을 설정
- 귀무가설(Null hypothesis, H₀): 현재 상태나 기존의 주장을 나타내는 가설
- 대립가설(Alternative hypothesis, H₁): 우리가 입증하고자 하는 새로운 주장
▶ 검정 방식의 분류
검정 방식은 대립가설의 형태에 따라 구분
- 양쪽 꼬리 검정(Two-sided test) : 모수가 특정 값과 다른지 검정
- 왼쪽 꼬리 검정(One-sided test) : 모수가 특정 값보다 작은지 검정
- 오른쪽 꼬리 검정(One-sided test) : 모수가 특정 값보다 큰지 검정
▶ 유의수준과 오류
유의수준(α)은 귀무가설이 참일 때 이를 잘못 기각할 확률을 의미
일반적으로 0.05, 0.01, 0.001 등의 값을 사용
통계적 오류는 두 가지 유형이 있음
- 제1종 오류 : 참인 귀무가설을 기각하는 오류 (확률 = α)
- 제2종 오류 : 거짓인 귀무가설을 채택하는 오류 (확률 = β)
[단일 표본에 대한 가설검정]
단일 표본 검정은 하나의 표본을 통해 모집단의 모수에 대한 가설을 검정하는 방법
▶ 검정 절차
- 가설 설정
- H₀ : μ = μ₀ vs H₁: μ ≠ μ₀ (양쪽 꼬리)
- H₀ : μ = μ₀ vs H₁: μ > μ₀ (오른쪽 꼬리)
- H₀ : μ = μ₀ vs H₁: μ < μ₀ (왼쪽 꼬리)
- 검정통계량 계산
- 유의수준 α = 0.05, 검정통계량 Z = (X̄ - μ₀)/(σ/√n) ~ N(0,1)
- 임계값 결정
- 검정통계량 분포에서 Zα = 1.96 (양쪽 꼬리, α = 0.05)
- 결론 도출
- |Z| ≥ Z_{α/2} 이면 H₀ 기각
- Z ≥ Zα 이면 H₀ 기각
- Z ≤ -Zα 이면 H₀ 기각
▶ 실제 예시
모집단의 기댓값이 140이고 μ = 140인지 검정하는 경우
- 표본 수가 0.05에서 임계통계량을 구하면 : Z = (140-140)/12√100 = -1.3333
- Z = -1.3333 < 1.96이므로, 귀무가설을 기각하지 않음
- 즉, 귀무가설을 받아들이고 μ = 140이라고 결론
[두 개의 표본에 대한 가설검정]
두 개의 서로 다른 모집단에서 추출한 표본들을 비교하여 모집단의 모수 차이를 검정하는 방법
▶ 검정 절차
- 가설 설정
- H₀ : μ₁ = μ₂ vs H₁: μ₁ ≠ μ₂
- H₀ : μ₁ = μ₂ vs H₁: μ₁ > μ₂
- H₀ : μ₁ = μ₂ vs H₁: μ₁ < μ₂
- 검정통계량 계산
- 유의수준 α = 0.05, 검정통계량 Z = (X̄₁ - X̄₂)/√(σ₁²/n₁ + σ₂²/n₂) ~ N(0,1)
- 결론 도출
- a) |Z| ≥ Z_{α/2} 이면 H₀ 기각
- b) Z ≥ Zα 이면 H₀ 기각
- c) Z ≤ -Zα 이면 H₀ 기각
▶ 실제 예시
예시 1 : 양쪽 꼬리 검정
- 검정통계량 계산 결과 Z = -1.3333
- |Z| = 1.3333 < 1.96이므로 H₀를 기각하지 않음
예시 2 : 오른쪽 꼬리 검정
- 검정통계량 계산 결과 Z = 6.188527
- Z = 6.188527 > 1.96이므로 H₀를 기각
- H₀를 기각할 수 있다. 즉, 두 모집단의 평균에 대립가설을 받아들임
예시 3 : 왼쪽 꼬리 검정
- 검정통계량 계산 결과 Z = -2.7118
- Z = -2.7118 < -1.70113이므로 H₀를 기각
- H₀를 기각할 수 있다. 즉, 하나의 모집단 평균이 낮다고 결론
▶ 검정력과 표본크기
가설검정에서 중요한 것은 올바른 결론을 내리는 것
이를 위해서는 다음 3가지가 필요함
- 적절한 표본크기 : 충분한 검정력을 확보하기 위해 필요
- 유의수준 선택 : 제1종 오류와 제2종 오류의 균형을 고려
- 검정 방법 선택 : 데이터의 특성과 연구 목적에 맞는 검정법 사용
[시각화 자료로 실습]
https://claude.ai/public/artifacts/cd2d8b9b-82ac-4cee-ab08-ec8ba3c25c65
[나의 생각 정리]
가설검정은 통계적 추론의 핵심 도구라고 한다.
올바른 가설 설정, 적절한 검정통계량 선택, 그리고 결과의 해석이 무엇보다 중요하다.
[적용점]
과학적 연구와 의사결정에 광범위하게 활용
“이 글은 제로베이스 데이터 스쿨 주 3일반 강의 자료 일부를 발췌하여 작성되었습니다.”
'제로베이스 데이터 취업 파트타임 > 100일 챌린지_일일 학습 일지' 카테고리의 다른 글
제로베이스 데이터 파트타임 스쿨 학습 일지 [25.06.23] (2) | 2025.06.23 |
---|---|
제로베이스 데이터 파트타임 스쿨 학습 일지 [25.06.22] (0) | 2025.06.22 |
제로베이스 데이터 파트타임 스쿨 학습 일지 [25.06.20] (0) | 2025.06.20 |
제로베이스 데이터 파트타임 스쿨 학습 일지 [25.06.19] (1) | 2025.06.19 |
제로베이스 데이터 파트타임 스쿨 학습 일지 [25.06.18] (1) | 2025.06.18 |