제로베이스 데이터 파트타임 스쿨 학습 일지 [25.06.21]

[강의 요약]

[Part 08 통계. Ch 02. 기초통계_심화과정] 강의 수강

클립 1~2 수강

🐢 100일 챌린지 🔥 : [▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰▰░              ] 97/100일 (97%)

토요일은 본가에 당일치기로 왕복해야 해서 잠을 버티면서 강의 수강 후 정리함

3일만... 3일만 더

 

 

 

[가설검정과 유의수준 정의]

▶ 가설의 종류

가설검정에서는 두 가지 상반된 가설을 설정

  • 귀무가설(Null hypothesis, H₀): 현재 상태나 기존의 주장을 나타내는 가설
  • 대립가설(Alternative hypothesis, H₁): 우리가 입증하고자 하는 새로운 주장

 

 

▶ 검정 방식의 분류

검정 방식은 대립가설의 형태에 따라 구분

  1. 양쪽 꼬리 검정(Two-sided test) : 모수가 특정 값과 다른지 검정
  2. 왼쪽 꼬리 검정(One-sided test) : 모수가 특정 값보다 작은지 검정
  3. 오른쪽 꼬리 검정(One-sided test) : 모수가 특정 값보다 큰지 검정

 

 

▶ 유의수준과 오류

유의수준(α)은 귀무가설이 참일 때 이를 잘못 기각할 확률을 의미

일반적으로 0.05, 0.01, 0.001 등의 값을 사용

 

통계적 오류는 두 가지 유형이 있음

  • 제1종 오류 : 참인 귀무가설을 기각하는 오류 (확률 = α)
  • 제2종 오류 : 거짓인 귀무가설을 채택하는 오류 (확률 = β)

 

 

 

[단일 표본에 대한 가설검정]

단일 표본 검정은 하나의 표본을 통해 모집단의 모수에 대한 가설을 검정하는 방법

▶ 검정 절차

  • 가설 설정
    • H₀ : μ = μ₀ vs H₁: μ ≠ μ₀ (양쪽 꼬리)
    • H₀ : μ = μ₀ vs H₁: μ > μ₀ (오른쪽 꼬리)
    • H₀ : μ = μ₀ vs H₁: μ < μ₀ (왼쪽 꼬리)
  • 검정통계량 계산
    • 유의수준 α = 0.05, 검정통계량 Z = (X̄ - μ₀)/(σ/√n) ~ N(0,1)
  • 임계값 결정
    • 검정통계량 분포에서 Zα = 1.96 (양쪽 꼬리, α = 0.05)
  • 결론 도출
    • |Z| ≥ Z_{α/2} 이면 H₀ 기각
    • Z ≥ Zα 이면 H₀ 기각
    • Z ≤ -Zα 이면 H₀ 기각

 

 

▶ 실제 예시

모집단의 기댓값이 140이고 μ = 140인지 검정하는 경우

  • 표본 수가 0.05에서 임계통계량을 구하면 : Z = (140-140)/12√100 = -1.3333
  • Z = -1.3333 < 1.96이므로, 귀무가설을 기각하지 않음
  • 즉, 귀무가설을 받아들이고 μ = 140이라고 결론

 

 

 

[두 개의 표본에 대한 가설검정]

두 개의 서로 다른 모집단에서 추출한 표본들을 비교하여 모집단의 모수 차이를 검정하는 방법

▶ 검정 절차

  1. 가설 설정
    • H₀ : μ₁ = μ₂ vs H₁: μ₁ ≠ μ₂
    • H₀ : μ₁ = μ₂ vs H₁: μ₁ > μ₂
    • H₀ : μ₁ = μ₂ vs H₁: μ₁ < μ₂
  2. 검정통계량 계산
    • 유의수준 α = 0.05, 검정통계량 Z = (X̄₁ - X̄₂)/√(σ₁²/n₁ + σ₂²/n₂) ~ N(0,1)
  3. 결론 도출
    • a) |Z| ≥ Z_{α/2} 이면 H₀ 기각
    • b) Z ≥ Zα 이면 H₀ 기각
    • c) Z ≤ -Zα 이면 H₀ 기각

 

 

 

▶ 실제 예시

예시 1 : 양쪽 꼬리 검정

  • 검정통계량 계산 결과 Z = -1.3333
  • |Z| = 1.3333 < 1.96이므로 H₀를 기각하지 않음

예시 2 : 오른쪽 꼬리 검정

  • 검정통계량 계산 결과 Z = 6.188527
  • Z = 6.188527 > 1.96이므로 H₀를 기각
  • H₀를 기각할 수 있다. 즉, 두 모집단의 평균에 대립가설을 받아들임

예시 3 : 왼쪽 꼬리 검정

  • 검정통계량 계산 결과 Z = -2.7118
  • Z = -2.7118 < -1.70113이므로 H₀를 기각
  • H₀를 기각할 수 있다. 즉, 하나의 모집단 평균이 낮다고 결론

 

 

▶ 검정력과 표본크기

가설검정에서 중요한 것은 올바른 결론을 내리는 것

이를 위해서는 다음 3가지가 필요함

  • 적절한 표본크기 : 충분한 검정력을 확보하기 위해 필요
  • 유의수준 선택 : 제1종 오류와 제2종 오류의 균형을 고려
  • 검정 방법 선택 : 데이터의 특성과 연구 목적에 맞는 검정법 사용

 

 

 

[시각화 자료로 실습]

https://claude.ai/public/artifacts/cd2d8b9b-82ac-4cee-ab08-ec8ba3c25c65

 

 

 

 

[나의 생각 정리]

가설검정은 통계적 추론의 핵심 도구라고 한다.

올바른 가설 설정, 적절한 검정통계량 선택, 그리고 결과의 해석이 무엇보다 중요하다.

 

 

 

[적용점]

과학적 연구와 의사결정에 광범위하게 활용

 

 

 

“이 글은 제로베이스 데이터 스쿨 주 3일반 강의 자료 일부를 발췌하여 작성되었습니다.”