728x90
95% Confidence Interval, 99% Confidence Interval 예제
포스트 난이도: HOO_Junior
# Confidence Interval
Confidence Interval은 한국말로 신뢰 구간이라고 부르며 데이터를 분석하는 데 사용되는 통계학적 표현이다. Confidence interval를 사용하는 이유는 모든 데이터를 분석하고 결과를 산출해내기가 어렵기 때문이다. 물론 모든 데이터를 분석하여 결과를 산출하면 100% 정확한 값을 얻을 수 있겠지만 현실적으로 수많은 데이터를 모두 분석하여 처리하는 데에는 어려움이 있다.
따라서 일부 Sample 데이터를 통해서 전체 데이터를 분석한 것과 같은 결과를 산출해낼 수 있도록 Confidnece Interval를 사용한다. 우리는 이것을 모수가 실제로 포함될 것으로 예측되는 범위를 찾는다고 말한다.
# 95% Confidence Interval
95% 기준으로 Confidence interval를 설정하고 Lower limit과 Upper limit를 구하는 코드는 아래와 같다.
import numpy as np
import scipy.stats as st
# Sample data
data = [12, 12, 13, 13, 15, 16, 17, 17, 22, 25, 26, 27, 28, 28, 28]
# 95% confidence interval
st.t.interval(alpha=0.95, df=len(data)-1, loc=np.mean(data), scale=st.sem(data))
# 99% Confidence Interval
99% 기준으로 Confidence interval를 설정하고 Lower limit과 Upper limit를 구하는 코드는 아래와 같다.
import numpy as np
import scipy.stats as st
# Sample data
data = [12, 12, 13, 13, 15, 16, 17, 17, 22, 25, 26, 27, 28, 28, 28]
# 99% confidence interval
st.t.interval(alpha=0.99, df=len(data)-1, loc=np.mean(data), scale=st.sem(data))
728x90
댓글