표준 편차 표준 오차 | 표준오차가 뭔가요? 표준편차랑 다른건가요? 55 개의 가장 정확한 답변

당신은 주제를 찾고 있습니까 “표준 편차 표준 오차 – 표준오차가 뭔가요? 표준편차랑 다른건가요?“? 다음 카테고리의 웹사이트 th.taphoamini.com 에서 귀하의 모든 질문에 답변해 드립니다: th.taphoamini.com/wiki. 바로 아래에서 답을 찾을 수 있습니다. 작성자 통계의 본질 EOStatistics 이(가) 작성한 기사에는 조회수 18,780회 및 좋아요 348개 개의 좋아요가 있습니다.

표준 편차 표준 오차 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 표준오차가 뭔가요? 표준편차랑 다른건가요? – 표준 편차 표준 오차 주제에 대한 세부정보를 참조하세요

강의록 링크
https://hsm-edu.tistory.com/794
표본평균의 평균이 모평균인 이유
(https://www.youtube.com/watch?v=Je62uPML0L0)
표본평균의 분산이 모분산/n인 이유 (https://www.youtube.com/watch?v=WfiRjHATlrg)
#통계강의 #통계

표준 편차 표준 오차 주제에 대한 자세한 내용은 여기를 참조하세요.

표준오차가 뭔가요? 표준편차랑 다른건가요?

표준오차는 ‘추정값인 표본평균들과 참값인 모평균과의 표준적인 차이’ 정도로 이해할 수 있습니다. 수식에서 n이 커지면 표준오차가 줄어듭니다. 실제로 …

+ 여기에 표시

Source: hsm-edu.tistory.com

Date Published: 1/18/2021

View: 1617

표준 편차와 표준 오차의 차이점 – 네이버블로그 – NAVER

표준오차는 여러개 뽑히는 표본평균들의 편차를 뜻합니다. 표본집단만 놓고 본다면 표준편차는 ‘특정한 표본집단 내의 편차’이고.

+ 여기를 클릭

Source: blog.naver.com

Date Published: 6/21/2021

View: 6581

#8 표준편차와 표준오차 – SLOG

표준편차(standard deviation)와 표준오차(standard error)에 대해 확실하게 … 표본분산과 표본표준편차의 식은 다음과 같이 정의할 수 있습니다:.

+ 여기에 표시

Source: be-favorite.tistory.com

Date Published: 8/8/2021

View: 4260

표본과 표준 오차의 의미 – 공돌이의 수학정리노트

표준 오차란 “표본 통계량의 표준 편차”를 의미하는 말이다. (글을 잘 읽어봐야 한다. 말이 꼬인다.) 앞서 말했듯 표본이 매번 추출될 때 마다 값이 …

+ 여기에 보기

Source: angeloyeo.github.io

Date Published: 7/11/2021

View: 8475

(통계 용어) 표준 편차 vs 표준오차 – Easy Statistics !

그 차이점에 대해 이야기해보겠습니다. 표준편차 (SD, Standard Deviation). 자료가 평균으로부터 얼마나 퍼져있는지 나타내는 지표. 아래의 그림에서 …

+ 더 읽기

Source: laoonlee.tistory.com

Date Published: 10/6/2021

View: 7781

표준 편차와 표준 오차 – Elliot – Tistory

표준오차 (SE, Standard Error) · 1. 표준오차는 표본평균의 표준편차다. (그러므로 기준이 되는 모 표준편차를 알고 있어야한다.) · 2. 표준오차는 모집단 …

+ 자세한 내용은 여기를 클릭하십시오

Source: puzzle-puzzle.tistory.com

Date Published: 8/20/2022

View: 3529

표준오차 Standard Error – datadata.link

오차(error)는 관측한 값과 기대값(예를 들면 표본일 경우 모집단의 값)과의 편차입니다. 그래서 양수와 음수를 모두 가집니다.

+ 더 읽기

Source: www.datadata.link

Date Published: 7/1/2021

View: 8454

표준 오차 개념과 공식, 그리고 계산 방법 – ilovemyage

표준 오차 SEM(Standard Error of Mean)은 측정값의 정확도 범위를 표현하기 위해 사용됩니다. 표준 오차는 표본 평균에 대한 표준 편차로서 일반적 …

+ 여기에 더 보기

Source: ballpen.blog

Date Published: 7/7/2022

View: 2212

표준편차 – 나무위키

표준편차의 경우 후술될 표준오차(stand error)와 함께 통계학 공부에서 제일 먼저 접하게 되는 개념이다. 특히, 표준편차는 서술되는 방식에 따라 그 …

+ 여기에 자세히 보기

Source: namu.wiki

Date Published: 7/13/2022

View: 5320

주제와 관련된 이미지 표준 편차 표준 오차

주제와 관련된 더 많은 사진을 참조하십시오 표준오차가 뭔가요? 표준편차랑 다른건가요?. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

표준오차가 뭔가요? 표준편차랑 다른건가요?
표준오차가 뭔가요? 표준편차랑 다른건가요?

주제에 대한 기사 평가 표준 편차 표준 오차

  • Author: 통계의 본질 EOStatistics
  • Views: 조회수 18,780회
  • Likes: 좋아요 348개
  • Date Published: 2019. 10. 29.
  • Video Url link: https://www.youtube.com/watch?v=TrIXkIHSqq4

표준오차가 뭔가요? 표준편차랑 다른건가요?

반응형

모집단이 있습니다. 모집단의 평균을 $\mu$(뮤), 표준편차를 $\sigma$ (시그마)라고 합시다.

모집단의 평균이 궁금한데 모집단이 너무 커서 구할 수가 없었습니다. 모집단의 평균을 추정하기 위해 모집단에서 크기가 n인 표본을 추출했습니다. 이 표본을 표본1이라고 합시다. 표본 1의 평균을 구했고 $\bar{X}_{1}$ 이라고 놓겠습니다.

이렇게 표본을 계속 뽑았습니다. 표본 평균들이 많이 구해지겠죠.

이 표본평균에는 아래와 같은 성질이 성립합니다.

$E\left [ \bar{X} \right ]$

$V\left [ \bar{X} \right ]=\frac{\sigma^2}{n}$

표본 평균의 평균이 모평균과 같다는 것과, 표본 평균의 분산이 모분산을 n으로 나눈 것과 같다는 성질입니다. 이유가 궁금하신 분들은 아래 링크에 유도과정이 있습니다.

표본평균의 평균이 모평균과 같은 이유 → https://hsm-edu.tistory.com/14

표본평균의 분산이 모분산과 같은 이유 → https://hsm-edu.tistory.com/16

이때 표본평균의 표준편차를 ‘표준오차’라고 합니다.

$\sigma \left [ \bar{X} \right ]=standard \ error=\frac{\sigma}{\sqrt{n}}$

왜 표준오차라는 말이 붙었을까요. 수식의 의미를 이해하면 왜 표준오차인지를 알 수 있습니다.

표본평균의 표준편차 아래와 같이 구합니다.

$\sigma \left [ \bar{X} \right ]=\sqrt{E\left [ \left ( \bar{X}-\mu \right )^2 \right ]}$

표준편차는 편차의 제곱의 평균에 루트를 씌운 값입니다. 편차는 변량에서 평균을 뺀 값입니다.

편차 = 변량-평균

표준편차는 변량들이 평균에서 얼마나 떨어져 있는지를 나타내주는 값입니다. 표본평균의 표준편차를 구하는 상황에서 변량은 표본평균입니다. 표본평균은 모평균에 대한 추정값입니다. 이때 모평균을 참값이라고 부릅니다. 따라서 (변량-평균)이, (추정값-참값)을 의미하게 됩니다. (추정값-참값)은 ‘오차’입니다.

편차(변량-평균)의 제곱의 평균에 루트를 씌운 값이 ‘표준편차’ 인 것처럼

오차(추정값-참값)의 제곱의 평균에 루트를 씌운 것이 ‘표준오차’ 가 된 것입니다.

표준오차는 ‘추정값인 표본평균들과 참값인 모평균과의 표준적인 차이’ 정도로 이해할 수 있습니다.

수식에서 n이 커지면 표준오차가 줄어듭니다. 실제로 표본을 뽑는 상황을 생각해봅시다. 모집단에서 크기가 큰 표본을 뽑을 수록 모집단과 가까워지겠죠? 따라서 오차는 줄어들 것입니다. 직관적으로도 성립합니다.

#영상 강의

반응형

표준 편차와 표준 오차의 차이점

통계학을 공부하다 보면

가끔 헷갈리는 개념들을 접하게 됩니다.

뒤에 ‘분석’이 붙는 상관분석, 분산분석, 회귀분석 등등

‘분포’가 붙는 T분포, Z분포, 카이제곱 분포 등등….

또, 같은 단어가 들어가지 않더라도 괜히 헷갈리는 ‘변동계수’나 ‘신뢰구간’같은 개념들.

한 번 쭈욱 훑어보아도 접할 때마다 새롭죠.

제가 통계학에 관련된 포스팅을 하기 시작한 이유이기도 하고요.

학부 시절에 통계학을 공부하면서 헷갈렸던 개념들, 그리고 개인적으로 정리해두고 싶은 개념들

이 모두를 그때그때 생각날 때 쓰기도 했고, 따로 메모해뒀다가 순서대로 쓰기도 해왔습니다.

최근에는 통계학을 공부하거나 좀 깊이있게 활용할 일이 없어서 관련 포스팅을 잠시 미뤘었는데

얼마전에 기사에서 ‘표준 오차’라는 단어를 오랜만에 접하게 되었습니다.

사실 공부할 때도 ‘오차’와 ‘편차’가 대체 뭐가 다른지 한 번도 생각해보지 않았었는데요.

오랜만에 포스팅도 할 겸 개인적으로 다시 한 번 되짚어 보기로 했습니다.

보통 여론 조사 결과를 발표하는 기사에서 이런 문장을 접하게 됩니다.

“이번 조사의 표준오차는 +/ – 3.9% 포인트다.”

대부분 기사의 마지막에 등장하는 문장인데요.

자세히는 모르겠지만 오차니까 저 범위가 적으면 적을수록 좋다는 건 알겠네요.

통계학을 공부하게 되면, 일반적으로 표준편차라는 개념을 더 많이 접하기 때문에

표준오차라는 단어를 보면 자기도모르게 표준편차로 해석하기도 합니다.

두 개념은 서로 연관되어 있지만, 당연히 다른 개념입니다.

먼저 표준편차에 대한 설명에서부터 출발하겠습니다.

표준편차라는 것은, 모집단의 경우를 예로 들면,

모집단에 속한 다른 숫자들이 모평균과 차이나는 평균적인 정도를 말합니다.

즉, 한 집단의 숫자들이 평균을 중심으로 퍼진 정도입니다.

모집단을 대상으로 한다면 ‘모 표준편차’이고 표본집단을 대상으로 한다면 ‘표본 표준편차’인 것이죠.

자, 이렇게 모집단과 표본집단이 있습니다.

표본집단을 추출하는 이유는 모집단의 속성을 알기 힘들 경우, 즉 모집단의 크기가 매우 클 경우에

그 안에서 랜덤하게 여러번 뽑힌 표본집단들로 하여금 그 모집단을 추정하기 위함이죠.

그렇다면 뽑힌 표본집단들이 모집단을 추정하기에 적절한지는 어떻게 알 수 있을까요?

여기서 바로 표준오차를 통해 판단할 수 있습니다.

모집단의 중요한 모수인 모평균을 추정하기 위해서 표본을 추출하여 표본의 평균값을 계산하죠?

그러나 모집단의 크기에 비해 추출된 표본의 크기는 상대적으로 작습니다.

당연히 표본의 평균값은 모집단의 모평균값과 정확하게 일치하지는 않을 것입니다.

게다가 어떤 표본을 뽑느냐에 따라 표본평균값이 달라지기도 하겠죠?

이 때, 매번 뽑히는 여러 표본평균들이 얼마만큼의 변동, 즉 편차를 가지겠는가에 대한 답을 주는 것이

바로 표준오차입니다.

즉, 표본평균들의 표준편차인 셈이죠.

표본평균들의 평균, 그러니까 표본평균들의 기댓값은 모평균이죠?

따라서 표준오차가 작다는 말은 뽑힌 표본평균들 간의 편차가 작다는 뜻이고

이는 표본평균들이 모평균과 큰 차이가 나지 않는다는 뜻으로 받아들일 수 있다는 것입니다.

그래서 표준오차가 작다면 표본평균들로 모평균을 추정한다는 사실을 의심할 필요가 적어지겠죠.

그러나, 일반적으로 표본추출은 단 한번 시행합니다.

따라서 표본평균도 하나가 나올 것이고, 표준오차를 계산할 수도 없겠죠.

표본평균이 여러개가 있어야 그들의 편차를 계산할 테니까요.

하지만 그럼에도 불구하고 이론적으로는 표준오차를 계산할 수가 있습니다.

그 공식은 다음과 같이 매우 간단합니다.

표본 표준편차를 원소 개수의 제곱근으로 나누어준 값이죠.

이처럼 단 하나의 표본 표준편차 값만 있더라고 표준 오차를 ‘이론적으로는’ 계산할 수 있습니다.

정리하자면, 표준편차는 모집단이건 표본집단이건 그 안의 숫자들의 편차를 뜻하고

표준오차는 여러개 뽑히는 표본평균들의 편차를 뜻합니다.

표본집단만 놓고 본다면 표준편차는 ‘특정한 표본집단 내의 편차’이고

표준오차는 ‘표본집단들 (평균)간의 편차’라고 할 수 있겠네요.

여론조사에서 A당 지지율이 30%고, B당 지지율이 70%인데

“표준오차는 +/-1%p이다.”라고 한다면

이 여론조사 결과는 매우 신뢰성이 높다고 할 수 있겠죠?

사실 중요한 정보입니다.

여론조사 내용이 뭐든 간에 그걸 신뢰할 수 없다면 아무 소용이 없으니까요.

왜 항상 기사의 마지막에 표준오차 값이 등장하는지 이제야 알겠네요.

#8 표준편차와 표준오차

❗️블로그 옮김: https://www.taemobang.com

표준편차(standard deviation)와 표준오차(standard error)에 대해 확실하게 정리합시다. 먼저 우리가 자료를 얻었을 때 주로 관심있는 것은 자료의 중심과 퍼짐성을 요약할 수 있는 특성값들로, 일반적으로 자료의 중심은 평균(mean), 자료의 퍼짐성을 잴 때는 분산 또는 표준편차를 사용합니다. 따라서 모집단에는 모평균 $\mu$, 모분산 $\sigma^2$, 모표준편차 $\sigma$가 중요한 특성값이며, 이들의 추정에 사용할 수 있는 좋은 통계량(statistic)이 각각 표본평균 $\bar{X}$, 표본분산 $s^2$, 표본표준편차 $s$에 해당합니다.

표준편차

표준편차란, 원시 자료(raw data)의 퍼짐성을 재는 측도라고 할 수 있습니다. 원시 자료의 퍼짐성은 모분산으로 측정할 수 있으나, 실제 문제에서 모분산에 대한 정보가 있는 경우는 드물다고할 수 있습니다. 그래서, 이 모분산의 좋은 추정값으로 우리는 표본분산 $s^2$을 이용합니다. 표본분산은 표본표준편차 $s$의 제곱 형태로 주어지는데, 통계분석시 분산이 직접적으로 사용되는 경우가 드뭅니다. 즉, 통계추론의 목적으로는 대부분의 경우 분산보다는 표준편차가 이용됩니다. 그 이유는 표준편차가 자료의 원 단위와 일치하기 때문입니다($\because$ 편차제곱항들의 평균에 루트를 씌운 형태이므로). 표본분산과 표본표준편차의 식은 다음과 같이 정의할 수 있습니다:

표본분산 $s^2 = \frac{1}{n-1}\sum_i^n (Y_i – \bar{Y})^2$

표본표준편차 $s = \sqrt{s^2} = \sqrt{\frac{1}{n-1}\sum_i^n (Y_i – \bar{Y})^2} $

표본 수 $n$이 아닌 $n-1$로 나눠주는 이유는, $n-1$로 나눈 형태가 불편성(unbiasedness)을 만족하는 추정량이기 때문입니다.

표준오차

표준오차는 근본적으로 통계량에 관한 특성값입니다. 즉, “모평균의 표준오차”라는 말은 존재하지 않습니다. 우리가 자료로부터 통계량의 표준편차를 추정하게 될 때, 우리는 이를 (통계량의) 표준오차라고 부릅니다. 설명의 편의를 위해 통계량을 표본평균이라고 해보겠습니다. 표본평균은 수집된 자료(관측자료, 원시자료)의 중심을 나타내는 값이라 할 수 있습니다. 그러나, 통계 분석에서는 자료의 중심위치를 나타내는 평균뿐만이 아닌, 자료의 변동(variability)에 관한 정보를 제공하는 것도 매우 중요합니다. 통계 추론에 점 추정뿐만이 아닌 구간 추정이 존재하는 이유도 이러한 이유에서 입니다. 그래서, 우리는 이 표본평균 $\bar{X}$의 퍼진 정도를 나타낼 수 있는 측도가 필요하며, 표준오차가 바로 그 측도에 해당합니다. 정확하게 말하면 표본평균의 표준오차에 해당하겠죠. 조금 더 다르게 말해보면, 표본평균의 표준편차를 추정하게 될 때 사용하는 값이 표본평균의 표준오차라고 할 수 있겠습니다. 표준오차는 S.E(stantard error)로 나타내며, 표본평균의 표준오차는 다음과 같이 계산할 수 있습니다. 표본평균의 표준오차에 대한 추정값은 곧 표본평균의 표준편차라고 했습니다:

S.E($\bar{X}$) $= \sqrt{\textrm{Var}(\bar{X})} = \sqrt{\textrm{Var}(\frac{1}{n}\sum X_i)} = \sqrt{\frac{1}{n^2}\textrm{Var}(\sum X_i)} = \sqrt{\frac{1}{n^2} ns^2} = \frac{s}{\sqrt{n}}$

즉, 표본평균의 표준오차를 $\frac{s}{\sqrt{n}}$으로 정의함은 당연한 것입니다. 그리고, 대부분의 검정통계량, 신뢰구간 추정의 계산은 표본평균에 기반한 값들로 이루어지기 때문에, 보통 “표본평균의” 표준오차가 아닌 “표준오차”라고만 칭합니다. 앞서 서술한 말들을 잘 이해하셨다면, 이제는 표준오차가 $\frac{s}{\sqrt{n}}$으로 주어지는 것에 대한 이해의 찝찝함이 충분히 풀어지셨을거라 생각합니다. 아울러, 위 말들을 잘 곱씹어보면 표준오차의 식이 $\frac{s}{\sqrt{n}}$인 것은 따로 외우려고 노력하지 않아도, 머릿 속에 들어오실겁니다.

표본평균의 퍼짐성? 변동?

마지막으로 표본평균의 퍼짐성, 변동을 측정한다는 말이 이해가 안되는 분들, 또는 그 필요성이 이해가 안되는 분들을 위해 한 가지 예를 들어 부연 설명을 해보겠습니다. 한 사람에게 A 고등학교의 남학생 평균 키를 100명을 대상으로 계산을 시켰다고 합시다. 이때 평균이 170이 나왔고, 이를 다른 사람에게 똑같이 시켰더니 172.5가 나왔습니다. 즉, 상식적으로 임의의 모집단에 대해 여러번의 샘플링을 했을 때 매번 같은 표본 평균이 나올 수는 없으며, 퍼짐이 존재하는 것은 당합니다. 그리고, 퍼짐이 존재함은 일정한 분포(distribution) 형태를 가질 수 있음을 말합니다. 아울러, 우리가 이론적 관점에서 바라보아도 표본평균은 분포를 가짐이 당연합니다. 그 이유는 $\bar{X} = \frac{1}{n}\sum X_i = \frac{1}{n}(X_1 + \cdots + X_n)$으로 즉 $\bar{X}$는 확률변수들의 선형결합의 형태이므로 통계량에 해당하기 때문이죠 . 통계학을 접근할 때 기본적으로 알아두어야 가장 중요한 개념 중 하나는 확률변수는 분포를 가진다는 점입니다. 즉, 통계량도 분포를 가지므로 표본평균이 분포를 가지고 퍼짐이 존재하는 것은 당연하며, 그에 따라 분포의 중심뿐만이 아닌 퍼짐에 대한 추정을 수행하는 것 또한 꼭 필요로 된다고 할 수 있습니다.

📝참고문헌

[1] 성내경 (2012). 실험설계와 분석 2판. 자유아카데미

[2] <슬기로운 통계생활> on Youtube

표본과 표준 오차의 의미

모집단과 표본 집단

통계학을 공부하기 시작하면 가장 먼저 듣게 되는, 마치 고교 수학에서 과 같은 위치를 차지하고 있는 개념이 바로 모집단과 표본 집단에 관한 이야기이다.집합>

고리타분한 이야기를 좋아하지는 않지만, 검정을 위한 통계학을 이해하기 위해선 모집단과 표본 집단에 대한 이해는 매우 필수적이다.

이 내용은 중요하기 때문에 한번 더 언급하겠다. 검정을 위한 통계학을 위해선 모집단과 표본 집단이 뽑히는 과정에 대해서 면밀히 이해해야한다!

이번 article에서는 “금성에 사는 외계인 150명”이라는 가상의 모집단을 상정하고, 표본을 추출하고, 표본 통계량을 계산해보면서 모집단과 표본 집단에 대해서 이해해보고자 한다.

모집단(population)과 모수(parameters)

모집단은 정보를 얻고자 하는 관심 대상의 전체 집합을 일컫는다.

모집단의 개념은 실제로는 매우 추상적이면서도 정확히는 알 수 없는 값이지만 이번 article에서는 상상의 모집단을 하나 만들어보도록 하자.

금성에 외계인이 산다고 해보자. 그리고, 그 금성에는 정확히 150명의 외계인이 살고 있고,

신의 계시에 따르면 각 외계인의 키는 다음과 같은 분포를 갖고 있다고 해보자.

그림 1. 상상속의 모집단인 금성 외계인 150명의 키 분포

어떤 집단의 분포는 수학적으로 잘 알려진 분포를 따른다. 그 중 가장 잘 알려진 분포가 정규분포인데, 정규분포의 경우 평균값과 표준편차 값을 이용하면 형태를 파악할 수 있다.

이처럼 전체 집단의 모든 데이터를 알지 못하더라도 수학적으로 그 분포를 기술할 수 있는 특성값들을 알 수만 있다면 “얼추 비슷하게나마” 모집단의 특성을 통계적으로 확인할 수 있다.

이 특성치들을 우리는 “모수(parameter)”라고 부르는데 대표적인 모수는 다음과 같다.

평균

분산, 표준편차

분위수 (중위값, 1분위수, 4분위수 등…)

모비율

다시 말해 우리는 모집단 전체 데이터는 얻을 수 없으니, 모집단의 특성을 나타내는 모수를 파악하여 모집단의 특성을 파악하고자 한다는 것이다.

문제는 한결 간단해진 것 같지만, 모수를 잘 추정하려면 어떻게 해야할까?

표본집단과 표본 통계량

통계학에서 표본이란 모집단의 부분집합으로 생각할 수 있다.

가령, 우리가 그림 1에서 보았던 150명의 금성인들(모집단)에서 임의로 6명을 추출한다고 생각해보자. 그 결과는 그림 2와 같을 수 있다.

그림 2. 150명의 모집단에서 6명의 표본을 추출한 경우. (표본은 빨간색으로 표시)

표본을 추출하는 이유는 현실적인 것으로, 우리가 모집단 전체에 대해 검사하기에는 비용이 너무 많이 들기 때문이라고 볼 수 있다.

따라서 표본은 모수를 추정하기 위해 얻는다고 할 수 있다.

그런데, 표본을 추출할 때 충분히 랜덤하게 뽑는다고 가정하면, 표본은 추출할 때 마다 매번 다른 값들로 구성될 수 있지 않을까? 6명의 크기의 표본 집단을 세 번 추출해본다고 하면 그림 3의 결과와 같을 것이다.

그림 3. 세 번 표본을 추출해보고 그 때 마다 얻게되는 표본 분포를 그린 것

그림 3에서 볼 수 있듯이 표본은 매번 추출할 때 마다 그 값이 달라지는 특성이 있다.

또한 추출된 표본들을 통계적으로 기술하기 위해서는 통계적 특징을 나타내는 수치를 만들어두면 편할 것이다. 모수와 마찬가지로 표본으로부터도 그 분포의 특성을 나타내는 표본 통계량(statistic)을 계산할 수 있다.

대표적인 표본 통계량은 다음과 같은 것들이 있다.

표본 평균

표본 표준편차

표본 비율

그런데, 표본이 매번 추출할 때 마다 그 값이 변하는데, 표본 통계량도 그때 그때 변하지 않을까?

맞는 말이다. 표본 통계량은 모수의 ‘추정치’로 볼 수 있고 추정된 값은 항상 오차를 수반한다.

추정은 오차를 수반한다: 표준 오차(☆)

표준 오차란 “표본 통계량의 표준 편차”를 의미하는 말이다.

(글을 잘 읽어봐야 한다. 말이 꼬인다.)

앞서 말했듯 표본이 매번 추출될 때 마다 값이 바뀌는 특성때문에 표본 통계량은 매번 그 값에 변동(혹은 오차)이 있다.

아래의 그림 4에서는 n=6인 표본을 100회 추출하면서 매번 표본 평균을 계산하여 그려가는 과정을 만들어보았다.

그림 4. 100 번 표본을 추출해보고 그 때 마다 얻게되는 표본 평균을 그린 것

즉, 그림 4에서 볼 수 있듯이 표본은 추출할 때 마다 그 구성값들이 모두 다르며 그때마다 표준 통계량의 값도 변한다.

표본 평균 평균의 표준 오차 수식적인 증명

그림 4에서 보았던 표본 평균의 표준 편차, 즉 평균의 표준 오차(Standard Error of Mean, SEM)를 구해보자.

한번에 $n$개의 표본을 추출하는 실험을 한다고 했을 때, 표본 평균은 다음과 같이 계산할 수 있다.

\[\bar{X} = \frac{1}{n}\sum_{i=1}^nX_i\]

여기서 $X_i$는 한번 추출한 표본 집단에서 표본값들을 의미한다.

우리가 구하려고 하는 것은 이 표본 평균($\bar{X}$)의 표준편차이므로 우선 표본 평균의 분산값을 계산해보면 다음과 같다.

\[Var[\bar{X}] = Var\left[\frac{1}{n}\sum_{i=1}^nX_i\right] = Var\left[\frac{1}{n}\left(X_1+X_2+\cdots+X_n\right)\right]\]

아래의 (3), (4)와 같은 분산 연산자의 두 가지 성질에 의하여,

\[Var[aX+b] = a^2Var[X]\] \[Var[X_1+X_2] = Var[X_1] + Var[X_2]\]

식 (2)는 다음과 같이 쓸 수 있다.

\[식(2) = \frac{1}{n^2}Var\left[X_1+X_2+\cdots+X_n\right]\] \[=\frac{1}{n^2} \times n\times Var[X] = \frac{1}{n}Var[X]\]

즉, 모분산을 $\sigma^2$라고 하면, 표본 평균의 표준 편차는

\[\sqrt{Var[\bar{X}]} = \frac{1}{\sqrt{n}}std[X] = \frac{1}{\sqrt{n}}\sigma\]

모분산의 추정치를 $s^2$라고 했을 때, 표본 평균의 표준편차는 추정치를 이용해

다음과 같이 쓸 수 있다.

\[SEM = \sqrt{Var[\bar{X}]} = \frac{s}{\sqrt{n}}\]

그림 4의 마지막 장면은 아래의 그림 5와 같은데 오른쪽의 표본 평균의 분포의 너비가 왼쪽의 원래의 분포에 비해 너비가 작은 것을 알 수 있다.

그림 5. 100 번째 표본까지의 표본 평균을 도시한 것.

주의: 표준 오차와 표준 편차는 다른 개념이다

표본 평균 표준 오차(SEM)와 표준 편차를 혼용해서 사용하거나, 잘못 사용하는 경우가 있다.

특히, 논문을 보다보면 이런 실수들을 종종 찾아볼 수 있는데, 식 (8)에서 볼 수 있었듯이 SEM은 표준 편차에 비해서 항상 값이 작기 때문에 데이터를 서술할 때 더 결과가 좋아보이기 때문이다.

다시 한번 정리하자면 표준 편차는 모집단의 분포가 얼마나 퍼져있는가를 서술하는 개념이고, SEM은 평균의 추정치에 대한 불확실도를 수치화한것이다.

보통의 경우 결과를 보는 사람의 입장에서는 모집단에 관심있는 경우가 더 많으므로 데이터에 관해 기술할 때는 표준 편차(혹은 그에 준하는 추정치)를 사용해 기술해야한다.

참고문헌

(통계 용어) 표준 편차 vs 표준오차

표준편차 와 표준오차

통계를 공부하는 사람이라면, 표준편차에 대해 많이 들어봤을 것입니다.

그렇다면 표준오차는 무엇일까요? 표준편차랑 같은 것일까요? 그 차이점에 대해 이야기해보겠습니다.

표준편차 (SD, Standard Deviation)

자료가 평균으로부터 얼마나 퍼져있는지 나타내는 지표

아래의 그림에서 $\sigma$에 해당합니다.

표준오차 (SEM, Standard Error of the Mean)

표본의 평균이 얼마나 모평균에 가까운지 나타내는 지표

여기서, SEM은 두 가지 특징을 갖습니다.

모집단의 변동과 추출된 표본의 개수에 따라 좌우된다. $\\$

그러나 실제로는 하나의 표본만 추출하므로, $\\$이 표본의 표준편차(SD)와 표본수를 이용하여 표준오차(SEM)를 추정.

표준편차(SD)와 표준오차(SEM)에 대한 특징들을 몇가지 적어보자면 다음과 같습니다.

º 분산은 계산과정 중 관측값의 단위를 제곱하게 되어 자료해석에 혼란 야기가 가능하여,

자료의 평균과 같은 단위를 사용하는 SD를 이용하는 것이 더 적절합니다.

º 표본 수가 같다면, SD, SEM 무엇을 사용해도 무관합니다.

그러나 다른 경우, 이를 명시하여 정확한 정보 전달이 필요합니다.

º 정규분포를 전제하는 표본에서는 SD : 표본을 구성하는 자료의 변동을 반영

SEM : 표집 분포를 구성하는 평균들의 변동을 반영

º 표본의 특성 기술 시 정규성 검정이 선행된 상태에서 SD를 사용하는 것이 바람직합니다.

그러나 자료에 따라 표본 수를 제시한다면, SEM or C.I(신뢰구간)를 통한 표현도 가능합니다.

º 통계분석 결과를 제시할 때는 SD보다는 표본 수와 함께 SEM을 사용하면,

추정된 모집단들의 직관적인 비교가 표나 그래프를 통해 가능하여 결과해석이 용이합니다.

표준 편차와 표준 오차

반응형

표준 편차와 표준 오차에 대해서 알아보겠습니다. 제가 이 둘을 헷갈려해서 따로 정리하여보았어요~

그런데 저 뿐만아니라 많은 분들도 헷갈려 하시더라구요.

표준편차 (SD, Standard Deviation)

– 점수집합 내에서 점수들 간의 상이한 정도를 나타내는 산포도 측정 도구

– 표준편차가 클수록 평균값에서 이탈한 것

– 표준편차가 작을수록 평균값에 근접한 것

– 변수값이 평균값에서 어느 정도 떨어져 있는지를 알 수 있음

모표준편차

표본표준편차

왜 분모가 n-1인지는 다른 글에 써놓았습니다.

표준오차 (SE, Standard Error)

– 표본추출의 과정에서 발생하는 오차와 연관된 것으로 추정량의 정도를 나타내는 측정 도구

– 표본이 모집단으로부터 얼마나 떨어져 있는지를 나타내는 것(모집단이라는거에 주목!)

– 각 표본들의 평균과 전체 평균 간의 간격

– 표준오차가 작을수록 표본의 대표성이 높다.

– 표본평균의 표준편차

– σ = 모표준편차

– σ^2 = 모분산

1. 표준오차는 표본평균의 표준편차다. (그러므로 기준이 되는 모 표준편차를 알고 있어야한다.)

2. 표준오차는 모집단에 대해서는 딱히 어떤 정보도 주지 않는다.

3. 표준오차는 아무 말이 없어도 표본에 대해서만 논한다. 즉, ‘모표준오차’와 같은 개념은 생각하지 않는다.

4. 표준오차는 주로 가설검정, 신뢰구간이나 예측구간을 구할 때 필요한 것이다. 즉, 맥락 상 구간 이야기가 있을 때만 신경쓰면 된다.

출처: https://canshot.tistory.com/32 [통계를 공부하자]

반응형

표준 오차 개념과 공식, 그리고 계산 방법

Last Updated on 2021-10-31 by BallPen

표준 오차를 도입하는 배경, 개념이 궁금합니다. 또한 표준 오차의 계산은 어떻게 할 수 있을까요?

표준 오차 개념을 이해하는 것은 측정값의 정확도를 올바르게 표기하는데 있어 아주 중요합니다. 계산은 비록 어렵지 않으나 그 개념을 이해하기는 쉽지 않습니다.

함께 표준 오차의 배경과 개념, 그리고 계산 방법을 알아보겠습니다. 목차는 다음과 같습니다.

1. 정확도와 정밀도의 계산과 표기 방법에 대한 복습

이전 포스트에서 측정 결과의 정확도와 정밀도에 대한 개념, 계산, 표기 방법에 대해 설명드린 바 있습니다. 간단히 복습을 하는 것이 표준 오차에 대한 이해도를 높일 수 있어요.

각각의 구체적인 계산법은 이전 포스트를 참고하세요.

1-1. 정확도

정확도는 측정값들이 한쪽으로 몰리는 일이 적은 정도를 나타내며, 표기하는 방법은 아래의 세가지 방법 중 하나를 적용하면 됩니다.

– 평균값과 참값의 백분율로 구하는 방법

측정값들의 평균값을 \(\mu\), 참값을 \(X\)라 할때 정확도는 다음과 같습니다.

$$

\tag{1} 정확도(\%) = {{\mu}\over{X}} \times 100

$$

– 절대오차

측정값을 \(x\), 참값을 \(X\)라 할 때 절대오차 \(\epsilon\)은 다음과 같습니다.

$$

\tag{2} \epsilon = x-X

$$

– 상대오차

상대오차 또는 백분율오차는 다음과 같습니다.

$$

\tag{3} 상대오차(\%) = {{|\epsilon|}\over{X}} \times 100

$$

1-2 정밀도

정밀도는 측정값들의 퍼짐이 좁은 정도를 나타내며, 표기하는 방법은 아래의 네가지 방법 중 하나를 적용하면 됩니다.

– 상대표준편차

측정값의 표준편차를 \(\sigma\), 평균값을 \(\mu\)라 했을 때 상대표준편차 \(\% \mathrm{RSD}\)는 다음과 같습니다.

$$

\tag{4} \% \mathrm{RSD} = {{\sigma}\over{\mu}} \times 100

$$

– 측정값의 범위를 이용한 정밀도 계산과 표기

측정값의 최대값인 \(x\)(max)과 최소값인 \(x\)(min)으로 range를 구한 후 ‘평균값\(\pm\)range’로 표기합니다.

$$

\tag{5} Range = x(\mathrm{max})-x(\mathrm{min})

$$

– 평균편차를 이용한 정밀도 계산과 표기

측정값을 \(x\), 측정값의 평균을 \(\mu\)라 했을 때, 평균편차 \(\bar d\)를 계산한 후 ‘평균값\(\pm\)\(\bar d\)’로 표기합니다.

$$

\tag{6} \bar d = {{\Sigma |x-\mu|}\over{n}}

$$

– 표준편차를 이용한 정밀도 계산과 표기

모집단 표준편차 \(\sigma\) 또는 표본 표준편차 \(s\) 를 계산한 후 ‘평균값\(\pm\)표준편차’로 표기합니다.

$$

\begin{align}

\tag{7}

\sigma = \sqrt{{\Sigma (x-\mu)^2}\over{n}}= \sqrt{Var[x]} ~ (모집단 표준편차) \\

\end{align}

$$

$$

\tag{8} s = \sqrt{{\Sigma (x-\mu)^2}\over{n-1}} ~ (표본 표준편차)

$$

(7)식에서 주어진 \(Var[x]\)는 모집단의 \(x\)에 대한 분산을 뜻합니다.

2. 표준 오차 도입 배경

앞의 내용으로 이미 이해하셨겠지만 정확도는 오차로 평가되고, 정밀도는 편차로 평가됩니다.

또한 정밀도는 측정값들의 평균값과 결합하여 ‘평균값\(\pm\)정밀도’의 형식으로 표기되어 사람들에게 정밀한 정도에 대한 정보를 제공합니다. 물론 정밀도를 무엇으로 구했는지는 별도 표기를 해주어야 합니다.

그런데 여기서 한가지 궁금한 사항이 있습니다. 정확도에서 오차를 구하기 위해서는 참값이 필요한데 참값을 모르는 경우가 많습니다.

예를 들어 어느 물체가 있다고 하겠습니다. 그 물체의 질량을 알고 싶어 저울을 이용해 측정했습니다. 총 6번을 측정했어요.

12.0, 12.3, 11.8, 11.9, 12.4, 12.1 kg

위 측정 결과로부터 정밀도를 계산할 수 있을 것입니다. 또 평균값 \(\mu\)도 계산할 수 있어요.

그런데 오차의 범위는 어떻게 구할 수 있을까요? 참값을 우리가 알고 있다면 오차를 명확하게 구할 수 있을텐데요. 보통은 참값을 모르는 경우가 많습니다.

결국 우리가 어느 측정값을 표기하기 위해서는 정밀도 뿐만 아니라 오차의 범위도 제시할 필요가 있습니다. 왜냐하면 정확한 참값을 모르기 때문입니다. 이러한 배경에서 출발한 것이 표준오차가 되겠습니다.

3. 표준 오차 개념

어느 물체의 질량을 측정하기 위해 저울을 이용합니다. 이때 하나의 저울을 이용해 어느 사람이 측정한 값들의 세트인 \(X_1\)이 아래에 주어져 있습니다.

\(X_1\) = {12.0, 12.3, 11.8, 11.9, 12.4, 12.1 kg}

이 값의 평균은 12.1 kg 입니다. 이 값이 참값일까요? 아닙니다. 바로 이 값들에는 계통오차가 들어가 있기 때문에 참값이라고 할 수 없습니다. 그렇다면 계통오차를 제거하여 참값을 도출하는 방법은 무엇일까요? 바로 아래에서 설명할 표본 평균의 평균이라는 값을 이용합니다.

그렇다면 표본 평균의 평균을 참값으로 간주한다면 위에서 측정한 측정값들의 표준편차를 구할 수 있을 것입니다. 이것이 표준 오차(Standard Error of Mean, SEM, 평균오차로 불리기도 함)입니다.

우선 단계적으로 표본 평균의 평균을 구하는 방법을 설명드리고 표준오차를 정의하는 방법을 구체적으로 설명드립니다.

3-1. 표본 평균의 평균

(1단계) \(n\)명의 사람들이 자신의 저울을 이용하여 각각 물체의 질량을 \(n\)번 측정한다고 생각하세요. 그러면 \(n\)개의 표본이 생기는 것입니다. 그러면 \(X_1\), \(X_2\), \(X_3\), \(\ldots\), \(X_n\)의 측정값 세트가 존재하겠죠.

(2단계) 각 측정값 세트의 평균을 내세요. 그러면 \(\bar{X}_1\), \(\bar{X}_2\), \(\bar{X}_3\), \(\ldots\), \(\bar{X}_n\)들이 구해질 것입니다. 이것이 표본 평균입니다.

(3단계) 2단계에서 구한 표본 평균들의 평균을 구하세요. 그 값을 \(k\)라고 하고, 이 값이 표본 평균의 평균값입니다.

표본 평균의 평균 \(k\)는 \(n\)개의 표본으로부터 구한 평균값이기 때문에 각 표본이 갖는 계통오차들이 서로 상쇄되어 제거된 것으로 볼 수 있습니다.

즉 어느 표본에서 양의 계통오차가 발생했다면 다른 표본에서는 같은 크기의 음의 계통오차가 발생되어 서로 상쇄되어 제거되고 결국 참값만 남게 되는 원리이죠. 물론 많은 표본을 운영할 수록 참값에 가까워집니다.

그러므로 표본 평균의 평균 \(k\)를 개념적으로 참값으로 간주합니다.

표준 오차 SEM은 표본 평균에 대한 표준편차를 뚯합니다. 각 표본의 측정세트로부터 표본 평균을 구하여 분포표가 만들어집니다. 이 표분 평균 분포표의 평균값이 참값 \(k\)로 간주됩니다. 결국 표준 오차는 \(k\)로부터 표본 평균들이 어느정도 흩어져 있는가의 척도입니다.

3-2. 표준 오차 정의

표준 오차 SEM은 표본 평균에 대한 표준편차로 정의됩니다.

그러므로 (7)식의 모집단 표준편차 공식을 그대로 사용하는데요. 다만 변수 \(x\) 대신에 표본 평균 \(\bar{X}_1\), \(\bar{X}_2\), \(\bar{X}_3\), \(\ldots\), \(\bar{X}_n\)가 적용되고, 평균값 \(\mu\) 대신에 표본 평균의 평균 \(k\)가 적용됩니다.

이를 식으로 표현하면 다음과 같습니다.

$$

\begin{align}

\tag{9} SEM &= \sqrt{{\Sigma (\bar{X} – k)^2}\over{n}} \\

&=\sqrt{Var{\bar{\big[ X \big]}}}

\end{align}

$$

(9)식에서 \(Var\big[ \bar{X} \big]\)를 분산이라고 합니다. 결국 표준 오차는 반복실험으로 구해진 표본 평균들이 \(k\)로부터 어느 정도 흩어져 있는가의 척도인 것입니다.

4. 표준 오차 공식과 모집단 표준 편차 추청

(9)식을 이용하면 표준 오차 SEM을 구할 수 있습니다. 물론 많은 반복 실험 세트를 통해 \(k\)를 구하고 각 실험세트당의 표본 평균 \(\bar{X}\)를 구한 후 (9)식에 적용하면 됩니다.

그렇다면 단지 하나의 실험세트만 있을 때에는 어떻게 표준 오차를 구할 수 있을까요? 이러한 경우가 실험 현장에서 사실 많습니다.

이럴 때는 바로 측정값으로부터 모집단의 표준 오차 \(\sigma\)를 추정하는 방법으로 구합니다. 구체적인 내용은 아래에 설명드립니다.

4-1. 표준 오차 공식의 일반화

일단 통계학적인 수식 처리과정을 거쳐 보겠습니다. 흐름은 위에서 개념 설명할 때와 같습니다.

\(n\)개의 표본에서 각각 \(n\)개의 측정이 이루어집니다. 그러면 \(i\)번째 표본에서 도출된 측정세트는 \(X_i\)이고 이러한 것들이 \(n\)개가 있는 것입니다.

한 표본에서의 평균인 \(\bar{X}\)는 아래와 같이 구해집니다.

$$

\tag{10} \bar{X}={{1} \over {n}} \sum_{i=1}^{n} X_i

$$

표준 오차의 정의 식인 (9)식에서 근호안에 있는 분산을 우선 표현하면 다음과 같습니다.

$$

\begin{align}

\tag{11} Var \big[ \bar{X} \big] &= Var \Big[ {{1}\over{n}} \sum_{i=1}^n X_i \Big]\\

&= Var \Big[ {{1}\over{n}} (X_1 + \ldots + X_n) \Big] \\

&= {{1}\over{n^2}} Var[X_1 + \ldots + X_n] \\

&= {{1}\over{n^2}} \times \big( n \times Var[X] \big) \\

&= {{1}\over{n}} Var[X]

\end{align}

$$

(11)식 전개 과정에서 다음의 성질이 이용되었습니다.

$$

\tag{12} Var[aX+b] = a^2 Var[X]

$$

$$

\begin{align}

\tag{13} Var[X_1 + \ldots + X_n ] &= Var[X_1] + \ldots + Var[X_n] \\

&= n \times Var[X]

\end{align}

$$

이때 (13)식에서 \(Var[X]\)는 모집단의 분산을 뜻합니다. 이것은 \(n\)이 크다면 모집단으로부터 추출되는 각 표본에서의 분산은 모집단의 분산과 같다는 통계학적 의미가 반영된 것입니다.

(7)식과 (11)식을 이용하여 (9)식의 표준 오차 SEM을 정리하면 아래와 같습니다.

$$

\begin{align}

SEM &= \sqrt{Var[\bar{X}]} = \sqrt{{{1}\over{n}} Var[{X}]} \\

&= \sqrt{{\Sigma({x} – \mu)^2}\over{n\times n}} \\

&= {{\sigma}\over{\sqrt{n}}}

\end{align}

$$

결국 표준 오차 SEM은 모집단의 표준편차 \(\sigma\)를 \(\sqrt{n}\)으로 나누면 간단히 구해집니다.

그런데 문제는 모집단의 표준편차 \(\sigma\)를 어떻게 구하느냐인데요.

보통은 모집단의 표준편차를 구하지 못하니 표본 측정값들의 표준편차 \(s\)를 구하고 이것을 모집단의 표준편차 \(\sigma\)의 추정치로 활용하게 됩니다.

결국 실험세트가 단지 하나인 경우에 SEM은 아래와 같이 구합니다.

$$

\tag{14} SEM = {{s}\over{\sqrt{n}}}

$$

4-2. 표준 오차 SEM을 이용한 측정값의 표기

그렇다면 측정값을 표기할 때 (9) 또는 (14)식으로 구한 표준오차 SEM을 어떻게 활용할까요?

정밀도를 표현할 때와는 약간 다릅니다. 즉 “평균값\(\pm\)(Z-score \(\times\) SEM)”를 활용하는데요.

$$

\tag{15} \bar{X} \pm Z{{s}\over{\sqrt{n}}}

$$

이 식에서 Z는 90% 신뢰수준의 경우 1.65, 95% 신뢰수준의 경우 1.96, 99% 신뢰수준의 경우 2.58을 적용합니다. 연구에서는 보통 95% 신뢰수준을 적용합니다.

정규분포표의 Z값을 적용하는 것은 실험세트의 측정값이 100개 이상인 경우에 보통 적용합니다. 만일 측정값이 100개 미만인 경우에는 (15)식에서 Z대신에 \(t\)분포값이 들어갑니다.

예를 들어 95% 신뢰수준에서 측정값이 5개 뿐인 경우에는 아래 (16)식과 같이 표기합니다. \(t\)분포표 보는 방법은 여기를 클릭하세요.

$$

\tag{16} \bar{X} \pm 2.776 {{s}\over{\sqrt{n}}}

$$

아울러 사람들이 평균값 \(\bar{X}\) 뒤에 쓰여진 것이 정밀도인지 아니면 표준오차인지를 헷갈릴 수 있으므로 반드시 표기해주어야 합니다.

5. 표준 오차 계산 방법 예제

6. 표준 오차 개념, 공식, 계산 방법의 정리

표준 오차 (또는 평균 표준 오차)란 표본 평균에 대한 표준편차이다.

오차 용어를 사용하는 이유는 표준 오차 공식에서, 표본 평균의 평균값 \(k\)를 참값으로 간주하고 표본 평균과의 차이인 오차 개념이 적용되기 때문이다.

표준오차는 측정값의 표준편차를 구한 후 그 값을 \(\sqrt{n}\)으로 나누면 간단히 구할 수 있다.

반복실험에 의해 측정값이 100회 이상인 경우에는 정규분포의 신뢰수준에 따른 측정값 표기방식을 따르고 100회 미만인 경우에는 t-분포표에 따른 표기방식을 따른다.

만일 측정값이 단지 5개 미만이라면 무리해서 표준 오차를 구하는 것보다는 평균치와 표준편차를 그대로 보여주는 것이 좋다.

키워드에 대한 정보 표준 편차 표준 오차

다음은 Bing에서 표준 편차 표준 오차 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 표준오차가 뭔가요? 표준편차랑 다른건가요?

  • 표준오차
  • 표준편차

표준오차가 #뭔가요? #표준편차랑 #다른건가요?


YouTube에서 표준 편차 표준 오차 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 표준오차가 뭔가요? 표준편차랑 다른건가요? | 표준 편차 표준 오차, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

See also  사구체 여과율 계산 | 진료현장에 사용되는 수학 - 사구체여과율의 계산 263 개의 가장 정확한 답변

Leave a Comment