Qq Plot 해석 | Qq Plot 상위 263개 베스트 답변

당신은 주제를 찾고 있습니까 “qq plot 해석 – QQ plot“? 다음 카테고리의 웹사이트 th.taphoamini.com 에서 귀하의 모든 질문에 답변해 드립니다: https://th.taphoamini.com/wiki/. 바로 아래에서 답을 찾을 수 있습니다. 작성자 통계는에이스 이(가) 작성한 기사에는 조회수 179회 및 좋아요 8개 개의 좋아요가 있습니다.

Q-Q plot이란? qqplot은 분위수대조도로 불리는 정규모집단 가정을 하는 방법 중 하나이다. 수집 데이터를 표준정규분포의 분위수와 비교하여 그리는 그래프로 데이터의 정규성 가정에 대한 검토를 가능하게 한다. 모집단이 정규성을 따른다면 직선의 형태로 그려지게 된다.

Table of Contents

qq plot 해석 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 QQ plot – qq plot 해석 주제에 대한 세부정보를 참조하세요

#QQplot #그래프 #통계

qq plot 해석 주제에 대한 자세한 내용은 여기를 참조하세요.

20. (R) 통계 – 정규성 검토 (Q-Q plot) – 네이버 블로그

Q-Q plot 이란 … qqplot은 분위수대조도로 불리며 정규모집단 가정을 하는 방법 중 하나이며 수집 데이터를 표준정규분포의 분위수와 비교하여 그리는 …

+ 더 읽기

Source: m.blog.naver.com

Date Published: 7/17/2022

View: 1713

Q-Q plot 정규분포에만 사용할까?? – Easy Statistics !

Q-Q plot이란? … Quantile – Quantile plot의 약자로, 분위수 대조도 라고 불리기도 합니다. 즉, quantile값을 사용해 두 확률분포를 비교하는 plot을 …

+ 여기에 더 보기

Source: laoonlee.tistory.com

Date Published: 5/18/2021

View: 2461

[기초 통계] Q-Q Plot (feat. shapiro-test) – 데이터과학 삼학년

Figure. 1. 분위수 대 분위수 플롯(Q-Q plot, quantile-quantile plot)[각주:1] · ⑴ (참고) 분위수(quantile) · ① 분위수 함수 : 누적분포함수 Φ의 역함수.

+ 자세한 내용은 여기를 클릭하십시오

Source: dodonam.tistory.com

Date Published: 2/2/2022

View: 6377

QQ Plot – actruce’s Blog

이번엔 QQPlot 은 이론적인 Quantile 값에 비해 위로 불룩한 형태로 그려지게 된다. 위에 사용된 R 소스는 GitHub 에 공유하였다. QQPlot 의 해석. 먼저 …

+ 여기에 더 보기

Source: actruce.com

Date Published: 11/13/2021

View: 7449

[데이터분석] 비전공자를 위한 QQ-Plot 설명하기

핵심부터 적어보자면 Q-Q Plot은 정규화를 검토하기 위한 그래프이다. 대략적으로 아래와 같이 생겼다. … 위에서 우리는 점들과 직선을 볼 수 있다. 직선 …

+ 여기에 자세히 보기

Source: han-py.tistory.com

Date Published: 3/5/2021

View: 3067

데이터과학을 위한 통계 리뷰- 5일차 (QQ plot,긴꼬리분포,t-분포 …

2.6.1 QQ plot (quantile-quantile Plot ). x축에는 Theoretical-Quantile 을, y축에는 획득된 샘플 값의 Empirical-Quantile (Z 점수) 을 표시.

+ 여기에 자세히 보기

Source: datacook.tistory.com

Date Published: 4/1/2022

View: 7891

엑셀에서 Q-Q플롯(Q-Q Plot) 그리기

Q-Q플롯(Q-Q Plot)은 ‘quantile-quantile plot’을 의미한다. Q-Q플롯(Q-Q Plot)은 선택된 데이터가 이론적인 분포를 하고 있는지 파악할 때 쓰인다.

+ 자세한 내용은 여기를 클릭하십시오

Source: loadtoexcelmaster.tistory.com

Date Published: 8/1/2022

View: 6538

[R 강의] 49. Q-Q plot 그리는 방법 (qqnorm)

도구 R로 푸는 통계 49. Q-Q plot 그리는 방법 (qqnorm) Q-Q plot은 Quantile-Quantile plot 의 약어입니다. Quantile은 ‘분위수’입니다.

+ 여기에 표시

Source: statools.tistory.com

Date Published: 7/30/2022

View: 6628

QQplot 해석-비정규 성을 결정할 규칙이 있습니까? 경험 법칙이

QQplot이 다른 정규성 테스트보다 더 유익 할 수 있음을 이해하기 위해 QQplots에서 충분한 스레드를 읽었습니다. 그러나 QQplots를 해석 한 경험이 …

+ 여기를 클릭

Source: qa.apthow.com

Date Published: 9/28/2021

View: 7627

주제와 관련된 이미지 qq plot 해석

주제와 관련된 더 많은 사진을 참조하십시오 QQ plot. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

QQ plot
QQ plot

주제에 대한 기사 평가 qq plot 해석

  • Author: 통계는에이스
  • Views: 조회수 179회
  • Likes: 좋아요 8개
  • Date Published: 2021. 10. 19.
  • Video Url link: https://www.youtube.com/watch?v=ROCoCovIu9I

20. (R) 통계 – 정규성 검토 (Q-Q plot)

지금부터 이 그래프를 그리는 방법과 이를 통해 정규성을 검토하는 방법에 대해 알아보겠습니다.

분위수(Quantile)에 대한 개념이 먼저 필요합니다.

분위수란 데이터의 분포에서 전체 넓이를 일정 비로 나누어 위치에 있는 값을 의미합니다.

* 많은 분들이 사분위수(quartile)과 분위수(quantile)의 발음이 유사하여 개념을 혼동하는 분들이 계십니다.

사분위수는 통계학에서

Min(최솟값) – Q1(제1 분위수 ) – Median(중위수) – Q3(제3 분위수) – Max(최댓값)을 의미하는 개념으로 각 0분 위수, 1/4 분위수, 2/4 분위수, 3/4 분위수, 4/4 분위수를 의미합니다.

개념과 발음이 유사하여 혼동하시는 분들이 많으니 혼동에 유의하시는 게 좋습니다!

위 사분위수에 대한 개념이 분위수 사용의 예라고 볼 수 있을 것 같습니다.

qqplot에서도 마찬가지로 위와 같은 분위수 개념이 적용됩니다.

이는 표준정규분포의 분위수와 이에 대응하는 분포의 분위수를 x, y 좌표평면에 plotting 하는 개념입니다.

확률 표본(X1, X2, X3, X4…. X100)이 평균이 mu, 표준편차가 std인 정규모집단을 따르는 모집단에서 추출된 표본인지에 대한 검토를 예로 들어보겠습니다.

표준정규분포의 분위수는 1~n(표본의 수)의 백분율 값만큼의 표준정규분포 X좌표 value가 됩니다.

예제의 분위수는 Z 0.01 , Z 0.02 , Z 0.03 ….Z 1 의 값이 됩니다.

이를 qnorm(quantile, mu, sd) 함수를 이용하여 각 백분율 값의 분위수를 구하면 아래와 같이 산출됩니다.

Q-Q plot 정규분포에만 사용할까??

회귀분석에서 오차의 정규성 검정에 자주 사용되는 Q-Q plot은 과연 정규분포에만 사용될까요??

결론부터 말하자면,

아닙니다!

Q-Q plot은 정규분포가 아닌 다른 분포에도 가능하며,

단지 두 확률 분포가 같은 형태인지를 확인하는 방법입니다.

그렇다면 이제부터 더 자세히 알아보겠습니다. 🙂

Q-Q plot이란?

Quantile – Quantile plot의 약자로, 분위수 대조도 라고 불리기도 합니다.

즉, quantile값을 사용해 두 확률분포를 비교하는 plot을 의미합니다!

그렇다면 quantile은 뭘까요?

quantile이란?

분위수로 불리며, 확률분포를 동일한 확률 간격으로 나누는 절단점을 의미합니다. (Wikipedia)

대표적으로 사분위수(Quartile)가 Quantile의 한 예입니다.

ex) (140, 143, 151, 155, 160)의 5개의 데이터가 있을 때, 20(%)-quantile 값은 5 x 0.2 = 1

즉, 1번째 값인 140이 되는 것입니다.

다시 Q-Q plot

으로 돌아와 얘기해보겠습니다.

Q-Q plot은 quantile을 통해 비교한다고 하였습니다. 그렇다면 어떻게 할까요??

예를 들어 $x$ : 100명 사람의 키 , $y$ : 100명 양팔 길이라 하고 100%-quantile(= 값을 100등분)을 사용한다고 합시다.

그렇다면 Q-Q plot은 ($x_i$ , $y_i$) i = 1,2,$\cdots$,100인 100쌍의 값들을 갖습니다. 여기서,

($x_1$, $y_1$) = (가장 작은 키, 가장 짧은 양팔 길이)

($x_2$, $y_2$) = (2번째 작은 키, 2번째 짧은 양팔 길이)

$\vdots$

($x_100$, $y_100$) = (가장 큰 키, 가장 긴 양팔 길이)가 되는 것입니다.

cf) 여기서 한 가지, 그렇다면 두 값의 개수가 다르다면 어떻게 할까요??

그럴 경우에는 적은 데이터에 대해 중복을 허용하게 됩니다.

즉, $x$는 100개 $y$는 50개인 경우 ($x_1$, $y_1$)($x_2$, $y_1$) ($x_3$, $y_2$) 이런 식으로

$x$의 개수에 맞춰 $y$는 중복되어 사용됩니다.

이런식으로 생긴 값들의 점을 plot위에 찍게 되고,

두 데이터의 확률분포가 비슷할수록 (대각선) 직선에 가까운 형태를 갖습니다.

즉, 분포가 정규분포가 아니라

단지 두 분포가 같은 형태인지를 확인하는 것이 Q-Q plot인 것입니다!

아래의 이미지를 보시면 Normal distribution이 아닌 “Theoretical Quantile vs Sample Quantile”로

이론적인 분포와 샘플의 분포를 비교하는 것으로 표시되어 있습니다.

Q-Q plot 해석

Q-Q plot을 간단히 해석하기 전에 세가지만 고려해주세요

1. $x$축이 이론적 분포 즉, 기준이 되는 분포입니다.

2. $y$축은 비교하고자 하는 분포 즉, 비교대상 분포입니다.

3. 데이터는 크기순으로 나열되어 왼쪽이 작은 값 오른쪽이 큰 값입니다.

이제 해석해보겠습니다.

– 점들이 직선 위에 있다 : 두 분포가 같은 형태이다.

– 특정 점들이 선 위쪽에 있다 : 그 위치에서 비교대상 분포가 기준 분포의 값보다 작은 값을 갖는다.

– 특정 점들이 선 아래쪽에 있다 : 그 위치에서 비교대상 분포가 기준분포의 값보다 큰 값을 갖는다.

이것만 아시면 가능합니다!

[기초 통계] Q-Q Plot (feat. shapiro-test)

반응형

Q-Q Plot

데이터의 정규성을 파악할때, QQ plot을 이용해 확인할수 있다.

이론적으로 데이터가 정규성을 따를때 quantiles 값을 x 축

실제 데이터들의 quantiles 값을 y 축

표현하게 된다.

이렇게 되면 데이터가 완전한 정규분포를 이루게 되면

아래와 같은 그림이 나오게 된다.

데이터에 skewed 가 있을때 Q-Q Plot

Figure. 1. 분위수 대 분위수 플롯(Q-Q plot, quantile-quantile plot)

⑴ (참고) 분위수(quantile)

① 분위수 함수 : 누적분포함수 Φ의 역함수

정의역 : {x | 0 ≤ x ≤ 1}

치역 : 관심 있는 집단의 통계량

② 구간의 개수에 따라 100분위수(percent), 4분위수(quartile) 등이 존재

⑵ 정의 : 다음과 같은 점 (x, y)들의 집합

①{(x, y) | Φ = P(X < x) = P(Y < y)}

② x는 표준정규분포의 통계량이고 y는 표본집단의 통계량임을 유의

⑶ 사례 분석

① 정규분포를 따르는 경우 : Q-Q plot은 직선에 가까움

② 오른쪽으로 skew된 경우

(참고) skewness < 0

발상 : 기존 정규분포에서 각 점들을 오른쪽으로 잡아끄는 것을 상기

각 점들의 확률변수가 커지므로 Q-Q plot 상의 각 점이 직선 위로 향함

③ 왼쪽으로 skew된 경우

(참고) skewness > 0

발상 : 기존 정규분포에서 각 점들을 왼쪽으로 잡아끄는 것을 상기

각 점들의 확률변수가 작아지므로 Q-Q plot 상의 각 점이 직선 아래로 향함

출처: https://nate9389.tistory.com/1742 [정빈이의 공부방]

QQ-Plot 외 데이터의 정규성을 확인하는 방법

Shapiro=test 샤피로 윌크 검정

샤피로 윌크 검정Shapiro-Wilk Test은 표본이 정규 분포로부터 추출된 것인지 테스트하기 위한 방법이다. 검정은 shapiro.test( ) 함수를 사용하며 이때 귀무가설은 주어진 데이터가 정규 분포로부터의 표본이라는 것이다.

shapiro.test : 데이터가 정규 분포를 따르는지 샤피로 윌크 검정을 수행한다. 귀무가설은 정규 분포를 따른다는 것이다.

▼ 표 7-15 샤피로 윌크 검정

다음은 정규 분포를 따르는 1,000개의 난수를 발생시킨 뒤 이 숫자들이 정규 분포를 따르는지 샤피로 윌크 검정을 수행한 예다.

> shapiro.test(rnorm(1000)) Shapiro-Wilk normality test data: rnorm(1000) W = 0.9974, p-value = 0.1052

p-value > 0.05이므로 데이터가 정규 분포를 따른다는 귀무가설을 기각할 수 없다.

즉 p-value가 클수록 데이터 정규분포를 따른다는 가정이 맞다고 볼 수 있다.

shapiro.test( ) 외에도 nortest 패키지에는

앤더스 달링 검정(Anderson-Darling Test)

피어슨 카이 제곱 검정(Pearson Chi-Square Test) 등을 사용해

정규성을 검정하는 다양한 함수가 있으니 참고하기 바란다.

thebook.io/006723/ch07/05/02/

728×90

반응형

QQ Plot – actruce’s Blog

Q-Q (quantile-quantile) Plot

Q-Q Plot 을 살펴보기 이전에 먼저 Quantile 이라는 개념을 짚고 넘어가자. Quantile 은 분위수라는 개념인데, 데이터들을 정렬한 뒤에 몇 등분으로 나눌 수 결정하고, 나눠진 등분을 구분하는 구분자를 찾는 개념이다. 이는 ‘Quantile (분위수)‘ 포스트를 참고하길 바란다.

Q-Q 가 의미하는 바가 quantile-quantile 인데,

Theoretical-Quantile vs. Emprical-Quantile ( Sample-Quantile )

로 생각하면 된다. 즉 가로축에는 이론상의 Quantile 을, 세로축에는 획득된 샘플 값의 Quantile 을 찍었을 때 이론과 실제가 얼마나 차이나는지를 쉽게 표현하기 위한 Plot 이다. (물론 가로, 세로가 바뀔 수도 있다.)

일종의 Q-Q Plot 인 Normal Probability Plot 을 예로 들어서 계속 설명하겠다.

유투브에 엑셀로 쉽게 설명한 영상이 있어 이를 참고하였다.

어떤 중학교 남학생의 키 데이터를 생각해 보자. 데이터를 키의 오름차순으로 정리한 후 개수만큼 인덱스를 정한다. 여기에는 57개의 데이터가 있다. 각각의 데이터의 이론적인 quantile (theoretical quantile) 인, 57-quantile 을 (i-0.5)/57 로 근사하여 계산한다. 그 후에 실제 데이터는 Standard Normal Distribution (정규 노멀 분포) 를 가정하여 정규화 시킨다. ( Z = \dfrac {(x-\mu)}{\sigma} )

Theoretical Quantile 을 가로축에 Empirical Quantile 을 세로축에 놓고 그래프를 그리면 Q-Q Plot 이 그려진다. (여기서 모집단의 분포를 모르지만 이론적인 분위수를 1부터 57까지 누적정규확률분포에 근사한다.)

QQPlot 의 형태

이론적 분위수 (Theoretical Quantiles) 와 실제 관찰된 분위수 (Empirical Quantiles) 를 Plotting 해보면, 대략적인 확률분포 형태를 짐작 해 볼 수 있다.

① 정규분포 (Normal Distribution) 을 따를 때

먼저 정규분포와 가깝게 데이터를 생성해 보면 다음과 같은 정규분포와 근접한 히스토그램을 얻을 수 있다.

위 데이터로 QQPlot 을 그려보면 이론적인 정규분포의 Quantile 값과 거의 일치하여 직선으로 Fitting 되는 것을 확인 할 수 있다.

② 왼쪽으로 치우친 분포 (Left-Skewed Distribution) 을 따를 때

분포가 왼쪽으로 치우치도록 데이터 샘플링 확률을 변경하여 히스토그램을 그려보면 다음과 같다.

위 히스토그램의 QQPlot 을 그려보면 아래와 같이 이론적인 Quantile 값에 비해 아래로 불룩한 형태로 그려지게 된다. 아래에서 좀 더 살펴보겠지만 같은 Q_t 값에 비해 Q_e 값이 작기 때문으로 생각할 수 있다.

③ 오른쪽으로 치우친 분포 (Right-Skewed Distribution) 을 따를 때

분포가 오른쪽으로 치우치도록 데이터 샘플링 확률을 변경하여 히스토그램을 그려보면 다음과 같다.

이번엔 QQPlot 은 이론적인 Quantile 값에 비해 위로 불룩한 형태로 그려지게 된다.

위에 사용된 R 소스는 GitHub 에 공유하였다.

QQPlot 의 해석

먼저 이곳의 해석을 참조 했음을 밝혀둔다.

Q_t 를 Theoretical Quantile 로, Q_e 를 Empirical Quantile (또는 Sample Quantile) 로 지칭하자. 아래와 같이 표본 분포(Sample Distribution) 가 Light-Tailed (이론적인 분포에 비해 꼬리 값이 더 얕은 분포) 를 가질 경우,

Q_e < Q_t 를 만족하게 된다. 반대로 Heavy-Tailed (이론적인 분포에 비해 꼬리 값이 더 두터운 분포)인 경우는 Q_e > Q_t 이 되고, 이를 그림으로 표현해 보면 아래와 같다.

즉, Light-Tailed 의 QQPlot 의 경우 직선 아래로 쳐지게 되며, Heavy-Tailed 의 QQPlot 의 경우 직선 위로 치솟게 되는 형태가 된다.

Left-Skewed 와 Right-Skewed 분포는 어떻게 될까? Left-Skewed 의 경우 분포가 왼쪽으로 치우치게 되어 정규 분포에 비해 Q_e < Q_t 관계가 되어 가운데가 아래로 불룩한 형태로 QQPlot 이 그려지며, Right-Skewed 분포는 반대로 가운데에서 위로 불룩한 형태가 된다. (위의 R Plot 을 확인해 보자.) 양쪽 꼬리 각각 (Right Tail 과 Left Tail)의 Light-Tailed 형태와 Heavy-Tailed 형태의 조합에 대해 정리해 보면 아래와 같이 정리할 수 있겠다. 4가지 조합이 나오며 Right Tail 의 형태가 QQPlot 의 오른쪽부분, Left Tail 의 형태가 왼쪽 부분의 모양을 결정한다. 위 링크에서도 소개 되었지만 MOOC 의 MIT 강의에서 이를 잘 설명해주고 있다. (45분 경) 이번 포스트에서 강조하고 싶은 부분은 이론적인 분위수(Theoretical Quantile)과 실제관찰된 분위수(Empirical Quantile) 간의 비교를 통해서 QQPlot 을 해석하면 된다는 것이다. 위 설명이 도움이 되었길 바라며, 포스트를 마친다.

[데이터분석] 비전공자를 위한 QQ-Plot 설명하기

반응형

통계는 공부하면 할수록 어렵다. 다른 블로그들은 봐도 수학적 기호가 뭐 그래 많은지…. 잘 모르겠다. 그래서 내가 정리해 보기로 했다. 기본적으로 데이터 분석을 위해 통계학적 지식은 사용할 수 있을 정도로만 이해하면 된다. 따라서 담백하게 수학적 이해를 제외하고 핵심만 간단히 적어보겠다. 우리는 데이터 분석을 위해 qq plot를 사용하고 있고 어떻게 사용하면 되는지를 중점적으로 이야기해 보겠다.

Q-Q Plot

핵심부터 적어보자면 Q-Q Plot은 정규화를 검토하기 위한 그래프이다. 대략적으로 아래와 같이 생겼다.

https://en.wikipedia.org/wiki/Q%E2%80%93Q_plot#/media/File:Normal_exponential_qq.svg

위에서 우리는 점들과 직선을 볼 수 있다. 직선은 정규분포의 값이고, 점선은 우리가 가진 실제 데이터 값이다. 분석하는 방법은 다음과 같다.

점선과 직선이 일치할수록, 데이터는 정규분포를 따른다.

위의 그림처럼 점선과 직선이 일치하지 않으면 데이터는 정규분포를 따르지 않는다.

코드

사용법을 알았으니 작성법을 알아보자.

import matplotlib.pyplot as plt import statsmodels.api as sm sm.qqplot(raw_data, fit=True, line=’45’)

> raw_data 위치에 분석하고자 하는 칼럼을 넣어주면 된다.

반응형

데이터과학을 위한 통계 리뷰- 5일차 (QQ plot,긴꼬리분포,t-분포,이항분포,푸아송 분포, 지수분포,고장률 추정,와이블 분포)

반응형

2.6.1 QQ plot (quantile-quantile Plot )

x축에는 Theoretical-Quantile 을, y축에는 획득된 샘플 값의 Empirical-Quantile (Z 점수) 을 표시

• 이론과 실제가 얼마나 차이나는지를 쉽게 표현하기 위한 Plot

Quantile 은 분위수라는 개념인데, 데이터들을 정렬한 뒤에 몇 등분으로 나눌 수 결정하고, 나눠진 등분을 구분하는 구분자를 찾는 개념

2.7 긴꼬리분포

데이터는 일반적으로 정규분포를 따르지 않는다(적은수의 극단값이 주로 존해하는 tail 을 갖음)

정규분포와 밀접한 관계 (일반적 – 왜도의 기준은 “0”)

Data의 평균의 경향 => 왜도, 표준편차의 경향 => 첨도

2.8 스튜던트의 t 분포

1. t 분포 = 연속확률분포이면서 표본분포로, 정규분포와 유사하게 생긴 t(평균)=0에서 좌우대칭을 이루는 분포

2. x축은 z점수, y축은 값

3. 분포의 모양을 결정하는 건 자유도이며, 자유도가 커질수록 표준정규분포에 가깝게 됨

t분포는 언제 사용을 할까요?

1.표본평균

2.두 표본평균 간 차이

3.회귀 파라미터

4.그 외 다른 통계량들의 분포를 구할 때

정규분포와 비슷하지만, 꼬리 부분이 약간 더 두껍고 길다.

표본의 크기가 크지 않으면 편향될 가능성이 있고, 신뢰도도 떨어진다.

그 대응책으로 예측 범위를 넓히기 위해 꼬리 부분을 조금 더 길고 두껍게 한 것.

표본이 커질수록 더 정규분포를 닮은 t 분포가 형성된다.

정리

표준화된 여러 통계 자료를 t 분포와 비교하여 신뢰구간을 추정할 수 있다.

* t 분포로 신뢰구간을 추정하고 가설검정을 할 때 t 값을 알아야 하는데, t값은 그래프의 x축 좌표

t값은 보통 ‘t분포표’를 사용해서 구함.

a = 유의확률, n = 표본크기

1.T분포 정리 + 식

https://blog.naver.com/PostView.nhn?blogId=antifatekr&logNo=221061029807&proxyReferer=https:%2F%2Fwww.google.com%2F

: t분포 추정 예시

https://blog.naver.com/PostView.nhn?blogId=gdpresent&logNo=221138172138&proxyReferer=https:%2F%2Fwww.google.com%2F

: t분포 보는 법 + 개념

이항분포

용어 내용 시행(trial) 독립된 결과를 가져오는 하나의 사건(예: 동전던지기) 성공(success) 시행에 대한 관심의 결과 (유의어: 1. 즉 0에 대한 반대) 이항식(binomial) 두 가지 결과를 갖는다.(유의어: 예/아니오, 0/1, 이진 이항시행(binomial trial) 두 가지 결과를 가져오는 시행 (유의어 : 베르누이 시행) 이항분포 (binomial distribution) X번 시행에서 성공한 횟수에 대한 분포 (유의어 : 베르누이 분포)

Ex) 우리의 목표를 학생이 수능 시험을 봤을 때 어떤 성적을 받을지 예측하는 것으로 해봅니다.

변수는 (모의) 수능 시험 성적입니다.

그리고 데이터는 실제로 변수에서 관측된 값입니다. (0점 ~ 400점)

우리는 모의 수능 시험 성적(데이터들)을 토대로 수능 시험 성적(변수)가 얼마가 나올지 예측할 수 있습니다.

2.10 푸아송 분포, 지수분포

•푸아송 분포 : 단위시간, 단위 공간에 어떤 사건이 몇 번 발생할 것인가를 표현하는 이산확률분포

극히 일어나지 않는 사건들의 일어날 확률을 구할때 사용

•Ex) 한 주에 고장 나는 횟수의 평균값이 3.4인 팝콘 기계가 있다. 기계가 3번 고장 날 확률?

#Python code import numpy as np np.random.poisson(lam=5, size=10000)

•지수분포 : 사건과 사건사이의 경과된 시간에 대한 분포, 다음 사건이 일어날 때 까지 대기시간

•Ex) 어느 회사에서 판매하는 전자제품의 평균수명은 3년, 보증기간은 1년이라고 한다. 그럼 이 전자제품이 1년 이내에 고장 나서, 보상받을 확률?

#Python code import numpy as np np.random.exponential(0.5, 10000)

2.10.3 고장률 추정

고장률(Failure rate)

: 공학 시스템이나 소자가 얼마나 자주 고장이 나는지를 측정하는 척도 (λ)

신뢰도 : R(t)

일정 시간 t 시점에서 동작하고 있는 Item의 비율

R(t) = (n(t))/N

n(t) : t 시점에서 동작하고 있는 수

N : 총 Item의 수

불신뢰도 : F(t)

일정 시간 t 시점에서 고장난 Item의 비율(누적고장확률)

F(t) = 1 – R(t) = 1 – (n(t))/N = (N – n(t))/N

R(t) + F(t) = 1

① t = 0 일 때, F(0) = 0, R(0) = 1

② t = ∞ 일 때, F(∞) = 1, R(∞) = 0

고장확률밀도함수 : f(t)

수명(고장시간)분포의 확률밀도함수

t시점과 t + ∆t 사이에서 발생한 구간 고장비율을 ∆t로 나눈 단위시간당 고장비율

고장률함수 : λ(t)

t 시점의 순간고장률

문제 예시

N = 90, 시험시간 = 6시간

동작시간 고장 수 동작 수 0~1 4 86 1~2 21 65 2~3 30 35 3~4 25 10 4~5 8 2 5~6 2 0

t=2에서 고장률은?

2.10.4 와이블 분포

와이블 분포(Weibull distribution)

: 사건 발생률(λ)가 일정한 지수분포와는 달리, 사건 발생률이 시간에 따라 변화하는 분포

반응형

엑셀에서 Q-Q플롯(Q-Q Plot) 그리기

Q-Q플롯(Q-Q Plot)은 ‘quantile-quantile plot’을 의미한다.

Q-Q플롯(Q-Q Plot)은 선택된 데이터가 이론적인 분포를 하고 있는지 파악할 때 쓰인다. 여기서 ‘이론적인 분포’란 정규분포(normal distribution)를 의미한다.

이번 포스팅에서는 Q-Q플롯(Q-Q Plot)을 만들어본다.

예시: 엑셀에서 Q-Q플롯(Q-Q Plot) 만들기

아래의 단계별로 Q-Q플롯(Q-Q Plot)을 그려본다.

1단계: 데이터 입력

우선 데이터를 오름차순으로 정리를 해야 한다. 위에 데이터는 오름차순으로 정리가 돼있다.

오름차순 정리를 하기 위해서 데이터 > 필터 > 오름차순으로 정렬한다.

2단계: 각 데이터에 순위를 찾는다.

엑셀에서 랭크 함수를 사용해서 데이터별 순위를 찾아낸다.

=RANK(A2, $A$2:$A$11, 1)

3단계: 백분위(percentile)를 찾아낸다.

아래 수식을 사용해서 백분위(percentile)을 찾아낸다.

=(B2-0.5)/COUNT($B$2:$B$11)

4단계: z-점수(z-score)를 구한다.

아래 수식을 사용해서 z-점수(z-score)을 구한다.

=NORM.S.INV(C2)

5단계: Q-Q플롯(Q-Q Plot)을 그린다.

A열에 데이터를 E열에 똑같이 복사한다. 그리고 D열, E열을 선택한다.

삽입 > 차트 > 분산형(X, Y)또는 거품형 차트 삽입에서 분산형을 선택한다.

아래와 같은 차트가 그려진다.

우측 상단에 + 마크를 클릭하고 추세선을 추가해준다.

보기 좋게 꾸며준다.

Q-Q플롯(Q-Q Plot)에 데이터가 45도 정도로 그어진 추세선에 맞아떨어질수록 데이터는 정규 분포(normal distiribution)에 가깝게 분포해있다. 왼쪽에선 아래로, 오른쪽에선 위로 살짝 벗어나 있어서 완전 정규 분포(normal distribution)가 아니다.

Q-Q플롯(Q-Q Plot)은 공식적인 통계 검정은 아니다. 하지만 정규 분포성을 검정할 수 있는 간편한 방법이다.

[R 강의] 49. Q-Q plot 그리는 방법 (qqnorm)

도구 R로 푸는 통계

Q-Q plot은 Quantile-Quantile plot 의 약어입니다. Quantile은 ‘분위수’입니다.

(분위수 설명 : http://hsm-edu.tistory.com/533)

이름 자체가 의미하고 있듯이 Q-Q plot은 분위수들을 그래프로 그리는 것입니다. 좌표평면에 있는 두개의 축에 서로 다른 두 데이터의 분위수를 각각 그려서 서로 비교합니다. 비교를 통해 두 데이터가 같은 분포를 따른는지 정성적인 판단을 합니다.

우리가 Q-Q plot을 사용할때는 주로 우리가 가진 데이터와 정규분포를 비교합니다. 따라서 ‘정규성 검정’의 한 방법이라고 이야기할 수도 있습니다.

– 넓은 의미의 Q-Q plot : 임의의 두 데이터 분포를 비교함

– 좁은 의미의 Q-Q plot : 정규성 검정의 한 방법

우리는 정규성검정을 위한 Q-Q plot을 그려볼 것입니다. qqnorm 함수를 사용합니다. qqnorm함수에 분위수 계산이 포함되어 있는데요. 이때 Type 9 의 계산방법을 사용합니다. (분위수 설명 : http://hsm-edu.tistory.com/533)

1부터 1000까지 수 중에서 임의로 50개를 뽑겠습니다.

(랜덤 샘플링 방법 : http://hsm-edu.tistory.com/457)

> SP=sample(1:1000,50)

Q-Q plot을 그리는 방법은 아래와 같습니다.

> qqnorm(SP) > qqline(SP)

이번에는 샘플을 표준정규분포에서 뽑고 Q-Q plot을 그려봅시다.

(표준정규분포에서 임의추출 : http://hsm-edu.tistory.com/263)

> SP_normal=rnorm(50) > qqnorm(SP_normal) > qqline(SP_normal)

QQplot 해석-비정규 성을 결정할 규칙이 있습니까? 경험 법칙이

QQplot이 다른 정규성 테스트보다 더 유익 할 수 있음을 이해하기 위해 QQplots에서 충분한 스레드를 읽었습니다. 그러나 QQplots를 해석 한 경험이 없습니다. 나는 많은 구글 검색; 나는 비정규 QQplots에 대한 많은 그래프를 찾았지만, 분포와 “장감”을 아는 것 외에는 그것을 해석하는 방법에 대한 명확한 규칙이 없습니다.

비정규 성을 결정하는 데 도움이되는 경험 법칙이 있는지 알고 싶습니다.

이 질문은이 두 그래프를 보았을 때 나타났습니다.

나는 비정규 성 결정이 데이터와 내가하고 싶은 것에 달려 있다는 것을 이해한다. 그러나 내 질문은 : 일반적으로 직선에서 관찰 된 출발이 정규성의 근사치를 불합리하게 만들 수있는 충분한 증거를 언제 구성합니까?

그만한 가치가 있기 때문에 Shapiro-Wilk 검정은 두 경우 모두 비정규 성 가설을 기각하지 못했습니다.

키워드에 대한 정보 qq plot 해석

다음은 Bing에서 qq plot 해석 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 QQ plot

  • 동영상
  • 공유
  • 카메라폰
  • 동영상폰
  • 무료
  • 올리기

QQ #plot


YouTube에서 qq plot 해석 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 QQ plot | qq plot 해석, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

See also  Happy Birthday To You 가사 | Happy Birthday To You 가사동영상 55 개의 가장 정확한 답변

Leave a Comment