Ocena brak

Przedział ufności

Autor /Encyklopedia Zarządzania Dodano /17.02.2012

Przedział ufności

Przedział ufności to przedział, który z zadanym z góry prawdopodobieństwem <math>1- \alpha</math>, zwanym współczynnikiem ufności, pokrywa nieznaną wartość szacowanego parametru. Przedział ten jest podstawowym narzędziem estymacji przedziałowej. Pojęcie to zostało wprowadzone do statystyki przez polskiego matematyka Jerzego Spławę-Neymana.

Definicja

Niech cecha X ma rozkład w populacji z nieznanym parametrem <math>\theta</math>. Z populacji wybieramy próbę losową <math>\left(X_{1}, X_{2}, ..., X_{n}\right)</math>. Przedziałem ufności<math> \left(\theta - \theta_{1}, \theta + \theta_{2} \right)</math> o współczynniku ufności <math>1- \alpha </math> nazywamy taki przedział, który spełnia warunek:


<math>P \left(\theta_{1}< \theta< \theta_{2}\right) = 1- \alpha</math>


gdzie <math> \theta_{1} i \theta_{2}</math> są funkcjami wyznaczonymi na podstawie próby losowej.


Współczynnik ufności <math> 1 - \alpha</math> interpretujemy w sposób następujący: jest to prawdopodobieństwo, że rzeczywista wartość parametru <math>\theta</math> w populacji znajduje się w wyznaczonym przez nas przedziale ufności tworzonym dzięki wielokrotnym pobieraniu prób n-elementowych prostych. Im większa wartość tego współczynnika, tym szerszy przedział ufności, a więc mniejsza dokładność estymacji parametru. Im mniejsza wartość <math> 1- \alpha</math>, tym większa dokładność estymacji, ale jednocześnie tym większe prawdopodobieństwo popełnienia błędu. Wybór odpowiedniego współczynnika jest więc kompromisem pomiędzy dokładnością estymacji a ryzykiem błędu. W praktyce przyjmuje się zazwyczaj wartości współczynnika bliskie 1 (0,9; 0,95; 0,99).

</div>

Przykłady przedziałów ufności

Największa dokładność estymacji parametru następuje wtedy, kiedy przedział ufności jest możliwie najkrótszy. Aby taki był należy wykorzystać wszystkie dostępne informacje o rozkładzie cechy w populacji. Interesujące są przede wszystkim odchylenie standardowe(<math>\sigma</math>) oraz liczebność próby.

Przedział ufności dla średniej


Znane odchylenie standardowe

Zakładamy, że cecha ma w populacji rozkład normalny N(<math>\mu</math>,<math>\sigma</math>), przy czym odchylenie standardowe <math>\sigma</math> jest znane. Przy estymacji przedziałowej tego parametru opieramy się na jego estymatorze tj. średniej z próby. Ma ona postać:


<math> \bar{X} \frac{1}{n} \sum_{k1}^n X_{i}</math>


Przedział ufności dla średniej µ populacji generalnej ma postać:


<math>P \left( \bar{X} - \mathit{u}_{\alpha} \frac{\sigma}{\sqrt{\mathit{n}}} < \mu < \bar{X} + \mathit{u}_{\alpha} \frac{\sigma}{\sqrt{\mathit{n}}} \right) = 1 - \alpha</math>


gdzie:

  • <math>\bar{X}</math> - średnia z próby losowej
  • <math>\sigma</math> - odchylenie standardowe populacji
  • n - liczebność próby losowej
  • <math>u_{\alpha}</math> - wartość zmiennej U~N(0,1) określona dla prawdopodobieństwa <math> 1 - \alpha</math> tak, aby:
<math>P\left(-u_{\alpha} < U < u_{\alpha}\right) = 1 - \alpha</math>


Nieznane odchylenie standardowe

W praktyce wartość odchylenia standardowego(<math>\sigma</math>) jest nieznana. Wynika z tego, że rozkład estymatora <math>\bar{X}</math> nie może być wyznaczony. Dlatego też, przy nieznanym odchyleniu standardowym korzysta się ze statystyki T wykorzystującej odchylenie standardowe z próby(S). Statystyka ta ma rozkład t-Studenta z <math>n - 1</math> stopniami swobody.

Przedział ufności dla średniej <math>\mu</math> populacji generalnej ma postać:


<math>P \left( \bar{X} - \mathit{t}_{\alpha} \frac{\mathit{S}}{\sqrt{\mathit{n} - 1}} < \mu < \bar{X} + \mathit{t}_{\alpha} \frac{\mathit{S}}{\sqrt{\mathit{n} - 1}} \right) = 1 - \alpha</math>


gdzie:

  • <math>\bar{X}</math> - średnia z próby losowej
  • <math>\sigma</math> - odchylenie standardowe populacji
  • n - liczebność próby losowej
  • <math>t_{\alpha}</math> - wartość zmiennej losowej T

Warto także zauważyć, że przedział ufności dla parametru <math>\mu</math> w populacji o rozkładzie normalnym N(<math>\mu</math>,<math>\sigma</math>), w przypadku nieznanego parametru <math>\sigma</math>, jest na ogół przy tej samej liczebności próby(n) dłuższy niż przedział ufności dla średniej <math>\mu</math> w przypadku znanego odchylenia standardowego <math>\sigma</math>. Rozkład t-Studenta charakteryzuje się bowiem nieco większym spłaszczeniem(rozproszeniem) niż rozkład normalny. Ponieważ rozkład t-Studenta zdąża do standaryzowanego rozkładu normalnego przy <math> n - 1 \to \infty</math>, to różnice między obydwoma przedziałami będą - przy dużej liczebności próby - niewielkie, tak że w zastosowaniach praktycznych już przy n - 1> 30 zastępuje się dokładny rozkład t-Studenta rozkładem granicznym, czyli standaryzowanym rozkładem normalnym. (A. Zeliaś 2000, s.245-246)



Nieznane odchylenie standardowe - duża próba (n>30)

Cecha ma w populacji rozkład normalny N(<math>\mu</math>,<math>\sigma</math>), przy czym odchylenie standardowe(<math>\sigma</math>) jest nieznane, a próba jest duża (n>30).

Przedział ufności dla parametru <math>\mu</math> tego rozkładu ma postać:


<math>P \left( \bar{X} - \mathit{u}_{\alpha} \frac{\mathit{S}}{\sqrt{\mathit{n}}} < \mu < \bar{X} + \mathit{u}_{\alpha} \frac{\mathit{S}}{\sqrt{\mathit{n}}} \right) = 1 - \alpha</math>


gdzie:

  • <math>\bar{X}</math> - średnia z próby losowej
  • <math>\sigma</math> - odchylenie standardowe populacji
  • n - liczebność próby losowej
  • <math>u_{\alpha}</math> - wartość zmiennej U~N(0,1) określona dla prawdopodobieństwa <math> 1 - \alpha</math> tak, aby:
<math>P\left(-u_{\alpha} < U < u_{\alpha}\right) = 1 - \alpha</math>


Przedział ufności dla wariancji

Przedział ufności dla wariancji <math>\sigma^2</math> w populacji generalnej można wyznaczyć, gdy cecha X charakteryzująca zbiorowość ma rozkład normalny N(<math>\mu</math>,<math>\sigma</math>). Parametry <math>\mu</math>,<math>\sigma</math> są nieznane. Estymatorem wariancji jest wariancja z próby - <math>S^2</math>. Ma ona postać:


<math> S \sqrt{\frac{1}{n}\sum_{k1}^n (X_{i}-\bar{X})^2}</math>


Przedział ufności może być zbudowany na podstawie rozkładu statystyki chi-kwadrat o n - 1 stopniach swobody:


<math> \chi^2 = \frac{nS^2} {\sigma^2}</math>


Przedział ufności dla parametru <math>\sigma^2</math> tego rozkładu ma postać:


<math>P \left( \frac{nS^2}{ \chi^2_{1 - \frac{\alpha}{2},n-1 }} < \sigma^2 < \frac{nS^2}{ \chi^2_{\frac{\alpha}{2},n-1 }} \right) = 1 - \alpha</math>


gdzie:

  • n - liczebność próby losowej
  • S - odchylenie standardowe z próby
  • <math> \chi^2_{\frac{\alpha}{2}} \chi^2_ 1 - {\frac{\alpha}{2}}</math> - statystyki spełniające odpowiednio równości:

<math>P \left( \chi^2 \ge \chi^2_{\frac{\alpha}{2},\mathit{n}-1} \right) \le \frac{\alpha}{2}</math>


<math>P \left( \chi^2 \ge \chi^2_{1-\frac{\alpha}{2},\mathit{n}-1} \right) \le 1 - \frac{\alpha}{2}</math>


Na podstawie przedziałów ufności dla wariancji <math>\sigma^2</math> w populacji można zbudować przedziały dla odchylenia standardowego <math>\sigma</math> w populacji. Aby tego dokonać należy obliczyć pierwiastki kwadratowe członów podanej we wzorze nierówności, znajdujących się pod znakiem prawdopodobieństwa.


Przedział ufności dla odchylenia standardowego - duża próba (n > 30)

Budując taki przedział ufności wykorzystuje się fakt, że estymator S parametru <math>\sigma</math> ma asymptotyczny rozkład normalny.

Przedział ufności dla parametru <math>\sigma</math> tego rozkładu ma postać:


<math>P \left( \frac{S}{ 1+ \frac{u_{\alpha}} {\sqrt{2n}} } < \sigma < \frac{S}{ 1- \frac{u_{\alpha}} {\sqrt{2n}} }\right) = 1 - \alpha </math>


gdzie:

  • S - odchylenie standardowe z próby
  • n - liczebność próby losowej
  • <math>u_{\alpha}</math> - wartość zmiennej U~N(0,1) określona dla prawdopodobieństwa <math> 1 - \alpha</math> tak, aby:
<math>P\left(-u_{\alpha} < U < u_{\alpha}\right) = 1 - \alpha</math>


Przedział ufności dla wskaźnika struktury

W przypadku analizy cech jakościowych populacji generalnej estymuje się wskaźnik struktury lub - po pomnożeniu przez 100 - procent elementów wyróżnionych w populacji posiadających badaną cechę. Wskaźnik ma postać:


<math>p = \frac{M}{N}</math>


gdzie M oznacza liczbę elementów wyróżnionych natomiast N liczebność populacji.


Najlepszym estymatorem wskaźnika struktury w populacji jest wskaźnik struktury z próby określony wzorem:


<math> \bar{p} = \frac{m}{n}</math>


W przypadku gdy n jest duże, a p jest małym ułamkiem(p>0,05) można przyjąć, że estymator ma rozkład asymptotycznie normalny.


Przedział ufności dla parametru p tego rozkładu ma postać:



<math> P \left( \frac{m}{n} - \mathit{u}_{\alpha} \sqrt{\frac{\frac{m}{n}\left(1-\frac{m}{n}\right)}{n} }< p < \frac{m}{n} + \mathit{u}_{\alpha} \sqrt{\frac{\frac{m}{n}\left(1-\frac{m}{n}\right)}{n} }\right) = 1 - \alpha </math>


gdzie:

  • m - liczba elementów wyróżnionych w próbie
  • n - liczebność próby losowej
  • <math>u_{\alpha}</math> - wartość zmiennej U~N(0,1) określona dla prawdopodobieństwa <math> 1 - \alpha</math> tak, aby:
P<math>\left(-u_{\alpha} < U < u_{\alpha}\right) = 1 - \alpha</math>


Autor: Kamil Wójcik
Źródło: Encyklopedia Zarządzania
Treść udostępniana na licencji GNU licencja wolnej dokumentacji 1.3 lub nowsza.

Podobne prace

Do góry