Ocena brak

Charakterystyki liczbowe rozkładów statystycznych

Autor /barbara Dodano /26.03.2011

Wymagany Adobe Flash Player wesja 10.0.0 lub nowsza.

praca w formacie txt Charakterystyki liczbowe rozkładów statystycznych

Transkrypt

Charakterystyki liczbowe rozkładów statystycznych
Charakterystyki pozycyjne
1.ŚREDNIA ARYTMETYCZNA:

xp =

gdzie
2.MEDIANA:

1
1 n
∑ x i lub x p = ∑ xi ni ,
n i
n i =1

x i -wartości,które przyjmuje cecha , ni -częstości.

x me - wartość cechy, która rozdziela uporządkowany szereg wartości cechy na dwie
równe grupy: pierwszą zawierającą elementy z wartościami cechy x 〈 x me
i drugą zawierającą elementy z wartościami cechy x 〉 x me .

Dla cechy skokowej: gdy n-nieparzyste (n=2k+1) , to
gdy n-parzyste (n=2k ) , to

x me

x me = x k +1
x + x k +1
.
= k
2

Dla cechy ciągłej medianę znajdujemy korzystając z warunku
przedział

( xi −1 , xi )

Fn ( x me ) =

1
. Znajdujemy najpierw
2

,w którym jest mediana, korzystając z warunku:

1
1
, Fn ( xi ) ≥
a wartość mediany ze wzoru:
2
2
0.5 − Fn ( xi −1 )
( xi − xi −1 ) ,
x me = xi −1 +
ωi
gdzie ω i -częstość względna przedziału mediany ( xi −1 , xi ) .
Fn ( xi −1 ) ≤

3.MODA (dominanta):

x mo

Dla cechy skokowej jest to ta wartość cechy, której odpowiada największa częstość .
Dla cechy ciągłej znajdujemy najpierw przedział, w którym jest moda, tzn. taki przedział
odpowiada największa częstość, a wartość mody znajdujemy ze wzoru:

x mo = xi −1 +
gdzie

( xi −1 , xi )

ni − ni −1
(x − x ) ,
( ni − ni−1 ) + ( ni − ni +1 ) i i−1

ni - częstość przedziału mody, ni −1 - częstość przedziału poprzedzającego przedział mody,

ni +1 - częstosc przedziału następującego po przedziale mody.

któremu

Momenty empiryczne
DEF. Momentem empirycznym rzędu

l względem stałej c nazywamy liczbę:

µl =

1
∑ ( xi − c ) l ni .
n i

1
∑ xi ni = x p
n i
1
2
2
momenty nazywamy centralnymi, np. µ 2 = ∑ ( xi − x p ) ni = D p X nazywamy wariancją
n i

Dla c=0 momenty nazywamy zwykłymi, np.
Dla c= x p

µ1 =

Charakterystyki rozrzutu
Charakterystyki rozrzutu różnią się między sobą wyborem średniej względem której badamy odchylenie, oraz
sposobami szacowania odchyleń.
1.ROZSTĘP:

R = x max − x min

2.ODCHYLENIE STANDARDOWE:

2
σ P = Dp X =

3.WSPÓŁCZYNNIK ZMIENNOŚCI:

Vp =

1
∑ ( x i − x p ) 2 ni
n i

σp
100% .
xp

Współczynnik zmienności ma duże zastosowanie przy porównywaniu wielkości rozproszenia
dwóch szeregów statystycznych, które mogą mieć różne średnie. Większe rozproszenie ma ten
szereg, dla którego współczynnik zmienności jest większy.

Inne charakterystyki
1
∑ ( xi − x p ) 3 ni
µ
n i
1.WSPÓŁCZYNNIK ASYMETRII:
Ap = 3 =
3
σp
σ3
p
Dla rozkładu symetrycznego A p = 0 , co oznacza, że wartości cechy jednakowo oddalone od
mają jednakowe częstości.
Jeżeli A p 〈0 , to w szeregu statystycznym jest więcej wartości mniejszych niż x p .
Jeżeli

A p 〉0 , to w szeregu statystycznym jest więcej wartości większych niż x p .

2.EKSCES:

µ
Ep = 4 − 3 =
4
σp

1
n

∑(x
i

− x p ) ni
4

i

σ4
p

−3

xp

Charakteryzuje on “ostrość” wykresu rozkładu statystycznego.

E p = 0 dla rozkładu normalnego.

Jeżeli E p 〈0 , to krzywa rozkładu statystycznego ma wykres bardziej “spłaszczony” niż krzywa
rozkładu normalnego (platykurtyczny).
Jeżeli E p 〉0 , to krzywa rozkładu statystycznego ma wykres bardziej “wysmukły” niż krzywa
rozkładu normalnego (leptokurtyczny).

ESTYMACJA PRZEDZIAŁOWA
OSZACOWANIE WARTOŚCI ŚREDNIEJ
1. X : N ( m, σ ) , σ -znane

( x − δ , x + δ ) , gdzie δ = u ⋅ σ , n- liczność próbki, wartość u znajdujemy z
n
P ( U 〈u ) = γ . Przy zadanym z góry poziomie ufności γ z tablic dystrybuanty Φ ( u )

Przedział ufności
warunku

p

p

1+ γ
.
2
2. X : N ( m, σ ) , σ - nieznane , n〈30
odczytujemy

u: Φ( u ) =

Przedział ufności

(x

p

− δ , x p + δ ) , gdzie δ =

t ⋅Sp
n

standardowe z próbki, wartość t znajdujemy z warunku
ści

γ

, n- liczność próbki,

S p - skorygowane odchylenie

P( T 〈t ) = γ . Przy zadanym poziomie ufno-

z tablic rozkładu T-Studenta, dla liczby stopni swobody

l = n −1 odczytujemy t : P( T 〉t ) = 1 − γ .

3. X : dowolny rozkład, n〉30
Postępujemy tak, jak przy szacowaniu przedziału ufności w modelu 1 ,przyjmując zamiast
nieznanego σ skorygowane odchylenie standardowe z próbki S p .

OSZACOWANIE WARIANCJI
1. X : N ( m, σ )

m, σ - nieznane , n〈30
2
2
 ( n − 1) S p ( n − 1) S p 
 , gdzie S 2 - skorygowana wariancja
,
Przedział ufności dla wariancji : 
p


b
a


z próby, a, b - znajdujemy z tablic rozkładu χ2 przy zadanym z góry poziomie ufności γ
1+ γ
1− γ
2
, P χ 〉b =
, dla liczby stopni swobody l = n −1.
P χ 2 〉a =
2
2
2. X : rozkład normalny lub zbliżony do niego i n〉30




 σ p , σ p  , gdzie σ - odchylenie
Przedział ufności dla odchylenia standardowego :
p

u
u 
1+
1−


2n
2n 


(

,

)

(

)

standardowe obliczone na podstawie n - elementowej próby,
rozkładu normalnego

u

znajdujemy z tablic dystrybuanty

N ( 0,1) wiedząc, że P ( U 〈u ) = γ ,czyli Φ ( u ) =

OSZACOWANIE WSKAŹNIKA STRUKTURY

1+ γ
.
2

n〉100 .

m m
m m 

1 − 
1 −  
m
n
n m
n
n
, +u
Przedział ufności dla wskaźnika struktury p :  − u
 ,
n
n
n
n







Badana cecha ma charakter niemierzalny,

gdzie m - liczba elementów posiadających badaną cechę jakościową wyznaczona na podstawie
n - elementowej próby, u znajdujemy z tablic rozkładu normalnego N ( 0,1) wiedząc, że

P ( U 〈u ) = γ , czyli Φ ( u ) =

1+ γ
.
2

WYZNACZANIE NIEZBĘDNEJ LICZBY POMIARÓW DO PRÓBY
1. X : N ( m, σ ) , σ - znane lub zbliżony do niego, ustalamy dokładność oszacowania δ = d .

W celu oszacowania metodą przedziałową wartości średniej m tak, aby na poziomie ufności γ
maksymalny błąd szacunku nie przekroczył z góry danej liczby d , należy niezbędną liczność próby

u2 ⋅ σ2 , u - odczytujemy z tablic dystrybuanty rozkładu normalnego
d2
1+ γ
.
N ( 0,1) tak, aby P ( U 〈u ) = γ , czyli Φ ( u ) =
2
2. X : N ( m, σ ) , σ - nieznane, ustalamy δ = d .
W celu oszacowania metodą przedziałową wartości średniej tak, aby na poziomie ufności γ
wyznaczyć ze wzoru:

n=

maksymalny błąd szacunku nie przekroczył z góry danej liczby d , należy niezbędną liczność próby
wyznaczyć ze wzoru :

3.

n=

t2 ⋅ S 2
p
d2

, gdzie

t odczytujemy z tablic rozkładu T-Studenta tak, aby

P( T 〉t ) = 1 − γ , dla liczby stopni swobody l = n0 − 1 , S 2 obliczamy na podstawie małej próby
p
wstępnej o liczności n0 .
Populacja ma rozkład dwupunktowy z parametrem p - wskaźnik struktury.
W celu oszacowania metodą przedziałową wskaźnika struktury p tak, aby na poziomie ufności
γ maksymalny błąd szacunku nie przekroczył z góry danej liczby d , należy niezbędną liczność

u2 , u - odczytujemy z tablic dystrybuanty rozkładu normalnego
4 ⋅ d2
1+ γ
.
N ( 0,1) tak, aby P ( U 〈u ) = γ , czyli Φ ( u ) =
2

próby wyznaczyć ze wzoru:

n=

STATYSTYCZNA WERYFIKACJA HIPOTEZ
TEST DLA WARTOŚCI ŚREDNIEJ

1.

X : N ( m, σ ) , σ - znane
H 0 : m = m0
H1: m ≠ m0

H 0 służy zmienna losowa U : N ( 0,1)
2. Ustalamy poziom istotności α , tak aby P ( U ≥ u ) = α . Wartość u wyznaczamy z tablic dystrybuanty
1. Do weryfikacji hipotezy

rozkładu normalnego

N ( 0,1) dla Φ ( u ) = 1 −

3. Wyznaczamy dwustronny obszar krytyczny

ω

ω:

α
.
2

-u
u
4. Na podstawie wyników n - elementowej próbki obliczamy wartość zaobserwowaną testu :

Up =

x p − m0
.
σ
n

5.Sprawdzamy, czy wartość zaobserwowana testu należy do obszaru krytycznego ω .
Jeżeli tak, to hipotezę zerową odrzucamy, jeżeli nie, to nie ma podstaw do odrzucenia hipotezy

H0.

UWAGI:

H1: m 〉 m0 , to obszar krytyczny jest obszarem prawostronnym
i P( U 〉u ) = α . Punkt krytyczny u znajdujemy z tablic dystrybuanty rozkładu N ( 0,1) dla Φ ( u ) = 1 − α .
ω
Jeżeli hipoteza alternatywna jest postaci

Jeżeli

H1: m 〈 m0

0
u
,to obszar krytyczny jest obszarem lewostronnym i

ω

-u

2. X : N ( m, σ )

,

P(U 〈u ) = α , wtedy Φ ( u ) = α .

0

σ - nieznane, n〈30

H 0 : m = m0
H1: m ≠ m0

1. Do weryfikacji hipotezy zerowej służy zmienna losowa o rozkładzie T-Studenta.

α tak , aby P ( T ≥ t ) = α i dla liczby stopni swobody l = n −1 z tablic
rozkładu T- Studenta znajdujemy punkt krytyczny t .
3.Wyznaczamy dwustronny obszar krytyczny ω :
2.Ustalamy poziom istotności

-t

0

t

x − m0
Tp = p
S p , gdzie x p - średnia arytmetyczna
4. Obliczamy wartość zaobserwowaną testu :
n
S p - skorygowane odchylenie standardowe zostały obliczone na podstawie n - elementowej próbki .
i
5. Sprawdzamy, czy

T p ∈ ω .Jezeli tak, to H 0 odrzucamy, jeżeli nie, to nie ma podstaw do odrzucenia H 0 .

UWAGI:
Jeżeli hipoteza alternatywna ma postać

H1: m 〉 m0 , to P( T 〉t ) = α .Wtedy punkt krytyczny t znajdujemy z
tablic rozkładu T - Studenta dla P ( T 〉t ) = 2α . Obszar krytyczny ω jest obszarem prawostronnym.
Jeżeli

H1: m 〈 m0 , to P( T 〈t ) = α . Wtedy t znajdujemy z tablic dla P ( T 〉t ) = 2α , ω jest obszarem

lewostronnym.

3. Cecha X

ma dowolny rozkład,

n〉30 .

H 0 : m = m0
H1: m ≠ m0

Postępujemy tak, jak w modelu 1, ale zamiast nieznanego
obliczone na podstawie n - elementowej próby.

σ bierzemy skorygowane odchylenie standardowe S p

TEST DLA DWÓCH ŚREDNICH
X 1 : N ( m1 , σ 1 ) , X 2 : N ( m2 , σ 2 ) , gdzie σ1, σ2 - znane.
Z obu populacji pobieramy próby o licznościach n1, n2 .
H 0 : m1 = m2

1.

H1: m1 ≠ m2

H 0 służy zmienna losowa U : N ( 0,1)
2. Ustalamy poziom istotności α , taki że P ( U ≥ u ) = α i z tablic dystrybuanty rozkładu N ( 0,1) odczytuα
jemy u dla Φ ( u ) = 1 −
.
2
3. Wyznaczamy dwustronny obszar krytyczny ω .
x p1 − x p2
Up =
4. Obliczamy wartość zaobserwowaną testu :
σ21 σ2 2 .
p
+ p
n1
n2
5. Sprawdzamy,czy U p ∈ ω . Jeżeli tak, to hipotezę zerową odrzucamy. Jeżeli nie, to nie ma podstaw do
1. Do weryfikacji hipotezy

do odrzucenia hipotezy zerowej.
UWAGI:
Jeżeli H1: m1 〈 m2 , to

P(U 〈u ) = α i Φ ( u ) = α , a obszar krytyczny jest obszarem lewostronnym. Jeżeli
H1: m1 〉 m2 , to P(U 〉u ) = α i Φ ( u ) = 1 − α , a obszar krytyczny jest obszarem prawostronnym.

2a.

X 1 : N ( m1 , σ 1 ) ,

X 2 : N ( m2 , σ 2 ) , σ1, σ2 -nieznane.

Z obu populacji pobieramy małe próby o licznościach

n1, n2 (mniejszych od 30).

H 0 : m1 = m2
H1: m1 ≠ m2
H 0 służy zmienna losowa o rozkładzie T-Studenta.
2. Ustalamy poziom istotności α taki, że P ( T ≥ t ) = α i dla liczby stopni swobody l = n1 + n2 − 2
z tablic rozkładu T-Studenta odczytujemy t .
3. Wyznaczamy dwustronny obszar krytyczny ω .
x p1 − x p 2
Tp =
2
2
n1σ p1 + n2σ p 2  1 1  .
4. Obliczamy wartość zaobserwowaną testu:
 + 
n1 + n2 − 2  n1 n2 


1. Do weryfikacji hipotezy

5. Sprawdzamy, czy

T p ∈ ω . Jeżeli tak, to H 0 odrzucamy. Jeżeli nie,to nie ma podstaw do odrzucenia H 0 .

2b.
Jeżeli wyniki obu prób można potraktować jako wyniki badań na tym samym elemencie przed eksperymentem x i i po eksperymencie yi , to można je analizować jako wyniki jednej próby przyjmując

zi = yi − x i .Wtedy hipoteza o równości wartości średnich przed eksperymentem i po eksperymencie

przyjmie postać:

H 0: z = 0
H 1: z ≠ 0

, gdzie

z oznacza średnią różnic w populacji.

1.Do weryfikacji hipotezy zerowej służy zmienna losowa o rozkładzie T-Studenta.

α , tak aby
rozkładu T-Studenta odczytujemy t .

P ( T ≥ t ) = α i dla liczby stopni swobody l = n −1 z tablic

2. Ustalamy poziom istotności

3. Wyznaczamy obszar dwustronny krytyczny

ω.

4. Obliczamy wartość zaobserwowaną testu:

Tp =

zp
Sp

n.

5. Sprawdzamy, czy wartość zaobserwowana testu należy do obszaru krytycznego

3.

X 1, X 2

-

cechy o dowolnych rozkładach.

Pobieramy z obu populacji duże próby o licznościach

n1, n2

H 0 : m1 = m2
H1 : m1 ≠ m2
Postępujemy podobnie jak w modelu
stawie prób S 21, S 2 2 .
p
p

1.

ale zamiast nieznanych

2
σ1 ,σ 2 bierzemy obliczone na pod2

TEST DLA WSKAŹNIKA STRUKTURY
X : rozkład dwupunktowy z parametrem p , n〉100
H 0 : p = p0
H1: p ≠ p0
1. Do weryfikacji hipotezy zerowej służy zmienna losowa o rozkładzie normalnym
2.Ustalamy poziom istotności

α taki, że P ( U ≥ u ) = α .

3. Z tablic dystrybuanty rozkładu
dwustronny obszar krytyczny

N ( 0,1) znajdujemy u dla Φ ( u ) = 1 −

ω:

N ( 0,1) .

α
i wyznaczamy
2

-u
0
u
4.Obliczamy wartość zaobserwowaną testu na podstawie wyników n-elementowej próby:

Up =

m
− p0
n
p0 .(1 − p0 )
n

gdzie m -liczba elementów wyróżnionych ze względu na badaną cechę i znalezionych
w n -elementowej próbie.
5. Jeżeli U p ∈ ω , to H 0 odrzucamy. Jeżeli U p ∉ ω , to nie ma podstaw do odrzucenia

Uwagi:
Dla H 1 : p〈 p0

H 0.

ω
budujemy lewostronny obszar krytyczny :

P(U 〈u ) = α . Punkt krytyczny u odczytujemy z tablic
dystrybuanty rozkładu N ( 0,1) dla Φ ( u ) = α .

-u

0

gdzie u jest taką wartością, dla której
Dla

H 1 : p〉 p0

budujemy prawostronny obszar krytyczny:

P(U 〉u ) = α
dla Φ ( u ) = 1 − α .
gdzie

0
, punkt krytyczny u odczytujemy z tablic dystrybuanty rozkładu

N ( 0,1)

u

TEST DLA DWÓCH WSKAŹNIKÓW STRUKTURY
Rozpatrujemy dwie populacje generalne o rozkładach dwupunktowych z parametrami

n1 , n2

Z obu populacji pobieramy duże próby o licznościach

p1 , p2

( większych od 100).

H 0 : p1 = p2
H 1 : p1 ≠ p2

1.Do weryfikacji hipotezy zerowej służy zmienna losowa o rozkładzie normalnym
2. Ustalamy poziom istotności

α

taki, że

P ( U 〉u ) = α .

3. Wyznaczamy dwustronny obszar krytyczny

-u

N ( 0,1) .

ω:
0

u

Punkt krytyczny u odczytujemy z tablic dystrybuanty rozkładu normalnego dla

Φ( u ) = 1 −

4. Obliczamy wartość zaobserwowaną testu :

Up =

gdzie

m1 , m2

m1 m2

n1 n2

p (1 − p )
n

-liczby elementów wyróżnionych ze względu na badaną cechę i znalezionych

w próbach o lcznościach

n1 , n2 ,oraz

α
.
2

p=
5.Jeżeli

m1 + m2
n1 + n2

n=

,

n1 . n2
n1 + n2

.

U p ∈ω ,to H 0 odrzucamy. Jeżeli U p ∉ω , to nie ma podstaw do odrzucenia H 0 .

UWAGA:
W przypadku inaczej postawionych hipotez alternatywnych korzystamy z powyższych uwag.

TEST DLA WARIANCJI
1. X : N ( m,σ ) ,

m, σ -nieznane.

Z populacji losujemy do próby n elementów (

n〈30 ) .

H 0 : σ2 = σ2
0
H 1: σ2 〉σ2
0
1.Do weryfikacji hipotezy zerowej służy zmienna losowa o rozkładzie

(

2. Ustalamy poziom istotności α taki, że P χ 2 〉b
3. Wyznaczamy prawostronny obszar krytyczny ω :

0

) =α

χ2 .

.

b

punkt krytyczny b odczytujemy z tablic rozkładu

χ2

dla liczby stopni swobody

l = n −1.

4.Obliczamy wartość zaobserwowaną testu :

χ =
2
p

2
( n − 1) S p
2
σ0

.

S p -skorygowane odchylenie standardowe obliczone na podstawie n-elementowej próby.
2
2
5. Jeżeli χ p ∈ω , to H 0 odrzucamy. Jeżeli χ p ∉ ω ,to nie ma podstaw do odrzucenia H 0 .
gdzie

2. X : dowolny rozkład , n〉30 .
H 0 : σ2 = σ2
0
H 1: σ2 〉σ2
0
1. Do weryfikacji hipotezy zerowej służy zmienna losowa o rozkładzie normalnym
2.Ustalamy poziom istotności α taki, że P(U 〉u )
3.Wyznaczamy prawostronny obszar krytyczny ω :
gdzie u odczytujemy z tablic dustrybuanty rozkładu
4. Obliczamy wartość zaobserwowaną testu :

=α .
0

N ( 0,1) dla Φ ( u ) = 1 − α .

N ( 0,1) .
u

U p = 2χ 2p − 2l − 1 ,
gdzie

χ =
2
p

2
( n − 1) S p
2
σ0

,

l = n −1,

S p - skorygowane odchylenie standardowe obliczone

na podstawie n- elementowej próby.
5. Jeżeli U p ∈ω , to hipotezę zerową odrzucamy. Jeżeli U p

∉ω ,to nie ma podstaw do odrzucenia H 0 .

Podobne prace

Do góry