Ocena brak

Statystyka - Charakterystyki liczbowe, struktury zbiorowości cd.

Autor /weronika Dodano /15.03.2011

Wymagany Adobe Flash Player wesja 10.0.0 lub nowsza.

praca w formacie pdf Statystyka - Charakterystyki liczbowe, struktury zbiorowości cd.

Transkrypt

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

CHARAKTERYSTYKI LICZBOWE
STRUKTURY ZBIOROWOŚCI
(c.d.)
1. miary poło enia - wykład 2
2. miary zmienności (dyspersji, rozproszenia)
3. miary asymetrii (skośności)
4. miary koncentracji

MIARY ZMIENNOŚCI
Miary zmienności charakteryzują stopień zró nicowania
jednostek zbiorowości pod względem badanej cechy.
Miary zmienności dzielą się na miary klasyczne i pozycyjne.
1. miary klasyczne (wariancja, odchylenie standardowe,
odchylenie przeciętne, współczynnik zmienności) oraz
2. miary pozycyjne (rozstęp, odchylenie ćwiartkowe,
współczynnik zmienności).

[1]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

[2]

Miary KLASYCZNE
Wariancja, odchylenie standardowe,
odchylenie przeciętne,

współczynnik zmienności (klasyczny)
2

Wariancję (s ) definiuje się jako średnią arytmetyczną
kwadratów odchyleń wartości cechy od średniej
arytmetycznej zbiorowości. Wariancja jest wielkością
mianowaną w kwadracie miana badanej cechy i
nie interpretujemy jej.
Odchylenie standardowe (s) jest pierwiastkiem
kwadratowym z wariancji. Jest ono wielkością mianowaną
tak samo jak badana cecha. Odchylenie standardowe określa
przeciętne zró nicowanie badanej cechy od średniej
arytmetycznej.

(d)

Odchylenie przeciętne
jest średnią arytmetyczną bezwzględnych
odchyleń wartości cechy od jej średniej arytmetycznej. Jest ono wielkością
mianowaną tak samo jak badana cecha. Odchylenie przeciętne
interpretujemy podobnie jak odchylenie standardowe.

Współczynnik zmienności (klasyczny) (Vs lub Vd) jest to
iloraz odchylenia standardowego (lub przeciętnego) przez
średnia arytmetyczną. Jest to wielkość niemianowana.
U ywamy go do porównań zmienności w dwu lub więcej
zbiorowościach.

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Ocena rozproszenia
na podstawie obserwacji diagramów

Na rysunku pokazano dwa diagramy częstości (1) i (2).
Dla uproszczenia miary poło enia (średnia, mediana i
modalna) są sobie równe i identyczne dla obu zbiorowości.
• Mniejsze rozproszenie wokół średniej występuje
w zbiorowości (1).
Diagram jest smuklejszy i wy szy.
• Większe rozproszenie wokół średniej występuje
w zbiorowości (2).
Diagram jest bardziej rozło ysty i ni szy.
Odchylenie standardowe w zbiorowości (1) jest mniejsze ni
w zbiorowości (2)

s1 < s2

[3]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Przedział TYPOWYCH wartości cechy
(miary klasyczne)

x − s < xtyp < x + s
Przedział taki ma tą własność, e około70% jednostek
badanej zbiorowości charakteryzuje się wartością cechy
nale ącą do tego przedziału.

Reguła „3 sigma

[4]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Dla szeregów szczegółowych
Wariancja
n

(x1 − x )2 + L + (xn − x )2
s2 =
n

(xi − x )2

i =1

=

n

Odchylenie standardowe
n

(x1 − x )

2

s=

+ L + (xn − x )
=
n
2

(xi − x )2

i =1

n

= s2

Odchylenie przeciętne
n

x1 − x + L + xn − x
d=
=
n

∑x −x
i

i =1

n

Współczynnik zmienności (klasyczny)

Vs =

s
x

lub

Vd =

d
x

PRZYKŁAD 1
Weźmy dane z przykładu 1 (wykład 2) o liczbie braków:
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
2, 2, 2, 2, 3, 3, 3, 3, 4, 4
Jak pamiętamy:

n=50

x = 0,8

[5]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Wariancja liczby braków:

(x1 − x )2 + L + (x50 − x )2 =
s2 =

50
2
2
(0 − 0,8) + L + (4 − 0,8) = 68 = 1,36
=
50
50
Odchylenie standardowe:

s = s 2 = 1,36 ≈ 1,17
Odchylenie przeciętne:

x1 − x + L + x50 − x
d=
=
50
0 − 0,8 + L + 4 − 0,8 48
=
=
= 0,96
50
50
Współczynnik zmienności (klasyczny)

1,17
Vs =
= 1,46
0,8

lub

0,96
Vd =
= 1,2
0,8

[6]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Dla szeregów rozdzielczych punktowych
Wariancja
k

(x1 − x )2 n1 + L + (xk − x )2 nk
s2 =
n

(xi − x )2 ni

i =1

=

n

Odchylenie standardowe
k

(x1 − x )2 n1 + L + (xk − x )2 nk

s=

n

(xi − x )2 ni

=

i =1

n

= s2

Odchylenie przeciętne
k

x − x ni
x1 − x n1 + L + xk − x nk ∑ i
d=
= i =1
n
n
W przykładzie z liczbą braków obliczenia przedstawia poni sza tabela.
numer liczba
liczba
odchylenie
obliczenia dla wariancji
klasy braków wyrobów
przeciętne
xi − x ( xi − x )2 (xi − x )2 ni
xi − x ni
i
xi
ni

1
2
3
4
5

0
1
2
3
4

30
8
6
4
2

-0,8
0,2
1,2
2,2
3,2

0,64
0,04
1,44
4,84
10,24

19,20
0,32
8,64
19,36
20,48

24,0
1,6
7,2
8,8
6,4

razem

×

50

×

×

68,00

48,0

68
s =
= 1,36 s = 1,36 ≈ 1,17
50
Współczynnik zmienności (klasyczny)
2

1,17
Vs =
= 1,46
0,8

lub

48
d=
= 0,96
50

0,96
Vd =
= 1,2
0,8

[7]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Dla szeregów rozdzielczych przedziałowych
Wariancja
k

(xi − x )2 ni
∑&

&
&
(x1 − x )2 n1 + L + (xk − x )2 nk
2
s =

i =1

=

n

n

Odchylenie standardowe
k

&
&
(x1 − x )2 n1 + L + (xk − x )2 nk

s=

n

(xi − x )2 ni
∑&
i =1

=

n

= s2

Odchylenie przeciętne
k

&
x − x ni
&
&
x1 − x n1 + L + xk − x nk ∑ i
d=
= i =1
n
n
PRZYKŁAD 2 - czas dojazdu pracowników firmy ZAUR
numer czas środek liczba
klasy dojazdu klasy pracow.

obliczenia dla wariancji

&
&
(xi − x )2 (xi − x )2 ni

odchylenie
przeciętne

i

x0i – x1i

&
xi

ni

&
xi − x

1
2
3
4
5
6

5 – 15
15 – 25
25 – 35
35 – 45
45 – 55
55 – 65

10
20
30
40
50
60

10
20
30
50
80
10

-30
-20
-10
0
10
20

900
400
100
0
100
400

9000
8000
3000
0
8000
4000

300
400
300
0
800
200

razem

×

×

200

×

×

32000

2000

Jak pamiętamy:

n=200

x = 40 [minut]

32000
s =
= 160 s = 160 ≈ 12,7
200
Współczynnik zmienności (klasyczny)
2

12,7
Vs =
= 0,32
40

&
xi − x ni

lub

2000
d=
= 10
200

10
Vd =
= 0,25
40

[8]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

[9]

Miary POZYCYJNE
Rozstęp, odchylenie ćwiartkowe,
współczynnik zmienności (pozycyjny)
Rozstęp ( R )definiuje się jako ró nicę pomiędzy największą i
najmniejszą wartością cechy:

R = xmax − xmin
Odchylenie ćwiatkowe (Q) jest miarą rozproszenia wartości
cechy od mediany. Definiuje się go jako połowę ró nicy
pomiędzy trzecim i pierwszym kwartylem:

QIII − QI
Q=
2
Odchylenie ćwiartkowe mierzy poziom zró nicowania połowy
jednostek populacji. Odrzucane są jednostki o wartościach
badanej cechy poni ej pierwszego kwartyla (25%) oraz
powy ej trzeciego kwartyla (25%).

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

[10]

Współczynnik zmienności (pozycyjny) jest to iloraz
odchylenia ćwiartkowego przez medianę. Jest to wielkość
niemianowana. U ywamy jej do porównań zmienności w dwu
lub więcej zbiorowościach.

Q
VQ =
Me
Przedział TYPOWYCH wartości cechy
(miary pozycyjne)
Definiujemy go podobnie jak w przypadku miar klasycznych
(rolę średniej przejmuje tutaj mediana, a rolę odchylenia
standardowego – odchylenie ćwiartkowe)

M e − Q < xtyp < M e + Q
Przedział ten będzie wę szy od przedziału dla miar
klasycznych.

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Dla szeregów szczegółowych
PRZYKŁAD 3
Weźmy dane z przykładu 1 (liczba braków):

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
2, 2, 2, 2, 3, 3, 3, 3, 4, 4
Rozstęp:

R = xmax − xmin = 4 − 0 = 4

Odchylenie ćwiartkowe:
QI = x13 = 0
QII (Me) = (x25 + x26)/2 = (0+0)/2 = 0
QIII = x38 = 1

QIII − QI 1 − 0
=
= 0,5
Q=
2
2
Współczynnik zmienności (pozycyjny):

Q 0,5
VQ =
=
= ???
Me
0

Nie mo na wyznaczyć !!!

Przedział typowych wartości cechy (pozycyjny):

M e − Q < xtyp < M e + Q
0 − 0,5 < xtyp < 0 + 0,5
− 0,5 < xtyp < 0,5

[11]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

PRZYKŁAD 4
Weźmy dane z przykładu 7 (wykład 2):

10, 10, 10, 12, 12,
13, 13, 14, 14, 15,
Rozstęp:

12, 12, 13, 13, 13,
15, 15

R = xmax − xmin = 15 − 10 = 5

Odchylenie ćwiartkowe:
QI = (x4 + x5)/2 = (12+12)/2 = 12
QII (Me) = x9 = 13
QIII = (x13 + x14)/2 = (14+14)/2 = 14

QIII − QI 14 − 12
Q=
=
=1
2
2
Współczynnik zmienności (pozycyjny):

Q
1
= ≈ 0,077
VQ =
M e 13
Przedział typowych wartości cechy (pozycyjny):

M e − Q < xtyp < M e + Q
13 − 1 < xtyp < 13 + 1
12 < xtyp < 14

[12]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Dla szeregów rozdzielczych punktowych
PRZYKŁAD 5
Dane z przykładu 5 (wykład 2).
czas
liczba
numer
klasy
obróbki
pracow[minuta]
ników
i
xi
ni
10
10
1
11
30
2
12
80
3
13
50
4
14
20
5
15
10
6

razem

R=x

×

liczebność
skumulowana

200

ni sk
10
40
120
170
190
200

×

− xmin = 15 − 10 = 5

max
Rozstęp:
Odchylenie ćwiartkowe:
QI = x3 = 12
QII (Me) = x3 = 12
QIII = x4 = 13

QIII − QI 13 − 12
Q=
=
= 0,5
2
2
Współczynnik zmienności (pozycyjny):

Q 0,5
VQ =
=
≈ 0,042
M e 12
Przedział typowych wartości cechy (pozycyjny):

12 − 0,5 < xtyp < 12 + 0,5
11,5 < xtyp < 12,5

[13]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

Dla szeregów rozdzielczych przedziałowych
PRZYKŁAD 6 Dane z przykładu 10 (wykład 2).
numer
klasy

liczba
pracowników
ni
10
20
30
50
80
10

skumul.
liczebność

i
1
2
3
4
5
6

czas
dojazdu
w ZAUR
x0i – x1i
5 – 15
15 – 25
25 – 35
35 – 45
45 – 55
55 – 65

razem

×

200

×

R=x

ni sk
10
30
60
110
190
200

− xmin = 65 − 5 = 60

max
Rozstęp:
Odchylenie ćwiartkowe:
QI ≈ 31,7
QII (Me) = 43
QIII = 50

QIII − QI 50 − 31,7
=
≈ 9,2
Q=
2
2
Współczynnik zmienności (pozycyjny):

Q 9,2
VQ =
=
≈ 0,213
M e 43
Przedział typowych wartości cechy (pozycyjny):

43 − 9,2 < xtyp < 43 + 9,2
33,8 < xtyp < 52,2

[14]

M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2006/07

[15]

Przykład 7 (praca domowa)
Płace (stawka godzinowa) w firmach A, B i C
klasa
i
1
2
3
4
5
×

Stawka
[zł/godz.]
x0i
x1i
2
4
4
6
6
8
8
10
10
12
razem

liczba pracowników (ni)
firma A
15
30
60
30
15

firma B
15
105
75
75
30

firma C
20
50
50
70
10

W ramach ćwiczenia wyznacz w ka dej z firm:
1. średnią
2. wariancję
3. odchylenie standardowe
4. medianę
5. modalną
6. na wspólnym wykresie narysuj diagramy częstości stawki
w firmach A, B i C

Uzyskany materiał będzie podstawą dla kolejnego wykładu.

Podobne prace

Do góry