Ocena brak

Statystyka - Charakterystyki liczbowe, struktury zbiorowości

Autor /weronika Dodano /15.03.2011

Wymagany Adobe Flash Player wesja 10.0.0 lub nowsza.

praca w formacie pdf Statystyka - Charakterystyki liczbowe, struktury zbiorowości

Transkrypt

















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

PARAMETRY STATYSTYCZNE - liczby słu ące do
syntetycznego opisu struktury zbiorowości statystycznej.
PARAMETRY DZIELIMY NA 4 GRUPY:
1. miary poło enia
2. miary zmienności (dyspersji, rozproszenia)
3. miary asymetrii (skośności)
4. miary koncentracji

MIARY POŁO ENIA
Miary przeciętne charakteryzują średni lub typowy poziom
wartości cechy.
Miary poło enia dzielą się na miary przeciętne i kwantyle.
Podział miar poło enia jest następujący:
1. miary klasyczne (średnia: arytmetyczna, harmoniczna,
geometryczna) oraz
2. miary pozycyjne (modalna, kwantyle)
Wśród kwantyli najczęściej mówi się o:
1. kwartylach (pierwszy, drugi zwany medianą, trzeci) podział zbiorowości na 4 części,
2. decylach - podział zbiorowości na 10 części,
3. centylach (percentylach) - podział zbiorowości na 100
części.



CHARAKTERYSTYKI LICZBOWE
STRUKTURY ZBIOROWOŚCI
(Parametry statystyczne)



Materiały do wykładu 2 ze Statystyki



 

















©

Materiały do wykładu 2 ze Statystyki

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

ŚREDNIA arytmetyczna
Średnią arytmetyczną definiuje się jako sumę wartości cechy
mierzalnej przez liczebność populacji. Średnia jest wielkością
mianowaną tak samo jak badana cecha.
Dla szeregów szczegółowych
Tutaj wyliczamy tzw. średnią arytmetyczną prostą
(niewa oną), która ma postać:
n

x + x + L + xn
x=
=
n

∑x

i

i=

n

PRZYKŁAD 1
Weźmy dane z przykładu (wykład 1) o liczbie braków:
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
2, 2, 2, 2, 3, 3, 3, 3, 4, 4

x=
x=

+L+ + +L+ + +L+ + +L+ + +
=

Średnia liczba braków przypadająca na 1 wyrób wynosi w
tym przykładzie 0,8 [brak/szt.].

 

















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Dla szeregów rozdzielczych punktowych
Tutaj wyliczamy tzw. średnią arytmetyczną wa oną,
która ma postać:
k

x n + x n + L + xk nk
x=
=
n

∑x n

i i

i=

n

lub
k

x = x w + x w + L + xk wk = ∑ xi wi
i=

W przykładzie z liczbą braków obliczenia według pierwszego
wzoru (z liczebnościami ni) przedstawia poni sza tabela.
numer
klasy

liczba
braków

i
1
2
3
4
5

xi
0
1
2
3
4

razem

×

liczba
obliczenia
wyrobów
do
(liczebność) średniej
ni
xi ni
0
30
8
8
6
12
4
12
2
8

50
x=

=

40



Materiały do wykładu 2 ze Statystyki















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

liczba
braków

wskaźnik
struktury

i
1
2
3
4
5

xi
0
1
2
3
4

wi
0,60
0,16
0,12
0,08
0,04

obliczenia
do
średniej
x i wi
0,00
0,16
0,24
0,24
0,16

razem

×

1,00

0,80

x=



numer
klasy

 

Obliczenia średniej liczby braków z wykorzystaniem drugiego
wzoru (ze wskaźnikami struktury wi)) pokazuje kolejna tabela.



Materiały do wykładu 2 ze Statystyki















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

k

&
&
&
x n + x n + L + xk nk
x=
=
n

&
∑x n

i i

i=

n

lub
k

&
&
&
&
x = x w + x w + L + xk wk = ∑ xi wi
i=

gdzie

&
xi

jest środkiem przedziału klasowego wyliczanym

następująco:

&
xi =

x i +xi

Nale y pamiętać, e przy pogrupowaniu danych źródłowych
w szereg rozdzielczy przedziałowy następuje pewna utrata
informacji. Je eli policzymy średnią dla szeregu szczegółowego lub
szeregu rozdzielczego punktowego, to wynik będzie dokładny i taki
sam. Dla danych w postaci szeregu rozdzielczego przedziałowego
średnia będzie ju przybli eniem. Tym większym, im szersze są
przedziały klasowe, im jest ich mniej, itd.
Np. dla danych źródłowych o czasach dojazdu pracowników firmy
ZAUR otrzymamy:

x=

=

minuty.



Tutaj wyliczamy tzw. średnią arytmetyczną wa oną,
która ma postać:

 

Dla szeregów rozdzielczych przedziałowych



Materiały do wykładu 2 ze Statystyki















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

i i

¡

 

1
2
3
4
5
6

5 – 15
15 – 25
25 – 35
35 – 45
45 – 55
55 – 65

10
20
30
40
50
60

10
20
30
50
80
10

razem

×

×

200

x=

100
400
900
2000
4000
600

8000

=

Obliczenia dla średniej według drugiego wzoru (ze wskaźnikami
struktury wi) przedstawia kolejna tabela.
numer
czas
środek
wskaźnik obliczenia
klasy
dojazdu przedziału struktury
do
w ZAUR
średniej
i
x0i – x1i
wi
&
&
x
xw
i

i

1
2
3
4
5
6

5 – 15
15 – 25
25 – 35
35 – 45
45 – 55
55 – 65

10
20
30
40
50
60

0,05
0,10
0,15
0,25
0,40
0,05

razem

×

×

1,00

x=

i

0,5
2,0
4,5
10,0
20,0
3,0

40,0



i

 

PRZYKŁAD 2
Obliczenia dla średniej w przykładzie z czasem dojazdu w firmie
ZAUR (wykład 1) według pierwszego wzoru (z liczebnościami ni)
przedstawia poni sza tabela.
czas
środek
liczba
obliczenia
numer
klasy
dojazdu przedziału pracowdo
w ZAUR
ników
średniej
i
x0i – x1i
ni
&
&
x
xn



Materiały do wykładu 2 ze Statystyki



 

















©

Materiały do wykładu 2 ze Statystyki

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Wa niejsze własności
ŚREDNIEJ arytmetycznej
1. Suma wartości cechy jest równa iloczynowi średniej arytmetycznej
i liczebności populacji, tj.
n

nx = ∑ xi
i=

k

nx = ∑ xi ni

lub

i=

2. Średnia arytmetyczna nie mo e być mniejsza od najmniejszej
wartości cechy ani te większa od największej jej wartości

x

≤x≤x

3. Suma odchyleń poszczególnych wartości cechy od średniej jest równa
zero
n

∑ (x − x ) =
i

i=

k

lub

∑ (x − x )n
i

i

=

i=

4. Średnią arytmetyczną oblicza się w zasadzie dla szeregów o
zamkniętych klasach przedziałowych. Mo na klasy sztucznie domknąć
(i policzyć średnią) tylko wtedy, gdy odsetek jednostek w tych klasach
jest niewielki (do 5%). Gdy ten odsetek jest du y nale y stosować miary
pozycyjne zamiast średniej.
5. Średnia arytmetyczna jest czuła na skrajne wartości cechy. Są to
wartości cechy dla jednostek nietypowych w badanej zbiorowości i
przypadkowo (niepoprawnie) włączonych do badanej populacji.



 

















©

Materiały do wykładu 2 ze Statystyki

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

ŚREDNIA harmoniczna
Średnią harmoniczną stosujemy wtedy, gdy wartości cechy są
podane w przeliczeniu na stałą jednostkę innej cechy, czyli w postaci
tzw. wskaźników natę enia (na przykład: prędkość pojazdu
[km/godz.], cena jednostkowa [zł/szt.], spo ycie [kg/osoba], itp.)
k

k

∑l

i

xH =

∑l

i

i=
k

∑m

=

i

i=

i=
k

li
∑x
i=
i

xi - wartość i-tego wariantu badanej cechy
li - wartość i-tego wariantu licznika badanej cechy
mi - wartość i-tego wariantu mianownika badanej cechy
PRZYKŁAD 3
Kierowca przejechał trasę ze zmienną prędkością. Odcinek A
o długości 30 km przejechał z prędkością 50 km/godz. Odcinek B
o długości 81 km przejechał z prędkością 90 km/godz. Z jaką
średnią prędkością pokonał trasę kierowca?
Badaną cechą X jest prędkość wyra ona w [km/godz.].
trasa
[km]

prędkość
[km/godz.]

czas
[godz.]

li

xi

mi =li /xi

1
2

30
81

50
90

0,6
0,9

Razem

111

×

1,5

i

xH

=
=
=

(

+

(

)(
+

+

)=

)=
=

















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Badaną cechą X jest cena słoja wyra ona w [zł/słój].
utarg
[zł]

cena
[zł/słój]

ilość
[słój]

li

xi

mi =li /xi

1
2
3

840
360
100

7
6
5

120
60
20

Razem

1300

×

200

i

xH

=
=
=

(

+

(

+
+

)(
+

+

)=

+
=

)=

 

PRZYKŁAD 4
Producent przetworów owocowych sprzedawał słoje z przetworami
na targowisku.
W godzinach 6-10 sprzedawał słoje po 7 zł/słój i utargował 840 zł.
W godzinach 10-12 sprzedawał słoje po 6 zł/słój i utargował 360 zł.
W godzinach 12-16 sprzedawał słoje po 5 zł/słój i utargował 100 zł.
Jaka była średnia cena słoja sprzedanego w tym dniu?



Materiały do wykładu 2 ze Statystyki















©

∏x

i

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

i=

Średnia ta znajduje szczególne zastosowania w analizie dynamiki
zjawisk (poczekaj na stosowny wykład).



xG = n x × x × L × xn = n

n



Średnią geometryczną określa się wzorem:

 

ŚREDNIA geometryczna



Materiały do wykładu 2 ze Statystyki





















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

MODALNA (Dominanta)
Modalna (Mo) zwana te dominantą (D) jest to wartość
cechy, która występuje najczęściej w badanej zbiorowości.

ZALECENIA przy wyznaczaniu modalnej
1. Modalną wyznaczamy i sensownie interpretujemy tylko wtedy, gdy
dane są pogrupowane w szereg rozdzielczy (punktowy lub
przedziałowy).
2. Liczebność populacji powinna być dostatecznie du a.
3. Diagram lub histogram liczebności (częstości) ma wyraźnie zaznaczone
jedno maksimum (rozkład jednomodalny).
4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy
modalna nie występuje w skrajnych przedziałach (pierwszym lub
ostatnim) - przypadek skrajnej asymetrii. Nie da się w takim
przypadku analitycznie wyznaczyć modalnej.
5. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy
przedział modalnej oraz dwa sąsiednie przedziały (poprzedzający i
następujący po przedziale modalnej) powinny mieć taką samą
rozpiętość.



Materiały do wykładu 2 ze Statystyki

















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Badano czas obróbki detalu [minuta] przez pracowników firmy
ZAUR. Otrzymane dane pogrupowano w szereg rozdzielczy
punktowy.

numer
klasy
i
1
2
3
4
5
6

czas
obróbki
[minuta]
xi
10
11
12
13
14
15

razem

×

liczba
pracowników
ni
10
30
80
50
20
10

200

wskaźnik
struktury
(częstość)
wi
0,05
0,15
0,40
0,25
0,10
0,05

1,00

Łatwo zauwa yć, e największa liczba pracowników (a zarazem
największa częstość) znajduje się w klasie 3 (m=3). Zatem modalna
wynosi:

M o = xm = x =
WNIOSEK: najczęściej występujący czas obróbki detalu wśród
pracowników firmy ZAUR to 12 minut.

W domu: policz samodzielnie średni czas obróbki i porównaj z
modalną.



PRZYKŁAD 5

 

Modalna dla szeregów rozdzielczych punktowych



Materiały do wykładu 2 ze Statystyki



 



















©

Materiały do wykładu 2 ze Statystyki

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Modalna dla szeregów rozdzielczych przedziałowych
Modalną wyliczamy tutaj wg następującego wzoru:

nm − nm −
M o = x m + hm
nm − nm − + n m − n m +
m - numer klasy (przedziału) z modalną
x0m - dolny kraniec przedziału modalnej
hm - rozpiętość przedziału modalnej (hm=x1m-x0m)
nm - liczebność przedziału modalnej
nm-1 (nm+1) - liczebność dla przedziałów sąsiadujących z przedziałem
modalnej

PRZYKŁAD 6
Wykorzystamy badanie czasu dojazdu w firmie ZAUR (wykład 1).

numer
klasy
i

czas
dojazdu
w ZAUR
x0i – x1i

liczba
pracowników
ni

1
2
3
4

5 – 15
15 – 25
25 – 35
35 – 45

10
20
30
50

5

45 – 55

80

6

55 – 65

10

razem

×

200

=

+

×

=

Mo

+

×




+
=


+

=
=

WNIOSEK: najczęściej występującym czasem dojazdu wśród
pracowników firmy ZAUR jest 48 minut.

 



















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Z wykorzystaniem częstości(wskaźniki struktury) wzór na modalną jest
następujący:

wm − wm−
M o = x m + hm
wm − wm− + wm − wm+
wm - częstość (wskaźnik struktury) przedziału modalnej
wm-1 (wm+1) - częstość dla przedziałów sąsiadujących z przedziałem modalnej

numer
klasy

czas
dojazdu
w ZAUR
x0i – x1i

wskaźnik
struktury

0,05
0,10
0,15
0,25

6

5 – 15
15 – 25
25 – 35
35 – 45
45 – 55
55 – 65

razem

×

1,00




+

= +

i
1
2
3
4

5

=

+

×

=

Mo

+

×

wi

0,40
0,05

=
=

Modalna mo emy wyznaczyć graficznie tak jak to pokazano na rysunku.



Materiały do wykładu 2 ze Statystyki

 



















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

KWARTYLE
Kwartyle to takie wartości cechy X, które dzielą zbiorowość na cztery równe
części pod względem liczebności (lub częstości). Części te pozostają w
okreśonych proporcjach do siebie.
Aby dokonywać takiego podziału zbiorowość musi być uporządkowana
według rosnących wartości cechy X.
Ka dy kwartyl dzieli zbiorowość na dwie części, które pozostają do siebie w
następujących proporcjach. I tak:
kwartyl 1 (QI) - 25% z lewej i 75% populacji z prawej strony kwartyla,
kwartyl 2 (QII) - 50% z lewej i 50% populacji z prawej strony kwartyla,
kwartyl 3 (QIII) - 75% z lewej i 25% populacji z prawej strony kwartyla.

Mediana
Mediana (Me) - wartość środkowa, inaczej: kwartyl 2 (QII).
Jest to taka wartość cechy X, która dzieli zbiorowość na dwie równe części,
tj. połowa zbiorowości charakteryzuje się wartością cechy X mniejszą lub
równą medianie, a druga połowa większą lub równą.

Mediana dla szeregu szczegółowego
Szereg musi być posortowany rosnąco !!!
Wartość mediany wyznacza się inaczej gdy liczebność populacji (n) jest
nieparzysta, a inaczej gdy jest parzysta.

M e = xn+
Dla n nieparzystego:

Dla n parzystego:


M e =  xn + xn

+









Materiały do wykładu 2 ze Statystyki















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

12, 12, 13, 13, 13,
15, 15

Liczebność populacji jest nieparzysta:

Me = x

+

n=17

=x =x =

WNIOSEK:
Dla połowy detali czas wykonania jednego detalu przez pracownika firmy
ALFA był nie dłu szy ni (≤) 13 minut, a drugiej połowy detali był

nie krótszy (≥) ni 13 minut.


PRZYKŁAD 8
Zmierzono czas wykonania detali [minuta/ szt.] przez wybranego
pracownika firmy BETA i otrzymano następujący szereg szczegółowy:

10, 10, 11, 12, 12,
13, 13, 14, 14, 15,

12, 12, 12, 12, 13,
15, 15, 16

Liczebność populacji jest parzysta:


Me =  x + x



+


=



n=18

(x

+x

)= (

+

)=

WNIOSEK:
Dla połowy detali czas wykonania jednego detalu przez pracownika firmy
BETA był nie dłu szy ni (≤) 12,5 minuty, a dla drugiej połowy detali był

nie krótszy (≥) ni 12,5 minuty.




10, 10, 10, 12, 12,
13, 13, 14, 14, 15,



Zmierzono czas wykonania detali [minuta/ szt.] przez wybranego
pracownika firmy ALFA i otrzymano następujący szereg szczegółowy:

 

PRZYKŁAD 7



Materiały do wykładu 2 ze Statystyki



 



















©

Materiały do wykładu 2 ze Statystyki

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Mediana dla szeregu rozdzielczego punktowego
1. Ustalamy na początek tzw. numer mediany (NMe). Jest to połowa
liczebności populacji:

N Me = n (albo ułamek ½ dla częstości).

2. Kumulujemy liczebności (albo częstości).
3. Znajdujemy klasę, w której po raz pierwszy przekroczony został numer
mediany. Klasa ta ma numer m.
4. Wartość cechy X w klasie m jest medianą, t.j.

M e = xm .

PRZYKŁAD 9
Dane z przykładu 5 o czasie obróbki detalu [minuta] przez
pracowników firmy ZAUR.
numer
czas
liczba
skumulowana skumulowana
klasy
obróbki
pracowliczebność
częstość
[minuta]
ników
i
xi
ni
ni sk
wi sk
1
10
10
10
0,05
2
11
30
40
0,20
3
12
80
120
0,60
4
13
50
170
0,85
5
14
20
190
0,95
6
15
10
200
1,00

×

razem

200

Liczebność populacji:
Numer mediany:


N Me =

×

×

n=200

=

(dla liczebności) albo

cz
N Me =


Numer klasy z medianą:

×

(dla częstości)

m=3

M e = xm = x =
Mediana:
WNIOSEK: Połowa pracowników firmy ZAUR obrabia detal nie dłu ej
ni (≤) 12 minut, a druga połowa nie krócej (≥) ni 12 minut.





 



















©

Materiały do wykładu 2 ze Statystyki

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Mediana dla szeregu rozdzielczego przedziałowego
Wzór na medianę (przy wykorzystaniu liczebności):

N Me − nm−
M e = x m + hm
nm

sk

PRZYKŁAD 10
Dane z przykładu 6 (badanie czasu dojazdu w firmie ZAUR).
numer
czas
liczba
skumul.
klasy
dojazdu
pracowliczebność
w ZAUR
ników
i
x0i – x1i
ni
ni sk
1
5 – 15
10
10
2
15 – 25
20
30
3
25 – 35
30
60
4
35 – 45
50
110
5
45 – 55
80
190
6
55 – 65
10
200

×

razem
Liczebność populacji:
Numer mediany: N Me =
Numer klasy z medianą:

n=200

×

=

m=4

=

+

×

=

+

×

=

Me

×

200



=

+ =

=

WNIOSEK: Połowa pracowników firmy ZAUR doje d a do pracy
w czasie nie dłu szym (≤) ni 43 minuty, a druga połowa w czasie nie

krótszym (≥) ni 43 minuty.


©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

Numer klasy z medianą:

Me

m=4

=

+

×

=

+

×

=

+ =



=
=

©

cz
N Me =
Numer mediany:



×



1,00



×



razem

wi sk
0,05
0,15
0,30
0,55
0,95
1,00



wskaźnik
struktury
(częstość)
wi
0,05
0,10
0,15
0,25
0,40
0,05

skumul.
częstość

i
1
2
3
4
5
6

czas
dojazdu
w ZAUR
x0i – x1i
5 – 15
15 – 25
25 – 35
35 – 45
45 – 55
55 – 65



numer
klasy



PRZYKŁAD 10 (c.d.)



sk



cz
N Me − wm−
M e = x m + hm
wm

 

Wzór na medianę (przy wykorzystaniu częstości):



Materiały do wykładu 2 ze Statystyki

















©

©

¢

¨

£

§

¦

¤

¥

¤

£

¢

 

¡

 

kwartyl

numer kwartyla
cz
dla liczebności ( NQ )
dla częstości ( N Q )

kwartyl 1 (QI)

N QI = n

cz
N QI =

=

kwartyl 2 (QII)
mediana

NQII = n = n

cz
NQII =

=

kwartyl 3 (QIII)

NQIII = n

cz
NQIII =

=

Kwartyle mo emy wyznaczyć graficznie tak jak to pokazano na rysunku.

 

Wszystkie kwartyle wyznaczamy podobnie jak kwartyl 2 (czyli medianę)
pamiętając w jakich proporcjach dzielą one zbiorowość.
Dla szeregów rozdzielczych pomocną mo e być tabela, w której zestawiono
numery kwartyli.

 

Pozostałe kwartyle



Materiały do wykładu 2 ze Statystyki

Podobne prace

Do góry