Professional Documents
Culture Documents
ZARZDZANIA I PRZEDSIBIORCZOCI
PR A C E DY D A K TY C Z NE N R 5
S E R I A: N AU K I S P O E C Z NE
ZYGMUNT BOBOWSKI
Wydanie 1
Wydawnictwo WWSZiP
2004
REDAKTOR WYDAWNICTWA
Micha Lesman
PROJEKT OKADKI
Stanisaw Gola
REDAKTOR TECHNICZNY
Wadysaw Ramotowski
ISBN 83-915717-9-3
Wydawnictwo WWSZiP, Wabrzych 2004
Wydanie I
Druk: Drukarnia D&D Spka z o.o. 44-100 Gliwice, ul. Moniuszki 6
SPIS TRECI
Przedmowa
I.
II.
5
6
15
15
21
27
27
29
45
55
61
III.
68
68
74
75
76
78
80
80
84
88
90
IV.
96
96
97
97
98
99
103
103
105
109
V.
Wnioskowanie statystyczne
5.1. Istota i metody wnioskowania statystycznego
5.2. Prba statystyczna i schematy jej losowania
5.3. Estymacja parametryczna
5.3.1. Pojcie i podane wasnoci estymatora. Metody estymacji
5.3.2. Estymacja przedziaowa wartoci redniej
5.3.3. Wyznaczanie minimalnej liczebnoci prby w procedurze
szacowania wartoci redniej
5.3.4. Estymacja przedziaowa wskanika struktury
5.3.5. Estymacja przedziaowa wariancji i odchylenia
standardowego
5.3.6. Estymacja przedziaowa wspczynnika korelacji
118
118
119
122
122
125
128
130
132
135
Zygmunt Bobowski
137
137
140
143
147
149
150
152
155
157
Bibliografia
159
Podstawowe wzory
161
Aneks
Tablica
Tablica
Tablica
Tablica
Tablica
1.
2.
3.
4.
5.
Rozkad
Rozkad
Rozkad
Rozkad
Rozkad
normalny
t Studenta
chi-kwadrat
Komogorowa
serii
169
170
171
172
173
PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI
SERIA:
NAUKI SPOECZNE
Przedmowa
Niniejszy podrcznik jest przeznaczony przede wszystkim dla studentw studiw dziennych i zaocznych kierunkw humanistycznych, chocia z uwagi na uniwersalny charakter przekazanej w niej podstawowej
wiedzy teoretycznej moe by z powodzeniem wykorzystywany rwnie przez
studentw innych kierunkw.
Wychodzc z zaoenia, e studentom tego typu kierunkw opanowanie przedmiotw ilociowych, do jakich naley statystyka, moe sprawia
pewne trudnoci Autor kierujc si sentencj sformuowan przez Einsteina: wszystko naley robi tak prosto, jak to jest moliwe, ale nie prociej,
podj prb przekazania wiedzy z tego zakresu w moliwie przystpnej
formie unikajc nadmiernego jej zmatematyzowania. Kady z rozdziaw
zawiera wic jedynie minimum teorii niezbdnej dla wyjanienia omawianych zagadnie, a dla uatwienia ich zrozumienia zamieszczono przykadowe zadania wraz z rozwizaniami.
Tre podrcznika zawiera si w piciu rozdziaach. W rozdziale
pierwszym omwiono podstawowe pojcia statystyczne oraz przedstawiono
procedur programowania badania statystycznego, w szczeglnoci badania
ankietowego. W rozdziale drugim dokonano prezentacji metod opisu statystycznego. Omwiono i zilustrowano przykadami zasady wykorzystania
metody tabelarycznej i graficznej. Zasadnicz cz tego rozdziau powicono opisowi parametrycznemu wskazujc na rol i moliwoci wykorzystania poszczeglnych grup parametrw i momentw statystycznych w tym
opisie. Rozdzia trzeci zawiera podstawowe metody analizy wspzalenoci
zmiennych i mierniki w tym zakresie wykorzystywane. W rozdziale czwartym omwiono metody analizy dynamiki zjawisk ze szczeglnym uwzgldnieniem metod indeksowych, analizy tendencji rozwojowej oraz analizy sezonowoci. Rozdzia pity powicono metodom wnioskowania statystycznego. Dokonano w nim prezentacji procedur szacowania podstawowych parametrw statystycznych dla populacji generalnej oraz testowania hipotez
statystycznych, zarwno parametrycznych jak i nieparametrycznych.
W kocowej czci publikacji zamieszczono tablice wybranych rozkadw teoretycznych wykorzystywane w procedurach wnioskowania statystycznego oraz zestawienie podstawowych wzorw statystycznych.
Autor zdaje sobie spraw z mankamentw tej publikacji i bdzie
wdziczny za uwagi, ktre pozwol na jej udoskonalenie.
Zygmunt Bobowski
PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI
SERIA:
NAUKI SPOECZNE
Rozdzia I
To kryterium podobiestwa jest czsto okrelane mianem cech staych, wrd ktrych wyrnia si cechy: rzeczowe, czasowe i przestrzenne. Ze wzgldu na te cechy jednostki badanej zbiorowoci s identyczne.
Zygmunt Bobowski
W literaturze podkrela si czsto, i podzia ten jest mao jednoznaczny, zaley bowiem
w duej mierze od poziomu szczegowoci i celu bada
kowej (np. pe, narodowo, poziom wyksztacenia); cecha opisowa odwzorowuje wic zbir obiektw w zbir okrele sownych,
b) cechy liczbowe (zwane rwnie ilociowymi, mierzalnymi), ktrych wartoci s mierzone na skalach interwaowej bd ilorazowej (np. waga,
wiek, temperatura); ta cecha z kolei odwzorowuje zbir obiektw w zbir
liczb.
Uszczegowienie tego podziau stanowi spotykany coraz czciej w literaturze podzia cech wedug rodzaju skali pomiarowej. Kryterium to pozwala wyodrbni cechy, ktrych wartoci s wyraane na skali:
a) nominalnej,
b) porzdkowej,
c) interwaowej,
d) ilorazowej.
W przypadku skali nominalnej wartoci cech s zwykle wyraane sownie, niekiedy wartociom cechy przyporzdkowuje si arbitralnie liczby,
ktre peni jedynie rol nazwy kategorii (na liczbach tych nie mona przeprowadza operacji matematycznych). Wykorzystywane w tym przypadku
symbole pozwalaj na stwierdzenie tosamoci lub rozrnienie obiektw ze
wzgldu na badan cech. W naukach spoecznych z tego typu cechami
mamy do czsto do czynienia, np. pe, status spoeczny, wykonywany
zawd, wyznawana religia. Ten rodzaj skali umoliwia klasyfikacj (grupowanie) badanego zbioru obiektw na grupy (kategorie) obiektw do siebie
podobnych, np. podzia spoeczestwa na wyznawcw rnych religii, podzia ludnoci na pracujcych i niepracujcych. Naley podkreli, i moe
budzi wtpliwoci zaliczenie skali nominalnej do skal pomiarowych. Oznacza to bowiem, e cechy wyraane na tej skali s cechami mierzalnymi.
Skala porzdkowa (rangowa) umoliwia bardziej precyzyjny, ni w przypadku skali nominalnej, pomiar wartoci cechy. Wartoci te mog by rwnie wyraane sownie lub liczbowo, jednak istnieje moliwo ich uporzdkowania wedug natenia cechy. Przykadami cech, ktrych wartoci s
wyraane na tej skali s: poziom wyksztacenia, wzrost (wyraony jako: niski, redni, wysoki), stopnie w subach mundurowych. Wartoci cechy wyraonej na tej skali umoliwiaj uporzdkowanie badanego zbioru obiektw
od najniszego do najwyszego poziomu badanej cechy. Naley jednak pamita, e nie istnieje moliwo okrelania wielkoci rnic midzy tymi
wartociami. Nie ma wic moliwoci wykonywania operacji matematycznych na wartociach takiej cechy. Cecha ta pozwala na stwierdzanie tosamoci bd rnoci obiektw, a ponadto pozwala na ich uporzdkowanie
jednak bez okrelania odlegoci.
Wartoci cechy wyraanej na skali interwaowej (przedziaowej) s liczbami ze zbioru liczb rzeczywistych (zarwno dodatnich jak i ujemnych).
Zbir wartoci tej cechy nie posiada naturalnej wartoci zerowej; warto
zerow przyjmuje si zwykle umownie. Do cech mierzonych na tej skali
mona zaliczy: temperatur powietrza (wody), wynik finansowy firmy. Dla
wartoci cech wyraonych na tej skali moliwe jest wykonywanie operacji
odejmowania (badanie odlegoci). Na wartociach tej cechy nie mona wykonywa operacji mnoenia i dzielenia.
10
Zygmunt Bobowski
a)
b)
Wrd
a)
11
cechy preferencyjne,
cechy neutralne.
cech preferencyjnych wyodrbnia si dodatkowo cechy:
stymulanty tzn. takie cechy ktrych wzrost wartoci powoduje
wzrost poziomu rozwoju obiektu (cechy te pobudzaj, stymuluj
rozwj obiektu); najkorzystniejsz wartoci takiej cechy jest jej
warto maksymalna, za najmniej korzystn warto minimalna,
b) destymulanty, czyli cechy, ktrych wzrost wartoci jest niekorzystny
dla oceny poziomu rozwoju obiektu; najkorzystniejsz jej wartoci
jest warto minimalna, za najmniej korzystn warto maksymalna,
c) nominanty, czyli cechy dla ktrych wzrost wartoci do wielkoci nominalnej jest korzystny z punktu widzenia badanego obiektu, natomiast ich dalszy wzrost staje si niekorzystny. Wartoci optymaln
w tym przypadku jest warto nominalna.
Cechy neutralne, z uwagi na ich charakter, mog by pominite w zestawie cech stanowicych podstaw hierarchicznego porzdkowania obiektw.
Kolejn istotn czynnoci w fazie wstpnej badania statystycznego jest
wybr jednej z dwch metod badania statystycznego, tj. badania cakowitego (wyczerpujcego) lub badania czciowego. Badanie cakowite obejmuje
ca zbiorowo statystyczn, a wic daje ono bardzo precyzyjny i wiarygodny jej opis. Ta metoda badania winna by szczeglnie preferowana.
W praktyce czsto mamy jednak do czynienia z sytuacjami, w ktrych
z rnych wzgldw nie ma moliwoci zbadania wszystkich elementw
tworzcych cakowit zbiorowo statystyczn (inaczej zwan populacj generaln) i jedyn moliwoci jej poznania jest zbadanie tylko jej czci
(tzw. prby statystycznej). W zwizku z powysz sytuacj zachodzi konieczno wnioskowania o caej zbiorowoci na podstawie wynikw uzyskanych dla prby. Mona wymieni kilka powodw, dla ktrych prowadzone
s badania czciowe:
badanie moe mie charakter niszczcy, np. badania jakociowe niektrych wyrobw; badanie caej populacji byoby rwnoznaczne z jej zniszczeniem,
badana populacja moe by bardzo liczna lub nieskoczenie liczna,
badanie cakowite moe by zbyt kosztowne lub zbyt czasochonne,
badanie czciowe gwarantuje wysz aktualno wynikw,
badanie czciowe - w niektrych przypadkach - jest jedynym moliwym, np. badanie krwi pacjentw,
badanie czciowe gwarantuje wysz rzetelno, poniewa moe by
zrealizowane mniejszym zespoem przeszkolonych fachowcw; istnieje
moliwo kontroli ich pracy.
Niezalenie od wybranej metody badania statystycznego istotnym problemem jest dobr techniki gromadzenia informacji. Musi ona gwarantowa
wysoki stopie wiarygodnoci gromadzonych informacji. Podstawowym rdem informacji jest wszelkiego rodzaju sprawozdawczo statystyczna prezentowana na rnym poziomie agregacji danych (np. kraju, wojewdztwa,
12
Zygmunt Bobowski
13
muowaniu odpowiedzi, jednak znacznie utrudnia ona opracowanie i analiz zebranych informacji. Tej formy pyta nie zaleca si umieszcza w ankietach, ktre nie bd realizowane w postaci kontaktu bezporedniego ankietera z respondentem.
Opracowany formularz ankiety winien by przetestowany w badaniu pilotaowym na niewielkiej prbie 30 50 osb. Badanie takie pozwala zweryfikowa poprawno postawionych pyta jak rwnie zamieszczonych wariantw odpowiedzi.
Waciwe badanie ankietowe moe by realizowane w rnych formach
kontaktw z respondentami. K. Mazurek-opaciska wyrnia nastpujce
metody przeprowadzenia badania ankietowego:
a) wywiad bezporedni,
b) ankieta telefoniczna,
c) ankieta pocztowa,
d) ankieta prasowa,
e) ankiety rozdawane.
Zalet pierwszej z metod jest gwarancja prawidowego zrozumienia
przez respondenta treci poszczeglnych pyta (zwaszcza, gdy ich tre
moe budzi wtpliwoci) i waciwego sformuowania odpowiedzi. W takim
przypadku z powodzeniem mona wykorzystywa ankiety, w ktrych zastosowano otwart form pyta. Ten sposb gromadzenia ankiet pozwala na
bieco kontrolowa ilo i jako zgromadzonego materiau badawczego.
W przypadku pozostaych metod, a zwaszcza pocztowej, prasowej i ankiet
rozdawanych naley liczy si z moliwoci wystpienia niewielkiej zwrotnoci ankiet, jak rwnie z przypadkami bdnie wypenionych kwestionariuszy.
Badania ankietowe maj najczciej charakter bada czciowych
i w zwizku z tym pojawia si problem doboru respondentw. Wytypowana
grupa respondentw winna by reprezentatywna dla caej populacji, o czym
decyduj dwa zasadnicze czynniki:
a) metoda doboru jednostek prby,
b) liczebno tej prby.
W literaturze wymienia si nastpujce sposoby pobierania prby:
a) dobr arbitralny jest to metoda subiektywna; jednostki do prby s typowane przez ekspertw bd ankieterw. W ramach tej metody mona dodatkowo wyodrbni:
- dobr kwotowy, ktrego celem jest uzyskanie prby o strukturze identycznej jak caa populacja potencjalnych respondentw. Po ustaleniu liczebnoci prby dokonuje si doboru okrelonych kwot respondentw
gwarantujcych uzyskanie odpowiedniej jej struktury,
- losowanie wedug wygody stosowane gwnie w badaniach marketingowych; przeprowadzane jest na grupach konsumentw okrelonych
towarw,
- losowanie metod przechwytywania respondentw po drodze badanie odbywa si na grupie respondentw wybieranych losowo spord
przechodniw, klientw sklepu itp.,
b) dobr losowy, gdy maj zastosowanie okrelone schematy pobierania
prb losowych, jak np. losowanie indywidualne (ograniczone i nieograni-
14
Zygmunt Bobowski
czone), losowanie warstwowe, losowanie systematyczne, losowanie wielostopniowe. Schematy te zostay dokadniej scharakteryzowane w rozdziale V.
O reprezentatywnoci prby decyduje rwnie jej liczebno. Im wiksza
jest liczba zgromadzonych ankiet tym bardziej wiarygodne dla caej populacji s wyniki bada. Pojawia si zatem problem ustalenia minimalnej liczebnoci prby. Analiza zgromadzonego drog ankietow materiau opiera
si zwykle na odpowiednio skonstruowanych tablicach uwzgldniajcych
struktur respondentw ze wzgldu na wyodrbnione kryteria (nastpuje
tym samym podzia tej zbiorowoci na podgrupy). Im wiksza jest liczba
wyodrbnianych podgrup, tym liczniejsza winna by grupa respondentw
objtych badaniem. O liczebnoci populacji respondentw decyduje rwnie
zasig bada (lokalny, regionalny bd krajowy). Im jest on wikszy tym
wiksza winna by losowana prba respondentw. W teorii bada ankietowych podaje si rne zalecenia dotyczce wielkoci populacji objtych takimi badaniami. Jedn z propozycji uzaleniajc wielko populacji respondentw od zasigu bada i liczby wyodrbnionych podgrup zawiera
ponisze zestawienie.
Liczba wyodrbnionych
podgrup
do 9
10 30
powyej 30
Inna propozycja nakazuje, by populacja bya na tyle liczna, aby liczebnoci najwaniejszych dla analizy komrek tablicy wynosiy 100, a mniej
wanych od 20 do 50.
Waciwie zaprojektowane badanie statystyczne stanowi podstawowy
warunek uzyskania wiarygodnych jego wynikw. Wymienione wyej metody
opisu i wnioskowania statystycznego s przedmiotem rozwaa w kolejnych
rozdziaach niniejszego opracowania.
PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI
SERIA:
NAUKI SPOECZNE
Rozdzia II
16
Zygmunt Bobowski
2.1.
gdzie:
k przybliona liczba klas,
N liczebno badanej zbiorowoci.
Uzyskan wedug powyszej formuy liczb klas naley traktowa jako
orientacyjn, a rzeczywista liczba klas moe by o jedn nisza bd wysza
od wielkoci k. Takie postpowanie odnosi si do cech liczbowych cigych,
w przypadku cech liczbowych skokowych bd opisowych o liczbie klas decyduje gwnie liczba wariantw cechy.
Przy okrelaniu wielkoci przedziaw klasowych naley dy by klasy
te posiaday jednakow rozpito, gdy znacznie uatwia to dalsz analiz
ujtego w szeregu materiau statystycznego jak rwnie wyznaczanie niektrych parametrw statystycznych. Naley rwnie zwrci uwag, by w
szeregu nie wystpoway klasy puste, tzn. klasy, dla ktrych nie mona
przyporzdkowa adnej jednostki statystycznej. Uwzgldniajc powysze
zastrzeenia przyblion wielko przedziaw klasowych (h) mona ustali
wedug formuy:
R( x)
k
2.2.
gdzie:
R(x) rozpito wartoci cechy obliczona wedug wzoru
R( x) = xmax xmin ,
k przyjta liczba klas.
Taka regua postpowania bdzie miaa miejsce w przypadku cech cigych. W przypadku cech opisowych bd liczbowych skokowych rwna
rozpito klas bdzie oznaczaa jednakow liczb wariantw cechy w kadej klasie.
Konieczno okrelenia zasad zamykania poszczeglnych klas odnosi
si do cech cigych. Przyjmuje si, i kada z klas musi by jednostronnie
zamknita (z gry bd z dou), co powoduje, e s one rozczne i umoliwiaj jednoznaczne przyporzdkowanie poszczeglnych jednostek statystycznych konkretnym przedziaom.
Skonstruowany szereg rozdzielczy (zarwno punktowy jak i przedziaowy) moe mie posta szeregu liczebnoci (prostej), liczebnoci skumulowanej, czstoci (prostej) bd czstoci skumulowanej. W szeregu liczebnoci
17
Liczba
pracownikw
( xi )
( ni )
Liczba
pracownikw
skumulowana
(cum
ni )
Czsto w %
(
fi )
Czsto skumulowana w %
(cum
fi )
niepene podstawowe
podstawowe
zasadnicze zawodowe
rednie
policealne
wysze
Razem
6,67
6,67
8
2
10
12
26,66
6,67
33,33
40,00
9
2
7
30
21
23
30
X
30,00
6,67
23,33
100,00
70,00
76,67
100,00
X
18
Poziom
wyksztacenia
Niepene podstawowe
i podstawowe
Zasadnicze
zawodowe
i rednie
Policealne
i wysze
Razem
Zygmunt Bobowski
Liczba
pracownikw
Liczba
pracownikw
skumulowana
Czsto
w%
Czsto
skumulowana
w%
10
10
33,33
33,33
11
21
36,67
70,00
30
30,00
100,00
30
100,00
Dochd na 1
osob w z
( xi )
<180,50
308,50)
<308,50
436,50)
<436,50
564,50)
<564,50
692,50)
<692,50
820,50)
Razem
19
Liczba
gospodarstw
( ni )
Skumulowana
liczba
gospodarstw
(cum ni )
Czsto
w%
( fi )
Czsto
skumulowana w %
(cum f i )
20,00
20,00
16,00
36,00
13
16,00
52,00
19
24,00
76,00
25
24,00
100,00
25
100,00
Liczba bankw
131
174
1468
49
217
48
1212
486
258
20
Zygmunt Bobowski
W literaturze wyodrbnia si dodatkowo szeregi: dynamiczne (chronologiczne, czasowe) obrazujce ksztatowanie si badanego zjawiska w czasie3.
Przykad takiego szeregu zawiera tablica 2.2.
Tablica 2.2. Przewozy pasaerw kolej w Polsce w latach 1990
1996
Lata
1990
11991
1992
1993
1994
1995
1996
Liczba pasaerw
(w mln osb)
787,5
650,2
548,1
540,1
493,7
465,1
433,5
Podane wyej przykady dotycz prezentacji tabelarycznej badanej zbiorowoci opisywanej ze wzgldu na jedn cech statystyczn. Badania statystyczne mog obejmowa rwnie przypadki jednoczesnego opisu zbiorowoci ze wzgldu na dwie bd wiksz liczb cech. W takim przypadku opis
tabelaryczny bdzie polega na ujciu zebranego materiau statystycznego w
postaci tablicy zoonej (w odrnieniu od niej szereg statystyczny bywa
rwnie okrelany mianem tablicy prostej). Sytuacja ta czsto ma miejsce,
gdy dokonuje si opracowania materiau zgromadzonego w trakcie bada
ankietowych. W tabelach prezentujcych wyniki takich bada dokonuje si
zwykle skorelowania uzyskanych odpowiedzi na poszczeglne pytania z
okrelonymi cechami respondentw (np. ich pci, wiekiem, miejscem zamieszkania).
Waciwie skonstruowana tablica winna skada si z tytuu, makiety
tablicy oraz rda danych. Tytu tablicy winien precyzyjnie okrela badan
zbiorowo pod wzgldem rzeczowym, czasowym i przestrzennym oraz zawiera ujte w tablicy cechy statystyczne; innymi sowy winien odpowiada
na nastpujce pytania: co stanowi opisywan zbiorowo statystyczn?;
jakiego momentu bd przedziau czasowego dotyczy badanie?; z jakiego
obszaru pochodzi badana zbiorowo?; jakie cechy statystyczne zbiorowoci
ujto w tablicy?
Makieta tablicy (zwana rwnie tablic waciw) skada si z wierszy i
kolumn oraz ich tytuw (tytuy wierszy okrela si boczkiem tablicy, za
tytuy kolumn gwk tablicy). Wntrze tablicy, czyli pola znajdujce si
na skrzyowaniach poszczeglnych wierszy i kolumn s wypeniane zgromadzonym materiaem statystycznym. Naley tu zaznaczy, i kade pole
tablicy musi by bezwzgldnie wypenione. Jeli z rnych wzgldw nie ma
moliwoci wypenienia pola tablicy danymi liczbowymi wwczas wykorzystywane s odpowiednie znaki umowne. Nale do nich nastpujce znaki:
3
21
19 21
21 23
23 25
211
122
187
142
45
67
774
185
252
124
95
32
15
703
321
87
97
48
25
578
Razem
717
461
408
285
102
82
2055
22
Zygmunt Bobowski
23
Wykres 2.1.
80%
Wysze
rednie
Zawodowe
Podstawowe
60%
40%
20%
0%
1999 2000 2001 2002
Lata
Wykres 2.2.
do 15 lat
15 - 25
powyej 65
25 - 35
55 - 65
35 - 45
45 - 55
24
Zygmunt Bobowski
Wykres 2.3.
30
25
20
15
10
00
20
99
19
98
19
97
19
96
19
95
19
94
19
93
19
92
19
91
19
Lata
Wykres 2.4.
Liczba mieszkancw (w
tys. osb)
1992
1994
1996
Lata
1998
2000
2002
25
Wykres 2.5
do 15 lat 15 - 25 25 - 35 35 - 45 45 - 55 55 - 65 powyej
65
Wiek
rdo: Opracowanie wasne
Wykres 2.6
Przecitna liczba
zapomg
99
19
98
19
97
19
96
19
95
19
94
19
93
19
92
19
91
19
Lata
26
Zygmunt Bobowski
Wykres 2.7
Rozmieszczenie szk z klas w Polsce we wrzeniu 2003 r.
Rys. 2.8
Przecitna roczna liczba wypalanych papierosw
przez mieszkacw miasta Z w latach 2000-2002
Lata
2002
2 001
200 0
1500
2000
2500
27
M k ( x) =
gdzie:
( x i 0 )k n i
i =1
k
i
ni
i =1
2.3
28
Zygmunt Bobowski
mk ( x ) =
gdzie:
(x
i =1
x ) ni
k
2.4.
M 1 (x ) =
x n
i
i =1
= x,
M 2 (x ) =
c)
2
i
ni
i =1
M 3 (x ) =
ni
i =1
m1 ( x ) =
(x
i =1
x ) ni
=0
m2 ( x ) =
c)
(x
i =1
x ) ni
2
= s 2 ( x)
29
l
m3 ( x ) =
(x
i =1
x ) ni
3
d) moment centralny rzdu czwartego (w postaci standaryzowanej) wykorzystywany jest do pomiaru spaszczenia rozkadu wartoci cechy:
l
m4 ( x ) =
(x
i =1
x ) ni
4
30
Zygmunt Bobowski
rednia arytmetyczna
rednia arytmetyczna jest ilorazem sumy wszystkich wartoci cechy i liczebnoci tego zbioru. W zalenoci od postaci materiau statystycznego
nieco odmienne s sposoby wyznaczania redniej arytmetycznej. I tak:
a) w przypadku szeregu szczegowego jest ona wyznaczana wedug nastpujcego wzoru:
N
x=
gdzie:
2.5.
i =1
stycznym,
N - liczebno analizowanego zbioru wartoci cechy.
Tak wyznaczan redni okrela si niekiedy redni arytmetyczn prost
(niewaon, chocia mona rwnie przyj, i mamy tu do czynienia z wagami jednostkowymi). Procedur obliczania redniej arytmetycznej dla tego
typu szeregu ilustruje poniszy przykad.
Przykad 2.3.
Zebrano informacje dotyczce wynikw egzaminu ze statystyki uzyskanych
przez studentw grupy 3 drugiego roku studiw WSP w Wabrzychu.
Otrzymano nastpujcy szereg: 3,0; 4,5; 4,0; 5,0; 2,0; 3,5; 4,0; 3,0; 4,0; 5,0;
4,5; 3,5; 3,5; 4,0; 3,0; 2,0; 3,5; 5,0; 4,0; 3,5; 3,0; 5,0; 4,0; 3,0; 3,5; 3,5; 4,0;
3,5; 3,5. Obliczy redni ocen uzyskanych z egzaminu ze statystyki.
Rozwizanie
redni arytmetyczn podanych ocen ustalimy wedug wzoru 2.5. Suma
ujtych w szeregu 29 ocen wynosi 103,5, podstawiajc j do wzoru otrzymujemy:
x=
103,5
3,57
29
x=
x i ni
i =1
x f
i
lub
x=
i =1
k
2.6.
i
i =1
gdzie:
ni , f i
(i= 1,2,., k)
oznaczaj przypisane tym wartociom wagi; w szczeglnym
przypadku mog to by liczebnoci ( ni ) lub czstoci (
f i ).
31
rednia tak wyznaczana okrelana jest mianem redniej arytmetycznej waonej, a procedur jej obliczania ilustruje przykad 2.4.
Przykad 2.4.
Zebrano informacje dotyczce wielkoci gospodarstw domowych zamieszkujcych miejscowo K. Otrzymano nastpujcy szereg:
Liczba osb w
gospodarstwie
Liczba
gospodarstw
10
25
20
12
Liczba gospodarstw
( ni )
2
3
4
5
6
7
Razem
Sum iloczynw podstawiamy do wzoru
x=
x i ni
3
10
25
20
12
5
5
80
i otrzymujemy:
20
75
80
60
30
35
303
303
3,8 osoby
80
x=
x&i ni
i =1
x& f
i
lub
x=
i =1
k
2.7.
i
i =1
gdzie:
32
Zygmunt Bobowski
Liczba studentw
( ni )
x&i
x& i ni
150 158
12
158 166
26
166 174
45
174 182
32
182 190
15
Razem
130
W kolumnie 4. ustalono iloczyny
154
1848
162
4212
170
7650
178
5696
186
2790
X
22196
x& i ni , a po wstawieniu ich sumy do
x=
27892
170,74 cm
130
33
Naley podkreli, e o ile w przypadku dwch pierwszych formu ustalona warto rednia bardzo wiarygodnie odzwierciedla przecitny poziom
wartoci cechy w badanej zbiorowoci, to w trzecim przypadku ma ona raczej charakter szacunkowy, odbiegajcy niekiedy do znacznie od faktycznego poziomu redniego i odchylenie to moe wzrasta wraz ze zwikszaniem rozpitoci przedziaw klasowych.
Powszechnie rednia arytmetyczna uwaana jest za parametr redni o
najkorzystniejszych wasnociach. Za najwaniejsze spord nich uwaa si
nastpujce:
jako parametr klasyczny ustalana jest na podstawie wszystkich
wartoci cechy, a wic posiada wysok warto poznawcz (w
odrnieniu np. od parametrw pozycyjnych),
suma waona odchyle poszczeglnych wartoci cechy od ich
redniej arytmetycznej wynosi zawsze zero, co wynika z faktu, e
rednia ta peni rol rodka cikoci analizowanego zbioru
wartoci cechy. Wasno t mona zapisa relacj:
N
i =1
i =1
i =1
waona suma kwadratw odchyle poszczeglnych wartoci cechy od ich redniej arytmetycznej jest najmniejsza z moliwych,
co mona zapisa nastpujc zalenoci:
N
( xi x )
i =1
=0
= ( xi x ) ni = ( x& i x ) ni = min
2
i =1
i =1
vi = wi q
vi =
lub
wi
,
q
x=
xi wi
i =1
k
i =1
x v
i
i =1
k
v
i =1
34
Zygmunt Bobowski
xi
q n
i =1
ni
N
q
(x q) n
i =1
x
q
x i ni
q = x q
= i =1
N
k
x i n i
i =1
+q= x+q
= i =1
N
k
k
(x i q ) n i x i n i
i =1
q = xq
= i =1
N
N
(x
lub
+ q )n i
lub
x=
n j
j =1
nj
j =1
fj
j =1
f
j =1
35
gdzie:
rowociom.
jest wykorzystywana do wyznaczania wielu innych parametrw statystycznych.
rednia arytmetyczna z uwagi na sposb jej wyznaczania moe by wykorzystywana dla oznaczania przecitnego poziomu wartoci cech jedynie
typu liczbowego. Dla cech opisowych wyraanych na skali nominalnej waciw miar redni jest dominanta, za dla cech mierzonych na skali porzdkowej mediana bd dominanta. Miary te zostan omwione w dalszej
czci opracowania.
rednia geometryczna
Naley do klasycznych parametrw rednich i jest stosowana do wyznaczania redniego poziomu wartoci cechy podanych w postaci szeregu czasowego momentw. Jej typowe wykorzystanie to badanie redniego tempa
zmian. Wyznaczana jest ona wedug wzoru:
x g = N x1 x 2 ... x N
gdzie:
2.8.
ci cechy.
Jako podstawowe uznaje si nastpujce wasnoci redniej geometrycznej:
obliczana jest jedynie dla dodatnich wartoci cechy; jeli cho jedna warto cechy wynosiaby zero, miara rwnie przyjmie wwarto zero,
jest ona mniej wraliwa od redniej arytmetycznej na zrnicowanie wartoci cechy.
Procedur wyznaczania redniej geometrycznej ilustruje poniszy przykad.
Przykad 2.6.
Informacje dotyczce liczby mieszkacw miejscowoci K w latach 1991
1997 zawiera ponisza tablica 2.2.
Tablica 2.2. Mieszkacy miejscowoci K w latach 1991 1997
(stan na 31.12.)
Liczba mieszkacw
Lata
(w tys. osb)
1991
15,9
1992
16,3
1993
15,7
1994
16,0
1995
17,1
1996
17,5
1997
18,0
rdo: Dane umowne
36
Zygmunt Bobowski
37
Rys. 2.9
50
45
40
32
30
26
20
15
12
10
150
158
166
174
182
190
wzrost
D(x)=170, 75cm
rdo: opracowanie wasne
Podejcie analityczne umoliwia oszacowanie wartoci dominanty metod interpolacyjn przy wykorzystaniu wzoru:
D(x ) = x0 +
gdzie:
n0 n01
h
(n0 n01 ) + (n0 n0+1 ) 0
2.9.
dominujcy,
liczebno (czsto) przedziau nastpnego po przedziale
dominujcym.
Przy wykorzystaniu podanego wzoru oszacujmy dominujcy wzrost dla
danych z przykadu 2.5. Przedziaem dominanty bdzie przedzia 166 174
cm, w ktrym wystpuje najwysza liczebno ( n3 = 45). Wstawiajc odpowiednie dane do wzoru 2.9. otrzymujemy:
38
Zygmunt Bobowski
D( x ) = 166 +
45 26
8 = 166 + 4,75 = 170,75 cm
(45 26) + (45 32)
Otrzymany wynik wskazuje, i dominujcy wzrost w badanej zbiorowoci wynosi okoo 170,75 cm. Jest to oczywicie wielko przybliona i w badanej zbiorowoci moe w ogle nie wystpowa. W takim przypadku dominant naley traktowa jako warto cechy, wok ktrej skupiona jest najwiksza liczba jednostek badanej zbiorowoci.
Wyznaczanie dominanty w szeregu z przedziaami klasowymi jest moliwe, gdy przedzia dominanty i przedziay bezporednio z nim ssiadujce
posiadaj jednakow rozpito. Jeli przedziaem dominanty jest jeden ze
skrajnych przedziaw w szeregu (pierwszy lub ostatni), wwczas przyj
naley liczebno rwn zero dla przedziau poprzedzajcego - w pierwszym
przypadku lub dla przedziau nastpnego - w drugim przypadku. Jeli w
szeregu wystpuj przedziay klasowe o zrnicowanej rozpitoci wwczas
dominant, a cilej ujmujc jej przedzia okrelamy przez wyznaczenie
przedziau o najwyszym nateniu liczebnoci lub czstoci.
Podsumowujc stwierdzi rwnie naley, e jakkolwiek dominanta kojarzy si najczciej z wystpowaniem w szeregu jednej wartoci dominujcej, to w praktyce mona si spotka rwnie z przypadkami wystpowania
rozkadw bimodalnych (wystpuj dwie dominanty) bd nawet trimodalnych (trzy dominanty). Takie przypadki wymagaj jednak dodatkowej analizy zebranego materiau statystycznego w celu stwierdzenia, czy ta wielomodalno ma charakter systematyczny (regularny).
Mediana
Mediana, oznaczana w dalszym cigu jako Me(x), zwana rwnie wartoci rodkow naley do grupy miar pozycyjnych okrelanych mianem
kwartyli (jest kwartylem drugim). Jest ona wartoci cechy dzielc badan
zbiorowo na dwie rwnoliczne czci: poow jednostek o wartociach cechy mniejszych lub rwnych medianie i drug poow o wartociach cechy
wikszych lub rwnych medianie. Sposb wyznaczania mediany uzaleniony jest od typu szeregu, w ktrym ujto zgromadzony materia statystyczny.
Procedura wyznaczania mediany w szeregu szczegowym i rozdzielczym punktowym jest podobna. W szeregu szczegowym procedura ta wymaga w pierwszej kolejnoci uporzdkowania (w cigu rosncym bd malejcym) takiego szeregu (szereg rozdzielczy punktowy najczciej jest ju
uporzdkowany). Dalsze postpowanie uzalenione jest od liczebnoci badanej zbiorowoci:
a) gdy liczebno ta jest nieparzysta, median stanowi warto cechy
wystpujca u jednostki rodkowej. Jeli liczebno zbiorowoci
oznaczymy jako N, to mediana bdzie wartoci cechy wystpujc
u jednostki o numerze N + 1 , co mona wyrazi nastpujco:
2
39
Me( x ) = x N +1 ,
2
rem:
Me( x ) =
xN + xN
2
+1
2.10.
40
Zygmunt Bobowski
Liczba gospodarstw
(ni)
Liczba gospodarstw
skumulowana
(cum ni)
1
2
3
4
5
6
7
Razem
3
10
25
20
12
5
5
80
3
13
38
58
70
75
80
X
N
cumn0 1
2
Me(x ) = x0 +
h0
n0
gdzie:
2.11.
41
Liczba studentw
(ni)
Liczba studentw
skumulowana
(cum ni)
150 158
158 166
166 174
174 182
182 190
Razem
12
26
45
32
15
130
12
38
83
115
130
X
130
38
Me(x ) = 166 + 2
8 = 170,8 cm
45
Uzyskana wielko oznacza, i wzrost osoby rodkowej wynosi okoo
170,8 cm.
W przypadku metody graficznej wykrelamy histogram i diagram liczebnoci skumulowanej, a nastpnie zgodnie z podan procedur wyznaczamy warto mediany (zob. rys 2.10).
42
Zygmunt Bobowski
Rys. 2.10
Wyznaczanie mediany metod graficzn
i =1
xi Me( x) < xi Z ,
i =1
43
na cztery rwnoliczne czci (inne to: decyle dzielce zbiorowo na dziesitne czci oraz centyle dzielce zbiorowo na setne czci).
Kwartyle dziel uporzdkowan zbiorowo na jednakowo liczne
wiartki: kwartyl pierwszy oddziela pierwsze 25% badanej zbiorowoci od
pozostaych 75 %, kwartyl drugi oddziela pierwsze 50% zbiorowoci od pozostaej poowy; jest to wic poznana ju mediana, kwartyl trzeci oddziela
pierwsze 75% badanej zbiorowoci od pozostaych 25%. Procedura wyznaczania kwartyli: pierwszego i trzeciego jest zbliona do metodyki ustalania
mediany; rnica sprowadza si jedynie do innego pooenia tych parametrw. Dodatkowo przyjmuje si, i parametry te winny by wyznaczane dla
licznych zbiorowoci; unika si wwczas sytuacji, gdy wyznaczona warto
parametru nie moe by przyporzdkowana konkretnej jednostce.
W przypadku wyznaczania kwartyli dla szeregu szczegowego (oczywicie w postaci uporzdkowanej) bd rozdzielczego punktowego: kwartyl
pierwszy bdzie odpowiada wartoci cechy wystpujcej u jednostki o numerze
N
3N
, za kwartyl trzeci o numerze
. W szeregu rozdzielczym z
4
4
przedziaami klasowymi mona podobnie jak w przypadku mediany zastosowa metod analityczn lub graficzn.
W przypadku metody analitycznej kwartyl pierwszy bdzie wyznaczany
zgodnie z wzorem:
N
cumn0 1
4
Q1 ( x ) = x0 +
h0
n0
2.12.
3N
cumn0 1
Q3 ( x ) = x0 + 4
h0
n0
gdzie:
2.13.
cumn0 1 liczebno (czsto) skumulowana do przedziau poprzedzajcego przedzia zawierajcy kwartyl pierwszy bd trzeci.
Metoda graficzna wymaga wykrelenia histogramu i diagramu kumulacyjnego, na ktrym podobnie jak w przypadku mediany wskazujemy
przyblion warto wymienionych kwartyli. Procedur wyznaczania kwar-
44
Zygmunt Bobowski
150 158
158 166
166 174
174 182
182 190
Razem
12
26
45
32
15
130
12
38
83
115
130
X
Metoda analityczna.
Kwartyl pierwszy znajduje si w przedziale 158 166, poniewa cum ni
dla tego przedziau jest nie mniejsze ni
N
, tj. 32,5, za kwartyl trzeci w
4
przedziale 174 182, poniewa cum ni dla tego przedziau jest nie mniejsze
od
3N
, tj. 97,5. Po podstawieniu odpowiednich danych do wzorw 2.12 i
4
2.13 otrzymujemy:
Q1 ( x ) = 158 +
32,5 12
8 = 164,3 cm,
26
Q3 ( x ) = 174 +
97,5 83
8 = 177,6 cm.
32
Metoda graficzna
Po wykreleniu histogramu i diagramu powyszego szeregu kumulacyjnego dokonujemy oszacowania wartoci odpowiednich kwartyli jak na
rys 2.11.
45
Rys. 2.11
Wyznaczenie kwartyli 1 i 3 metod graficzn
46
Zygmunt Bobowski
R( x ) = xmax xmin
2.14.
wzorem:
Oc ( x ) =
Q3 ( x ) Q1 ( x )
2
2.15.
W literaturze podaje si rwnie sposb inny sposb wyznaczania odchylenia wiartkowego. Zgodnie z nim parametr ten definiuje si jako redni arytmetyczn odchyle kwartyli pierwszego i trzeciego od mediany.
Mona to wyrazi wzorem:
Oc ( x ) =
2.16.
Jak atwo zauway po niewielkim przeksztaceniu ta posta wzoru moe by zredukowana do postaci 2.15. W porwnaniu z poprzedni miar odchylenie wiartkowe pozbawione jest wpywu jednostek nietypowych dla
4
w przypadku szeregu rozdzielczego z przedziaami klasowymi wielkociami tymi s odpowiednio: grna granica ostatniego i dolna granica pierwszego przedziau.
47
badanej zbiorowoci, dla ktrych wartoci cechy wyranie odbiegaj od pozostaych, na warto tej miary. Wartoci nietypowe znajd si bowiem
albo poniej kwartyla pierwszego, albo powyej kwartyla trzeciego. Mankamentem tej miary jest problem z nadaniem jej treci merytorycznej, dlatego
miara ta jest rzadko stosowana. Zalecana jest wwczas, gdy w szeregu wystpuj skrajne klasy otwarte i nie ma moliwoci zastosowania klasycznych miar zmiennoci.
Wyznaczajc omwione wyej miary zmiennoci dla danych z przykadu
2.3 otrzymujemy:
Q 3 ( x ) Q1 ( x ) 5 3
=
= 1 osoba
2
2
O c (x ) =
Wariancja
Wariancja (od aciskiego sowa variare- zmienia si, rni si) naley
do klasycznych, absolutnych miar zmiennoci i mona j definiowa jako
redni kwadratw odchyle poszczeglnych wartoci cechy od ich redniej
arytmetycznej. W zalenoci od postaci materiau statystycznego wariancja,
oznaczana w dalszej czci jako s
szych wzorw:
a) dla szeregu szczegowego:
N
s 2 (x ) =
(x
i =1
x)
2.17.
s 2 (x ) =
(x
x ) ni
2
i =1
2.18.
(x ) =
(x&
i =1
x ) ni
2
2.19.
48
Zygmunt Bobowski
Istotnym mankamentem wariancji jest to, e jej miano nie jest naturalnym dla badanej cechy, co wynika z potgowania odchyle wartoci cechy
od redniej arytmetycznej. Utrudnia to nadanie jej wartociom treci merytorycznej. W praktyce wykorzystuje si pierwiastek kwadratowy z wariancji
okrelany mianem odchylenia standardowego. Niemniej wariancja posiada
wiele pozytywnych waciwoci, do ktrych mona zaliczy nastpujce:
a) jako klasyczna miara zmiennoci liczona jest w oparciu o wszystkie
wartoci cechy, a warunkiem jej wyznaczenia jest znajomo redniej arytmetycznej w stosunku do ktrej jest obliczana,
b) przyjmuje tylko wartoci nieujemne; warto zerow osiga w przypadku cechy staej (wwczas wszystkie wartoci cechy s identyczne),
c) jeli w szeregu rozdzielczym wszystkie wagi - wi (w szczeglnym
przypadku
(x
i =1
x ) (w i q )
k
(w
i =1
gdzie:
q)
(x
i =1
x ) wi
2
i =1
wi wagi przypisane poszczeglnym wartociom cechy (w szczeglnym przypadku bd to liczebnoci ni lub czstoci f i ,
q wielko staa,
d) jeli wszystkie wartoci cechy pomnoymy bd podzielimy przez t
sam wielko q, to wariancja tak zmienionych wartoci cechy bdzie q2 razy wiksza w przypadku mnoenia lub q2 razy mniejsza w
przypadku dzielenia od wariancji pierwotnych wartoci cechy; wasno t wyraaj ponisze rwnoci:
s (x q ) = s (x ) q
2
x s 2 (x )
s = 2
q
q
2
e) jeli do wszystkich wartoci cechy dodamy lub od wszystkich wartoci cechy odejmiemy t sam wielko q, to wariancja tak zmienionych wartoci cechy bdzie identyczna jak wariancja pierwotnych
wartoci cechy; wyraa to poniszy zapis:
s 2 (x + q ) = s 2 (x )
s 2 (x q ) = s 2 (x )
f)
49
jeli zbiorowo podzielimy na dowoln liczb podzbiorowoci czstkowych (grup), to wariancja oglna badanej cechy bdzie sum wariancji rednich grupowych i redniej wariancji wewntrzgrupowych,
co mona wyrazi wzorem:
s 2 (x ) = s j ( x ) + s 2 (x j ),
2
gdzie:
Na podstawie podanej formuy mona stwierdzi, e na oglne zrnicowanie wartoci cechy wpywa cznie wewntrzgrupowe zrnicowanie tej cechy, jak rwnie zrnicowanie midzygrupowe. Podana relacja jest okrelana mianem rwnoci wariancyjnej
g) wariancja stanowi rnic midzy redni arytmetyczn kwadratw
wartoci cechy a kwadratem redniej arytmetycznej wartoci tej cechy:
Jak ju wspomniano w badaniach zmiennoci wykorzystuje si pierwiastek z wariancji zwany odchyleniem standardowym. Z uwagi na t prost
zaleno procedury obliczania obu parametrw zostan zilustrowane cznie.
Odchylenie standardowe
Stanowi ono najczciej wykorzystywan miar zmiennoci. Procedur
obliczania odchylenia standardowego oznaczanego zwykle jako s ( x) mona
wyrazi oglnym wzorem:
s (x ) = s 2 ( x )
2.20.
s(x ) =
(x
i =1
x)
2.21.
50
Zygmunt Bobowski
s (x ) =
(x
x ) ni
2
i =1
2.22.
s (x ) =
(x&
i =1
x ) ni
2
2.23.
s(x ) =
1110
= 8,6 lat.
15
51
Przykad 2.10.
Ponisza tablica zawiera informacje dotyczce liczby bdw popenianych przez osoby zdajce test teoretyczny w ramach egzaminu na prawo
jazdy w pewnym Orodku Egzaminacyjnym.
Liczba popenionych bdw ( xi )
Liczba zdajcych
(ni )
0
1
2
3
4
5
6
Razem
5
15
20
15
5
3
2
65
Liczba zdajcych
(ni )
x i ni
(xi x )2
( x i x )2 n i
0
1
2
3
4
5
6
Razem
5
15
20
15
5
3
2
65
0
15
40
45
20
15
12
147
5,11
1,59
0,07
0,55
3,03
7,51
13,99
X
25,55
23,85
1,40
8,25
15,15
22,53
27,98
124,71
x=
147
= 2,26
65
52
Zygmunt Bobowski
s(x ) =
124,71
= 1,4 bdu
65
Uzyskana warto miary oznacza, i przecitnie liczba bdw popenionych przez kadego ze zdajcych rnia si o okoo 1,4 od redniej liczby
tych bdw.
Przykad 2.11.
Dla 120 uczniw jednej ze szk podstawowych przeprowadzono badanie warunkw rodowiska domowego. Uzyskane wyniki badania ujto w
poniszej tablicy:
Wyniki pomiaru
w punktach ( xi )
Liczba
uczniw
(ni )
10
35
55
20
120
11 25
26 40
41 55
56 - 70
Razem
rdo: Badanie wasne
Na podstawie podanych informacji zbada zmienno uzyskanych wynikw pomiaru za pomoc odchylenia standardowego.
Rozwizanie
Celem ustalenia wartoci tej miary naley w pierwszej kolejnoci wyznaczy redni arytmetyczn wynikw pomiaru. Obliczenia pomocnicze wykonano w kolumnie 4 poniszej tablicy roboczej.
Wyniki
pomiaru
(w punktach) ( xi )
Liczba
uczniw
(ni )
rodki
przedziaw
( x&i )
x i ni
(x&i x )2
(x& i x )2 ni
11 25
26 40
41 55
56 - 70
Razem
10
35
55
20
120
18
33
48
63
X
180
1155
2640
1260
5235
655,4
112,4
19,4
376,4
X
6554
3934
1067
7528
19083
rednia ta wynosi:
5235
= 43,6 punktu. Kolejne obliczenia pomocnicze
120
53
19083
= 12,6 punktu
120
s(x ) =
Interpretacja: Przecitnie wyniki pomiaru rodowiska domowego kadego z uczniw rni si o okoo 12,6 punktu od pomiaru redniego.
Odchylenie przecitne
Odchylenie przecitne, oznaczane dalej jako d ( x ) , definiowane jest jako
rednia bezwzgldnych odchyle poszczeglnych wartoci cechy od ich
redniej arytmetycznej. W zalenoci od typu szeregu, w ktrym ujty zosta
materia statystyczny bdzie ono wyznaczane wedug poniszych wzorw:
a) dla szeregu szczegowego:
N
x x
i
d ( x) =
2.24.
i =1
d ( x) =
x ni
2.25.
i =1
d ( x) =
x& x n
i
2.26.
i =1
Rwnie w tym przypadku wystpujce we wzorach 2.2 i 2.26 liczebnoci mog by zastpione czstociami.
Interpretacja odchylenia przecitnego jest identyczna jak odchylenia
standardowego, co jednak nie oznacza, e wartoci obu miar s identyczne.
Odchylenie standardowe przyjmuje wartoci nie mniejsze od odchylenia
przecitnego, co mona uj nastpujc relacj:
s(x ) d (x )
54
Zygmunt Bobowski
Wz ( x ) =
s(x )
x
2.27.
Oc ( x )
Me( x )
2.28.
Q3 ( x ) Q1 ( x )
Q3 ( x ) + Q1 ( x )
2.29.
Wz ( x ) =
lub
Wz ( x ) =
Wz ( x ) =
55
8,6
= 0,27
32
Wynik ten oznacza, e odchylenie standardowe wieku przestpcw stanowi 27% ich wieku redniego.
W przykadzie 2.10 miernik ten przyjmie posta:
Wz ( x ) =
1,4
= 0,62
2,26
Wz ( x ) =
12,6
= 0,29
43,6
Otrzymana wielko oznacza, e odchylenie standardowe wynikw pomiaru rodowiska domowego stanowi 29% ich pomiaru redniego.
Jak wczeniej podkrelono, wspczynnik zmiennoci jako miara niemianowana umoliwia porwnanie rozproszenia rnych cech. W wietle tego mona stwierdzi, e w badanych przypadkach zdecydowanie najwysze
zrnicowanie wartoci cechy wystpuje w przykadzie 2 (liczba bdw
popenianych w trakcie zdawania testu teoretycznego), natomiast w pozostaych przykadach poziom zmiennoci jest zbliony.
2.3.4. Miary skonoci
Zjawisko skonoci (w literaturze uywa si zamiennie pojcia asymetrii)
okrelane jest jako brak symetrii w rozoeniu wartoci cechy wzgldem ich
redniej arytmetycznej, co jest rwnoznaczne z niesymetrycznym rozoeniem jednostek statystycznych. Jeli w zbiorowoci statystycznej opisywanej ze wzgldu na okrelon cech przewaaj liczebnie jednostki o wartociach cechy niszych od redniej arytmetycznej, to sytuacj t okrela si
mianem skonoci prawostronnej, za w przypadku dominacji jednostek o
wartociach cechy wyszych od redniej arytmetycznej - mwimy o skonoci lewostronnej. Przypadki te oraz ksztat rozkadu symetrycznego zilustrowano na rys. 2.12, na ktrym zaznaczono rwnie orientacyjne pooenie podstawowych parametrw rednich
56
Zygmunt Bobowski
Rys. 2.12
Graficzna ilustracja skonoci
Rozkad symetryczny
x
D(x )
Me( x )
Skono prawostronna
D( x ) Me( x ) x
Skono lewostronna
x
rdo: Opracowanie wasne
Me(x ) D( x )
57
M s (x ) = x D(x )
2.30.
Okrelona w powyszy sposb miara skonoci jest wielkoci mianowan i nienormowan, co nie pozwala na ustalenie natenia skonoci. W
literaturze podaje si rwnie zmodyfikowan posta podanej wyej miary
(traktowan jako jej rwnowan) o postaci:
M s ( x ) = 3 [x Me( x)]
2.31.
58
Zygmunt Bobowski
Wspczynniki skonoci
Badania porwnawcze skonoci rnych cech wymagaj stosowania
wzgldnych (niemianowanych) miernikw. Nale do nich wspczynniki
skonoci. Najczciej wykorzystywan formu mona wyrazi nastpujco:
x D(x )
s(x )
2.32.
3 [x Me( x)]
s(x )
2.33.
Ws1 ( x ) =
lub
Ws1 ( x ) =
Ws 2 ( x) =
[Q3 (x) Me( x] [Me( x) Q1 (x)] [Q3 (x) Me(x)] [Me( x) Q1 (x)]
=
[Q3 (x) Me( x)] + [Me( x) Q1 (x)]
2 Oc ( x)
2.34.
Podane wspczynniki skonoci s wielkociami wzgldnymi i unormowanymi. W wikszoci przypadkw przyjmuj wartoci z przedziau od -1
do +1; przy duym nateniu skonoci wspczynnik skonoci o postaci
2.32 moe przyjmowa wartoci wykraczajce poza podany przedzia.
Trzeci moment centralny
Kolejna miara skonoci oparta jest na wykorzystaniu momentu statystycznego rzdu trzeciego. W literaturze mona spotka rne propozycje
wykorzystania tego miernika do pomiaru skonoci. I tak dla stwierdzenia
jedynie faktu wystpowania skonoci moe by wykorzystany trzeci moment centralny o postaci5:
k
m3 ( x ) =
(x
i =1
x ) ni
3
2.35.
Okrelanie na jego podstawie faktu wystpowania skonoci i jego kierunku odbywa si w sposb nastpujcy:
jeli m3 ( x ) = 0 skono nie wystpuje, rozkad jest symetryczny,
5
Zjawisko skonoci badane jest gwnie w oparciu o dane ujte w szeregach rozdzielczych,
dlatego te podane w dalszej czci formuy odnosz si do tego typu szeregw. Wystpujce
w podanych wzorach liczebnoci mog by zastpione czstociami
59
jeli
stronna,
jeli m3 ( x ) < 0 rozkad jest asymetryczny, wystpuje skono lewo-
stronna.
W celu dodatkowego okrelenia natenia skonoci trzeci moment centralny poddajemy standaryzacji, co prezentuje ponisza formua
k
(x
m (x )
m3 (t ) = 33
=
s (x )
i =1
x ) ni
3
( x i x ) ni
i =1
2.36.
Wystpujcy w mianowniku podanej formuy szecian odchylenia standardowego umoliwia uzyskanie miary niemianowanej, ktra moe by wykorzystywana do analizy porwnawczej skonoci rozkadw cech o rnych
jednostkach miary. Mankamentem tej miary jest brak cile okrelonych
granic przedziau, z ktrego moe ona przyjmowa wartoci liczbowe. Uniemoliwia to ocen natenia skonoci. M. Krzysztofiak proponuje w tym
celu nastpujc modyfikacj powyszej postaci standaryzowanej:
m3 (t ) =
*
m3 ( x )
m3 ( x ) + s 3 ( x )
2.37.
60
Zygmunt Bobowski
Rozwizanie
Dla badania skonoci wykorzystamy zaprezentowane wyej miary.
Wymagaj one przeprowadzenia wielu oblicze pomocniczych, ktre zostay
ujte w poniszej tablicy roboczej (pominite zostan obliczenia wykonane
w przykadzie 2.11):
Wyniki pomiaru
(w punktach)
( xi )
Liczba
uczniw
(ni )
rodki
przedziaw
( x&i )
cum ni
(x&i x )3
(x& i x )3 ni
11 25
26 40
41 55
56 - 70
Razem
10
35
55
20
120
18
33
48
63
X
180
1155
2640
1260
5235
-16777,2
-1201,6
80,8
7320,8
X
-167772,0
-42056,6
4444,0
146416,0
-59068,6
D( x ) = 41 +
(55 35)
14 = 46,1 punktu
(55 35) + (55 20)
za mediana:
120
45
2
14 = 44,8 punktu
Me(x ) = 41 +
55
Miara skonoci ustalona wedug wzoru 2.30 wyniesie:
Na podstawie obu miar mona stwierdzi wystpowanie w badanym szeregu skonoci lewostronnej (ujemnej), co oznacza, e w badanej zbiorowoci dominuj uczniowie, dla ktrych wyniki pomiarw warunkw rodowiska domowego s wysze od rednich.
Dla okrelenia natenia skonoci (jak rwnie jej kierunku) wykorzystamy zarwno wspczynniki skonoci jak i trzeci moment centralny
standaryzowany.
Standaryzowane wspczynniki skonoci o postaciach 2.32 i 2.33
przyjmuj odpowiednio wartoci:
Ws1 ( x ) =
61
43,6 46,1
3 (43,6 44,8)
= 0,20 Ws1 ( x ) =
= 0,29
12,6
12,6
120
10
Q1 ( x ) = 26 + 4
14 = 34 punkty
35
za kwartyl trzeci:
3 120
45
4
Q3 ( x ) = 41 +
14 = 52,5 punktu
55
Wobec tego wspczynnik skonoci przyjmie warto:
Ws 2 ( x ) =
59068,6
492,2
*
120
m3 (t ) =
=
= 0,20
59068,6
492,2 + 2000,4
3
+ (12,6)
120
Kolejna miara rwnie wskazuje niewielk skono lewostronn.
2.3.5. Miary koncentracji
Zjawisko koncentracji wartoci cechy jest w statystyce dwojako interpretowane. Po pierwsze, moe oznacza skupienie wartoci cechy wok
redniej arytmetycznej; po drugie moe by utosamiane z nierwnomiernym rozkadem globalnego funduszu wartoci cechy wrd jednostek statystycznych badanej zbiorowoci.
62
Zygmunt Bobowski
i =1
powiadajcych im liczebnoci
x& n ).
i
i =1
k=
a
5000
2.38.
gdzie: a jest powierzchni zawart midzy krzyw Lorenza a lini rwnomiernego podziau globalnego funduszu wartoci cechy.
Wspczynnik ten jest wielkoci unormowan w przedziale <0 ; 1>. Im
wysza jest jego warto tym wiksza nierwnomierno rozoenia globalnego funduszu wartoci cechy, a wielkoci skrajne oznaczaj:
0 - cakowity brak koncentracji,
1 - koncentracj zupen (praktycznie nie ma ona miejsca).
Wyznaczajc analitycznie wspczynnik koncentracji mona wykorzysta informacje ujte na wykresie krzywej (w praktyce nie jest to krzywa,
lecz linia amana) Lorenza. Sposb postpowania w przypadku graficznego i
analitycznego badania koncentracji ilustruje poniszy przykad.
Przykad 2.13.
Ponisza tablica zawiera informacje dotyczce struktury przedsibiorstw
woj. D wedug wielkoci zatrudnienia:
Liczba
przedsibiorstw
Zatrudnienie
(
xi )
ni )
rodki przedziaw
(x&i )
x& i ni
63
f i x&i ni
i =1
f i (ni )
cumfi x&i ni
i
=
1
cumfi (ni )
1-10
11-50
51-200
201-500
501-1000
Razem
450
100
35
12
3
600
5
30
125
350
750
X
2250
3000
4375
4200
2250
16075
14,00
18,66
27,22
26,12
14,00
100,00
75,00
16,67
5,83
2,00
0,50
10,00
14,00
32,66
59,88
86,00
100,00
X
75,00
91,67
97,50
99,50
100,00
X
i =1
64
Zygmunt Bobowski
Rys. 2.13
Krzywa Lorenza
cum f i xi ni
i
100
90
80
70
60
50
40
32,66
30
20
14
10
I
10
20
30
40
50
60
III
II
70
80
90
100
cum f i (ni )
Pomiar natenia koncentracji metod analityczn odbywa si najczciej przy wykorzystaniu powyszego wykresu, na podstawie ktrego moliwe jest precyzyjne okrelenie powierzchni powstaego pola. Poniewa jego
ksztat nie stanowi regularnej figury geometrycznej, wobec tego zaleca si
ustalenie wielkoci pola znajdujcego si pod krzyw Lorenza, tj. dopenienia pola a. Dopenienie pola a skada si w naszym przykadzie z 5 figur
geometrycznych (ponumerowanych I - V) powstaych w wyniku zrzutowania poszczeglnych punktw wyznaczajcych przebieg krzywej Lorenza na
o odcitych (uzyskalimy 1 trjkt i 4 trapezy). Ich pola wyznaczamy posugujc si wsprzdnymi poszczeglnych punktw. I tak:
pole trjkta (figura I) = 75 14/2 = 525
pole trapezu (figura II) = (32,66 + 14) /2 16,67 = 388,91
pole trapezu (figura III) = (59,88 + 32,66)/2 5,83 = 269,75
pole trapezu (figura IV) = (86 + 59,88)/2 2,00 = 145,88
pole trapezu (figura V) = (100 + 86)/2 0,50 = 46,50
65
k=
3623,96
= 0,725
5000
Zakadajc, e we wszystkich przypadkach wystpuje identyczna warto rednia zaprezentowane krzywe I - III prezentuj rny poziom skupie-
66
Zygmunt Bobowski
nia wartoci cechy wok tej redniej. W przypadku krzywej I mona mwi
o wystpowaniu normalnego skupienia (normalnej koncentracji) wok
redniej. Dwie pozostae krzywe prezentuj odpowiednio: II - poziom skupienia mniejszy od normalnego (koncentracj mniejsz od normalnej);
krzywa ta ma ksztat spaszczony, platykurtyczny, III - poziom skupienia
wikszy od normalnego (koncentracj wiksz od normalnej); krzywa ma
ksztat wysmuky, leptokurtyczny.
Pomiaru tak rozumianej koncentracji dokonujemy przy pomocy miary
kurtozy (mona rwnie spotka okrelenie miary puapu) ustalanej wedug
wzoru:
k
(x i
m 4 (t ) =
m 4 (x )
=
s 4 (x )
i =1
x ) ni
N
(x
i =1
x)
N
ni
2.39.
Jak atwo zauway w liczniku podanej miary wystpuje moment centralny rzdu czwartego, za wykorzystanie w mianowniku odchylenia standardowego podniesionego do potgi czwartej ma na celu uzyskanie miary
niemianowanej. Im wysza warto tej miary tym wikszy poziom skupienia
wartoci cechy wok redniej arytmetycznej (wie si to ze spadkiem rozproszenia wartoci cechy, jednak warto mianownika maleje szybciej ni
warto czwartego momentu centralnego). W przypadku normalnego skupienia wartoci cechy warto tej miary wynosi 3, w przypadku wartoci
wikszych od 3 wystpuje koncentracja wiksza od normalnej, za przy
wartociach mniejszych od 3 - koncentracja mniejsza od normalnej.
W literaturze spotyka si rwnie modyfikacj tak sformuowanej miary
koncentracji. Nosi ona nazw miary ekscesu. Mierzy ona poziom odchylenia
badanego przypadku koncentracji od koncentracji normalnej i wyraa si
ona wzorem:
e(t ) = m4 (t ) 3
2.40.
Gdy jej warto wynosi zero - wystpuje koncentracja normalna; wartoci dodatnie wskazuj na wystpowanie koncentracji wikszej od normalnej, za mniejsze od zera - koncentracj mniejsz od normalnej.
W literaturze zaleca si badanie tak rozumianej koncentracji jedynie w
przypadku rozkadw symetrycznych lub nieznacznie skonych. W przypadku duej skonoci naley bada poziom nierwnomiernoci rozoenia globalnego funduszu wartoci cechy
Procedur wyznaczania miary kurtozy ilustruje poniszy przykad.
67
Przykad 2.14.
Na podstawie danych z przykadu 2.11 zbada poziom skupienia (koncentracji) wynikw pomiaru warunkw rodowiska domowego wok ich
wartoci redniej.
Rozwizanie:
Przypomnijmy, e ustalona warto rednia wynosi 43,6 punktu, a odchylenie standardowe 12,6 punktu. Obliczenia pomocnicze dla wyznaczenia
czwartego momentu centralnego wykonano w poniszej tablicy roboczej:
Wyniki
pomiaru
(w punktach)
( xi )
Liczba
uczniw
( ni )
rodki przedziaw
( x&i )
(x&i x )4
(x& i x )4 ni
11 25
26 40
41 55
56 - 70
Razem
10
35
55
20
120
18
33
48
63
X
429496,7
12624,8
374,8
141646,8
X
4294967,0
441868,0
20614,0
2832936,0
7590385,0
7590395
63253,2
m4 (t ) = 120 4 =
= 2,51 ,
25204,7
(12,6 )
a ustalona na tej podstawie miara ekscesu:
PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI
SERIA:
NAUKI SPOECZNE
Rozdzia III
3.1. WPROWADZENIE
Zagadnienie to stanowi segment wielowymiarowej analizy statystycznej,
ktra moe by rozpatrywana w dwch ujciach. Po pierwsze, dotyczy moe opisu zbiorowoci statystycznej, w ktrym kada jednostka statystyczna
jest charakteryzowana przez dowolnie liczny (liczcy co najmniej 2) zbir
cech statystycznych. Oznacza to, i mamy w tym przypadku do czynienia z
wielowymiarowym opisem rozkadu okrelonej zbiorowoci. Po drugie - rozpatrywa mona rwnie inn sytuacj, gdy t sam cech opisujemy kilka
zbiorowoci statystycznych.
Analizujc pierwszy przypadek (w praktyce najczciej rozpatrywany) w
zbiorze cech przyjtych do opisu badanej zbiorowoci na podstawie analizy merytorycznej - wyodrbniamy takie, ktre wystpuj we wzajemnym
powizaniu i celem prowadzonego w takim przypadku badania wspzalenoci moe by udzielenie odpowiedzi na pytanie; Czy pomidzy wybranymi cechami opisujcymi badan zbiorowo wystpuje zaleno? W
drugiej sytuacji interesuje nas odpowied na pytanie: Czy pomidzy wartociami wybranej cechy opisujcymi rne zbiorowoci wystpuje zaleno?. Ilustracj pierwszego problemu moe by prba ustalenia: Czy istnieje zaleno pomidzy czasem powicanym na nauk okrelonego
przedmiotu przez badan grup studentw a uzyskiwanymi przez nich wynikami na egzaminie? W drugim przypadku moe to by prba udzielenia
odpowiedzi na pytanie: Czy istnieje zaleno midzy poziomem wyksztacenia rodzicw a ich dzieci na podstawie zebranego materiau statystycznego o wyksztaceniu z jednej strony populacji rodzicw a z drugiej - ich dzieci?
Naley podkreli, e badanie wspzalenoci dotyczy gwnie pierwszej z
omawianych sytuacji.
Prowadzenie analizy wspzalenoci wymaga wyodrbnienia w zbiorze
cech opisujcych badan zbiorowo takich cech, co do ktrych zachodzi
podejrzenie, e wystpuje pomidzy nimi zwizek przyczynowo-skutkowy.
Z powyszego wynika, e waciwe badanie wspzalenoci musi by po-
69
przedzone analiz merytoryczn (okrelan rwnie mianem analizy jakociowej) badanego zwizku w celu uniknicia badania tzw. wspzalenoci
pozornej. Wspzaleno taka ma miejsce wwczas, gdy wystpuje zaleno midzy wartociami badanych cech, ale nie ma midzy nimi powiza
przyczynowo-skutkowych, np. zaleno midzy liczb przebywajcych na
okrelonym obszarze bocianw a liczb urodze dzieci. Stwierdzenie wspomnianych powiza przyczynowych pomidzy cechami upowania do prowadzenia waciwej analizy wspzalenoci. W analizie takiej wyodrbnia
si zwykle dwa rodzaje cech: niezalen (jedn bd kilka) - utosamian z
przyczyn oraz zalen stanowic skutek oddziaywania wspomnianej
przyczyny.
Z teoretycznego punktu widzenia mona mwi o dwch rodzajach zalenoci pomidzy cechami: funkcyjnej i statystycznej. W pierwszym przypadku mamy do czynienia z jednoznacznym przyporzdkowaniem wartociom cechy niezalenej odpowiednich wartoci cechy zalenej (kadej wartoci zmiennej niezalenej odpowiada tylko jedna warto zmiennej zalenej). Ten typ zalenoci nie odnosi si w zasadzie do relacji zachodzcych w
przypadku zjawisk spoeczno-gospodarczych. Wynika to midzy innymi z
nastpujcych przyczyn:
zjawiska tego typu podlegaj zwykle oddziaywaniu bardzo wielu czynnikw,
w wikszoci przypadkw trudno jednoznacznie zidentyfikowa wszystkie czynniki,
nie wszystkie z ustalonych czynnikw maj charakter mierzalny by
mona je byo uwzgldni w analizie wspzalenoci,
wpyw wielu czynnikw, nawet tych mierzalnych, trudno jednoznacznie
okreli liczbowo z uwagi na czsto wystpujce zoone powizania z
innymi czynnikami,
uwzgldnienie w badaniach zbyt duej liczby czynnikw znacznie komplikuje procedury obliczeniowe, a niekiedy wrcz je uniemoliwia.
W takich warunkach badanie wspzalenoci odbywa si zwykle na zasadzie eksperymentowania, bowiem w naukach spoeczno-ekonomicznych
niemoliwe jest wyizolowanie badanych zjawisk od oddziaywania przyczyn
nieistotnych.
W zwizku z powyszym w przypadku zjawisk spoeczno-gospodarczych
mona mwi jedynie o wystpowaniu zalenoci typu statystycznego. Jest
to zaleno niejednoznaczna, tzn. kadej wartoci zmiennej niezalenej odpowiadaj rne wartoci zmiennej zalenej.
Analizujc oba rodzaje wspzalenoci naley zauway, e o ile w
przypadku zwizku funkcyjnego nie ma uzasadnienia pytanie: czy okrelona zmienna wystpuje w silniejszej bd sabszej zalenoci funkcyjnej od
innej zmiennej, o tyle w przypadku zwizku statystycznego postawienie podobnego pytania jest sensowne. Mona bowiem mwi o mniejszym bd
wikszym nateniu zalenoci typu statystycznego.
W literaturze wyodrbnia si rne podejcia do badania wspzalenoci o zrnicowanym stopniu precyzji wynikw jej badania. Nale do nich:
a) metoda graficzna,
b) metoda tabelaryczna,
70
Zygmunt Bobowski
b)
c)
rzdkowanie wzajemne wartoci cech X i Y; kadej wartoci cechy X odpowiada tylko jedna warto cechy Y przy czym rosncym wartociom
cechy X odpowiadaj rosnce wartoci cechy Y lub malejcym wartociom cechy X odpowiadaj malejce wartoci cechy Y,
zaleno prostoliniow o kierunku dodatnim; w tym przypadku poszczeglnym wartociom cechy X moe odpowiada dowolna liczba wartoci
cechy Y; dodatkowo - wraz ze wzrostem wartoci cechy X wzrastaj
(rednio) wartoci cechy Y (lub odwrotnie),
ten ksztat diagramu ilustruje zaleno funkcyjn o kierunku ujemnym;
w tym przypadku rwnie wystpuje jednoznaczne, wzajemne przyporzdkowanie wartoci cech X i Y, przy czym rosncym wartociom cechy
71
X odpowiadaj malejce wartoci cechy Y lub malejcym wartociom cechy X odpowiadaj rosnce wartoci cechy Y,
d) ten przypadek ilustruje zaleno prostoliniow o kierunku ujemnym; poszczeglnym wartociom cechy X moe odpowiada dowolna liczba wartoci cechy Y, przy czym rosncym wartociom cechy X odpowiadaj malejce (rednio) wartoci cechy Y (lub odwrotnie),
e) ilustruje jeden z przypadkw zwizku krzywoliniowego; w tym przypadku wystpuje niejednoznaczne przyporzdkowanie wartoci obu cech, a
dodatkowo nie ma miejsca jednolita tendencja zmian wartoci tych cech,
f) ten przypadek jest ilustracj braku zalenoci midzy cechami.
Na podstawie powyszego mona stwierdzi, e metoda graficzna oprcz
informacji o charakterze zwizku (liniowy lub krzywoliniowy) i kierunku
zwizku (dodatni lub ujemny) dostarcza rwnie wskazwek umoliwiajcych wstpn ocen siy zwizku miedzy cechami. Moe ona stanowi
punkt wyjcia dla stosowania formalnych metod opisu wspzalenoci.
Metoda tabelaryczna badania wspzalenoci wykorzystujca informacje ujte zarwno w szeregach jak i tablicach statystycznych - pozwala
na uzyskanie wynikw badania o stopniu precyzji zblionym do metody graficznej. Diagram korelacyjny to przecie nic innego, jak zaprezentowany w
postaci graficznej materia statystyczny ujty w szeregach bd tablicy statystycznej. W przypadku informacji o wartociach cech ujtych w postaci
szeregw statystycznych ocena charakteru zwizku jak i natenia oraz kierunku zalenoci odbywa si na podstawie okrelenia charakteru wzajemnych powiza wartoci dwch badanych cech. Analiza taka pozwala na
wstpne wyodrbnienie jednej z powyszych sytuacji oznaczonych jako (a)
( f).
Dla licznych zbiorowoci (przyjmuje si zwykle, e ich liczebno przekracza 30) materia statystyczny opisujcy je ujmuje si w formie tablicy
statystycznej zwanej w tym przypadku tablic korelacyjn6. Tablica taka
prezentuje jednoczesny rozkad badanej zbiorowoci ze wzgldu na dwie cechy, std te spotykane w literaturze okrelenie, i przedstawia ona dwuwymiarowy rozkad zbiorowoci. W tablicy takiej dla cech typu liczbowego
ich wartoci ujmowane s najczciej w postaci przedziaw klasowych7, za
dla cech typu opisowego przyjmuje si wystpujce w zbiorowoci ich warianty. Sformuowane przedziay klasowe bd warianty cech ujmowane s
w gwce i boczku tablicy. Zgromadzony w postaci szeregw szczegowych materia statystyczny moe by przeniesiony do przygotowanej makiety tablicy korelacyjnej tzw. metod kreskow, tzn. po odczytaniu wartoci cech dla okrelonej jednostki statystycznej jest ona umieszczana za pomoc kreski w odpowiednim polu tablicy korelacyjnej. Wypenion kreskami tablic korelacyjn traktujemy jako robocz, a po ich zliczeniu
otrzymujemy wynikow tablic liczebnoci, ktra moe by przeksztacona
w tablic czstoci. W tym celu naley wszystkie liczebnoci podzieli przez
72
Zygmunt Bobowski
liczebno ogln (N). Ilustracj takiej tablicy liczebnoci i jej przeksztacenia w tablic czstoci jest ponisza tablica 3.1.
Tabela 3.1. Pracownicy firmy Z ze wzgldu na wiek i sta pracy
(w latach)
Sta pracy
Wiek
20 - 30
30 - 40
nj
fj
0-5
5 - 10
10 15
ni
fi
15
0,30
5
0,10
10
0,20
10
0,20
10
0,20
25
0,50
25
0,50
20
0,40
20
0,40
10
0,20
50
1,00
Na jej podstawie dokonana zostanie charakterystyka podstawowych typw rozkadw wystpujcych w tablicy korelacyjnej, tj. rozkadu cznego,
brzegowych i warunkowych.
a) rozkad czny opisuje badan zbiorowo jednoczenie ze wzgldu na
obie cechy (w tablicy znajduje si w jej zacieniowanej czci). Liczebnoci w
tym rozkadzie oznaczane s symbolem nij (za czstoci f ij ) i naley je odczytywa jako liczebnoci (czstoci) i-tego wiersza i j-tej kolumny. W naszym przykadzie rozkad czny liczebnoci odczytujemy nastpujco: w
badanej zbiorowoci pracownikw 15 osb posiada wiek 20 30 lat i sta
pracy 0 5 lat, 10 osb w wieku 20 30 lat i stau 5 10 lat, 5 osb posiadajcych wiek 30 40 lat oraz sta 0 5 lat, 10 osb w wieku 30 40 lat i
stau pracy 5 10 lat jak rwnie 10 osb posiadajcych wiek 30 40 lat i
sta 10 15 lat; rozkad czny czstoci odczytywany jest zwykle w ujciu
procentowym w sposb nastpujcy: 30 % pracownikw tej firmy posiada
wiek 20 30 lat i sta pracy 0 5 lat, 20 % jest w wieku 20 30 lat i stau
5 10 lat, 10 % posiada wiek 30 40 lat oraz sta 0 5 lat, 20 % jest w
wieku 30 40 lat i stau pracy 5 10 lat, rwnie 20 % posiada wiek 30
40 lat i sta 10 15 lat,
b) w tablicy wystpuj dwa rozkady brzegowe: wierszowy i kolumnowy.
Kady z nich opisuje badan zbiorowo ze wzgldu na jedn cech. Rozkad brzegowy wierszowy tworz sumy liczebnoci (czstoci) liczone po
poszczeglnych wierszach. S one oznaczane symbolem ni (czstoci - f i ) i
naley je odczytywa jako liczebnoci (czstoci) i-tego wiersza. W naszym
przykadzie liczebnoci (czstoci) te s umieszczone w ostatniej kolumnie i
ilustruj one rozkad zbiorowoci pracownikw ze wzgldu na wiek. Na ich
podstawie mona stwierdzi, e w badanej zbiorowoci 25 pracownikw, tj.
50 % zbiorowoci pracownikw jest w wieku 20 30 lat i taka sama liczba
posiada wiek 30 40 lat. Rozkad brzegowy kolumnowy tworz sumy liczebnoci (czstoci) liczone w poszczeglnych kolumnach. Oznaczane s
one symbolem
73
74
Zygmunt Bobowski
noci statystycznej, tj. metoda nieparametrycznego (stochastycznego) i metoda parametrycznego (korelacyjnego) badania wspzalenoci. Pierwsza z
metod opiera si na badaniu podobiestwa rozkadw warunkowych (analiza dotyczy jedynie rozkadw cech a nie ich wartoci) cechy zalenej. Natenie zalenoci w tym przypadku okrelamy na podstawie stopnia podobiestwa warunkowych rozkadw tej cechy. W drugim przypadku przedmiotem analizy jest badanie podobiestwa parametrw warunkowych
(rednich warunkowych) cechy zalenej. Wysze podobiestwo rednich warunkowych cechy zalenej oznacza bdzie mniejsze natenie zalenoci. W
ramach obu metod wykorzystywanych jest wiele miar wspzalenoci cech
o cile okrelonych waciwociach i wynikajcych std warunkach ich
stosowania. Ich prezentacja zostanie dokonana na tle hipotetycznej idealnej miary zalenoci.
Natenie zalenoci
niezaleno (brak zalenoci)
zaleno saba
zaleno wyrana
zaleno silna
zaleno funkcyjna
c) oprcz natenia winna wskazywa rwnie kierunek zalenoci; jej warto winna informowa, czy w okrelonym przypadku mamy do czynienia z zalenoci o kierunku dodatnim bd ujemnym. W przypadku zalenoci dodatniej rosncym (malejcym) wartociom cechy niezalenej
odpowiadaj rosnce (malejce) wartoci cechy zalenej. Zaleno
ujemna oznacza, i rosncym (malejcym) wartociom cechy niezalenej
towarzysz malejce (rosnce) wartoci cechy zalenej. Miary wskazujce
kierunek zalenoci przyjmuj wartoci zarwno dodatnie jak i ujemne;
w przypadku miar unormowanych przyjmuj one wartoci z przedziau
liczbowego <-1; 1>. Badanie kierunku zalenoci odnosi si do relacji zachodzcych midzy cechami, ktrych wartoci s wyraone przynajmniej
na skali porzdkowej,
75
76
Zygmunt Bobowski
ci midzy badanymi cechami moe by oceniane na podstawie stopnia podobiestwa tych rozkadw. Jeli wszystkim wariantom cechy niezalenej
odpowiadaj identyczne rozkady warunkowe cechy zalenej, oznacza to
wystpowanie niezalenoci cech w sensie nieparametrycznym. W przypadku zrnicowanych rozkadw warunkowych wystpuje zaleno cech, a
stopie ich niepodobiestwa pozwala na wstpn ocen natenia zalenoci.
Sformuowany wyej w sposb opisowy warunek niezalenoci cech
mona sformalizowa w sposb nastpujcy:
jeli dla wszystkich kombinacji wariantw cech zalenej i niezalenej (czyli
wszystkich pl rozkadu cznego w tablicy korelacyjnej) zachodzi relacja:
f ij = f i f j , tzn. f ij f i f j = 0
wwczas wystpuje niezaleno badanych cech.
Warunek ten jest symetryczny.
3.3.1. Wspczynnik zbienoci Czuprowa
W oparciu o podany wyej warunek skonstruowany zosta wspczynnik
zbienoci Czuprowa o postaci:
d =
c
i, j
(f
fi f j )
ij
fi f j
3.1.
min(r , s ) 1
f ij , f i , f j
2) ustali dla kadego pola tablicy korelacyjnej iloczyny
fi f j ,
(f
fi f j ) ,
2
ij
77
f i f j , tzn.
(f
fi f j )
ij
fi f j
rednie
wysze
ni
10
42
33
25
15
30
15
15
10
3
2
-
35
75
50
40
110
75
15
200
Czas pozostawania
bez pracy (Y)
0-6
6 - 12
12 - 18
18 24
nj
rdo: Dane umowne
dc =
0 ,1685
= 0 , 29
3 1
Uzyskana wielko oznacza wystpowanie niewielkiej zalenoci czasu pozostawania bez pracy od poziomu wyksztacenia bezrobotnych.
78
Zygmunt Bobowski
Wyksztacenie(X)
Czas pozostawania
bez pracy (Y)
06
6 12
12 - 18
18 24
nj
fj
rednie
wysze
15
0,075
0,0656
0,0094
~0,0001
0,0013
30
0,15
0,1406
0,0094
~0,0001
0,0006
15
0,075
0,0938
-0,0188
0,0004
0,0047
15
0,075
0,0750
0
0
0
10
0,05
0,0131
0,0369
0,0014
0,1068
3
0,015
0,0281
-0,0131
0,0002
0,0061
2
0,01
0,0188
-0,0088
0,0001
0,0041
0,0150
-0,015
0,0002
0,015
75
0,375
15
0,075
podstawowe
(1)
(2)
(3)
(4)
10
0,05
0,0963
0,0463
0,0021
0,0223
42
0,21
0,2063
0,0037
~0,0001
0,0001
33
0,165
0,1375
0,0275
0,0008
0,0055
25
0,125
0,1100
0,0150
0,0002
0,0020
110
0,55
ni
fi
35
0,175
75
0,375
50
0,25
40
0,20
200
1,00
79
z podanych wyej dziaa, w wyniku ktrych otrzymujemy wyraenia o postaci: f ij f i f j . Wrd otrzymanych wielkoci wyodrbniamy dwa podzbiory:
G , dla ktrego
f ij f i f j > 0
M, dla ktrego
f ij f i f j < 0
H
G
f ij
i , j G
fi f
i , j G
3.2.
(r , s )
min
b) dla podzbioru M:
d
H
M
fi f
i , j M
f ij
i , j M
3.3.
1
min
(r , s )
podstawowe
0-6
6 - 12
12 - 18
18 24
fj
0,21
0,2063
0,0037
0,165
0,1375
0,0275
0,125
0,1100
0,0150
0,55
rednie
wysze
fi
(1) 0,075
(2) 0,0656
(3) 0,0094
0,15
0,1406
0,0094
0,05
0,0131
0,0369
0,175
0,375
0,25
0,20
0,375
0,075
1,00
80
Zygmunt Bobowski
ij
= 0,775
i , j G
f j = 0,6731
i , jG
dG
0,775 0,6731
= 0,39
1
1
3
Uzyskana warto miary odbiega nieznacznie od otrzymanej dla wspczynnika zbienoci Czuprowa. Oznacza ona wystpowanie wyranej zalenoci czasu pozostawania bez pracy od poziomu wyksztacenia bezrobotnych.
81
(y
xj
y) 2 n j
rk =
s( y x j )
s( y )
( y i y ) 2 ni
3.4.
N
lub
(y
xi
y ) 2 ni
r =
k
s ( y xi )
s( y )
( y j y) 2 n j
3.5.
N
gdzie:
( )
( )
s( y )
y x j lub y xi - rednie warunkowe cechy zalenej,
y - rednia oglna cechy zalenej.
Podana pierwsza wersja tej miary jest wykorzystywana, gdy wartoci cechy zalenej (Y) wystpuj w boczku tablicy, za druga, gdy s one
umieszczone w gwce tablicy. Naley rwnie doda, i wystpujce we
wzorach liczebnoci mog by zastpione czstociami.
Algorytm obliczania tej miary mona uj w nastpujcych punktach:
1) wyznaczenie rednich warunkowych i redniej oglnej cechy zalenej (Y),
2) ustalenie wariancji, a nastpnie odchylenia standardowego rednich
warunkowych cechy zalenej,
3) ustalenie wariancji, a nastpnie odchylenia standardowego oglnego
cechy zalenej,
k
82
Zygmunt Bobowski
Przykad 3.2.
W poniszej tablicy zawarto wyniki badania warunkw materialnych losowej grupy gospodarstw domowych miasta L uwzgldniajce wysoko
dochodw na 1 czonka gospodarstwa domowego (Y) oraz liczb osb w gospodarstwie (X).
Tablica 3.3 Gospodarstwa domowe miasta L wedug dochodw na
1 osob w z oraz liczb osb w gospodarstwie
Liczba osb w gospodarstwie (X)
13
46
7-9
2
13
20
8
17
20
20
-
Dochd na 1
osob w z (Y)
150 350
350 550
550 750
nj
30
50
20
ni
35
25
40
100
Na podstawie analizy rednich warunkowych oraz przy wykorzystaniu stosunku korelacyjnego zbada, czy w badanej zbiorowoci wystpuje zaleno wysokoci dochodu na osob od liczby osb w gospodarstwie domowym.
Rozwizanie:
rednie warunkowe cechy zalenej bd stanowiy rednie dochodw na
osob w wyodrbnionych trzech kategoriach wielkoci gospodarstw, tj. 1 3
osb, 4 6 osb oraz 7 9 osb. Dla ich wyznaczenia naley ustali rodki
przedziaw klasowych dla dochodw ( ujto je w nawiasach w pierwszej kolumnie poniszej tablicy roboczej).
Poszczeglne rednie warunkowe wyznaczone zostan w nastpujcy
sposb:
y13 =
y 4 6
y 7 9
83
y& n
i
y=
Dochd
(rodki przedzia-
y&i )
w -
250
450
650
nj
Liczba osb (
xi )
13
2
8
20
30
46
13
17
20
50
7-9
20
20
570
478
12100
363000
ni
( y&i y )2 ( y& i y )2 ni
35
25
40
100
44100
100
36100
250
324
44100
16200
882000
= 1261200
1543500
2500
1444000
= 2990000
i
(y
(y
yx j
xj
y nj
2
xj
rk =
1261200
112 ,3
100
=
= 0,65
172 ,9
2990000
100
Uzyskana warto miary oznacza, e wystpuje wyrana zaleno wysokoci dochodw na 1 osob od liczby osb w gospodarstwie domowym.
Wykorzystana miara nie okrela kierunku zalenoci, ale na podstawie
rednich warunkowych stwierdzilimy, e jest on ujemny.
Omawiana miara zalenoci charakteryzuje si nastpujcymi wasnociami:
1) jest niemianowana,
2) jest unormowana w przedziale <0 ; 1>,
3) nie wskazuje kierunku zalenoci; w szczeglnych przypadkach moe by on okrelony w oparciu o rednie warunkowe,
4) jest w zasadzie niesymetryczna (zjawisko symetrii zachodzi tylko w
przypadku zwizku prostoliniowego),
5) jest wykorzystywana do badania zalenoci w zwizkach krzywoliniowych lub, gdy charakter zwizku nie jest znany,
6) stosuje si j do badania zalenoci, gdy przynajmniej cecha zalena
jest liczbowa,
7) spenia warunek jednolitej preferencji wartoci.
84
Zygmunt Bobowski
(x
rP =
x ) ( y i y )
c (x, y )
=
s ( x ) s ( y )
(x
x)
(y
y)
3.6.
(x
rP =
c (x, y )
=
s ( x ) s ( y )
x ) ( y i y ) n ij
i, j
(x
x) n j
(y
y ) ni
2
3.7.
gdzie:
c( x, y ) kowariancja cech X i Y,
s ( x) odchylenie standardowe cechy X,
s ( y ) odchylenie standardowe cechy Y.
Wzr o postaci 3.7. odpowiada ukadowi tablicy, w ktrej wartoci cechy
X umieszczone s w jej gwce , za cechy Y w boczku; w przypadku odwrotnego ukadu cech wystpujce w podanym wzorze indeksy i oraz j winny by zamienione miejscami. Naley rwnie doda, e wystpujce we
wzorze 3.7 liczebnoci mog by zastpione czstociami.
Jeli dla badania zalenoci wykorzystujemy wersj wspczynnika korelacji dla szeregw szczegowych, wwczas wykonujemy kolejno nastpujce dziaania:
1) wyznaczamy na podstawie szeregw szczegowych wartoci rednie
dla obu cech,
2) ustalamy wielkoci rnic poszczeglnych wartoci cech X i Y oraz
ich wartoci rednich, tj. xi x oraz yi y ,
3) ustalamy kwadraty uzyskanych rnic,
4) dokonujemy ich sumowania,
5) ustalamy iloczyny rnic uzyskanych w p. 2,
85
Przy pomocy wspczynnika korelacji liniowej Pearsona zbada, czy wystpuje zaleno wysokoci wydatkw od liczby osb w gospodarstwie domowym?
Rozwizanie:
Obliczenia pomocnicze zgodnie z podan procedur zostan wykonane
w poniszej tablicy roboczej:
Liczba
Wydatki
osb ( xi )
3
5
7
2
6
4
5
3
2
2
4
6
5
3
3
7
4
2
4
3
= 80
yi )
70
75
60
100
85
70
90
50
70
70
110
75
40
60
90
90
75
60
80
90
y =
i
1510
xi x (xi x)2
-1
1
3
-2
2
0
1
-1
-2
-2
0
2
1
-1
-1
3
0
-2
0
-1
1
1
9
4
4
0
1
1
4
4
0
4
1
1
1
9
0
4
0
1
=
i
yi y ( yi y)2
-5,5
-0,5
-15,5
24,5
9,5
-5,5
14,5
-25,5
-5,5
-5,5
34,5
-0,5
-35,5
-15,5
14,5
14,5
-0,5
-15,5
4,5
14,5
50
30,25
0,25
240,25
600,25
90,25
30,25
210,25
650,25
30,25
30,25
1190,25
0,25
1260,25
240,25
210,25
210,25
0,25
240,25
20,25
210,25
=
i
5495
(xi x)( yi y)
5,5
-0,5
-46,5
-49,0
19
0
14,5
25,5
11
0
0
1
-35,5
15,5
-14,5
43,5
0
31,0
0
-14,5
15,0
86
Zygmunt Bobowski
x=
80
= 4,0 osoby
20
y=
1510
= 75,5 z.
20
rP =
15
0,75
20
=
= 0,03
50 5495 1,58 16,58
20
20
Otrzymana warto miary wskazuje na wystpowanie niewielkiej zalenoci wysokoci wydatkw na cele kulturalne od liczby osb w badanych
gospodarstwach domowych.
W przypadku badania zalenoci na podstawie danych ujtych w tablicy
korelacyjnej wykorzystujemy drug wersj wspczynnika korelacji i w
zwizku z tym wykonujemy kolejno nastpujce dziaania:
1) wyznaczamy wartoci rednie dla obu cech,
2) ustalamy wielkoci rnic poszczeglnych wariantw cech X i Y oraz
ich wartoci rednich, tj. x j x oraz yi y ,
3)
obliczamy iloczyny kwadratw ustalonych wyej rnic oraz odpowiadajcych im liczebnoci brzegowych, tj.
( x j x ) 2 n j oraz
( y i y ) 2 ni
4) dokonujemy sumowania tych iloczynw,
5) dla poszczeglnych pl rozkadu cznego ustalamy iloczyny
(x
x ) ( y i y ) nij
87
x=
30 2 + 50 5 + 20 8 470
=
= 4,7 osoby.
100
100
450
650
nj
5
13
- 63
-819
17
-3
-51
20
57
1140
8
20
-693
-13860
-
30
50
20
ni
( y&i y ) ( y& y )2 n
i
i
35
-210
25
-10
2500
40
190
1444000
100
1543500
= 2990000
i
x& j x
-2,7
0,3
3,3
( x& j x ) 2 n j
218,7
4,5
217,8
= 441
c(x, y) =
c ( x, y ) :
osoby)
rP =
225
441 2990000
100
100
225
= 0,62
2,1172,9
88
Zygmunt Bobowski
Sp
= 1
6 d xi d y i
i
3.8.
N3 N
gdzie:
89
Rozwizanie:
Obliczenia pomocnicze zostan wykonane w poniszej tablicy roboczej.
W kolumnach 3. i 4. dokonano rangowania wartoci cech X i Y od wartoci
najniszych do najwyszych.
Liczba
osb ( xi )
3
5
7
2
6
4
5
3
2
2
4
6
5
3
3
7
4
2
4
3
Wydatki
( yi )
70
75
60
100
85
70
90
50
70
70
110
75
40
60
90
90
75
60
80
90
Razem
d xi
d yi
7
15
19,5
2,5
17,5
11,5
15
7
2,5
2,5
11,5
17,5
15
7
7
19,5
11,5
2,5
11,5
7
7,5
11
4
19
14
7,5
16,5
2
7,5
7,5
20
11
1
4
16,5
16,5
11
4
13
16,5
(d
xi
d yi
0,25
16
240,25
272,25
12,25
16
2,25
25
25
25
72,25
42,25
196
9
90,25
9
0,25
2,25
2,25
90,25
1139,0
r Sp = 1
6 1139,0
6834,0
= 1
= 1 0,86 = 0,14
3
7980
20 20
Uzyskana warto miary wskazuje na wystpowanie niewielkiej, dodatniej zalenoci wydatkw na cele kulturalne od wielkoci gospodarstw domowych. Niewielka rnica w wartociach miary Pearsona i Spearmana
wie si z mniejsz precyzj tej drugiej. Wspczynnik Spearmana nie
uwzgldnia bowiem stopnia zrnicowania poszczeglnych wartoci cechy.
Stosowany jest on z reguy do wstpnego badania zalenoci. Wspczynnik
ten charakteryzuj nastpujce wasnoci:
1) jest miar niemianowan,
2) przyjmuje wartoci z unormowanego przedziau <-1; 1>,
3) wskazuje natenie i kierunek zalenoci,
4) jest miar symetryczna,
90
Zygmunt Bobowski
y = a y x + b
3.9.
b) regresja X wzgldem Y:
x = a x y + b
3.10.
gdzie:
a, b parametry rwnania regresji ustalane wedug wzorw podanych niej.
91
Dla dalszych rozwaa jako podstawowe przyjmiemy pierwsze z podanych rwna regresji, bowiem opisuje zaleno cechy Y (zalenej) od cechy
X (niezalenej). Wystpujce w nim parametry a i b ustalane s wedug
wzorw:
(x
ay =
x ) ( y i y )
C (x , y )
=
s 2 (x )
N
2
x)
(x i
3.11.
b = y ay x
3.12.
(x
ax =
C ( x, y )
=
s 2 (y)
x ) ( y i y )
N
( y i y )2
3.13
N
b = x ax y
3.14.
gdzie:
c( x, y ) kowariancja cech X i Y,
s 2 ( x) wariancja cechy X,
s 2 ( y ) wariancja cechy Y.
Wystpujcy w podanych rwnaniach parametr a okrelany jest mianem wspczynnika regresji i oznacza skal wzrostu (lub spadku) zmiennej,
dla ktrej skonstruowano rwnanie przy wzrocie wartoci drugiej zmiennej
o jedn jednostk, za parametr b oznacza poziom tej zmiennej, gdy druga
z nich przyjmuje warto rwn zero.
Z wzorw 3.11 i 3.13 wynika oczywista zaleno:
r P = ay ax
3.15.
jak rwnie, i o znaku wspczynnika regresji decyduje znak wspczynnika korelacji liniowej Pearsona wyraajcego zaleno obu cech. Dla potrzeb szacowania rwna regresji moe by wykorzystywany materia staty-
92
Zygmunt Bobowski
( y y )
=
(y y)
2y
3.16.
(x
2x =
x i
)2
(x i
x)
3.17.
Im nisz warto przyjmuje ten wspczynnik, tym lepsze jest dopasowanie rwnania regresji do danych empirycznych. Jako miar dopasowania funkcji wykorzystuje si rwnie tzw. wspczynnik determinacji
ktry stanowi przeciwiestwo wspczynnika zbienoci:
R2 = 1 2
R2 ,
3.18.
( )
R2 = r P
3.19
93
10 2 4
25
18
17
13 5
10
22
8 4
12
13 6 7
10
15
20
19
15 9
10
14
20
12 8
Wydajno
( xi )
pracy (
yi )
xi x ( xi x ) 2 yi y ( yi y ) 2
(xi x)( yi y)
y i
( yi yi )2
8
10
4
7
7
25
18
17
13
5
7
10
22
8
4
12
13
8
10
10
15
20
19
15
9
10
14
20
12
8
-3
-1
-7
-4
-4
14
7
6
2
-6
-4
-1
11
-3
-7
9
1
49
16
16
196
49
36
4
36
16
1
121
9
49
-1
0
-5
-3
-3
2
7
6
2
-4
-3
1
7
-1
-5
1
0
25
9
9
4
49
36
4
16
9
1
49
1
25
3
0
35
12
12
28
49
36
4
24
12
-1
77
3
35
11,38
12,46
9,22
10,84
10,84
20,56
16,78
16,24
14,08
9,76
10,84
12,46
18,94
11,38
9,22
0,38
0,29
1,49
0,71
0,71
30,91
10,37
7,62
0,85
0,58
0,71
2,37
1,12
0,38
1,49
608
238
329
59,98
x =165 y =195
i
x=
165
= 11 lat
15
y=
195
= 13 szt/godz.
15
94
Zygmunt Bobowski
329
21,93
a = 15 =
= 0,54
608 40,53
15
b = 13 0,54 11 = 7,06
i w konsekwencji otrzymujemy rwnanie o postaci:
y = 0,54 x + 7,06
Parametry tego rwnania mona interpretowa nastpujco: wzrost stau pracy pracownika o 1 rok powoduje redni wzrost wydajnoci o 0,54
szt/godz., za przy zerowym stau pracy wydajno wyniosaby 7,06
szt/godz.
- X wzgldem Y:
329
21,93
a = 15 =
= 1,38
238 15,87
15
b = 11 1,38 13 = 6,94
a rwnanie regresji ma posta:
x = 1,38 y 6,94 .
Przebieg prostych oszacowanych powyszymi rwnaniami obrazuje
rys. 3.2.
W tym przypadku uzyskane parametry oznaczaj: wzrost wydajnoci
pracy o 1 szt/godz. wywoywany jest wzrostem stau o 1,38 roku, interpretacja drugiego z parametrw jest bezsensowna.
Podstawowe znaczenie posiada pierwsze z oszacowanych rwna, bowiem trudno uzna badany zwizek za dwustronny.
Na podstawie uzyskanego rwnania regresji mona zgodnie z wzorem
3.15 - okreli warto wspczynnika korelacji liniowej Pearsona mierzcego zaleno midzy badanymi cechami:
95
^y=
6
7,0
4x+
0,5
^x=
1,3
5
4
4
,9
y- 6
3
2
1
-2 -1
-1
x
5
10 11 12 13 14
-2
2y =
59,98
= 0,25
238
R 2 = 1 0,25 = 0,75
Wobec tego mona stwierdzi, e zmienno wydajnoci pracy jest w
75 % zdeterminowana staem pracy, a w 25% innymi czynnikami.
PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI
SERIA:
NAUKI SPOECZNE
Rozdzia IV
4.1. WPROWADZENIE
Opisu rozwoju zjawiska bd zbiorowoci mona dokona rwnie przy
pomocy szeregw czasowych (inaczej chronologicznych, dynamicznych). Szeregi takie mog mie posta tablic dwukolumnowych bd dwuwierszowych, w ktrych wartoci analizowanej zmiennej s uporzdkowane wedug
czasu. Zmienn t bdziemy w dalszym cigu oznaczali jako Y, a jej realizacje yt i , za zmienn czasow -T i jej realizacje ti . Czas jest zmienn cig,
ktrej realizacjami mog by poszczeglne momenty czasowe bd przedziay czasowe (okresy). Odpowiednio do tych dwch przypadkw mona wyrni dwa typy szeregw prezentujcych rozwj zjawiska bd zbiorowoci
w czasie.
Szereg czasowy momentw prezentuje zwykle rozwj okrelonej zbiorowoci (zjawiska), ktrej jednostki istniej w duszym okresie czasu, a szereg podaje jej stan w rnych momentach czasu (np. ludno Jeleniej Gry
w latach 1990 2000, stan na 31.12.) Sumowanie wartoci tak ujtej
zmiennej nie ma sensu (oznaczaoby ono wielokrotne dodawanie tych samych wartoci); mona je natomiast odejmowa od siebie, a rnice obrazuj zmiany stanu badanej zbiorowoci. Umoliwia to przejcie z szeregw
czasowych momentw na szeregi czasowe okresw. Informacje ujte w takim szeregu obrazuj przyrosty bd spadki poziomu badanego zjawiska w
okrelonym przedziale czasowym.
Przecitny poziom zjawiska, ktrego wielkoci ujte s w szeregu czasowym momentw ustalamy przy wykorzystaniu redniej chronologicznej o
postaci:
ychr
1
1
y1 + y2 + .... + yn
2
= 2
n 1
4.1.
97
98
Zygmunt Bobowski
W przypadku miar jednopodstawowych dla celw analizy dynamiki jeden z okresw (momentw) przyjmowany jest jako staa baza porwnawcza
i poziom zjawiska kadego z pozostaych okresw (momentw) jest porwnywany (na zasadzie rnicy bd ilorazu) z poziomem zjawiska wystpujcym w okresie (momencie) bazowym. Istotny problem stanowi tutaj kwestia
wyboru bazy porwnawczej; nie powinien jej stanowi okres (moment), w
ktrym poziom zjawiska by wyjtkowo niski bd wysoki. Najczciej jako
podstaw porwna przyjmuje si poziom zjawiska w pierwszym wystpujcym w szeregu okresie (momencie).
Dokonujc analizy dynamiki przy pomocy miar acuchowych poziom
zjawiska kadego z okresw (momentw) porwnywany jest (na zasadzie
rnicy bd ilorazu) z poziomem zjawiska wystpujcym w okresie (momencie) poprzedzajcym; badamy wic w tym przypadku zmiany poziomu
zjawiska z okresu na okres.
Zarwno miary rnicowe jak i ilorazowe mog mie charakter miar
jednopodstawowych jak i acuchowych.
4.2.2. Rnicowe miary dynamiki
Wrd miar rnicowych wyrnia si dodatkowo:
rnic absolutn ,
rnic wzgldn.
Obie miary mog mie charakter miar jednopodstawowych lub acuchowych.
Rnic absolutn jednopodstawow ( R
r/s)
R a r / s = yr ys
natomiast rnic absolutn acuchow ( R
R a r / r 1 = yr yr 1
gdzie:
4.2.
r / r 1 )
wedug formuy:
4.3.
r/s)
R wr / s =
Rar / s
y ys
100 = r
100
ys
ys
R w r / r 1 =
99
r / r 1 )
4.4.
R a r / r 1
y yr 1
100 = r
100
yr 1
yr 1
4.5.
Wymienione wyej miary o charakterze wzgldnym s miarami niemianowanymi i mog by wyraone w postaci dziesitnej lub w procentach (naley wwczas jak w podanych formuach ich warto pomnoy przez
100). Warto miary (moe by dodatnia bd ujemna lub zerowa) informuje, jaki by wzrost lub spadek poziomu badanego zjawiska w okresie (momencie) badanym w stosunku do porwnawczego.
stawie zmiennej) 9. Indeks indywidualny o podstawie staej ( w r / s ) obliczany jest wedug wzoru :
wi r / s =
yr
100
ys
wi r / r 1 =
yr
100
yr 1
4.6.
wi r / r 1 ) wedug formuy:
4.7.
Naley tu zwrci uwag na sposb zapisu tych indeksw we wszelkiego rodzaju rocznikach;
zapis "rok poprzedni = 100" oznacza, i podane indeksy maj charakter miar acuchowych,
za zapis " rok s = 100" oznacza, i podane indeksy maj charakter miar jednopodstawowych , gdzie jako sta baz porwnawcz przyjto rok s.
100
Zygmunt Bobowski
1995
15,5
1996
14,9
1997
14,5
1998
14,5
1999
15,1
2000
15,4
2001
15,7
2002
16,2
101
Liczba
bezrobotnych
R a r / 1995
R a r / r 1
1995
1996
1997
1998
1999
2000
2001
2002
15,5
14,9
14,5
14,5
15,1
15,4
15,7
16,2
0
- 0,6
-1,0
- 1,0
- 0,4
- 0,1
0,2
0,7
- 0,6
- 0,4
0
0,6
0,3
0,3
0,5
R w r / 1995
R w r / r 1
wi r / 1995
wi r / r 1
(w %)
(w %)
(w %)
(w %)
0
- 3,87
- 6,45
- 6,45
- 2,58
- 0,65
1,29
4,52
- 3,87
-2,68
0
4,14
1,99
1,94
3,18
100
96,13
93,55
93,55
97,42
99,35
101,29
104,52
96,13
97,32
100
104,14
101,99
101,94
103,18
2000 / 1999
102
-
Zygmunt Bobowski
R w r / s + 100 = wi r / s
R w r / r 1 + 100 = wi r / r 1
Przykad 4.2.
Ponisza tablica zawiera informacje dotyczce dynamiki stopy bezrobocia w powiecie L w latach 1995 - 2001
Rok
1995
1996
1997
1998
1999
2000
2001
R w r / 1996
(w %)
5,5
8,2
10,5
15,0
12,0
10,0
R w r / 1996
wi r / 1996
wi r / r 1
wi r / 1999
(w %)
(w %)
(w %)
(w %)
1995
1996
1997
1998
1999
2000
2001
5,5
0
8,2
10,5
15,0
12,0
10,0
105,5
100,0
108,2
110,5
115,0
112,0
110,0
94,79
108,20
102,13
104,07
97,39
98,21
91,74
86,96
94,09
96,09
100
97,39
95,65
103
104
Zygmunt Bobowski
y (3) 2 =
4.8.
- rednie 5-okresowe:
y3..
( 5)
y1 + y 2 + y3 + y 4 + y5
y + y3 + y 4 + y5 + y6
(5 )
....;.... y 4 = 2
5
5
4.9.
yn 2
( 5)
y n 4 + y n 3 + y n 2 + y n 1 + y n
5
od koca
rednie ruchome dla wikszej liczby okresw bd liczone wedug podobnych zasad.
Obok zalety metody mechanicznej - tj. prostoty oblicze - naley zwrci
uwag na istotny jej mankament polegajcy na skracaniu szeregu czasowego. Im rednia jest wyznaczana dla wikszej liczby okresw, tym wikszemu skrceniu ulega szereg, ale jednoczenie uzyskujemy jego wiksze
105
yt = a t + b
gdzie:
4.10.
a =
(t
i =1
t ) yti
4.11.
(t
i =1
t )2
106
Zygmunt Bobowski
b = y at
4.12.
2 =
(y
i =1
n
ti
( y
i =1
ti
y t i ) 2
y )2
4.13.
Mierzy on poziom niedopasowania funkcji trendu do danych empirycznych, w zwizku z czym malejca jego warto oznacza wyszy poziom
zgodnoci danych empirycznych i teoretycznych.
Charakter tendencji rozwojowej mona rwnie bada okrelajc przecitne tempo zmian poziomu badanego zjawiska. Jest ono wyznaczane jako
rednia geometryczna cigu indeksw acuchowych wedug wzoru:
wi r / r1 = n1 wi 2/1 wi 3/ 2 wi 4/ 3 ... wi n / n1 = n1 wi n /1
4.14.
Korzystajc z relacji zachodzcych midzy cigami indeksw acuchowych i jednopodstawowych zamiast iloczynu wszystkich indeksw acuchowych mona w powyszej formule wykorzysta indeks jednopodstawowy
okresu ostatniego w stosunku do okresu pierwszego. Wskazane jest tu wykorzystywanie indeksw wyraonych w postaci dziesitnej. Trudnoci pojawiaj si w przypadku wyznaczania redniego tempa dla dugiego szeregu
czasowego; zachodzi wwczas konieczno okrelenia wartoci pierwiastka
wysokiego stopnia. W takiej sytuacji wykorzystuje si posta logarytmiczn
podanego wyej wzoru:
log w i r / r 1 =
1 n
1
log wi r / r 1 =
log wi n / 1
n 1 i =2
n 1
4.15.
107
Przykad 4.3.
W pewnym badaniu statystycznym obejmujcym obszar wojewdztwa
K zebrano m. in. informacje dotyczce ksztatowania si wskanika rozwodw (na 1000 mieszkacw) w latach 1991 2000. Informacje te ujto w
poniszej tablicy:
Rok
Wskanik rozwodw
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
2,2 2,5 2,0 2,3 2,8 3,2 3,5 3,9 4,2 4,4
Rok
Nr
Wskanik
okresu rozwodw
( ti )
yi )
rednie
rednie
3-okresowe 5-okresowe
ti t (ti t ) 2 ( ti t ) yti wi r / r 1
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
Razem
1
2
3
4
5
6
7
8
9
10
55
2,2
2,5
2,0
2,3
2,8
3,2
3,5
3,9
4,2
4,4
31
2,23
2,27
2,37
2,77
3,17
3,53
3,87
4,17
X
2,36
2,56
2,76
3,14
3,52
3,84
X
- 4,5
- 3,5
- 2,5
- 1,5
- 0,5
0,5
1,5
2,5
3,5
4,5
X
20,25
12,25
6,25
2,25
0,25
0,25
2,25
6,25
12,25
20,25
82,5
- 9,9
- 8,75
- 5,0
- 3,45
- 1,4
1,6
5,25
9,75
14,7
19,8
22,6
1,14
0,80
1,15
1,22
1,14
1,09
1,11
1,08
1,05
X
Wielkoci podane w kolumnach 3, 4 i 5 nanosimy na ukad wsprzdnych. Linia amana powstaa z poczenia punktw obrazujcych wielkoci
empiryczne (dane z kolumny 3) moe suy do oceny wzrokowej charakteru
tendencji rozwojowej. Na jej podstawie mona stwierdzi, i wielko
wskanika rozwodw w badanym okresie wykazuje tendencj rosnc (por.
rys. 4.1; linia 1)
108
Zygmunt Bobowski
Rys. 4.1
Wyznaczanie tendencji rozwojowej
Linia przebiegajca przez punkty wyznaczone przez rednie trzyokresowe (dane z kolumny 4) ma ksztat bardziej wygadzony w stosunku do linii
empirycznej. Wygadzenie to jednak odbyo si kosztem skrcenia szeregu czasowego o informacje dla lat 1991 i 2000 (patrz rys. 4.1, linia 2).
Linia, ktrej przebieg wyznaczyy rednie 5-okresowe charakteryzuje si
dalszym wygadzeniem przy kolejnej stracie informacji dla dwch kolejnych okresw. Wszystkie one potwierdzaj jednak wystpowanie tendencji
rosncej wskanika rozwodw na 1000 mieszkacw na badanym obszarze
(por. rys. 4.1, linia 3).
ad. b) Wyznaczamy rwnanie trendu o postaci 4.10, a parametry tego rwnania wedug wzorw 4.11 i 4.12. Obliczenia pomocnicze wykonano w
powyszej tablicy roboczej w kolumnach 6 -8. Wartoci rednie dla
badanych zmiennych wynosz:
- dla zmiennej czasowej T: t = 5,5;
- dla zmiennej Y, tj. wskanika rozwodw: y = 3,1
Wstawiajc odpowiednie wielkoci uzyskane w tabeli roboczej do wzorw 4.11. i 4.12 uzyskujemy nastpujce wartoci parametrw rwnania
trendu:
a=
22,6
= 0,27 (rozwodw na 1000 mieszkacw/ rok)
82,5
109
yt = 0,27t + 1,59
Z oszacowanej funkcji wynika, e w badanym okresie wskanik rozwodw wykazywa tendencj rosnc (parametr a jest dodatni) i wzrasta on
redniorocznie o 0,27, za jego wielko w roku zerowym, tj. 1990 wynosia 1,59. Obraz graficzny oszacowanej tendencji rozwojowej zaprezentowano
rwnie na powyszym wykresie (por. rys. 4.1, linia .4).
ad. c) W celu okrelenia redniorocznego tempa zmian wielkoci wskanika
rozwodw dokonamy wyznaczenia redniego indeksu acuchowego
(indeksy te obliczono w tabeli roboczej w kolumnie 9). Konieczne jest
zatem obliczenie redniej geometrycznej ustalonego cigu indeksw
acuchowych. Naley tu zauway, i ich iloczyn jest identyczny jak
indeks dla roku 2000 liczony w stosunku do roku 1991. Postpujc
zgodnie z formu 4.14 otrzymujemy:
w i r / r 1 = 9 1,14 0,90 1,15 1,22 1,14 1,09 1,11 1,08 1,05 = 9 2,0 = 1,079
110
Zygmunt Bobowski
Sj =
yj
y
100
4.16.
gdzie :
111
Sj =
( j)
ti
( j)
100
4.17.
ci
gdzie:
( j)
( j)
ti
ci
112
Zygmunt Bobowski
Sj =
( j)
ti
100
( j)
y ti
4.18.
gdzie:
( j)
ti
ti
( j)
- suma wartoci teoretycznych dla jtego okresu oszacowanych za pomoc rwnania trendu
k=
4.19.
r 100
gdzie:
Lata
1996
1997
1998
1999
2000
113
Kwartay
I
171
160
154
146
143
II
191
174
168
158
148
III
297
276
249
221
213
IV
223
214
202
192
186
( )
Kwartay
1996
1997
1998
1999
2000
Suma
I
171
160
154
146
143
774
II
191
174
168
158
148
839
III
297
276
249
221
213
1256
IV
223
214
202
192
186
1017
yj
154,8
167,8
251,2
203,4
y=
Zrnicowane rednie dla poszczeglnych kwartaw wskazuj na wystpowanie sezonowoci kwartalnej w poziomie zatrudnienia pracownikw
w badanej firmie. Skal tego zjawiska okrelimy wyznaczajc wskaniki sezonowoci dla poszczeglnych kwartaw zgodnie z wzorem 4.16:
114
Zygmunt Bobowski
154,8
100 = 79,67%
194,3
SI =
167,8
100 = 86,36%
194,3
251,2
=
100 = 129,28%
194,3
203,4
=
100 = 104,68%
194,3
S II =
S III
S IV
ad. b) Dla potrzeb tej metody wyznaczamy - zgodnie z jej reguami - rednie
ruchome 4-okresowe, a nastpnie poddajemy je centrowaniu. Dokonano tego w poniszej tablicy roboczej. w kolumnach 4 i 5.
Wykorzystujc wzr 4.17 wyznaczamy wskaniki sezonowoci dla poszczeglnych kwartaw (dla kwartau I podano szczegowo sposb liczenia wskanika sezonowoci):
SI =
648
100 = 85,76%
755,625
S III =
S IV =
1043
100 = 131,11%
795,5
831
100 = 105,64%
786,625
Rok/
kwarta
Nr
Zaokresu trudnie
nie
( ti )
( yt )
i
1996/ I
171
II
191
115
rednie
ruchome
4okresowe
rednie
ruchome
4-okresowe
centrowane
- 9,5
90,25
- 1624,5
216,65
- 8,5
72,25
- 1623,5
214,3
219,125
- 7,5
56,25
- 2227,5
211,95
215,625
- 6,5
42,25
- 1449,5
209,6
210,875
- 5,5
30,25
- 880
207,25
207,125
- 4,5
20,25
- 1749
204,9
205,25
-3,5
12,25
- 966
202,55
203,75
- 2,5
6,25
- 535
200,2
199,625
- 1,5
2,25
- 231
197,85
194,75
- 0,5
0,25
- 84
195,5
192,25
0,5
0,25
124,5
193,15
190,00
1,5
2,25
303
190,8
185,25
2,5
6,25
365
188,45
180,50
3,5
12,25
553
186,1
178,875
4,5
20,25
994,5
183,75
177,25
5,5
30,25
1056
181,4
175,00
6,5
42,25
929,5
179,05
173,25
7,5
56,25
1110
176,7
8,5
9,5
X
72,25
90,25
665
1810,5
1767
- 1565
174,35
172
X
ti t ( ti t )2
(t i t ) y ti yt i
220,5
III
297
217,75
IV
223
213,5
1997/ I
160
208,25
II
174
206
III
276
204,5
IV
214
203
1998/ I
154
196,25
II
10
168
193,25
III
11
249
191,25
IV
12
202
188,75
1999/ I
13
146
181,75
II
14
158
179,25
III
15
221
178,5
IV
16
192
176
2000/ I
17
143
174
II
18
148
172,5
III
IV
Suma
19
20
X
213
186
X
k=
400,72
= 1,001875
4 100
116
Zygmunt Bobowski
SI =
78,24
= 78,09%
1,001875
S II =
85,76
= 85,60%
1,001875
S III =
131,11
= 130,86%
1,001875
S IV =
105,64
= 105,44%
1,001875
Interpretacja uzyskanych skorygowanych wskanikw odbywa si podobnie jak w przypadku poprzedniej metody.
ad. c) W celu zastosowania tej metody konieczne jest oszacowanie rwnania
trendu o postaci 4.10. dla analizowanego szeregu czasowego okresw,
gdzie okresami s poszczeglne kwartay. Obliczenia pomocnicze dla
okrelenia parametrw rwnania zgodnie z wzorami 4.11 i 4.12 zawarto w powyszej tablicy roboczej w kolumnach 6 - 8. Wartoci rednie wynosz:
- dla zmiennej czasowej T : t = 10,5,
- dla zmiennej Y:
y = 194,3.
Parametry rwnania wyznaczane wedug podanych wzorw bd wynosiy:
1565
= 2,35
665
b = 194,3 + 2,35 10,5 = 219
a=
yt = 2,35t + 219
Wykorzystujc oszacowane rwnanie wyznaczamy wartoci teoretyczne
( y t i ) dla poszczeglnych okresw podstawiajc do rwnania kolejne ich
numery (por. kolumna 9 tabeli roboczej). Po podstawieniu do wzoru 4.18
odpowiednich wartoci empirycznych i odpowiadajcych im wartoci teoretycznych otrzymujemy wskaniki sezonowoci dla poszczeglnych kwartaw (dla kwartau I podano szczegowo sposb wyznaczania wskanika):
SI =
117
1256
100 = 130,05%
965,75
1017
100 = 106,60%
954
Suma uzyskanych wskanikw nieznacznie przekracza warto teoretyczn ( wynosi 400,72 %), a wic nie zachodzi potrzeba ich korygowania.
Na podstawie przeprowadzonych bada uzyskano podobne wielkoci
wskanikw sezonowoci przy wykorzystaniu wszystkich trzech metod ich
wyodrbniania.
PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI
SERIA:
NAUKI SPOECZNE
Rozdzia V
Wnioskowanie statystyczne
119
malny o parametrach:
( x)
N E ( x);
. Twierdzenie to zasuguje na uwag,
n
120
Zygmunt Bobowski
121
122
Zygmunt Bobowski
zwana jest interwaem losowania i jest ustalana jako iloraz liczebnoci populacji generalnej i losowanej prby.
Z n = f ( X 1 , X 2 ,..., X n ) okrelon na prbie, ktra ma t wasno, e prawdopodobiestwo zdarzenia Z n = Q jest tym blisze jednoci,
wali funkcj
Z n , a para(gdzie
>
Praktycznie relacja ta oznacza, e ze wzrostem liczebnoci prby warto estymatora bdzie si zbliaa do wartoci szacowanego parametru.
Nieobciono wykorzystujc wartoci estymatora uzyskiwane z rnych prb do oszacowania parametru estymowanego mona uzyska
rne jego oceny (oszacowania). Podane jest by oszacowania te nie
zawieray bdu systematycznego tzn. nie odchylay si przecitnie ani
poniej ani powyej wartoci tego parametru. Estymator bdziemy uwaali za nieobciony, jeeli jego warto oczekiwana jest rwna parame-
123
E (Z n ) = Q
cha-
rakteryzuje si mniejsz zmiennoci. Estymator o najmniejszej wariancji spord wszystkich moliwych nieobcionych estymatorw parametru Q jest nazywany estymatorem najefektywniejszym. Miar efektywnoci dowolnego estymatora jest iloraz wariancji estymatora najefektywniejszego i wariancji tego estymatora. Jeli efektywno estymatora
wzrasta wraz ze wzrostem liczebnoci prby, to o estymatorze mwimy,
e jest asymptotycznie najefektywniejszy.
Rys. 5.1.
Efektywno estymatorw
Zn
Q
rdo: opracowanie wasne
Zn
124
Zygmunt Bobowski
Dostateczno - estymator jest dostateczny (wystarczajcy), jeeli wykorzystuje wszystkie informacje o szacowanym parametrze, ktre s zawarte w prbie.
Teoria szacowania parametrw obejmuje dwie metody estymacji: punktow i przedziaow. Estymacja punktowa polega na tym, e jako ocen
nieznanego parametru Q populacji generalnej przyjmujemy uzyskan z wylosowanej prby warto estymatora Z n . Szacowanie polega w tym przypadku na podaniu jednej konkretnej wartoci liczbowej parametru estymowanego. Taki sposb postpowania oznacza, e jeli z populacji bdziemy
pobierali kolejne prby, wyznaczali dla kadej z nich warto estymatora, to
mona si spodziewa zrnicowanych wartoci liczbowych, a to z kolei moe oznacza, i dla tej samej populacji istnieje kilka wartoci tego samego
parametru estymowanego (np. kilka wartoci rednich tej samej zmiennej),
co jest przecie niemoliwe. Prawdopodobiestwo zajcia zdarzenia, e uzyskana z dowolnej prby warto estymatora jest identyczna jak faktyczna
warto szacowanego parametru jest praktycznie rwne zero, co mona zapisa nastpujc relacj:
P (Z n = Q ) = 0
Dyskwalifikuje ona t metod estymacji.
W przypadku estymacji przedziaowej, na podstawie wynikw z wylosowanej prby, konstruowany jest przedzia liczbowy, ktry z okrelonym z
gry prawdopodobiestwem pokrywa warto parametru estymowanego.
Przedzia ten jest okrelany mianem przedziau ufnoci, natomiast prawdopodobiestwo poziomem (wspczynnikiem) ufnoci. Poziom ufnoci (oznaczany dalej jako ) mona zdefiniowa jako prawdopodobiestwo, e skonstruowany przedzia ufnoci zawiera warto parametru estymowanego.
Przyjmuje si, e prawdopodobiestwo to spenia warunek: 0,90 . Istnieje okrelona relacja midzy wielkoci poziomu ufnoci a precyzj szacowania parametru estymowanego: im wyszy jest poziom ufnoci, tym
mniejsza precyzja szacowania (wikszy bd szacunku, wiksza rozpito
przedziau ufnoci).
Oglny schemat postpowania w procedurze szacowania parametrw
metod przedziaow mona uj w nastpujcych punktach:
1) z populacji generalnej losowana jest prba statystyczna,
2) na podstawie wynikw uzyskanych z prby ustalana jest warto estymatora odpowiedniego dla szacowanego parametru estymowanego,
3) zakadany jest poziom ufnoci uwzgldniajcy wynikajce z tego
faktu konsekwencje w postaci okrelonej precyzji szacowania parametru estymowanego,
4) z tablic statystycznych odpowiedniego rozkadu odczytywana jest
waciwa dla przyjtego poziomu ufnoci warto statystyki teoretycznej
tt ,
125
5) uzyskane dla prby wartoci odpowiednich parametrw oraz odczytana z tablic wielko statystyki teoretycznej wstawiane s do odpowiedniej formuy szacowania przedziau ufnoci dla okrelonego parametru estymowanego; przedzia ten zostaje okrelony poprzez wyznaczenie jego dolnej i grnej granicy.
Poniej zostan omwione metody estymacji podstawowych parametrw
statystycznych.
5.3.2. Estymacja przedziaowa wartoci redniej
W literaturze wymienia si zazwyczaj dwa modele szacowania wartoci
redniej cile powizane z liczebnoci prby, na podstawie ktrej jest ono
dokonywane, tj. modele oparte na wynikach z maej i duej prby.
Model dla maej prby
Jako ma przyjmuje si traktowa prb o liczebnoci n 30 . Estymatorem dla oszacowania wartoci redniej w populacji generalnej E (x ) jest
rednia z prby x . Przyjmuje si zaoenie, e rozkad badanej zmiennej w
populacji generalnej ma charakter rozkadu normalnego. Z populacji tej losowana jest prba i na podstawie uzyskanych z niej danych wyznaczana
jest warto rednia x i odchylenie standardowe s (x) . Z gry zakadany
jest poziom ufnoci . Przedzia ufnoci dla wartoci redniej E (x ) w populacji generalnej szacowany jest wedug wzoru:
x tt
s(x )
n 1
< E (x ) < x + t t
s(x )
n 1
5.1
126
Zygmunt Bobowski
do normalnego - przy poziomie ufnoci 0,98 - oszacowa metod przedziaow redni roczn liczb przeczytanych ksiek dla tej populacji.
Rozwizanie
Wylosowana prba jest maa, a wic dla oszacowania przedziau ufnoci
wykorzystamy formu 5.1. W pierwszej kolejnoci wymaga ona wyznaczenia
redniej i odchylenia standardowego liczby przeczytanych ksiek w prbie.
Korzystajc z odpowiednich wzorw otrzymujemy:
165
= 11 ksiek
15
550
s(x ) =
= 6,1 ksiki.
15
x=
11 2,624
6,1
15 1
6,1
15 1
15,3 6,7
= 4,3 jest okrela2
x tt
gdzie:
s(x )
n
127
< E (x ) < x + t t
s(x )
5.2
Przykad 5.2.
W badaniach struktury wydatkw gospodarstw domowych zebrano m.
in. informacje dotyczce wydatkw na zakup artykuw przemysowych. Dla
losowej prby 200 gospodarstw uzyskano roczne kwoty wydatkw na zakup
tych artykuw podane w tablicy 5.1.
Tablica 5.1. Gospodarstwa domowe miasta K wedug rocznej
kwoty wydatkw na zakup artykuw przemysowych
Kwota wydatkw w z
500 - 1000
1000 1500
1500 - 2000
2000 2500
2500 - 3000
Liczba gospodarstw
40
65
55
30
10
Kwota
wydatkw
w z (xi )
500 - 1000
1000 1500
1500 - 2000
2000 2500
2500 - 3000
Razem
Liczba
gospodarstw
(ni )
40
65
55
30
10
200
x& i ni
x&i x
(x& i x )2 ni
30.000
81.250
96.250
67.500
27.500
302.500
- 762,5
- 262,5
237,5
737,5
1237,5
X
23.255.487,5
4.478.643,75
3.102.581,25
16.317.925,0
15.315.300,0
62.469.937,5
128
Zygmunt Bobowski
Otrzymujemy:
302500
= 1512,50 z
200
62469937,5
s(x ) =
= 558,9 z
200
x=
0,99
= 0,495 ; jako warto najbardziej zblion do tej wielko2
ci przyjmujemy 0,4951, ktrej odpowiada tt =2,58. Podstawiajc uzyskane
tujemy
tt dla
1512,5 2,58
558,9
200
558,9
200
s 2 ( x ) =
(x
x)
n 1
5.3
lub o postaci
s 2 ( x ) =
(x
129
x ) ni
2
n 1
5.4
t t s 2 ( x )
=
d2
2
n min
5.5
tt odczytujemy z ta-
blic rozkadu t Studenta dla k = n 1 oraz 1 . Z uwagi na fakt, e liczebno prby musi by liczb cakowit w zwizku z tym w przypadku
koniecznoci - dokonujemy zawsze jej zaokrglenia do penej jednostki w
gr.
Przykad 5.3.
Traktujc wylosowan w przykadzie 5.1 prb uczniw jako prb
wstpn ustali, jaka minimalna liczba uczniw pozwoliaby oszacowa
redni roczn liczb przeczytanych ksiek dla wszystkich uczniw klas I
III z bdem maksymalnym 2 ksiki przy poziomie ufnoci 0,95.
Rozwizanie
Na podstawie wynikw z prby wstpnej ustalamy zgodnie z wzorem 5.3
wariancj
550
= 39,28 (ksiek)2
14
tt dla
n min
2
(
2,145) 39,28 180,7
=
=
= 45,17
4
(2)2
uczniw
130
Zygmunt Bobowski
m
, gdzie m jest liczb wyrnionych w prbie
n
elementw, a n jej liczebnoci. Zakadany jest poziom ufnoci . Przedzia ufnoci dla wskanika struktury (p) w populacji generalnej wyznaczany jest wedug formuy:
m m
m m
1
1
m
m
n
n
n
n
tt
< p < + tt
n
n
n
n
Wystpujc w podanym wzorze warto statystyki
blic dystrybuanty rozkadu normalnego dla
5.6
tt odczytujemy z ta-
Przykad 5.4.
W badaniach warunkw socjalnych studentw pewnej uczelni zebrano
midzy innymi informacje dotyczce miejsca ich zamieszkania w okresie
studiw. Uzyskano dane ujte w tablicy 5.2.
Tablica 5.2. Studenci Akademii Medycznej w K wedug miejsca
zamieszkania w czasie studiw
Miejsce zamieszkania
Dom studencki
Stancja
Dom rodzinny
Razem
Liczba studentw
120
60
40
220
131
Rozwizanie
ad. a) W celu oszacowania przedziau ufnoci dla wskanika struktury wykorzystamy wzr 5.6. Wymaga on wyznaczenia z prby wskanika
struktury dla studentw zamieszkujcych w domu studenckim.
Wskanik ten wynosi
m 120
=
= 0,5455
n 220
Z tablic dystrybuanty rozkadu normalnego odczytujemy warto statystyki
tt dla
0,95
= 0,475 ; wynosi ona 1,96. Podstawiamy otrzymane wiel2
0,5455 1,96
0,5455(1 0,5455)
0,5455(1 0,5455)
< p < 0,5455 + 1,96
220
220
0,5455 0,0669 < p < 0,5455 + 0,0669
0,4786 < p < 0,6124
m 120 + 60
=
= 0,8182
n
220
Warto
0,8182 1,96
0,8182(1 0,8182 )
0,8182(1 0,8182)
< p < 0,8182 + 1,96
220
220
0,8182 0,0516 < p < 0,8182 + 0,0516
0,7666 < p < 0,8698 ,
132
Zygmunt Bobowski
a w ujciu procentowym:
n s 2 (x )
n s 2 (x )
2
< (x ) <
t t1
t t2
gdzie:
5.7
2 (chi-kwadrat)
1
,
2
1+
.
- tt 2 dla k = n 1 oraz
2
-
W celu uzyskania przedziau ufnoci dla odchylenia standardowego wyznaczamy pierwiastki kwadratowe z kocw przedziau oszacowanego dla
wariancji (korzystamy tu z oczywistej relacji zachodzcej midzy tymi parametrami).
Przykad 5.5.
Na wylosowanej grupie 10 dzieci w wieku przedszkolnym przeprowadzono test pamici. Otrzymano nastpujcy rozkad liczby zapamitanych
przez nie elementw: 15; 34; 45; 32; 18; 52; 25; 50; 40; 29. Zakadajc, e w
populacji generalnej rozkad liczby zapamitanych elementw ma charakter
rozkadu normalnego oszacowa granice przedziau ufnoci dla wariancji i
133
x=
s 2 (x ) liczby zapamita-
340
= 34 elementy
10
s 2 (x ) =
1464
= 146,4
10
2 odczytujemy:
1 0,96
= 0,02 i otrzymujemy 19,679
2
1 + 0,96
= 0,98 i wynosi ono 2,532.
- tt 2 dla k = 10 1 = 9 oraz
2
-
10 146,4
10 146,4
< 2 (x ) <
19,679
2,532
74,39 < 2 ( x ) < 578,20 (elementw)2
Oszacowany przedzia o kocach 74,39 i 578,2 (elementw)2 zawiera
wariancj liczby zapamitanych elementw dla wszystkich dzieci w wieku
przedszkolnym przy poziomie ufnoci 0,96.
Przedzia ufnoci dla odchylenia standardowego liczby zapamitanych
elementw uzyskamy ustalajc pierwiastki kwadratowe z kocw oszacowanego powyej przedziau. Otrzymujemy:
134
Zygmunt Bobowski
s (x )
s(x )
< (x ) <
t
t
1+ t
1 t
2n
2n
gdzie:
5.8
Liczba pacjentw
20
30
25
75
Zakadajc poziom ufnoci 0,90 oszacowa metod przedziaow odchylenie standardowe i wariancj czasu oczekiwania pacjentw na wizyt u lekarza specjalisty.
135
Rozwizanie
Z uwagi na du prb dla oszacowania przedziau ufnoci dla odchylenia standardowego i wariancji wykorzystamy formu 5.8. Na podstawie danych zawartych w tablicy 5.3 obliczamy odchylenie standardowe s (x ) czasu
oczekiwania z prby. Obliczenia pomocnicze zawarto w poniszej tablicy roboczej
Czas oczekiwania Liczba
pax& i ni
x&i x
( x& i x ) 2 ni
w dniach
cjentw
05
20
50
- 9,7
1872,1
5 - 15
30
300
- 2,2
145,2
15 - 30
25
562,5
10,3
2662,55
Razem
75
912,5
X
4679,85
Otrzymujemy
x=
912,5
= 12,2 dnia oraz s ( x ) =
75
4679,85
= 7,9 dnia.
75
0,90
= 0,45 ; jako warto najblisz tej wielkoci przyjmijmy
2
0,4505, co oznacza przyjcie tt = 1,65. Na podstawie wzoru 5.8, w pierwszej
styki
tt dla
1+
7,9
< (x ) <
1,65
2 75
7,9
1,65
2 75
7,9
7,9
< (x ) <
1 + 0,13
1 0,13
7,0 < ( x) < 9,1 dni
Przedzia liczbowy o kocach 7 i 9,1 dni z ufnoci 0,90 pokrywa odchylenie standardowe czasu oczekiwania na wizyt u lekarza specjalisty dla
wszystkich pacjentw.
Przedzia ufnoci dla wariancji czasu oczekiwania otrzymamy ustalajc
kwadraty kocw powyszego przedziau. Otrzymamy:
136
Zygmunt Bobowski
r tt
P
gdzie:
1 (r P ) 2
n
< < r + tt
P
( )
1 r P
5.9
tt
cji generalnej,
- warto statystyki odczytywana z tablic dystrybuanty rozkadu
normalnego dla
Oszacowany przedzia z prawdopodobiestwem rwnym poziomowi ufnoci pokrywa nieznan warto wspczynnika korelacji dla populacji generalnej.
Przykad 5.7.
W pewnym badaniu socjologicznym zebrano m. in. informacje dotyczce
wieku kobiet i mczyzn wstpujcych w zwizek maeski. Dla wylosowanych 200 par maeskich stwierdzono, i pomidzy badanymi cechami wystpuje zaleno mierzona wspczynnikiem korelacji liniowej Pearsona
rwna + 0,75. Przy poziomie ufnoci 0,99 oszacowa metod przedziaow
wspczynnik korelacji dla wieku wszystkich kobiet i mczyzn zawierajcych zwizek maeski.
137
Rozwizanie
Przedzia ufnoci dla wspczynnika korelacji oszacujemy zgodnie z formu 5.9. Dla przyjtego wspczynnika ufnoci z tablic rozkadu normalnego odczytujemy tt = 2,58.
Podstawiajc odpowiednie dane do wzoru otrzymujemy
0,75 2,58
1 (0,75) 2
200
1 (0,75)
200
138
Zygmunt Bobowski
1) stawiamy hipotez zerow i konkurencyjn wobec niej hipotez alternatywn; w zalenoci od postaci hipotezy alternatywnej wykorzystywany jest test dwustronny bd jednostronny (prawo- lub lewostronny); naley tu doda, e w przypadku testu istotnoci hipoteza zerowa jest zawsze formuowana w postaci rwnoci,
2) arbitralnie przyjmujemy poziom istotnoci 1 ,
3) z populacji generalnej losowana jest prba statystyczna i na podstawie wynikw z tej prby ustalana jest warto statystyki empirycznej temp ,
4) dla przyjtego poziomu istotnoci z odpowiednich tablic odczytywana jest warto statystyki teoretycznej tt okrelanej rwnie mianem wartoci krytycznej,
5) porwnujemy wartoci statystyki empirycznej i teoretycznej i w
przypadku:
a) testu dwustronnego;
- jeli
- jeli
zerowej,
b) testu prawostronnego:
- jeli temp tt podejmujemy decyzj o odrzuceniu hipotezy zerowej,
- jeli
zerowej,
c) testu lewostronnego:
- jeli temp tt podejmujemy decyzj o odrzuceniu hipotezy zerowej,
- jeli
zerowej.
Procedura weryfikacji hipotez, a zwaszcza ostatnia z wymienionych
czynnoci moe by rwnie zilustrowana graficznie. Wwczas dla przyjtej
postaci hipotezy alternatywnej konstruowany jest tzw. obszar krytyczny odpowiadajcy poziomowi istotnoci. Ilustruje to poniszy rys.5.2.
W przypadku (a) mamy do czynienia z testem dwustronnym i odpowiadajcym mu pooeniem obszaru krytycznego. Przypadek (b) odpowiada testowi prawostronnemu i takiemu rwnie pooeniu obszaru krytycznego,
za przypadek (c) testowi lewostronnemu i odpowiedniemu pooeniu obszaru krytycznego. Jeli ustalona na podstawie prby warto statystyki empirycznej wpada w obszar krytyczny wwczas podejmowana jest decyzja o
odrzuceniu hipotezy zerowej, w przeciwnym przypadku brak jest podstaw
do jej odrzucenia.
Jakkolwiek podany wyej algorytm postpowania ma charakter oglny,
to jednak wymienione czynnoci s charakterystyczne dla wszystkich niej
omwionych przypadkw weryfikacji hipotez.
139
Rys. 5.2
Relacje midzy postaci hipotezy alternatywnej
a pooeniem obszaru krytycznego
140
Zygmunt Bobowski
H 0 : E ( x ) = E0 ( x )
H1 : E ( x ) > E0 (x )
c) H1 : E ( x ) < E0 ( x ) ,
gdzie: E ( x ) warto rednia dla populacji generalnej,
E0 ( x) zaoona hipotetyczna warto rednia.
b)
W przypadku uwzgldnienia pierwszej wersji hipotezy alternatywnej postpowanie bdzie si odbywao przy wykorzystaniu testu dwustronnego,
drugiej testu prawostronnego, trzeciej lewostronnego.
2) zakadamy poziom istotnoci 1 ,
3) z populacji generalnej losujemy ma prb o liczebnoci n 30 i na
podstawie uzyskanych z niej wynikw wyznaczamy warto redni
x i odchylenie standardowe s (x ) . Parametry te wykorzystujemy do
wyznaczenia statystyki empirycznej zgodnie z wzorem:
t emp =
x E 0 (x )
n 1
s(x )
5.10
141
dane (wiek w latach): 17; 16; 18; 15; 17; 19; 16; 15; 17; 14; 13; 15; 16; 14;
18. Zakadajc, e rozkad wieku nieletnich przestpcw ma charakter rozkadu normalnego przy poziomie istotnoci 0,01 zweryfikowa hipotez, i
redni wiek dla caej ich populacji jest rwny 17 lat.
Rozwizanie
Zgodnie z procedur stawiamy hipotezy o postaci:
H 0 : E ( x ) = 17 lat
H1 : E ( x ) 17 lat
x=
240
= 16 lat
15
s(x ) =
40
= 1,63 lat
15
t emp =
16 17
15 1 = 0,61 3,74 = - 2,28
1,63
t emp =
x E0 (x )
n
s(x )
s (x ) , a nastpnie war-
5.11
142
Zygmunt Bobowski
Dla przyjtego poziomu istotnoci z tablic dystrybuanty rozkadu normalnego ustalana jest warto statystyki teoretycznej tt zgodnie z regu:
1
,
2
- w przypadku testu jednostronnego: tt odczytujemy dla 0,5 (1 ) .
- w przypadku testu dwustronnego:
Decyzja o odrzuceniu hipotezy zerowej bd stwierdzeniu braku podstaw do takiej decyzji podejmowana jest jak w podanym algorytmie.
Przykad 5.9.
Zebrano informacje dla grupy kierowcw, ktrzy w okresie ostatnich 8
lat na terenie miasta K spowodowali wypadek drogowy znajdujc si pod
wpywem alkoholu. Uzyskano nastpujce zestawienie:
Poziom alkoholu we krwi
(w promilach)
0,40 1,0
1,0 1,6
1,6 2,2
2,2 2,8
Liczba kierowcw
15
120
180
85
H 0 : E ( x ) = 2,3
H1 : E ( x ) > 2,3
Zaoony poziom istotnoci wynosi 0,05. Dla wyznaczenia wartoci statystyki empirycznej na podstawie uzyskanych danych ustalamy redni x i
odchylenie standardowe s (x ) stenia alkoholu we krwi kierowcw. Obliczenia pomocnicze zawarto w tablicy roboczej.
Poziom alkoholu we
krwi (w promilach)
0,40 1,0
1,0 1,6
1,6 2,2
2,2 2,8
Razem
Liczba
kierowcw
15
120
180
85
400
x& i ni
(x& i x )2 ni
10,5
156,0
342,0
212,5
721
18,15
30,0
1,8
41,65
91,6
143
Otrzymujemy:
x=
s(x ) =
721
= 1,80 promila
400
91,6
= 0,48 promila
400
t emp =
1,80 2,30
400 = 20,83
0,48
Z tablic rozkadu normalnego odczytujemy warto statystyki teoretycznej tt dla 0,5 0,05 = 0,45 (test ma charakter prawostronny). Wynosi ona
1,65. Zachodzi relacja:
temp < tt , a wic nie ma podstaw do odrzucenia hipotezy zerowej, e rednie stenie alkoholu we krwi nietrzewych kierowcw,
ktrzy spowodowali wypadek jest rwne 2,3 promila.
5.4.3. Weryfikacja hipotezy dla dwch rednich
Test dla dwch rednich dotyczy weryfikacji hipotezy o rwnoci rednich w dwch populacjach o rozkadzie normalnym. W zalenoci od wielkoci wylosowanych z tych populacji prb wyrnia si dwa modele postpowania.
Model oparty na wynikach z dwch maych prb.
Zakada si, e rozkady obu populacji s normalne o nieznanych wartociach rednich i nieznanych, ale jednakowych odchyleniach standardowych. Procedura weryfikacji odbywa si wedug nastpujcego schematu:
1) stawiana jest hipoteza zerowa o postaci H 0 : E1 ( x ) = E2 ( x )
i jedna z niej podanych postaci hipotezy alternatywnej:
a) H1 : E1 ( x ) E2 ( x )
H1 : E1 ( x ) > E2 ( x )
c) H1 : E1 ( x ) < E2 (x )
gdzie: E1 ( x ) i E2 ( x ) s hipotetycznymi wartociami rednimi dla pierwb)
144
Zygmunt Bobowski
temp =
x1 x2
2
n s ( x ) + n2 s2 ( x ) 1 1
+
n1 + n2 2
n1 n 2
2
1 1
5.12
Dla przyjtego poziomu istotnoci z tablic rozkadu t Studenta odczytujemy warto statystyki teoretycznej wedug zasady:
a) dla testu dwustronnego: dla k = n1 + n2 2 oraz poziomu istotnoci
1 ,
H 0 : E1 ( x) = E2 ( x)
H1 : E1 ( x) > E2 ( x)
gdzie: subskryptem 1 oznaczono populacj kobiet, natomiast 2 populacj
mczyzn.
Zakadamy poziom istotnoci 1 = 0,05
Warto statystyki empirycznej wyznaczamy wedug wzoru 5.12, co
wymaga wyznaczenia rednich i wariancji absencji dla obu prb:
- dla kobiet:
- dla mczyzn:
x1 =
40
62
2
= 4 dni i s1 ( x ) =
= 6,2 (dni)2
10
10
x2 =
54,92
37
2
= 4,58 (dni)2
= 3,1 dni i s 2 ( x ) =
12
12
145
4,0 3,1
t emp =
10 6,2 + 12 4,58 1
1
+
10 + 12 2 10 12
0,9
116,92
0,18
20
0,9
= 0,87
1,03
tt dla
temp =
x1 x2
s1 ( x ) s2 ( x )
+
n1
n2
2
5.13
rozkadu normalnego:
1
,
2
b) w przypadku testu jednostronnego - dla 0,5 (1 ) .
a)
0,5
Kocowa czynno polegajca na podjciu odpowiedniej decyzji odnonie hipotezy zerowej jest podejmowana zgodnie z wczeniej podanymi zasadami.
Przykad 5.11.
W badaniach efektywnoci szkolenia zawodowego pracownikw bezporednio produkcyjnych w pewnym przedsibiorstwie dla losowo wybranej
prby 60 pracownikw dokonano pomiaru ich wydajnoci pracy
146
Zygmunt Bobowski
Liczba pracownikw
przed szkoleniem
po szkoleniu
28
5
18
20
12
25
2
10
Zakadajc, e w caej populacji pracownikw wydajno pracy ma rozkad zbliony do normalnego przy poziomie istotnoci 0,01 zweryfikowa
hipotez, i szkolenie zawodowe istotnie zwiksza wydajno pracy pracownikw.
Rozwizanie
Stawiane hipotezy bd miay posta:
H 0 : E1 ( x) = E2 ( x)
H1 : E1 ( x) < E2 ( x) ; (subskryptem 1 oznaczono populacj przed odbyciem szkolenia, natomiast 2- po jego odbyciu)
Przyjty poziom istotnoci 1 wynosi 0,01. Wyznaczenie statystyki
empirycznej wymaga obliczenia dla obu sytuacji (przed i po odbyciu szkolenia) redniej i wariancji wydajnoci pracy. Dokonamy tego w poniszej tablicy roboczej
Wydajno
(xi )
10 - 14
14 - 18
18 - 22
22 26
Razem
Liczba pracownikw
n2i
n1i
28
5
18
20
12
25
2
10
60
60
x& i n1i
x& i n2 i
336
288
240
48
912
60
320
500
240
1120
224,45
145,8
42,25
280,9
693,4
Otrzymujemy:
912
738,4
2
= 15,2 szt., s1 ( x ) =
= 12,3 (szt.)2
60
60
1120
693,4
2
- po odbyciu szkolenia: x2 =
= 18,7 szt. i s2 ( x ) =
= 11,6 (szt.)2
60
60
- przed odbyciem szkolenia: x1
147
temp =
3,5
15,2 18,7
=
= 5,56
12,3 11,6
0,398
+
60
60
H 1: p > p0
c) H 1: p < p0 .
b)
t emp
gdzie:
m
p0
n
=
p 0 q0
n
5.14
n liczebno prby,
m liczba wyrnionych elementw w prbie,
p 0 hipotetyczny wskanik struktury dla wyrnionych elementw,
q0 = 1 p0
148
Zygmunt Bobowski
1
,
2
b) w przypadku testu jednostronnego - dla 0,5 (1 ) .
0,5
Liczba odpowiedzi
120
60
55
5
H 0 : p = 0,30
H1 : p 0,30
Przyjty poziom istotnoci wynosi 0,10.
Ustalamy wskanik struktury dla czynnie wypoczywajcych w prbie:
m
55
=
= 0,229 . Wielko t podstawiamy do wzoru 5.14 i otrzymujemy
n 240
t emp =
0,229 0,30
Statystyk teoretyczn
0,30 0,70
240
0,071
= 2,37
0,030
0,1
= 0,45 (test ma charakter dwustronny) i wynosi ona 1,65. Zacho2
dzi relacja temp > tt , co oznacza, e hipotez zerow naley odrzuci, czyli
0,5
149
b)
t emp =
rP
( )
1 rP
n2
5.15
150
Zygmunt Bobowski
Rozwizanie
Stawiamy hipotezy o postaci:
H 0 : = 0 , tzn. midzy badanymi cechami wystpuje niezaleno,
t emp =
0,80
2
1 (0,80 )
20 2 = 5,65
2 (chi-kwadrat)
t emp =
i, j
(n
N fi f j )
ij
N fi f j
dla
cja
temp
5.16
k = (l 1) (s 1) oraz poziomu istotnoci 1 . Gdy zachodzi rela tt odrzucamy hipotez zerow o niezalenoci cech w populacji ge-
151
Przykad 5.14.
Dla losowej prby bezrobotnych zarejestrowanych w Powiatowym Urzdzie Pracy w K zebrano informacje dotyczce ich poziomu wyksztacenia
(X) oraz czasu pozostawania bez pracy (Y). Wyniki badania ujto w poniszej tablicy korelacyjnej.
Tablica 5.4. Bezrobotni zarejestrowani w Powiatowym Urzdzie
Pracy w K wedug poziomu wyksztacenia i czasu pozostawania bez pracy.
Czas pozostawania bez
pracy w miesicach
do 6
6 - 12
12 - 24
Poziom wyksztacenia
podstawowe
rednie
wysze
ni
15
25
30
15
25
15
15
10
10
45
60
55
70
55
35
160
nj
rdo: Dane umowne
no wystpuje.
Statystyk empiryczn obliczamy w poniszej tablicy roboczej zgodnie z
wzorem 5.16 wykonujc nastpujce dziaania (ich kolejno ponumerowano w pierwszym wierszu poniszej tablicy roboczej):
1) przeksztacenie rozkadw brzegowych liczebnoci w rozkady czstoci,
2) ustalenie iloczynw czstoci brzegowych f i f j dla kadego pola
tablicy korelacyjnej,
3) okrelenie dla kadego pola tablicy liczebnoci hipotetycznych poprzez wyznaczenie iloczynw N f i f j ,
4) ustalenie dla kadego pola tablicy wielkoci rnic liczebnoci empirycznych i hipotetycznych , a nastpnie kwadratw tych rnic
zgodnie z formu
(n
N fi f j ) ,
2
ij
(n
N fi f j )
ij
N fi f j
, a na-
152
Zygmunt Bobowski
do 6
6 - 12
12 - 24
fj
Poziom wyksztacenia
podstawowe
rednie
wysze
15
2) 0,123
3) 19,7
4) 22,09
5) 1,12
25
0,164
26,2
1,44
0,05
30
0,151
24,2
33,64
1,39
15
0,097
15,5
0,25
0,02
25
0,129
20,6
19,36
0,94
15
0,118
18,9
15,2
0,80
15
0,061
9,8
27,04
2,76
10
0,082
13,1
9,61
0,73
10
0,075
12
4
0,33
0,438
0,344
0,218
fi
1) 0,281
0,375
0,344
1,00
t emp = 1,12 + 0,02 + 2,76 + 0,05 + 0,94 + 0,73 + 1,39 + 0,80 + 0,33 = 8,14.
k = (3 1) (3 1) = 4 oraz 1- = 0,05 z tablic rozkadu 2 odczytujemy warto statystyki tt = 9,488. Poniewa zachodzi relacja t emp < t t
Dla
(chi-kwadrat)
sem:
sowanej prby materia statystyczny ujmowany jest w postaci szeregu rozdzielczego punktowego bd przedziaowego. Liczebno prby, przy
153
t emp =
i
gdzie:
(ni N pi )2
5.17
N pi
dla
k = r 1 lub k = r l 1 (gdzie: r
liczba klas w szeregu rozdzielczym, l liczba szacowanych z prby parametrw) i poziomu istotnoci 1 . Kocow decyzj podejmujemy zgodnie
z oglnymi zasadami.
Przykad 5.15.
W badaniach warunkw ycia mieszkacw pewnego miasta zebrano m.
in. informacje o wysokoci dochodw przypadajcych na 1 czonka gospodarstwa domowego. Dla losowej prby 200 gospodarstw uzyskano nastpujce wyniki bada:
Dochd na 1 osob w z
150 350
350 550
550 750
750 - 950
950 - 1150
1150 - 1350
Liczba gospodarstw
5
25
80
70
15
5
Na poziomie istotnoci 0,01 zweryfikowa hipotez, e rozkad dochodw w gospodarstwach domowych ma charakter rozkadu normalnego.
Rozwizanie
Stawiana jest hipoteza zerowa o postaci
H 0 : F ( x ) = F0 ( x ) zakadajca,
154
Zygmunt Bobowski
E ( x) = x =
146000
= 730 z
200
6599000
= 181,6 z
200
(x ) = s(x ) =
W wyniku tych ustale hipotetyczny rozkad normalny posiadaby parametry: N(730 z; 181,6 z). Dalsze obliczenia pomocnicze dla wyznaczenia
statystyki empirycznej zgodnie z wzorem 5.17 zostan wykonane w poniszej tablicy roboczej, w ktrej:
- w kolumnie 1. poszczeglne przedziay klasowe zastpiono ich grnymi kracami,
- w kolumnie 2. podano liczebnoci empiryczne poszczeglnych klas,
- w kolumnie 3. dokonano standaryzacji grnych kocw przedziaw
klasowych wedug formuy: t i
xi E ( x)
,
( x)
- w kolumnie 4. umieszczono wartoci dystrybuanty teoretycznej rozkadu normalnego dla poszczeglnych ti odczytane z tablic rozkadu
normalnego,
- w kolumnie 5. na podstawie odczytanych wartoci dystrybuanty ustalono prawdopodobiestwa teoretyczne uzyskania dochodw mieszczcych si w poszczeglnych przedziaach klasowych,
- w kolumnie 6. ustalono teoretyczne liczebnoci dla poszczeglnych
klas,
- w kolumnie 7. dokonano obliczenia statystyki empirycznej.
Dochd
na
1 osob
w z ( xi )
Liczba
gospodarstw
( ni )
ti
F0i ( x) = F (ti )
pi
N pi
(ni N pi )2
N pi
350
550
750
950
1150
1350
Razem
5
25
80
70
15
5
200
- 2,09
- 0,99
0,11
1,21
2,31
3,41
X
0,0183
0,1611
0,5438
0,8869
0,9896
~ 1,00
X
0,0183
0,1428
0,3827
0,3431
0,1027
0,0104
1,0000
3,7
28,6
76,5
68,6
20,5
2,1
X
1,76
0,45
0,16
0,03
1,48
4,00
7,88
tt odczytujemy z tablic rozkadu 2 dla k = 6 2 1 = 3 i poziomu istotnoci 1 = 0,01. Otrzymujemy tt = 11,345. Zachodzi relacja: temp < tt ,
wobec czego przy poziomie istotnoci 0,01nie ma podstaw do odrzucenia
155
hipotezy, e rozkad dochodw na jedn osob w gospodarstwach domowych ma charakter rozkadu normalnego
5.4.8. Test zgodnoci Komogorowa
Ma on podobny charakter do wyej omawianego testu. Zadaniem testu
Komogorowa jest weryfikacja hipotezy o zgodnoci rozkadu okrelonej populacji z rozkadem normalnym. Badanie zgodnoci odbywa si poprzez porwnywanie wartoci dystrybuanty empirycznej i dystrybuanty hipotetycznej rozkadu normalnego. Test ten ma zastosowanie do zmiennych typu
cigego, dla innego typu zmiennych naley wykorzysta podany wyej test
zgodnoci 2 .
(x )
i odchylenia standardowego
E ( x) i ( x ) . Z tablic dystry-
buanty rozkadu normalnego dla grnych kracw poszczeglnych przedziaw klasowych odczytujemy wartoci dystrybuanty hipotetycznej F0 ( x ) .
W dalszej kolejnoci porwnujemy parami wartoci obu dystrybuant i maksymalna rnica midzy nimi stanowi podstaw do ustalenia statystyki empirycznej zgodnie z wzorem:
t emp = D n
5.18
gdzie: D = max Fi (x ) F0 i ( x ) oznacza maksymaln rnic odpowiadajcych sobie wartoci dystrybuant empirycznej i teoretycznej,
n liczebno wylosowanej prby.
Warto statystyki teoretycznej
1 - odczytujemy z tablic granicznego rozkadu Komogorowa dla . Jeli zachodzi relacja: temp tt hipotez zerow naley odrzuci, w przeciwnym
przypadku brak jest podstaw do jej odrzucenia, co oznacza wystpowanie
zgodnoci rozkadu badanej zmiennej w populacji generalnej z rozkadem
156
Zygmunt Bobowski
normalnym. Naley rwnie doda, e istnieje odmiana tego testu pozwalajca na weryfikacj hipotezy o zgodnoci rozkadw dwch populacji okrelana mianem testu zgodnoci Komogorowa Smirnowa.
Przykad 5.16.
Na podstawie danych z przykadu 5.15 - przy poziomie istotnoci 0,05 zweryfikowa hipotez, e rozkad dochodw w caej populacji gospodarstw
domowych jest normalny.
Rozwizanie
Stawiane hipotezy maj posta identyczn jak w przykadzie 5.15, tj.
H 0 : F ( x ) = F0 ( x ) i H1 : F (x ) F0 ( x ) . Z uwagi na du prb podobnie
jak poprzednio - redni i odchylenie standardowe z prby moemy przyj
jako parametry rozkadu normalnego. Wobec tego hipotetyczny rozkad
normalny posiada bdzie parametry: N(730 z; 181,6 z). Dalsze obliczenia
pomocnicze dla wyznaczenia statystyki empirycznej zgodnie z wzorem 5.18
zostay wykonane w poniszej tablicy roboczej, w ktrej:
- w kolumnie 1.poszczeglne przedziay klasowe zastpiono ich grnymi
kracami,
- w kolumnie 2. podano liczebnoci empiryczne poszczeglnych klas,
- w kolumnie 3. dokonano standaryzacji grnych kocw przedziaw
klasowych wedug formuy: t i =
xi E ( x)
,
( x)
- w kolumnie 4. umieszczono wartoci dystrybuanty teoretycznej rozkadu normalnego dla poszczeglnych ti odczytane z tablic dystrybuanty rozkadu normalnego,
- w kolumnie 5. umieszczono wartoci dystrybuanty empirycznej odpowiadajce czstociom skumulowanym,
- w kolumnie 6. ustalono bezwzgldne odchylenia wartoci dystrybuant
empirycznej i teoretycznej.
Dochd
na
1 osob
w z ( xi )
Liczba
gospodarstw
( ni )
ti
F0i ( x) = F (ti )
Fi ( x ) = cumf i
F0i Fi ( x)
350
550
750
950
1150
1350
Razem
5
25
80
70
15
5
200
- 2,09
- 0,99
0,11
1,21
2,31
3,41
X
0,0183
0,1611
0,5438
0,8869
0,9896
~ 1,00
X
0,025
0,15
0,55
0,90
0,975
1,00
X
0,0067
0,0111
0,0062
0,0131
0,0146
0
X
157
1
,
2
1
- k 2 dla n1 i n2 oraz 1
,
2
gdzie: n1 i n2 odpowiadaj liczbie wystpujcych w cigu symboli a i b.
-
k1 dla n1 i n2 oraz
158
Zygmunt Bobowski
k1 < k < k2
5.20
0,10
= 0,05 ; wynosi ono 8
2
0,10
- k 2 dla n1 =12 i n2 =12 oraz 1
= 0,95 ; otrzymujemy 17
2
Zachodzi relacja k1 < k < k 2 , co oznacza, e dobr prby by losowy.
159
BIBLIOGRAFIA
[1]
[2]
Bazarnik J., Grabiski T. (i inni); Badania marketingowe. Metody i oprogramowanie komputerowe. Warszawa Krakw: Canadian Consortium of
Management Schools. AE w Krakowie
[3]
Bk I., Mankowicz I., Mojsiewicz M., Wawrzyniak K.: Statystyka w zadaniach. Cz. I i II. Warszawa: WN-T 2001
[4]
[5]
[6]
[7]
Gralski A.: Metody opisu i wnioskowania statystycznego w psychologii. Warszawa: PWN 1976
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
160
Zygmunt Bobowski
[18]
Sadowski W.: Statystyka dla ekonomistw. Wnioskowanie statystyczne. Warszawa: PWE 1972
[19]
[20]
[21]
[22]
Walter J., McLean M.: Statystyka dla kadego. Warszawa: WSiP 1994
[23]
Wawrzynek J.: Wybrane metody opisu i wnioskowania statystycznego w biznesie. Wrocaw: AE 1995
[24]
[25]
Zastosowanie
metod
statystycznych.
A. Luszniewicza. Warszawa: PWE 1983
Praca
zbiorowa
pod
red.
161
PODSTAWOWE WZORY
Wzr
Liczba klas
N
R( x)
h=
k
Rozpito klas
l
x n
i
M 1 (x ) =
N
k
(x
=x
x ) ni
i =1
N
k
m3 ( x ) =
i =1
m2 (x ) =
(x
x ) ni
i =1
N
k
(x
m4 (x ) =
x ) ni
i =1
rednia arytmetyczna w
szeregu szczegowym
x=
i =1
N
k
x=
x i ni
i =1
x f
i
x=
i =1
i =1
x=
x& i ni
i =1
x=
x& i f i
i =1
i =1
x g = N x1 x 2 ... x N
ychr
Zastosowanie
1
1
y1 + y2 + .... + yn
2
= 2
n 1
rednia arytmetyczna w
szeregu rozdzielczym
punktowym
rednia arytmetyczna w
szeregu rozdzielczym z
przedziaami
klasowymi
rednia geometryczna
rednia chronologiczna
162
Zygmunt Bobowski
n0 n01
D(x ) = x0 +
h
(n0 n01 ) + (n0 n0+1 ) 0
N
cumn0 1
2
h0
Me(x ) = x0 +
n0
N
cumn0 1
4
Q1 ( x ) = x0 +
h0
n0
3N
cumn0 1
h0
Q3 ( x ) = x0 + 4
n0
R( x ) = xmax xmin
Oc (x ) =
Q3 (x ) Q1 (x ) , O
c
2
N
s (x ) =
2
(x x )
Wariancja w
szeregu rozdzielczym
punktowym
Wariancja w
szeregu rozdzielczym z
przedziaami
klasowymi
Rwno wariancyjna
Odchylenie
standardowe
w szeregu
szczegowym
i =1
N
k
s 2 (x ) =
x ) ni
N
i
(x&
x ) ni
2
i =1
s 2 (x ) = s j ( x ) + s 2 (x j )
2
s(x ) =
(x
i =1
Odchylenie
wiartkowe
Wariancja w
szeregu szczegowym
i =1
(x
s 2 (x ) =
(x ) =
Dominanta w
szeregu rozdzielczym z
przedziaami
klasowymi
Mediana w
szeregu rozdzielczym z
przedziaami
klasowymi
Kwartyl pierwszy w szeregu
rozdzielczym z
przedziaami
klasowymi
Kwartyl trzeci
w szeregu rozdzielczym z
przedziaami
klasowymi
Obszar zmiennoci
x)
(x
s(x ) =
x ) ni
2
i =1
N
k
(x&
s(x ) =
x ) ni
2
i =1
N
N
d (x ) =
x x
i
i =1
N
k
d (x ) =
N
k
d (x ) =
x ni
i =1
x&
x ni
i =1
s(x )
x
O (x )
;
Wz ( x ) = c
Me( x )
Wz ( x ) =
M s (x ) = x D(x ) ;
Wz ( x ) =
Q3 ( x ) Q1 ( x )
Q3 ( x ) + Q1 ( x )
Ws1 ( x ) =
163
Odchylenie
standardowe
w szeregu rozdzielczym
punktowym
Odchylenie
standardowe
w szeregu rozdzielczym z
przedziaami
klasowymi
Odchylenie
przecitne w
szeregu szczegowym
Odchylenie
przecitne w
szeregu rozdzielczym
punktowym
Odchylenie
przecitne w
szeregu rozdzielczym z
przedziaami
klasowymi
Klasyczny
wspczynnik
zmiennoci
Kwartylowy
wspczynnik
zmiennoci
Absolutna miara skonoci
Wspczynnik
skonoci
Kwartylowy
wspczynnik
skonoci
Trzeci moment
centralny
standaryzowany
164
k=
Zygmunt Bobowski
a
5000
Wspczynnik
koncentracji
4
(x
m4 (x )
=
s 4 (x )
e(t ) = m4 (t ) 3
Miara kurtozy
m 4 (t ) =
d =
c
(f
dG
rk =
N
4
s (x )
Miara ekscecsu
fi f j )
ij
Wspczynnik
Czuprowa
fi f j
i, j
min(r , s ) 1
x ) ni
i =1
ij
i , jG
( )
s yxj
s( y )
fj
i , jG
dM
1
1
min(r , s )
(y
y n j
fi f j
i , jM
( yi y )
rk =
ni
1
1
min (r , s )
(y
( )
s y xi
s( y )
y ni
(y
y n j
2
xi
Stosunek korelacyjny
(x
x ) ( y i y )
N
(x
x)
(y
(x
y)
x ) ( y i y ) n ij
(x
x) n j
6 d x i d y i
i
N3 N
(y
Wspczynnik
korelacji liniowej Pearsona
dla szeregw
szczegowych
i, j
y = a y x + b
c ( x, y )
rP =
=
s (x ) s( y )
c ( x, y )
rP =
=
s ( x ) s ( y )
= 1
Wspczynnik
Hellwiga
xi
ij
Sp
i , jM
xj
y ) ni
2
Wspczynnik
korelacji liniowej Pearsona
dla tablicy korelacyjnej
Wspczynnik
korelacji rang
Spearmana
Rwnanie regresji Y wzgldem X
(x
x ) ( y i y )
C ( x, y )
=
s 2 (x )
ay =
165
N
( x i x )2
i
N
b = y ay x
( y y )
=
(y y)
2y
Wspczynnik
zbienoci
R2 = 1 2
R a r / s = yr ys
R a r / r 1 = yr yr 1
Rar / s
y ys
100 = r
100
ys
ys
R wr / s =
R w r / r 1 =
wi r / s =
R a r / r 1
y yr 1
100 = r
100
yr 1
yr 1
yr
100
ys
wi r / r 1 =
yr
100
yr 1
y1 + y2 + y3 (3) y2 + y3 + y4
; y3 =
;.....,
3
3
y + yn 1 + yn
= n2
3
y2(3) =
yn(3)1
y3..
(5)
yn 2
(5)
y1 + y2 + y3 + y4 + y5
y + y3 + y4 + y5 + y6
(5)
....;.... y4 = 2
5
5
yn 4 + yn 3 + yn 2 + yn 1 + yn
5
yt = a t + b
Wspczynnik
determinacji
Rnica absolutna jednopodstawowa
Rnica absolutna acuchowa
Rnica
wzgldna jednopodstawowa
Rnica
wzgldna acuchowa
Indeks indywidualny jednopodstawowy
Indeks indywidualny acuchowy
rednie ruchome trzyokresowe
166
Zygmunt Bobowski
a=
(t
t ) yti
i =1
(t
t )2
i =1
b = y a t
n
=
2
(y
ti
i =1
n
y t i ) 2
( y
y )2
ti
i =1
w i r / r 1 = n1 wi 2 / 1 wi3 / 2 wi 4 / 3 ... wi n / n1 = n1 wi n / 1
Sj =
Sj =
yj
y
100
( j)
ti
ci
ti
ti
( j)
100
Sj =
( j)
( j)
100
k=
r 100
x tt
x tt
s(x )
s(x )
E (x ) x + tt
n 1
n 1
s(x )
s(x )
E ( x ) x + tt
n
n
s 2 ( x ) =
(x
x)
n 1
Wspczynnik
zbienoci dla
rwnania trendu
rednie tempo
zmian
Wskanik sezonowoci
oparty na
rednich okresw jednoimiennych
Wskanik sezonowoci
oparty na
rednich ruchomych centrowanych
Wskanik sezonowoci
oparty na rwnaniu trendu
Wspczynnik
korygujcy surowe wskaniki sezonowoci
Przedzia ufnoci dla redniej
(maa prba)
Przedzia ufnoci dla redniej
(dua prba)
Wariancja dla
maej prby
167
Minimalna liczebno prby
dla szacowania
redniej
t s 2 ( x )
= t 2
d
2
n min
m m
m m
1
1
m
m
n
n
n
n
tt
< p < + tt
n
n
n
n
n s2 (x ) 2
n s2 (x )
( x )
t t1
t t2
2
s (x )
s(x )
( x )
t
t
1+ t
1 t
2n
2n
r tt
P
1 (r P ) 2
n
r + tt
P
t emp =
x E 0 (x )
n 1
s(x )
t emp =
x E0 (x )
n
s(x )
temp =
temp =
( )
1 r P
n
x1 x2
2
n s ( x ) + n2 s2 ( x ) 1 1
+
n1 + n2 2
n1 n 2
2
1 1
x1 x2
s1 ( x ) s2 ( x )
+
n1
n2
2
168
t emp
Zygmunt Bobowski
m
p0
= n
p 0 q0
n
rP
t emp =
( )
1 r
t emp =
ij
t emp =
i
(n
P 2
n2
N fi f j )
ij
N fi f j
(ni N pi )2
N pi
Statystyka
empiryczna
przy weryfikacji hipotezy dla
wskanika
struktury
Statystyka
empiryczna
przy weryfikacji hipotezy dla
wspczynnika
korelacji
Statystyka
empiryczna dla
testu niezalenoci chikwadrat
Statystyka
empiryczna dla
testu zgodnoci
chi-kwadrat
Statystyka
empiryczna dla
testu zgodnoci
Komogorowa
169
ANEKS
Tablica 1. Dystrybuanta rozkadu normalnego (dla
tt
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891
1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41308 0,41466 0,41621 0,41774
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574
2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361
2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861
3,0 0,49865 0,49873 0,049878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49898 0,4990
1
170
Zygmunt Bobowski
1
0,8
0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257
0,257
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,255
0,255
0,255
0,255
0,255
0,255
0,255
0,255
0,255
0,6
0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542
0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533
0,532
0,532
0,532
0,531
0,531
0,531
0,531
0,530
0,530
0,530
0,530
0,530
0,530
0,529
0,529
0,529
0,529
0,529
0,529
0,529
0,4
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,853
0,853
0,853
0,852
0,852
0,852
0,851
0,851
0,851
0,851
0,2
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,309
1,309
1,308
1,307
1,306
1,306
1,305
1,304
1,304
1,303
0,1
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,696
1,694
1,692
1,691
1,690
1,688
1,687
1,686
1,685
1,684
0,05
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,040
2,037
2,035
2,032
2,030
2,028
2,026
2,024
2,023
2,021
0,02
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,453
2,449
2,445
2,441
2,438
2,434
2,431
2,429
2,426
2,423
0,01
63,656
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,744
2,738
2,733
2,728
2,724
2,719
2,715
2,712
2,708
2,704
0,001
636,578
31,600
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,633
3,622
3,611
3,601
3,591
3,582
3,574
3,566
3,558
3,551
Tablica 3. Rozkad
0,95
0,90
171
(chikwadrat)
0,99
0,98
0,80
0,70
0,50
0,30
0,20
0,10
0,05
0,02
0,01 0,001
0,0002
0,0006
0,004
0,016
0,064
0,020
0,040
0,103
0,211
0,446
0,115
0,185
0,352
0,584
1,005
0,297
0,429
0,711
1,064
1,649
0,554
0,752
1,145
1,610
2,343
0,872
1,134
1,635
2,204
3,070
1,239
1,564
2,167
2,833
3,822
1,647
2,032
2,733
3,490
4,594
2,088
2,532
3,325
4,168
5,380
10
2,558
3,059
3,940
4,865
6,179
11
3,053
3,609
4,575
5,578
6,989
12
3,571
4,178
5,226
6,304
7,807
13
4,107
4,765
5,892
7,041
8,634
14
4,660
5,368
6,571
7,790
9,467
15
5,229
5,985
7,261
8,547
10,307 11,721 14,339 17,322 19,311 22,307 24,996 28,259 30,578 37,698
16
5,812
6,614
7,962
9,312
11,152 12,624 15,338 18,418 20,465 23,542 26,296 29,633 32,000 39,252
17
6,408
7,255
8,672
10,085
12,002 13,531 16,338 19,511 21,615 24,769 27,587 30,995 33,409 40,791
18
7,015
7,906
9,390
10,865
12,857 14,440 17,338 20,601 22,760 25,989 28,869 32,346 34,805 42,312
19
7,633
8,567
10,117
11,651
13,716 15,352 18,338 21,689 23,900 27,204 30,144 33,687 36,191 43,819
20
8,260
9,237
10,851
12,443
14,578 16,266 19,337 22,775 25,038 28,412 31,410 35,020 37,566 45,314
21
8,897
9,915
11,591
13,240
15,445 17,182 20,337 23,858 26,171 29,615 32,671 36,343 38,932 46,796
22
9,542
10,600
12,338
14,041
16,314 18,101 21,337 24,939 27,301 30,813 33,924 37,659 40,289 48,268
23 10,196
11,293
13,091
14,848
17,187 19,021 22,337 26,018 28,429 32,007 35,172 38,968 41,638 49,728
24 10,856
11,992
13,848
15,659
18,062 19,943 23,337 27,096 29,553 33,196 36,415 40,270 42,980 51,179
25 11,524
12,697
14,611
16,473
18,940 20,867 24,337 28,172 30,675 34,382 37,652 41,566 44,314 52,619
26 12,198
13,409
15,379
17,292
19,820 21,792 25,336 29,246 31,795 35,563 38,885 42,856 45,642 54,051
27 12,878
14,125
16,151
18,114
20,703 22,719 26,336 30,319 32,912 36,741 40,113 44,140 46,963 55,475
28 13,565
14,847
16,928
18,939
21,588 23,647 27,336 31,391 34,027 37,916 41,337 45,419 48,278 56,892
29 14,256
15,574
17,708
19,768
22,475 24,577 28,336 32,461 35,139 39,087 42,557 46,693 49,588 58,301
30 14,953
16,306
18,493
20,599
23,364 25,508 29,336 33,530 36,250 40,256 43,773 47,962 50,892 59,702
172
Zygmunt Bobowski
1,01
1,02
1,03
1,04
1,05
1,06
1,07
1,08
1,09
1,10
1,11
1,12
1,13
1,14
1,15
1,16
1,17
1,18
1,19
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
1,13
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
0,740566
0,750826
0,760780
0,770434
0,779794
0,788860
0,797636
0,806128
0,814342
0,822282
0,829950
0,837356
0,844502
0,851394
0,858038
0,864442
0,870612
0,876548
0,882258
0,887750
0,893030
0,898104
0,902972
0,907648
0,912132
0,916432
0,920556
0,924505
0,928288
0,931908
0,935370
0,938682
0,941848
0,944872
0,947756
0,950512
0,953142
0,955650
0,958040
0,960318
1,41
1,42
1,43
1,44
1,45
1,46
1,47
1,48
1,49
1,50
1,51
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
1,60
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,79
1,80
0,962486
0,964552
0,966516
0,968382
0,970158
0,971846
0,973448
0,974970
0,976412
0,977782
0,979080
0,980310
0,981476
0,982578
0,983622
0,984610
0,985544
0,986426
0,987260
0,988048
0,988791
0,989492
0,990154
0,990777
0,991364
0,991917
0,992928
0,992928
0,993389
0,993828
0,994230
0,994612
0,994972
0,995309
0,995625
0,995922
0,996200
0,996460
0,996704
0,996932
1,81
1,82
1,83
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,91
1,92
1,93
1,94
1,95
1,96
1,97
1,98
1,99
2,00
2,01
2,02
2,03
2,04
2,05
2,06
2,07
2,08
2,09
2,10
2,11
2,12
2,13
2,14
2,15
2,16
2,17
2,18
2,19
2,20
0,997146
0,997346
0,997533
0,997707
0,997870
0,998023
0,998145
0,998297
0,998421
0,998536
0,998644
0,998744
0,998837
0,998924
0,999004
0,999079
0,999149
0,999213
0,999273
0,999329
0,999380
0,999428
0,999474
0,999516
0,999552
0,999588
0,999620
0,999650
0,999680
0,999705
0,999723
0,999750
0,999770
0,999790
0,999806
0,999822
0,999838
0,999852
0,999864
0,999874
2.21
2,22
2,23
2,24
2,25
2,26
2,27
2,28
2,29
2,30
2,31
2,32
2,33
2,34
2,35
2,36
2,37
2,38
2,39
2,40
2,41
2,42
2,43
2,44
2,45
2,46
2,47
2,48
2,49
2,50
2.55
2,60
2,65
2,70
2,75
2,80
2,85
2,90
2,95
3,00
0,999886
0,999896
0,999904
0,999912
0,999920
0,999926
0,999934
0,999940
0,999944
0,999949
0,999954
0,999958
0,999962
0,999965
0,999968
0,999970
0,999973
0,999976
0,999978
0,999980
0,999982
0,999984
0,999986
0,999987
0,999988
0,999989
0,999990
0,999991
0,999992
0,99993
0,999995
0,999974
0,999998
0,999999
0,9999994
0,9999997
0,9999998
0,9999999
0,99999994
0,99999997
173
n2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
n1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
10
11
12
13
14
15
16
17
18
19
20
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
2
2
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
3
3
3
3
4
4
4
4
4
5
5
5
5
5
5
5
3
4
4
4
5
5
5
5
5
6
6
6
6
6
6
4
4
5
5
5
6
6
6
6
6
7
7
7
7
5
5
6
6
6
6
7
7
7
7
8
8
8
6
6
6
7
7
7
8
8
8
8
8
8
6
7
7
8
8
8
8
9
9
9
9
7
8
8
8
9
9
9
10
10
10
8
9
9
9
10
10
10
10
11
9
9
10
10
10
11
11
11
10
10
11
11
11
12
12
11
11
11
12
12
12
11
12
12
13
13
12
13
13
13
13
14
14
14
14
15
dla
n2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
= 0,05
= 0,95
n1
2
4
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
10
11
12
13
14
15
16
17
18
19
20
6
6
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
8
8
8
9
9
9
9
9
9
9
9
9
9
9
9
9
8
9
9
10
10
10
11
11
11
11
11
11
11
11
11
11
10
10
11
11
11
12
12
12
12
13
13
13
13
13
13
11
12
12
12
13
13
13
13
14
14
14
14
14
14
12
13
13
14
14
14
15
15
15
15
15
15
16
13
14
14
15
15
16
16
16
16
17
17
17
15
15
16
16
16
17
17
17
18
18
18
16
16
17
17
18
18
18
19
19
19
17
17
18
18
19
19
20
20
20
18
19
19
20
20
20
21
21
19
20
20
21
21
22
22
20
21
21
22
22
23
22
22
23
23
24
23
23
24
24
24
24
25
25
26
26