You are on page 1of 173

WABRZYSKA WYSZA SZKOA

ZARZDZANIA I PRZEDSIBIORCZOCI
PR A C E DY D A K TY C Z NE N R 5
S E R I A: N AU K I S P O E C Z NE

ZYGMUNT BOBOWSKI

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

Wydanie 1

Wydawnictwo WWSZiP
2004

KIEROWNIK NAUKOWY SERII


prof. dr hab. Zbigniew Kurcz

REDAKTOR WYDAWNICTWA
Micha Lesman

PROJEKT OKADKI
Stanisaw Gola

REDAKTOR TECHNICZNY
Wadysaw Ramotowski

Copyright by Wabrzyska Wysza Szkoa Zarzdzania i Przedsibiorczoci, Wabrzych 2004


Wszelkie prawa zastrzeone. Kopiowanie, przedrukowywanie i rozpowszechnianie caoci lub fragmentw bez zgody wydawcy jest zabronione.
Printed in Poland

ISBN 83-915717-9-3
Wydawnictwo WWSZiP, Wabrzych 2004
Wydanie I
Druk: Drukarnia D&D Spka z o.o. 44-100 Gliwice, ul. Moniuszki 6

SPIS TRECI
Przedmowa
I.
II.

Przedmiot i podstawowe pojcia statystyki

5
6

Metody opisu zbiorowoci statystycznej


2.1.Opis tabelaryczny
2.2. Graficzny opis zbiorowoci statystycznej
2.3. Parametryczny opis zbiorowoci statystycznej
2.3.1. Istota i klasyfikacja parametrw i momentw
statystycznych
2.3.2. Miary rednie i pooenia
2.3.3. Miary zmiennoci
2.3.4. Miary skonoci (asymetrii)
2.3.5. Miary koncentracji

15
15
21
27
27
29
45
55
61

III.

Analiza wspzalenoci zmiennych


3.1. Wprowadzenie
3.2. Wasnoci idealnej miary zalenoci
3.3. Metoda nieparametrycznego badania wspzalenoci
3.3.1. Wspczynnik zbienoci Czuprowa
3.3.2. Wspczynnik zalenoci Hellwiga
3.4. Metoda parametrycznego badania wspzalenoci
3.4.1. Stosunek korelacyjny
3.4.2. Wspczynnik korelacji liniowej Pearsona
3.4.3. Wspczynnik korelacji rang Spearmana
3.5. Analiza regresji

68
68
74
75
76
78
80
80
84
88
90

IV.

Analiza szeregw czasowych


4.1. Wprowadzenie
4.2. Miary dynamiki
4.2.1. Klasyfikacja miar dynamiki
4.2.2. Rnicowe miary dynamiki
4.2.3. Ilorazowe miary dynamiki (indeksy)
4.3. Metody wyodrbniania tendencji rozwojowej
4.3.1. Metoda oceny wzrokowej i mechaniczna
4.3.2. Metoda analityczna i badanie redniego tempa zmian
4.4. Analiza sezonowoci

96
96
97
97
98
99
103
103
105
109

V.

Wnioskowanie statystyczne
5.1. Istota i metody wnioskowania statystycznego
5.2. Prba statystyczna i schematy jej losowania
5.3. Estymacja parametryczna
5.3.1. Pojcie i podane wasnoci estymatora. Metody estymacji
5.3.2. Estymacja przedziaowa wartoci redniej
5.3.3. Wyznaczanie minimalnej liczebnoci prby w procedurze
szacowania wartoci redniej
5.3.4. Estymacja przedziaowa wskanika struktury
5.3.5. Estymacja przedziaowa wariancji i odchylenia
standardowego
5.3.6. Estymacja przedziaowa wspczynnika korelacji

118
118
119
122
122
125
128
130
132
135

Zygmunt Bobowski

5.4. Weryfikacja hipotez statystycznych


5.4.1. Istota procedury weryfikacji hipotez statystycznych
5.4.2. Weryfikacja hipotezy dla wartoci redniej
5.4.3. Weryfikacja hipotezy dla dwch rednich
5.4.4. Weryfikacja hipotezy dla wskanika struktury
5.4.5. Weryfikacja hipotezy dla wspczynnika korelacji
5.4.6. Test niezalenoci chi-kwadrat
5.4.7. Test zgodnoci chi-kwadrat
5.4.8. Test zgodnoci Komogorowa
5.4.9. Test serii

137
137
140
143
147
149
150
152
155
157

Bibliografia

159

Podstawowe wzory

161

Aneks
Tablica
Tablica
Tablica
Tablica
Tablica

1.
2.
3.
4.
5.

Rozkad
Rozkad
Rozkad
Rozkad
Rozkad

normalny
t Studenta
chi-kwadrat
Komogorowa
serii

169
170
171
172
173

PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI

SERIA:
NAUKI SPOECZNE

Przedmowa
Niniejszy podrcznik jest przeznaczony przede wszystkim dla studentw studiw dziennych i zaocznych kierunkw humanistycznych, chocia z uwagi na uniwersalny charakter przekazanej w niej podstawowej
wiedzy teoretycznej moe by z powodzeniem wykorzystywany rwnie przez
studentw innych kierunkw.
Wychodzc z zaoenia, e studentom tego typu kierunkw opanowanie przedmiotw ilociowych, do jakich naley statystyka, moe sprawia
pewne trudnoci Autor kierujc si sentencj sformuowan przez Einsteina: wszystko naley robi tak prosto, jak to jest moliwe, ale nie prociej,
podj prb przekazania wiedzy z tego zakresu w moliwie przystpnej
formie unikajc nadmiernego jej zmatematyzowania. Kady z rozdziaw
zawiera wic jedynie minimum teorii niezbdnej dla wyjanienia omawianych zagadnie, a dla uatwienia ich zrozumienia zamieszczono przykadowe zadania wraz z rozwizaniami.
Tre podrcznika zawiera si w piciu rozdziaach. W rozdziale
pierwszym omwiono podstawowe pojcia statystyczne oraz przedstawiono
procedur programowania badania statystycznego, w szczeglnoci badania
ankietowego. W rozdziale drugim dokonano prezentacji metod opisu statystycznego. Omwiono i zilustrowano przykadami zasady wykorzystania
metody tabelarycznej i graficznej. Zasadnicz cz tego rozdziau powicono opisowi parametrycznemu wskazujc na rol i moliwoci wykorzystania poszczeglnych grup parametrw i momentw statystycznych w tym
opisie. Rozdzia trzeci zawiera podstawowe metody analizy wspzalenoci
zmiennych i mierniki w tym zakresie wykorzystywane. W rozdziale czwartym omwiono metody analizy dynamiki zjawisk ze szczeglnym uwzgldnieniem metod indeksowych, analizy tendencji rozwojowej oraz analizy sezonowoci. Rozdzia pity powicono metodom wnioskowania statystycznego. Dokonano w nim prezentacji procedur szacowania podstawowych parametrw statystycznych dla populacji generalnej oraz testowania hipotez
statystycznych, zarwno parametrycznych jak i nieparametrycznych.
W kocowej czci publikacji zamieszczono tablice wybranych rozkadw teoretycznych wykorzystywane w procedurach wnioskowania statystycznego oraz zestawienie podstawowych wzorw statystycznych.
Autor zdaje sobie spraw z mankamentw tej publikacji i bdzie
wdziczny za uwagi, ktre pozwol na jej udoskonalenie.
Zygmunt Bobowski

PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI

SERIA:
NAUKI SPOECZNE

Rozdzia I

Przedmiot i podstawowe pojcia


statystyki

W literaturze wyrnia si kilka znacze terminu statystyka, chocia


jego pierwotne znaczenie wywodzi si od wyrazu status, czyli pastwo, co
pozwalaoby okreli j mianem pastwoznawstwa, tj. nauk zajmujc
si opisem procesw zachodzcych w pastwie. Wrd spotykanych wspczenie znacze tego terminu naley wyrni:
a) statystyk jako zbir danych; w tym znaczeniu moe by ona utosamiana z rocznikiem statystycznym (np. Rocznik Statystyczny Woj. Dolnolskiego),
b) statystyk jako proces gromadzenia informacji (czynnociowe znaczenie
tego terminu); potocznie o osobach zatrudnionych w firmach, instytucjach zajmujcych si przygotowywaniem wszelkiego rodzaju sprawozda, w tym obligatoryjnych przekazywanych urzdom statystycznym
mona powiedzie, i zajmuj si statystyk tego podmiotu,
c) statystyk jako parametr statystyczny, czyli liczb syntetycznie opisujc badan zbiorowo (np. rednia arytmetyczna jako bardzo czsto
uywana podstawowa statystyka badanej zbiorowoci),
d) statystyk jako nauk zajmujc si badaniem procesw, zjawisk masowych i opisujc je najczciej za pomoc liczb w celu ustalenia prawidowoci charakteryzujcych ich ksztatowanie si. Takie znaczenie
statystyce przypisa m. in. O. Lange, wedug ktrego;
statystyka jest dyscyplin traktujc o metodach ilociowych badania zjawisk masowych.
Procedura badania zjawisk masowych, w tym gromadzenia danych
i ustalania prawidowoci, okrelana jest mianem badania statystycznego.
Obejmuje ono najczciej nastpujce trzy etapy:
I) programowanie badania statystycznego, ktre ma charakter etapu przygotowujcego waciwe badanie. Etap ten obejmuje nastpujce czynnoci
okrelajce:

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

problem badawczy, czyli sformuowanie celu badania,


zakres rzeczowy badania, czyli sprecyzowanie jednostki i zbiorowoci
statystycznej w proponowanym badaniu,
zakres czasowy badania, czyli przyjcie momentu czasowego bd przedziau czasowego dla badania,
zakres przestrzenny badania, czyli sprecyzowanie obszaru, z ktrego
wywodzi si badana zbiorowo,
cechy statystyczne, ze wzgldu na ktre bdzie dokonana charakterystyka zbiorowoci bd zjawiska,
metod badania zbiorowoci bd zjawiska, czyli wybr jednej z dwch
metod, tj. badania cakowitego lub czciowego,
sposb gromadzenia informacji gwarantujcy uzyskanie danych o najwyszym stopniu wiarygodnoci,
tre formularza badawczego; czynno szczeglnie istotna w przypadku
bada ankietowych.
II) gromadzenie danych, tj. etap o zasadniczym znaczeniu, bowiem jako
zebranych informacji decyduje o jakoci i prawidowoci formuowanych
w dalszej czci badania wnioskw. Proces gromadzenia informacji winien
by zakoczony kontrol kompletnoci zgromadzonego materiau jak rwnie jego kontrol merytoryczn,
III) opis statystyczny, w ramach ktrego odbywa si opracowywanie i analiza zgromadzonego materiau statystycznego przy wykorzystaniu rnorodnych metod opisu statystycznego w celu ustalenia okrelonych prawidowoci. Ze wzgldu na jego posta wyrnia si opis: tabelaryczny, graficzny
i parametryczny, za z uwagi na jego cel: opis struktury zbiorowoci, opis
wspzalenoci wybranych cech, opis dynamiki badanego zjawiska.
Wymienione wyej trzy etapy badania s charakterystyczne dla kadego
badania statystycznego zarwno cakowitego jak i czciowego i tworz one
tzw. statystyk opisow. W przypadku bada czciowych wyrni naley
dodatkowy etap czwarty okrelany mianem wnioskowania statystycznego.
Jego zadaniem jest wnioskowanie, przy wykorzystaniu odpowiednich metod
statystycznych, o prawidowociach wystpujcych w zbiorowoci cakowitej na podstawie wynikw bada stwierdzonych w badanej prbie statystycznej. Zbir stosowanych w tym przypadku metod tworzy tzw. statystyk
matematyczn.
Pierwszy z wymienionych etapw badania statystycznego ma charakter
przygotowawczy. Prawidowe przygotowanie badania wymaga znajomoci
podstawowych poj statystycznych. Nale do nich: jednostka, zbiorowo
i cecha statystyczna.
Jednostk statystyczn jest kada pojedyncza jednostka (np. osoba,
przedmiot, zjawisko) podlegajca badaniu, za zbiorowoci zbir tych jednostek wyodrbnionych wedug okrelonego kryterium ich podobiestwa1
(np. pracownicy firmy K, studenci uczelni W, mieszkacy miasta P). Ze

To kryterium podobiestwa jest czsto okrelane mianem cech staych, wrd ktrych wyrnia si cechy: rzeczowe, czasowe i przestrzenne. Ze wzgldu na te cechy jednostki badanej zbiorowoci s identyczne.

Zygmunt Bobowski

wzgldu na przyjte kryterium podobiestwa poddana badaniu zbiorowo


jest jednorodna.
Zgodnie z podan wyej definicj wymaga si by zbiorowo taka miaa
charakter masowy, gdy tylko wwczas ujawniaj si prawidowoci, ktrych nie mona zaobserwowa w pojedynczym przypadku. Liczebno badanej zbiorowoci przyjmuje si zwykle oznacza jako N. Warto tu przytoczy kilka najczciej spotykanych klasyfikacji zbiorowoci statystycznych.
I tak:
I) ze wzgldu na ich liczebno wyodrbnia si zbiorowoci:
a) skoczenie liczne, skadajce si ze skoczonej, przeliczalnej liczby
jednostek statystycznych (np. zbiorowo studentw II roku),
b) nieskoczenie liczne, tworzone przez nieskoczon liczb jednostek
statystycznych (np. zbir istot ywych na kuli ziemskiej); w przypadku tego typu zbiorowoci stosowana jest metoda bada czciowych ograniczajcych si jedynie do badania pewnego jej wycinka,
II) ze wzgldu na przyjty zakres czasowy badania dokonuje si podziau
zbiorowoci na:
a) statyczne, gdy wszystkie jednostki statystyczne s badane wedug
stanu na ten sam moment czasowy (np. studenci wedug miejsca
zamieszkania na dzie 30.05.2003 r.),
b) dynamiczne, gdy zbiorowo jest charakteryzowana ze wzgldu na
okrelon cech w pewnym przedziale czasowym (np. struktura
mieszkacw Wabrzycha w latach 1990 2003 wedug wieku),
III) ze wzgldu liczb cech niezbdnych dla ich opisu wyrnia si zbiorowoci2:
a) proste (jednorodne), ktre s opisywane niewielk liczb cech (1 2),
np. zbir awek w sali dydaktycznej,
b) zoone (niejednorodne), dla opisu ktrych wykorzystuje si liczny
zbir cech, np. studenci okrelonej uczelni.
Wyodrbniona zbiorowo jest poddawana badaniu ze wzgldu na
okrelone waciwoci okrelane mianem cech statystycznych. Wedug
B. Szulca cecha statystyczna ...jest to waciwo obiektu odrniajca go
od innych obiektw. Podobn definicj formuuj M. Krzysztofiak
i A. Luszniewicz, wedug ktrych cechami statystycznymi nazywamy waciwoci, ktrych odmiany lub wartoci wyrniaj jednostki wchodzce w
skad zbiorowoci statystycznej.
Cechy statystyczne przyjmuje si oznacza duymi literami: X, Y, Z, za
ich realizacje: xi , yi , zi i naley je interpretowa jako wartoci cechy X, Y, Z
zaobserwowane w i-tej jednostce.
Z punktu widzenia dalszych rozwaa istotne znaczenie maj spotykane
w literaturze przedmiotu klasyfikacje cech wedug rnych kryteriw.
I tak z punktu widzenia sposobu zapisu wartoci cechy wyrnia si:
a) cechy opisowe (okrelane rwnie jako werbalne, niemierzalne, jakociowe), ktrych realizacje s wyraane na skali nominalnej lub porzd-

W literaturze podkrela si czsto, i podzia ten jest mao jednoznaczny, zaley bowiem
w duej mierze od poziomu szczegowoci i celu bada

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

kowej (np. pe, narodowo, poziom wyksztacenia); cecha opisowa odwzorowuje wic zbir obiektw w zbir okrele sownych,
b) cechy liczbowe (zwane rwnie ilociowymi, mierzalnymi), ktrych wartoci s mierzone na skalach interwaowej bd ilorazowej (np. waga,
wiek, temperatura); ta cecha z kolei odwzorowuje zbir obiektw w zbir
liczb.
Uszczegowienie tego podziau stanowi spotykany coraz czciej w literaturze podzia cech wedug rodzaju skali pomiarowej. Kryterium to pozwala wyodrbni cechy, ktrych wartoci s wyraane na skali:
a) nominalnej,
b) porzdkowej,
c) interwaowej,
d) ilorazowej.
W przypadku skali nominalnej wartoci cech s zwykle wyraane sownie, niekiedy wartociom cechy przyporzdkowuje si arbitralnie liczby,
ktre peni jedynie rol nazwy kategorii (na liczbach tych nie mona przeprowadza operacji matematycznych). Wykorzystywane w tym przypadku
symbole pozwalaj na stwierdzenie tosamoci lub rozrnienie obiektw ze
wzgldu na badan cech. W naukach spoecznych z tego typu cechami
mamy do czsto do czynienia, np. pe, status spoeczny, wykonywany
zawd, wyznawana religia. Ten rodzaj skali umoliwia klasyfikacj (grupowanie) badanego zbioru obiektw na grupy (kategorie) obiektw do siebie
podobnych, np. podzia spoeczestwa na wyznawcw rnych religii, podzia ludnoci na pracujcych i niepracujcych. Naley podkreli, i moe
budzi wtpliwoci zaliczenie skali nominalnej do skal pomiarowych. Oznacza to bowiem, e cechy wyraane na tej skali s cechami mierzalnymi.
Skala porzdkowa (rangowa) umoliwia bardziej precyzyjny, ni w przypadku skali nominalnej, pomiar wartoci cechy. Wartoci te mog by rwnie wyraane sownie lub liczbowo, jednak istnieje moliwo ich uporzdkowania wedug natenia cechy. Przykadami cech, ktrych wartoci s
wyraane na tej skali s: poziom wyksztacenia, wzrost (wyraony jako: niski, redni, wysoki), stopnie w subach mundurowych. Wartoci cechy wyraonej na tej skali umoliwiaj uporzdkowanie badanego zbioru obiektw
od najniszego do najwyszego poziomu badanej cechy. Naley jednak pamita, e nie istnieje moliwo okrelania wielkoci rnic midzy tymi
wartociami. Nie ma wic moliwoci wykonywania operacji matematycznych na wartociach takiej cechy. Cecha ta pozwala na stwierdzanie tosamoci bd rnoci obiektw, a ponadto pozwala na ich uporzdkowanie
jednak bez okrelania odlegoci.
Wartoci cechy wyraanej na skali interwaowej (przedziaowej) s liczbami ze zbioru liczb rzeczywistych (zarwno dodatnich jak i ujemnych).
Zbir wartoci tej cechy nie posiada naturalnej wartoci zerowej; warto
zerow przyjmuje si zwykle umownie. Do cech mierzonych na tej skali
mona zaliczy: temperatur powietrza (wody), wynik finansowy firmy. Dla
wartoci cech wyraonych na tej skali moliwe jest wykonywanie operacji
odejmowania (badanie odlegoci). Na wartociach tej cechy nie mona wykonywa operacji mnoenia i dzielenia.

10

Zygmunt Bobowski

Skala ilorazowa moe by traktowana jako szczeglny przypadek skali


interwaowej, bowiem w przypadku skali ilorazowej wartoci cechy nale
do zbioru liczb rzeczywistych nieujemnych. Skala ta posiada naturalny
punkt zerowy. Do cech wyraanych na tej skali mona zaliczy: wzrost, wag bd wiek czowieka, dochd przypadajcy na 1 osob w rodzinie. Dla
wartoci cech wyraonych na skali ilorazowej dopuszczalne jest stosowanie
wszystkich operacji matematycznych, tj.: stwierdzanie tosamoci obiektw,
ich porzdkowanie, ustalanie odlegoci, okrelanie rwnoci ilorazw.
Zbliona do powyszego podziau jest klasyfikacja cech wedug moliwoci ich pomiaru fizycznego. Wedug tego kryterium wyrnia si:
a) cechy mierzalne, czyli takie ktrych wartoci s wynikiem pomiaru
fizycznego i wyraone s w okrelonych jednostkach miary, np.
wzrost w cm, waga w kg,
b) cechy porednio mierzalne, tzn. cechy ktrych wartoci wyraone s
liczbowo, ale liczby te s jedynie wynikiem oceny (przyporzdkowane
s odpowiednim wyraeniom sownym), np. ocena z egzaminu, nota
sdziowska w skokach narciarskich,
c) cechy niemierzalne, czyli cechy ktrych wartoci s wyraane sownie, np. pe, pochodzenie spoeczne, marka samochodu.
Ze wzgldu na liczebno zbioru wartoci cechy wyrnia si:
a) cechy stae, dla ktrych zbir wartoci jest jednoelementowy; innymi
sowy kademu obiektowi badanej zbiorowoci przypisywana jest ta
sama warto cechy. Niekiedy wrd nich wyrnia si dodatkowo
cechy stae rzeczowe, czasowe i przestrzenne umoliwiajce precyzyjne zdefiniowanie jednostki i zbiorowoci statystycznej dla okrelonego badania. Cechy te odpowiadaj zakresowi rzeczowemu, czasowemu i przestrzennemu badania.
b) cechy zmienne, dla ktrych zbir wartoci jest co najmniej dwuelementowy. Cechy te stanowi przedmiot bada statystycznych.
Wrd cech zmiennych dokonuje si zwykle dalszego ich podziau z
punktu widzenia podanego wyej kryterium i wyrnia si dodatkowo:
1) dla cech opisowych:
a) cechy dwuwariantowe (zero-jedynkowe) np. pe,
b) cechy wielowariantowe, np. poziom wyksztacenia, zawd,
2) dla cech liczbowych:
a) cechy skokowe (dyskretne); posiadaj one przeliczalny zbir wartoci zawierajcy si w zbiorze liczb naturalnych (liczby cakowite nieujemne), np. liczba osb w rodzinie,
b) cechy cige, ktrych zbir wartoci jest nieprzeliczalny i naley
do zbioru liczb rzeczywistych; wartoci takiej cechy s nieskoczenie podzielne i mog by wyraane z dowolnie du dokadnoci, np. wzrost, wiek, waga.
Z punktu widzenia znaczenia poszczeglnych cech dla okrelonego badania wyrnia si:
a) cechy istotne ze wzgldu na sformuowany cel badawczy,
b) cechy nieistotne, ktre w badaniu mog by pominite.
Biorc pod uwag wpyw cechy na poziom rozwoju obiektw, gdy celem badania jest hierarchiczne porzdkowanie obiektw, wyrnia si:

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

a)
b)
Wrd
a)

11

cechy preferencyjne,
cechy neutralne.
cech preferencyjnych wyodrbnia si dodatkowo cechy:
stymulanty tzn. takie cechy ktrych wzrost wartoci powoduje
wzrost poziomu rozwoju obiektu (cechy te pobudzaj, stymuluj
rozwj obiektu); najkorzystniejsz wartoci takiej cechy jest jej
warto maksymalna, za najmniej korzystn warto minimalna,
b) destymulanty, czyli cechy, ktrych wzrost wartoci jest niekorzystny
dla oceny poziomu rozwoju obiektu; najkorzystniejsz jej wartoci
jest warto minimalna, za najmniej korzystn warto maksymalna,
c) nominanty, czyli cechy dla ktrych wzrost wartoci do wielkoci nominalnej jest korzystny z punktu widzenia badanego obiektu, natomiast ich dalszy wzrost staje si niekorzystny. Wartoci optymaln
w tym przypadku jest warto nominalna.
Cechy neutralne, z uwagi na ich charakter, mog by pominite w zestawie cech stanowicych podstaw hierarchicznego porzdkowania obiektw.
Kolejn istotn czynnoci w fazie wstpnej badania statystycznego jest
wybr jednej z dwch metod badania statystycznego, tj. badania cakowitego (wyczerpujcego) lub badania czciowego. Badanie cakowite obejmuje
ca zbiorowo statystyczn, a wic daje ono bardzo precyzyjny i wiarygodny jej opis. Ta metoda badania winna by szczeglnie preferowana.
W praktyce czsto mamy jednak do czynienia z sytuacjami, w ktrych
z rnych wzgldw nie ma moliwoci zbadania wszystkich elementw
tworzcych cakowit zbiorowo statystyczn (inaczej zwan populacj generaln) i jedyn moliwoci jej poznania jest zbadanie tylko jej czci
(tzw. prby statystycznej). W zwizku z powysz sytuacj zachodzi konieczno wnioskowania o caej zbiorowoci na podstawie wynikw uzyskanych dla prby. Mona wymieni kilka powodw, dla ktrych prowadzone
s badania czciowe:
badanie moe mie charakter niszczcy, np. badania jakociowe niektrych wyrobw; badanie caej populacji byoby rwnoznaczne z jej zniszczeniem,
badana populacja moe by bardzo liczna lub nieskoczenie liczna,
badanie cakowite moe by zbyt kosztowne lub zbyt czasochonne,
badanie czciowe gwarantuje wysz aktualno wynikw,
badanie czciowe - w niektrych przypadkach - jest jedynym moliwym, np. badanie krwi pacjentw,
badanie czciowe gwarantuje wysz rzetelno, poniewa moe by
zrealizowane mniejszym zespoem przeszkolonych fachowcw; istnieje
moliwo kontroli ich pracy.
Niezalenie od wybranej metody badania statystycznego istotnym problemem jest dobr techniki gromadzenia informacji. Musi ona gwarantowa
wysoki stopie wiarygodnoci gromadzonych informacji. Podstawowym rdem informacji jest wszelkiego rodzaju sprawozdawczo statystyczna prezentowana na rnym poziomie agregacji danych (np. kraju, wojewdztwa,

12

Zygmunt Bobowski

powiatu, gminy, przedsibiorstw, instytucji). Udostpniane danych w takim


przypadku odbywa si gwnie w formie rocznikw statystycznych bd
rnego rodzaju sprawozda.
W praktyce bada socjologicznych szczeglne znaczenie naley przypisa badaniom ankietowym jako formie gromadzenia informacji. Ankieta
stanowi zbir odpowiednio sprecyzowanych pyta sucych realizacji okrelonego celu badania. Zasadnicze problemy zwizane z tego typu badaniami
dotycz w szczeglnoci:
a) liczby i treci pyta zawartych w ankiecie,
b) sposobu przeprowadzenia badania ankietowego,
c) wyboru grupy respondentw tj. osb ankietowanych.
Ankieta skada si zwykle z dwch zasadniczych czci, tj. metryczki
i czci merytorycznej. Metryczka stanowi istotny element ankiety, poniewa
pozwala klasyfikowa zbiorowo respondentw wedug rnych kryteriw
i prowadzi analiz uzyskanych wynikw badania ankietowego w ramach
wyodrbnionych podzbiorowoci respondentw. Najczciej w metryczce
uwzgldnia si takie cechy respondentw jak: pe, stan cywilny, wiek, poziom wyksztacenia, miejsce zamieszkania, wykonywany zawd. Naley jednak wyranie zaznaczy, e sposb gromadzenia tych danych winien zapewnia anonimowo respondenta.
Druga cz ankiety zawiera zestaw pyta dotyczcych okrelonego zagadnienia. Waciwe skonstruowanie tej czci ankiety stanowi podstawowy
warunek powodzenia przeprowadzanego badania. Nie moe by ona zbyt
obszerna, poniewa moe zniechca respondentw do poddania si badaniu ankietowemu (zwaszcza w przypadku, gdy badanie ma by prowadzone
w formie sondau ulicznego). Projektujc merytoryczn cz ankiety naley przestrzega nastpujcych zasad:
1) pytania winny by jasno, jednoznacznie i prosto sformuowane,
2) pytania winny by umieszczone w logicznej kolejnoci,
3) winny umoliwia udzielenie precyzyjnej odpowiedzi, w miar moliwoci liczbowej,
4) pytania natury osobistej winny by bardzo taktowne.
Umieszczone w ankiecie pytania mog mie charakter zamknity lub
otwarty. W pierwszym przypadku, do pytania doczony jest rozczny
i wyczerpywalny zestaw odpowiedzi. Odpowiedzi te mog by ujte w formie:
a) alternatywy (dwch wykluczajcych si moliwoci),
b) zamknitego zestawu wielu moliwych odpowiedzi,
c) zestawu potwartego, gdy oprcz podanego zestawu odpowiedzi respondent ma moliwo dopisania innych moliwoci,
d) odpowiedzi skali, gdy respondent dokonuje oceny natenia zachowa, pogldw, opinii (skala taka moe mie charakter liczbowy
bd porzdkowy).
W drugim przypadku respondent ma pen swobod formuowania odpowiedzi.
Wybr zamknitej formy pyta znacznie uatwia respondentom udzielanie na nie odpowiedzi, jak rwnie istotnie uatwia opracowanie zgromadzonego materiau badawczego, tj. kodowanie odpowiedzi, analiz wynikw
badania. Otwarta forma pyta daje respondentom wiksz swobod w for-

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

13

muowaniu odpowiedzi, jednak znacznie utrudnia ona opracowanie i analiz zebranych informacji. Tej formy pyta nie zaleca si umieszcza w ankietach, ktre nie bd realizowane w postaci kontaktu bezporedniego ankietera z respondentem.
Opracowany formularz ankiety winien by przetestowany w badaniu pilotaowym na niewielkiej prbie 30 50 osb. Badanie takie pozwala zweryfikowa poprawno postawionych pyta jak rwnie zamieszczonych wariantw odpowiedzi.
Waciwe badanie ankietowe moe by realizowane w rnych formach
kontaktw z respondentami. K. Mazurek-opaciska wyrnia nastpujce
metody przeprowadzenia badania ankietowego:
a) wywiad bezporedni,
b) ankieta telefoniczna,
c) ankieta pocztowa,
d) ankieta prasowa,
e) ankiety rozdawane.
Zalet pierwszej z metod jest gwarancja prawidowego zrozumienia
przez respondenta treci poszczeglnych pyta (zwaszcza, gdy ich tre
moe budzi wtpliwoci) i waciwego sformuowania odpowiedzi. W takim
przypadku z powodzeniem mona wykorzystywa ankiety, w ktrych zastosowano otwart form pyta. Ten sposb gromadzenia ankiet pozwala na
bieco kontrolowa ilo i jako zgromadzonego materiau badawczego.
W przypadku pozostaych metod, a zwaszcza pocztowej, prasowej i ankiet
rozdawanych naley liczy si z moliwoci wystpienia niewielkiej zwrotnoci ankiet, jak rwnie z przypadkami bdnie wypenionych kwestionariuszy.
Badania ankietowe maj najczciej charakter bada czciowych
i w zwizku z tym pojawia si problem doboru respondentw. Wytypowana
grupa respondentw winna by reprezentatywna dla caej populacji, o czym
decyduj dwa zasadnicze czynniki:
a) metoda doboru jednostek prby,
b) liczebno tej prby.
W literaturze wymienia si nastpujce sposoby pobierania prby:
a) dobr arbitralny jest to metoda subiektywna; jednostki do prby s typowane przez ekspertw bd ankieterw. W ramach tej metody mona dodatkowo wyodrbni:
- dobr kwotowy, ktrego celem jest uzyskanie prby o strukturze identycznej jak caa populacja potencjalnych respondentw. Po ustaleniu liczebnoci prby dokonuje si doboru okrelonych kwot respondentw
gwarantujcych uzyskanie odpowiedniej jej struktury,
- losowanie wedug wygody stosowane gwnie w badaniach marketingowych; przeprowadzane jest na grupach konsumentw okrelonych
towarw,
- losowanie metod przechwytywania respondentw po drodze badanie odbywa si na grupie respondentw wybieranych losowo spord
przechodniw, klientw sklepu itp.,
b) dobr losowy, gdy maj zastosowanie okrelone schematy pobierania
prb losowych, jak np. losowanie indywidualne (ograniczone i nieograni-

14

Zygmunt Bobowski

czone), losowanie warstwowe, losowanie systematyczne, losowanie wielostopniowe. Schematy te zostay dokadniej scharakteryzowane w rozdziale V.
O reprezentatywnoci prby decyduje rwnie jej liczebno. Im wiksza
jest liczba zgromadzonych ankiet tym bardziej wiarygodne dla caej populacji s wyniki bada. Pojawia si zatem problem ustalenia minimalnej liczebnoci prby. Analiza zgromadzonego drog ankietow materiau opiera
si zwykle na odpowiednio skonstruowanych tablicach uwzgldniajcych
struktur respondentw ze wzgldu na wyodrbnione kryteria (nastpuje
tym samym podzia tej zbiorowoci na podgrupy). Im wiksza jest liczba
wyodrbnianych podgrup, tym liczniejsza winna by grupa respondentw
objtych badaniem. O liczebnoci populacji respondentw decyduje rwnie
zasig bada (lokalny, regionalny bd krajowy). Im jest on wikszy tym
wiksza winna by losowana prba respondentw. W teorii bada ankietowych podaje si rne zalecenia dotyczce wielkoci populacji objtych takimi badaniami. Jedn z propozycji uzaleniajc wielko populacji respondentw od zasigu bada i liczby wyodrbnionych podgrup zawiera
ponisze zestawienie.
Liczba wyodrbnionych
podgrup
do 9
10 30
powyej 30

Liczba jednostek w badaniu o zasigu


krajowym
regionalnym
1000 1500
200 500
1500 2500
500 1000
powyej 2500
powyej 1000

Inna propozycja nakazuje, by populacja bya na tyle liczna, aby liczebnoci najwaniejszych dla analizy komrek tablicy wynosiy 100, a mniej
wanych od 20 do 50.
Waciwie zaprojektowane badanie statystyczne stanowi podstawowy
warunek uzyskania wiarygodnych jego wynikw. Wymienione wyej metody
opisu i wnioskowania statystycznego s przedmiotem rozwaa w kolejnych
rozdziaach niniejszego opracowania.

PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI

SERIA:
NAUKI SPOECZNE

Rozdzia II

Metody opisu zbiorowoci


statystycznej

2.1. OPIS TABELARYCZNY


Zgromadzony w ramach drugiego etapu badania statystycznego zbir
danych ma posta szeregu szczegowego, nieuporzdkowanego; tym samym jest mao przejrzysty, chaotyczny. Podejmowane w tej fazie czynnoci
w pierwszej kolejnoci zmierzaj do jego uporzdkowania. W przypadku
cech opisowych dokonuje si najczciej jego pogrupowania wedug wariantw tej cechy, za w przypadku cech liczbowych polega ono zwykle na uporzdkowaniu realizacji cechy od najniszej do najwyszej. Prowadzi to do
uzyskania szeregu uporzdkowanego. W przypadku licznych zbiorowoci
taka posta materiau statystycznego jest do obszerna, co moe znacznie
utrudni jego dalsz analiz. Problem ten mona rozwiza tworzc szeregi
rozdzielcze, w ktrych badana zbiorowo dzielona jest na okrelon liczb
klas na podstawie wartoci badanej cechy i kadej z klas zostaje przyporzdkowana odpowiednia liczba jednostek statystycznych. Szeregi rozdzielcze mog mie posta szeregu punktowego bd przedziaowego.
W szeregu rozdzielczym punktowym kada klasa zawiera tylko jedn
warto cechy (opisowej bd liczbowej) i w zwizku z tym szereg taki posiada tyle klas, ile wariantw cechy wystpuje w zgromadzonym materiale
statystycznym. W szeregu z przedziaami klasowymi dokonuje si grupowania wartoci cechy w przedziay klasowe okrelajc ich doln i grn
granic. Szeregi z przedziaami klasowymi s najczciej tworzone dla cech
liczbowych o charakterze cigym, chocia naley zaznaczy, i przedziay
takie mona rwnie utworzy dla cech liczbowych skokowych, a nawet
opisowych.
Budowa szeregu z przedziaami klasowymi wymaga rozstrzygnicia nastpujcych kwestii:
a) ile klas winno by utworzonych?
b) jaka winna by ich wielko (rozpito)?

16

Zygmunt Bobowski

c) jak winny by ustalone (zamknite) granice przedziaw?


Przy podejmowaniu decyzji o liczbie klas naley mie na uwadze, i nie
ma w teorii statystyki jednoznacznych wskaza w tym zakresie. Formuowane s jedynie pewne zalecenia, by liczba klas nie bya ani zbyt dua, ani
zbyt maa i bya uzaleniona gwnie od liczebnoci zbiorowoci. Zgodnie
z t sugesti wielu autorw proponuje wyznacza orientacyjn (przyblion)
liczb klas wedug wzoru:

2.1.

gdzie:
k przybliona liczba klas,
N liczebno badanej zbiorowoci.
Uzyskan wedug powyszej formuy liczb klas naley traktowa jako
orientacyjn, a rzeczywista liczba klas moe by o jedn nisza bd wysza
od wielkoci k. Takie postpowanie odnosi si do cech liczbowych cigych,
w przypadku cech liczbowych skokowych bd opisowych o liczbie klas decyduje gwnie liczba wariantw cechy.
Przy okrelaniu wielkoci przedziaw klasowych naley dy by klasy
te posiaday jednakow rozpito, gdy znacznie uatwia to dalsz analiz
ujtego w szeregu materiau statystycznego jak rwnie wyznaczanie niektrych parametrw statystycznych. Naley rwnie zwrci uwag, by w
szeregu nie wystpoway klasy puste, tzn. klasy, dla ktrych nie mona
przyporzdkowa adnej jednostki statystycznej. Uwzgldniajc powysze
zastrzeenia przyblion wielko przedziaw klasowych (h) mona ustali
wedug formuy:

R( x)
k

2.2.

gdzie:
R(x) rozpito wartoci cechy obliczona wedug wzoru
R( x) = xmax xmin ,
k przyjta liczba klas.
Taka regua postpowania bdzie miaa miejsce w przypadku cech cigych. W przypadku cech opisowych bd liczbowych skokowych rwna
rozpito klas bdzie oznaczaa jednakow liczb wariantw cechy w kadej klasie.
Konieczno okrelenia zasad zamykania poszczeglnych klas odnosi
si do cech cigych. Przyjmuje si, i kada z klas musi by jednostronnie
zamknita (z gry bd z dou), co powoduje, e s one rozczne i umoliwiaj jednoznaczne przyporzdkowanie poszczeglnych jednostek statystycznych konkretnym przedziaom.
Skonstruowany szereg rozdzielczy (zarwno punktowy jak i przedziaowy) moe mie posta szeregu liczebnoci (prostej), liczebnoci skumulowanej, czstoci (prostej) bd czstoci skumulowanej. W szeregu liczebnoci

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

17

bd czstoci kadej klasie zostaje przyporzdkowana okrelona liczba


jednostek statystycznych lub ich udzia (najczciej wyraony w procentach) w caej zbiorowoci. W szeregach skumulowanych kadej klasie przyporzdkowana jest odpowiadajca jej liczebno bd czsto skumulowana.
Procedur tworzenia szeregw z przedziaami klasowymi zilustrujemy
na poniszych przykadach.
Przykad 2.1
Zbiorowo pracownikw pewnej firmy scharakteryzowano ze wzgldu
na poziom wyksztacenia i uzyskano nastpujce dane: wysze, podstawowe, rednie, rednie, zasadnicze zawodowe, podstawowe, niepene podstawowe, rednie, wysze, policealne, wysze, rednie, zasadnicze zawodowe,
podstawowe, podstawowe, rednie, rednie, wysze, rednie, podstawowe,
wysze, wysze, rednie, rednie, podstawowe, podstawowe, wysze, niepene podstawowe, podstawowe, policealne
Dokona grupowania badanej zbiorowoci wedug poziomu wyksztacenia.
Uzyskane wyniki skomentowa.
Rozwizanie.
Zgromadzony materia statystyczny ma posta szeregu szczegowego
nieuporzdkowanego. Grupowania dokonamy ujmujc podane informacje
w postaci szeregu rozdzielczego punktowego. W szeregu tym kademu poziomowi wyksztacenia przyporzdkujemy odpowiedni liczb pracownikw.
Efekt tego grupowania ujto w kolumnie 2. poniszej tablicy roboczej.
W kolumnie 3. utworzono szereg liczebnoci skumulowanej. W kolumnach
4. i 5. umieszczono szeregi czstoci i czstoci skumulowanej. Czsto
wyznaczono jako udzia procentowy pracownikw o okrelonym poziomie
wyksztacenia w caej populacji pracownikw.
Poziom
wyksztacenia

Liczba
pracownikw

( xi )

( ni )

Liczba
pracownikw
skumulowana
(cum

ni )

Czsto w %
(

fi )

Czsto skumulowana w %
(cum

fi )

niepene podstawowe
podstawowe
zasadnicze zawodowe
rednie
policealne
wysze
Razem

6,67

6,67

8
2

10
12

26,66
6,67

33,33
40,00

9
2
7
30

21
23
30
X

30,00
6,67
23,33
100,00

70,00
76,67
100,00
X

Mona rwnie dokona innego grupowania tworzc klasy (przedziay) jak w


kolejnej tabeli:

18

Poziom
wyksztacenia
Niepene podstawowe
i podstawowe
Zasadnicze
zawodowe
i rednie
Policealne
i wysze
Razem

Zygmunt Bobowski

Liczba
pracownikw

Liczba
pracownikw
skumulowana

Czsto
w%

Czsto
skumulowana
w%

10

10

33,33

33,33

11

21

36,67

70,00

30

30,00

100,00

30

100,00

W badanej zbiorowoci w podobnym stopniu dominuj pracownicy


o wyksztaceniu: podstawowym (26,66% badanej zbiorowoci), rednim
(30% badanej grupy) i wyszym (23,33% badanej populacji).
Przykad 2.2
Dla wylosowanej grupy 25 gospodarstw domowych zebrano informacje
dotyczce wysokoci dochodu (w z) przypadajcego na 1 osob. Uzyskano
nastpujce dane: 201,50; 556,10; 220,00; 820,40; 482,50; 339,60; 682,40;
398,40; 238,70; 180,50; 627,40; 421,60; 354,50; 289,70; 645,00; 654,30;
728,60; 453,90; 678,20; 721,00; 804,50; 487,60; 564,70; 732,40; 810,00.
Powysze informacje uj w postaci szeregu rozdzielczego z przedziaami
klasowymi. Uzyskane wyniki skomentowa.
Rozwizanie.
Zauwamy, i badana cecha ma charakter cechy liczbowej cigej
i w takim przypadku nie tworzy si zazwyczaj szeregw rozdzielczych punktowych. Procedur budowy szeregu przedziaowego przeprowadzimy zgodnie
z podanymi wyej wskazwkami. W pierwszej kolejnoci dokonujemy ustalenia liczby klas wedug wzoru 2.1. Otrzymujemy k = 5, co oznacza, i liczba
klas winna wynosi okoo piciu (mona rozwaa wariantowo liczb klas
od 3 5). Przyjmijmy liczb klas rwn 5. W dalszej kolejnoci celem wyznaczenia rozpitoci klas (zakadamy, e wszystkie klasy bd posiaday
identyczn rozpito) ustalamy rozpito wartoci badanej cechy; warto
minimalna ( xmin ) wynosi 180,50 z, za warto maksymalna ( xmax )
820,40 z, co daje nam rozpito wynoszc 639,90 z (820,40 180,50).
Zgodnie z wzorem 2.2. uzyskujemy dla kadej z 5 klas rozpito 128 z
(dokadnie 127,98 z, ale ze wzgldw praktycznych dokonuje si zwykle jej
zaokrglenia w gr). Przyjmijmy rwnie, i kada z klas bdzie zamknita lewostronnie. W ten sposb otrzymamy przedziay klasowe ujte w poniszej tabeli roboczej, a po zakwalifikowaniu wartoci cechy do okrelonych
przedziaw ujte w kolejnych kolumnach rozkady: liczebnoci i czstoci
oraz liczebnoci i czstoci skumulowanej.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

Dochd na 1
osob w z
( xi )
<180,50
308,50)
<308,50
436,50)
<436,50
564,50)
<564,50
692,50)
<692,50
820,50)
Razem

19

Liczba
gospodarstw
( ni )

Skumulowana
liczba
gospodarstw
(cum ni )

Czsto
w%
( fi )

Czsto
skumulowana w %
(cum f i )

20,00

20,00

16,00

36,00

13

16,00

52,00

19

24,00

76,00

25

24,00

100,00

25

100,00

Na podstawie powyszej tabeli mona sformuowa nastpujce wnioski:


a) wystpuje brak wyranej dominacji gospodarstw o okrelonej wielkoci dochodw,
b) blisko poow badanych gospodarstw charakteryzuj dochody na
osob przekraczajce 564 z, w przypadku pozostaych dochd na
osob jest niszy od tej wielkoci,
c) najmniej liczne s gospodarstwa z przedziaw dochodowych 308,50
436,50 z i 436,50 564,50 z.
Zaprezentowane wyej szeregi statystyczne mona zaliczy do tzw. szeregw strukturalnych, umoliwiaj one bowiem okrelenie struktury badanej zbiorowoci ze wzgldu na przyjt cech statystyczn. Zazwyczaj prezentuj one t struktur w okrelonym momencie czasowym, co oznacza
statyczne ujcie badanej zbiorowoci. Odmian szeregw strukturalnych
stanowi szeregi przestrzenne, w ktrych struktura zbiorowoci okrelana
jest w oparciu o jej terytorialne rozmieszczenie. Ten typ szeregu ilustruje
tablica 2.1.
Tablica 2.1. Banki ogem w krajach Unii Europejskiej w 1994 r.
Kraj
Belgia
Dania
Francja
Grecja
Hiszpania
Irlandia
Niemcy
Wielka Brytania
Wochy

Liczba bankw
131
174
1468
49
217
48
1212
486
258

rdo: W. Jaworski: Banki polskie warunki przetrwania. Warszawa 1997

20

Zygmunt Bobowski

W literaturze wyodrbnia si dodatkowo szeregi: dynamiczne (chronologiczne, czasowe) obrazujce ksztatowanie si badanego zjawiska w czasie3.
Przykad takiego szeregu zawiera tablica 2.2.
Tablica 2.2. Przewozy pasaerw kolej w Polsce w latach 1990
1996
Lata
1990
11991
1992
1993
1994
1995
1996

Liczba pasaerw
(w mln osb)
787,5
650,2
548,1
540,1
493,7
465,1
433,5

rdo: Rocznik Statystyczny GUS 1997. Warszawa: GUS. 1997

Podane wyej przykady dotycz prezentacji tabelarycznej badanej zbiorowoci opisywanej ze wzgldu na jedn cech statystyczn. Badania statystyczne mog obejmowa rwnie przypadki jednoczesnego opisu zbiorowoci ze wzgldu na dwie bd wiksz liczb cech. W takim przypadku opis
tabelaryczny bdzie polega na ujciu zebranego materiau statystycznego w
postaci tablicy zoonej (w odrnieniu od niej szereg statystyczny bywa
rwnie okrelany mianem tablicy prostej). Sytuacja ta czsto ma miejsce,
gdy dokonuje si opracowania materiau zgromadzonego w trakcie bada
ankietowych. W tabelach prezentujcych wyniki takich bada dokonuje si
zwykle skorelowania uzyskanych odpowiedzi na poszczeglne pytania z
okrelonymi cechami respondentw (np. ich pci, wiekiem, miejscem zamieszkania).
Waciwie skonstruowana tablica winna skada si z tytuu, makiety
tablicy oraz rda danych. Tytu tablicy winien precyzyjnie okrela badan
zbiorowo pod wzgldem rzeczowym, czasowym i przestrzennym oraz zawiera ujte w tablicy cechy statystyczne; innymi sowy winien odpowiada
na nastpujce pytania: co stanowi opisywan zbiorowo statystyczn?;
jakiego momentu bd przedziau czasowego dotyczy badanie?; z jakiego
obszaru pochodzi badana zbiorowo?; jakie cechy statystyczne zbiorowoci
ujto w tablicy?
Makieta tablicy (zwana rwnie tablic waciw) skada si z wierszy i
kolumn oraz ich tytuw (tytuy wierszy okrela si boczkiem tablicy, za
tytuy kolumn gwk tablicy). Wntrze tablicy, czyli pola znajdujce si
na skrzyowaniach poszczeglnych wierszy i kolumn s wypeniane zgromadzonym materiaem statystycznym. Naley tu zaznaczy, i kade pole
tablicy musi by bezwzgldnie wypenione. Jeli z rnych wzgldw nie ma
moliwoci wypenienia pola tablicy danymi liczbowymi wwczas wykorzystywane s odpowiednie znaki umowne. Nale do nich nastpujce znaki:
3

Ten typ szeregw bdzie przedmiotem szczegowej analizy w rozdziale IV

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

21

oznacza, e zjawisko nie wystpuje,


oznacza zupeny brak informacji lub brak informacji wiarygodnych,
0 (zero)
oznacza, e zjawisko wystpuje w niewielkich ilociach (mniej ni 50% przyjtej jednostki miary),
(ukony krzyyk) oznacza, e wypenienie danego pola ze wzgldu
na ukad tablicy jest niemoliwe bd niecelowe,
(pusty trjkt)
oznacza, e nazwy zostay skrcone w stosunku
do obowizujcej klasyfikacji,
(peny trjkt)
oznacza, e dane nie mog by opublikowane ze
wzgldu na konieczno zachowania tajemnicy
statystycznej,
w tym
oznacza, e nie podaje si wszystkich skadnikw
sumy.
Bezporednio pod tablic umieszcza si rdo danych zawartych w tablicy. rdo takie mog stanowi: rocznik statystyczny, wyniki spisu, badania wasne, sprawozdawczo firmy bd instytucji, itp. Ilustracj prawidowo skonstruowanej tablicy opisujcej zbiorowo studentw ze wzgldu
na trzy cechy jest ponisza tablica 2.3.
(kreska)
. (kropka)

Tablica 2.3. Studenci Wyszej Szkoy Pedagogicznej w Warszawie


wedug pci, wieku i miejsca zamieszkania (stan na
30.09.2003 r.)
Wiek w latach
Wyszczeglnienie
Kobiety
Mczyni
Woj. MazoKobiety
wieckie
Mczyni
Inne wojeKobiety
wdztwa
Mczyni
Razem
Warszawa

19 21

21 23

23 25

211
122
187
142
45
67
774

185
252
124
95
32
15
703

321
87
97
48
25
578

Razem
717
461
408
285
102
82
2055

rdo: Badania wasne

2.2. GRAFICZNY OPIS ZBIOROWOCI STATYSTYCZNEJ


Opis graficzny polega na prezentacji zgromadzonego materiau statystycznego ujtego w formie szeregw statystycznych w postaci rnego rodzaju wykresw statystycznych. Ta forma opisu statystycznego nie funkcjonuje zazwyczaj samodzielnie. Wykresy stanowi zwykle ilustracj materiau statystycznego ujtego w postaci szeregw bd tablic i ich zadaniem
jest pogldowa prezentacja treci tablic umoliwiajca wstpn, pobien

22

Zygmunt Bobowski

ocen prawidowoci wystpujcych w badanej zbiorowoci. Do najczciej


wykorzystywanych form graficznych zalicza si wykresy: powierzchniowe,
liniowe, bryowe, obrazkowe, mapowe i kombinowane. Ich dobr uzaleniony jest od typu szeregu, ktry ma by zaprezentowany graficznie oraz od celu, jakiemu ma on suy.
Wykresy powierzchniowe su gwnie do prezentacji szeregw strukturalnych. Wykorzystywane s tu takie figury geometryczne jak: prostokty,
kwadraty, koa. Na podstawie danych ujtych w szeregu statystycznym nastpuje podzia powierzchni tych figur na czci proporcjonalnie do struktury badanego zjawiska. W praktyce najczciej wykorzystywany jest wykres supkowy zwany rwnie histogramem, ktry jest umieszczany zazwyczaj w ukadzie wsprzdnych. Na osi odcitych nanoszone s wartoci cechy (zarwno liczbowej jak i opisowej), a na osi rzdnych liczebnoci bd
czstoci odpowiadajce poszczeglnym wariantom cechy. W zalenoci od
typu ilustrowanego szeregu moe to by histogram liczebnoci bd czstoci prostej lub skumulowanej. Wykresy 2.1 i 2.2 stanowi ilustracj tego
typu prezentacji graficznych.
Wykresy liniowe (diagramy) s najczciej wykorzystywane do prezentacji szeregw czasowych. Wykres tego typu umieszczany jest w ukadzie
wsprzdnych, gdzie na osi odcitych odkadane s poszczeglne jednostki
czasu, za na osi rzdnych odmierzane s wielkoci badanego zjawiska. Ilustruje to wykres 2.3.
Wykresy punktowe posiadaj zastosowanie podobne do wykresw liniowych, a wic mog suy ilustracji szeregw czasowych (por. wykres 2.4)
Wykresy bryowe peni podobn rol jak wykresy powierzchniowe.
W tym przypadku poziom zjawiska ewentualnie jego struktura prezentowana jest przy wykorzystaniu bry (np. szecianu, prostopadocianu, kuli).
Ten typ prezentacji graficznej ilustruje wykres 2.5.
Wykresy kombinowane stanowi kompilacj wymienionych typw wykresw, np. wykresu powierzchniowego i liniowego, obrazkowego i mapowego itp. (por. wykres 2.6)
Wykresy mapowe (kartogramy) su do prezentacji przestrzennego
rozmieszczenia badanego zjawiska. Wielko badanego zjawiska (jego natenie) na poszczeglnych obszarach moe by ukazywana poprzez rozmieszczenie odpowiednich symboli o zrnicowanej wielkoci, stosowanie
zabarwie o okrelonych kolorach lub okrelonego typu zakreskowania.
Wykresy tego typu wymagaj zwykle zamieszczenia legendy objaniajcej
zastosowan symbolik. Ilustruje to wykres 2.7.
Wykresy obrazkowe prezentuj wielko badanego zjawiska za pomoc
odpowiednich symboli graficznych (sylwetek obrazkw prezentujcych badane zjawisko). T form prezentacji ilustruje wykres 2.8.
Naley doda, i w przypadku wykresu, podobnie jak tablicy, naley
umieci jego tytu oraz rdo danych (tym rdem najczciej jest odpowiedni szereg lub tablica statystyczna, na podstawie ktrych zosta on sporzdzony).

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

23

Wykres 2.1.

Ludno miasta Z wg poziomu wyksztacenia


w latach 1999-2002
100%
Udzia w %

80%
Wysze
rednie
Zawodowe
Podstawowe

60%
40%
20%
0%
1999 2000 2001 2002
Lata

rdo: Opracowanie wasne

Wykres 2.2.

Struktura wiekowa mieszkancw miasta "Z"


w 2001 r. (stan na 31.12.)

do 15 lat
15 - 25

powyej 65

25 - 35

55 - 65

35 - 45
45 - 55

rdo: Opracowanie wasne

24

Zygmunt Bobowski

Wykres 2.3.

Rozwj ludnociowy miasta "Z"


w latach 1991-2000 (stan na 31.12)
Liczba mieszkacw (w
tys. osb)

30

25

20

15

10

00
20

99
19

98
19

97
19

96
19

95
19

94
19

93
19

92
19

91
19

Lata

rdo: Opracowanie wasne

Wykres 2.4.

Liczba mieszkancw (w
tys. osb)

Ludno miasta "Z" w latach 1991 - 2000


35
30
25
20
15
10
5
0
1990

1992

1994

1996
Lata

rdo: Opracowanie wasne

1998

2000

2002

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

25
Wykres 2.5

Struktura wiekowa mieszkacw miasta "Z" w 2001 r. (stan na


31.12.)
30
25
20
udzia w % 15
10
5
0

do 15 lat 15 - 25 25 - 35 35 - 45 45 - 55 55 - 65 powyej
65

Wiek
rdo: Opracowanie wasne

Wykres 2.6

Przecitna liczba
zapomg

Przecitna liczba zapomg na jednego


bezrobotnego
w miecie "Z" w latach 1991-2000
5
4
3
2
1
0
00
20

99
19

98
19

97
19

rdo: Opracowanie wasne

96
19

95
19

94
19

93
19

92
19

91
19

Lata

26

Zygmunt Bobowski

Wykres 2.7
Rozmieszczenie szk z klas w Polsce we wrzeniu 2003 r.

rdo: Gazeta Wyborcza z 14 padziernika 2003 r.

Rys. 2.8
Przecitna roczna liczba wypalanych papierosw
przez mieszkacw miasta Z w latach 2000-2002
Lata

2002

2 001

200 0

Lic zba wypal anych pa pierosw


1000

1500

rdo: opracowanie wasne

2000

2500

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

27

2.3. PARAMETRYCZNY OPIS ZBIOROWOCI STATYSTYCZNEJ


2.3.1. Istota i klasyfikacja parametrw i momentw statystycznych
Opis parametryczny stanowi jeden z najczciej wykorzystywanych sposobw opisu rozkadu cechy statystycznej gwnie z uwagi na jego syntetyczn i skrcon posta. Ta forma opisu wykorzystuje parametry statystyczne, tj. charakterystyki liczbowe opisujce rozkad wartoci badanej cechy w szeregu statystycznym. Przy ich pomocy dokonujemy opisu okrelonych wasnoci analizowanego zbioru wartoci cechy. Opis tych wasnoci
moe obejmowa:
a) okrelenie redniego poziomu zbioru wartoci cechy, czyli wybr pojedynczej wartoci cechy reprezentujcej cay zbir analizowanych
wartoci; ma tu zastosowanie grupa parametrw zwanych miarami
rednimi i pooenia,
b) okrelenie poziomu zrnicowania (zmiennoci) analizowanego zbioru wartoci cechy, do czego wykorzystywane s parametry zmiennoci (rozproszenia),
c) okrelenie poziomu odchylenia analizowanego rozkadu wartoci cechy od rozkadu symetrycznego; badanie tej wasnoci dokonywane
jest przy pomocy miar skonoci,
d) okrelenie poziomu skupienia bd nierwnomiernoci rozoenia
wartoci cechy mierzone przy pomocy miar koncentracji,
e) okrelenie rozmieszczenia realizacji wartoci cechy w analizowanym
zbiorze poprzez wyznaczenie odpowiednich momentw statystycznych.
Jak wynika z powyszego zestawienia do badania wasnoci ujtych w
punktach a - d wykorzystywane s odpowiednie grupy parametrw statystycznych (ich szczegowa charakterystyka zostanie dokonana w dalszej
czci tego podrozdziau), za wasno e badana jest przy pomocy momentw statystycznych.
Momenty statystyczne s czsto wykorzystywanymi charakterystykami
rozkadw cechy statystycznej. Wrd nich wyrnia si dwie podstawowe
grupy:
a) momenty zwyke, ktre s rednimi odchyle wartoci cechy od
punktu zerowego podniesionych do potgi k; ich ogln posta mona wyrazi wzorem:
l

M k ( x) =
gdzie:

( x i 0 )k n i
i =1

k
i

ni

i =1

M k ( x) oznacza moment zwyky rzdu k,


i = 1, 2, , l warianty (klasy) cechy X

2.3

28

Zygmunt Bobowski

b) momenty centralne, ktre s rednimi odchyle wartoci cechy od


ich redniej arytmetycznej podniesionych do potgi k; ich ogln posta wyraa wzr:
l

mk ( x ) =
gdzie:

(x
i =1

x ) ni
k

2.4.

mk ( x) - oznacza moment centralny rzdu k.

Celowa wydaje si prezentacja wybranych momentw statystycznych.


I tak wrd momentw zwykych:
a) moment zwyky rzdu pierwszego jest miar redni i nosi nazw
redniej arytmetycznej:
x
l

M 1 (x ) =

x n
i

i =1

= x,

b) moment zwyky rzdu drugiego jest redni kwadratw wartoci cechy:


l

M 2 (x ) =
c)

2
i

ni

i =1

moment zwyky rzdu trzeciego jest redni szecianw wartoci cechy:


l

M 3 (x ) =

ni

i =1

Wrd momentw centralnych:


a) moment centralny rzdu pierwszego jest zawsze rwny zero na mocy
jednej z wasnoci redniej arytmetycznej:
l

m1 ( x ) =

(x

i =1

x ) ni

=0

b) moment centralny rzdu drugiego jest miar rozproszenia wartoci


cechy i nosi nazw wariancj:
l

m2 ( x ) =
c)

(x
i =1

x ) ni
2

= s 2 ( x)

moment centralny rzdu trzeciego jest wykorzystywany do pomiaru


skonoci w rozkadzie wartoci cechy:

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

29
l

m3 ( x ) =

(x
i =1

x ) ni
3

d) moment centralny rzdu czwartego (w postaci standaryzowanej) wykorzystywany jest do pomiaru spaszczenia rozkadu wartoci cechy:
l

m4 ( x ) =

(x
i =1

x ) ni
4

Naley doda, i momenty statystyczne mog by ustalane zarwno dla


szeregw szczegowych jak i rozdzielczych liczebnoci i czstoci. Jak wynika z tej krtkiej prezentacji momenty statystyczne znajduj szerokie zastosowanie w badaniach statystycznych, a znaczna ich cz peni rol parametrw statystycznych.
2.3.2. Miary rednie i pooenia
Ta grupa miar wykorzystywana jest do opisu przecitnego poziomu analizowanego zbioru wartoci cechy. Miary te wskazuj warto najlepiej charakteryzujc wszystkie realizacje wystpujce w szeregu statystycznym i
na og moliwe jest nadanie im odpowiedniej treci. Analiza porwnawcza
zbiorowoci statystycznych za pomoc tej grupy miar ma sens, gdy s one
w miar jednorodne. W literaturze spotykany jest najczciej nastpujcy
podzia tej grupy miar:
1) miary rednie klasyczne, czyli takie, ktre s ustalane na podstawie
penego zbioru wartoci cechy (innymi sowy: wszystkie jednostki
statystyczne badanej zbiorowoci maj wpyw na warto takiej
miary). Najczciej wykorzystywane miary rednie klasyczne to:
rednia arytmetyczna, rednia geometryczna, rednia harmoniczna,
rednie potgowe,
2) miary rednie pozycyjne, czyli takie o wartoci ktrych decyduj jedynie jednostki zajmujce okrelon pozycj w szeregu statystycznym (innymi sowy: nie wszystkie wartoci cechy decyduj o poziomie tej miary). Naley tu podkreli, i nie wszystkie z nich mona
okreli mianem miar rednich w cisym tego sowa znaczeniu.
Cz z nich ma raczej charakter miar pooenia i suy do opisu
rozmieszczenia wariantw wartoci cechy. Podobny charakter posiadaj wykorzystywane w opisie parametrycznym momenty statystyczne. Zastosowanie niektrych z nich zostanie zaprezentowane w
dalszej czci opracowania. Najczciej stosowane pozycyjne miary
rednie to warto dominujca oraz warto rodkowa. Spord
miar pooenia naley wymieni przede wszystkim kwartyle pierwszy, drugi i trzeci oraz decyle.

30

Zygmunt Bobowski

rednia arytmetyczna
rednia arytmetyczna jest ilorazem sumy wszystkich wartoci cechy i liczebnoci tego zbioru. W zalenoci od postaci materiau statystycznego
nieco odmienne s sposoby wyznaczania redniej arytmetycznej. I tak:
a) w przypadku szeregu szczegowego jest ona wyznaczana wedug nastpujcego wzoru:
N

x=
gdzie:

2.5.

i =1

x i - oznacza wartoci cechy przypisane i-tym jednostkom staty-

stycznym,
N - liczebno analizowanego zbioru wartoci cechy.
Tak wyznaczan redni okrela si niekiedy redni arytmetyczn prost
(niewaon, chocia mona rwnie przyj, i mamy tu do czynienia z wagami jednostkowymi). Procedur obliczania redniej arytmetycznej dla tego
typu szeregu ilustruje poniszy przykad.
Przykad 2.3.
Zebrano informacje dotyczce wynikw egzaminu ze statystyki uzyskanych
przez studentw grupy 3 drugiego roku studiw WSP w Wabrzychu.
Otrzymano nastpujcy szereg: 3,0; 4,5; 4,0; 5,0; 2,0; 3,5; 4,0; 3,0; 4,0; 5,0;
4,5; 3,5; 3,5; 4,0; 3,0; 2,0; 3,5; 5,0; 4,0; 3,5; 3,0; 5,0; 4,0; 3,0; 3,5; 3,5; 4,0;
3,5; 3,5. Obliczy redni ocen uzyskanych z egzaminu ze statystyki.
Rozwizanie
redni arytmetyczn podanych ocen ustalimy wedug wzoru 2.5. Suma
ujtych w szeregu 29 ocen wynosi 103,5, podstawiajc j do wzoru otrzymujemy:

x=

103,5
3,57
29

Uzyskana ocena rednia jest nieznacznie wysza od dostatecznej plus.


b) w przypadku szeregu rozdzielczego punktowego jej ustalanie odbywa si
wedug wzoru:
k

x=

x i ni
i =1

x f
i

lub

x=

i =1
k

2.6.
i

i =1

gdzie:

xi oznacza wystpujce w szeregu warianty wartoci cechy

ni , f i

(i= 1,2,., k)
oznaczaj przypisane tym wartociom wagi; w szczeglnym
przypadku mog to by liczebnoci ( ni ) lub czstoci (

f i ).

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

31

rednia tak wyznaczana okrelana jest mianem redniej arytmetycznej waonej, a procedur jej obliczania ilustruje przykad 2.4.
Przykad 2.4.
Zebrano informacje dotyczce wielkoci gospodarstw domowych zamieszkujcych miejscowo K. Otrzymano nastpujcy szereg:
Liczba osb w
gospodarstwie
Liczba
gospodarstw

10

25

20

12

Ustali redni wielko gospodarstwa domowego za pomoc redniej arytmetycznej.


Rozwizanie
Prezentowany szereg ma charakter szeregu rozdzielczego punktowego (z cech statystyczn liczbow, skokow). Wyznaczana rednia bdzie
miaa charakter redniej waonej, gdzie wagami s liczebnoci gospodarstw o okrelonej wielkoci. Zgodnie z wzorem 2.6 wyznaczamy iloczyny
xi ni (s one umieszczone w kolumnie 3 poniszej tabeli)
Liczba osb w gospodarstwie domowym ( xi )

Liczba gospodarstw
( ni )

2
3
4
5
6
7
Razem
Sum iloczynw podstawiamy do wzoru

x=

x i ni
3

10
25
20
12
5
5
80
i otrzymujemy:

20
75
80
60
30
35
303

303
3,8 osoby
80

rednia liczebno gospodarstwa domowego wynosi 3,8 osoby.


c) w przypadku szeregu rozdzielczego z przedziaami klasowymi do jej
wyznaczenia wykorzystywany jest poniszy wzr:
k

x=

x&i ni
i =1

x& f
i

lub

x=

i =1
k

2.7.
i

i =1

gdzie:

x& i - oznacza rodek i-tego przedziau klasowego (i = 1,2,,k),

32

Zygmunt Bobowski

n i , f i - oznaczaj wagi przypisane poszczeglnym przedziaom


klasowym; w szczeglnym przypadku mog to by liczebnoci (n i ) lub czstoci ( f i ).
Podanej formuy nie mona stosowa, gdy w szeregu wystpuje chocia
jeden otwarty skrajny przedzia klasowy (nie ma wwczas moliwoci wyznaczenia jego rodka). Powszechnie przyjmuje si jednak moliwo wyznaczenia redniej w takiej sytuacji, gdy liczebno takich przedziaw jest
niewielka (do 5 % badanej zbiorowoci). Wwczas dla przedziau otwartego
przyjmuje si rozpito tak, jak dla pozostaych klas. Wyznaczanie redniej dla szeregu z przedziaami klasowymi ilustruje przykad 2.5.
Przykad 2.5.
Wrd studentw II roku Wydziau Socjologii zebrano informacje dotyczce ich wzrostu. Uzyskane dane ujto w poniszym szeregu z przedziaami klasowymi:
Wzrost w cm
Liczba studentw
( xi )
( ni )
150 158
12
158 166
26
166 174
45
174 182
32
182 190
15
Razem
130
Ustali redni wzrost studentw II roku Wydziau Socjologii.
Rozwizanie:
Uzyskane informacje ujto w postaci szeregu z przedziaami klasowymi, co
powoduje konieczno ustalenia rodkw tych przedziaw. W poniszej tablicy roboczej ujto je w kolumnie 3 i zostay one wyznaczone jako rednia
arytmetyczna z grnej i dolnej granicy kadego przedziau.
Wzrost w cm
( xi )

Liczba studentw
( ni )

x&i

x& i ni

150 158
12
158 166
26
166 174
45
174 182
32
182 190
15
Razem
130
W kolumnie 4. ustalono iloczyny

154
1848
162
4212
170
7650
178
5696
186
2790
X
22196
x& i ni , a po wstawieniu ich sumy do

wzoru 2.7 otrzymujemy:

x=

27892
170,74 cm
130

redni wzrost studentw wynosi okoo 170,74 cm.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

33

Naley podkreli, e o ile w przypadku dwch pierwszych formu ustalona warto rednia bardzo wiarygodnie odzwierciedla przecitny poziom
wartoci cechy w badanej zbiorowoci, to w trzecim przypadku ma ona raczej charakter szacunkowy, odbiegajcy niekiedy do znacznie od faktycznego poziomu redniego i odchylenie to moe wzrasta wraz ze zwikszaniem rozpitoci przedziaw klasowych.
Powszechnie rednia arytmetyczna uwaana jest za parametr redni o
najkorzystniejszych wasnociach. Za najwaniejsze spord nich uwaa si
nastpujce:
jako parametr klasyczny ustalana jest na podstawie wszystkich
wartoci cechy, a wic posiada wysok warto poznawcz (w
odrnieniu np. od parametrw pozycyjnych),
suma waona odchyle poszczeglnych wartoci cechy od ich
redniej arytmetycznej wynosi zawsze zero, co wynika z faktu, e
rednia ta peni rol rodka cikoci analizowanego zbioru
wartoci cechy. Wasno t mona zapisa relacj:
N

i =1

i =1

i =1

(xi x ) = (xi x )ni = (x& i x )ni

waona suma kwadratw odchyle poszczeglnych wartoci cechy od ich redniej arytmetycznej jest najmniejsza z moliwych,
co mona zapisa nastpujc zalenoci:
N

( xi x )
i =1

=0

= ( xi x ) ni = ( x& i x ) ni = min
2

i =1

i =1

Wasno ta jest wykorzystywana w znanej z ekonometrii metodzie najmniejszych kwadratw.


jeli w szeregu rozdzielczym wszystkie wagi ( wi ) - w szczeglnym
przypadku bd to liczebnoci ( ni ) bd czstoci ( f i ) - pomnoymy (bd podzielimy) przez ten sam czynnik q, to rednia
arytmetyczna wartoci cechy z nowym systemem wag ( vi ), gdzie:

vi = wi q

vi =

lub

wi
,
q

bdzie identyczna jak rednia liczona wedug pierwotnych wag


( wi ) . Mona to uj w nastpujcej relacji:
k

x=

xi wi
i =1
k

i =1

x v
i

i =1
k

v
i =1

Wynika to z faktu, e warto redniej arytmetycznej nie zaley od


absolutnych wielkoci wag, lecz od proporcji wystpujcych midzy
nimi,

34

Zygmunt Bobowski

jeli wszystkie wartoci cechy X podzielimy (bd pomnoymy)


przez t sam wielko q to rednia arytmetyczna tak zmienionych
wartoci cechy bdzie q-krotnie mniejsza (lub q-krotnie wiksza) od
redniej pierwotnych wartoci cechy. Wasno t mona zapisa nastpujcymi relacjami:
k

xi

q n
i =1

ni

N
q

(x q) n

i =1

x
q

x i ni
q = x q
= i =1
N

gdzie: x - rednia arytmetyczna pierwotnych wartoci cechy.


jeli do wszystkich wartoci cechy X dodamy (bd od wszystkich
wartoci odejmiemy) t sam wielko q to rednia arytmetyczna tak
zmienionych wartoci cechy bdzie o wielko q wiksza (lub o wielko q mniejsza) od redniej liczonej dla pierwotnych wartoci cechy.
Wasno t ujmuj ponisze relacje:

k
x i n i
i =1
+q= x+q
= i =1
N

k
k
(x i q ) n i x i n i

i =1
q = xq
= i =1
N
N

(x

lub

+ q )n i

lub

gdzie: x - rednia arytmetyczna pierwotnych wartoci cechy.


jeli badan zbiorowo podzielimy na kilka podzbiorowoci to rednia arytmetyczna dla caej zbiorowoci bdzie redni arytmetyczn
ze rednich tych podzbiorowoci,
l

x=

n j

j =1

nj
j =1

fj

j =1

f
j =1

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

35

x j - rednie arytmetyczne wyodrbnionych podzbiorowoci


( j = 1,2,..., l ),
n j , f j - liczebnoci bd czstoci odpowiadajce tym podzbio-

gdzie:

rowociom.
jest wykorzystywana do wyznaczania wielu innych parametrw statystycznych.
rednia arytmetyczna z uwagi na sposb jej wyznaczania moe by wykorzystywana dla oznaczania przecitnego poziomu wartoci cech jedynie
typu liczbowego. Dla cech opisowych wyraanych na skali nominalnej waciw miar redni jest dominanta, za dla cech mierzonych na skali porzdkowej mediana bd dominanta. Miary te zostan omwione w dalszej
czci opracowania.

rednia geometryczna
Naley do klasycznych parametrw rednich i jest stosowana do wyznaczania redniego poziomu wartoci cechy podanych w postaci szeregu czasowego momentw. Jej typowe wykorzystanie to badanie redniego tempa
zmian. Wyznaczana jest ona wedug wzoru:

x g = N x1 x 2 ... x N
gdzie:

2.8.

x1 , x2 ,...., xN - oznaczaj wystpujce w szeregu czasowym warto-

ci cechy.
Jako podstawowe uznaje si nastpujce wasnoci redniej geometrycznej:
obliczana jest jedynie dla dodatnich wartoci cechy; jeli cho jedna warto cechy wynosiaby zero, miara rwnie przyjmie wwarto zero,
jest ona mniej wraliwa od redniej arytmetycznej na zrnicowanie wartoci cechy.
Procedur wyznaczania redniej geometrycznej ilustruje poniszy przykad.
Przykad 2.6.
Informacje dotyczce liczby mieszkacw miejscowoci K w latach 1991
1997 zawiera ponisza tablica 2.2.
Tablica 2.2. Mieszkacy miejscowoci K w latach 1991 1997
(stan na 31.12.)
Liczba mieszkacw
Lata
(w tys. osb)
1991
15,9
1992
16,3
1993
15,7
1994
16,0
1995
17,1
1996
17,5
1997
18,0
rdo: Dane umowne

36

Zygmunt Bobowski

Na podstawie podanych informacji obliczy przecitn liczb mieszkacw


tej miejscowoci w badanym okresie.
Rozwizanie:
Informacje podano w postaci szeregu czasowego momentw (liczba mieszkacw na koniec kadego roku), a wic dla obliczenia poziomu redniego
wykorzystana zostanie rednia geometryczna. Jej obliczenia dokonamy wedug wzoru 2.8. i po podstawieniu danych otrzymujemy:

x g = 7 15,9 16,3 15,7 16,0 17,1 17,5 18,0 =16,62


Uzyskany wynik informuje, e przecitna liczba mieszkacw miejscowoci
K w latach 1991 1997 wynosia 16,62 tys. osb.
Dominanta
Dominanta, oznaczana jako D(x), zwana rwnie wartoci modaln
bd typow, jest wartoci cechy wystpujc najliczniej (najczciej) w
badanej zbiorowoci. Zaleca si wykorzystywanie tego parametru gwnie w
przypadku badania zbiorowoci ze wzgldu na cechy opisowe, gdy ograniczone s wwczas moliwoci wykorzystywania innych parametrw rednich.
Procedura wyznaczania tego parametru w przypadku szeregu szczegowego i rozdzielczego punktowego polega na wskazaniu takiej wartoci cechy, ktra w zgromadzonym materiale statystycznym powtarza si najczciej (o ile taka warto wystpuje). W przykadzie 2.3 bdzie to ocena 3,5,
poniewa wystpuje ona najliczniej (a 9-krotnie). W szeregu rozdzielczym
punktowym ( zob. przykad 2.4), najliczniej wystpujc wielkoci gospodarstwa domowego jest gospodarstwo 3-osobowe; takich gospodarstw jest
25, a wic dominanta wynosi 3.
W przypadku szeregu z przedziaami klasowymi procedura wyznaczania
dominanty jest bardziej skomplikowana. Okrela si w takim przypadku jej
warto przyblion. Mona tego dokona metod graficzn bd analityczn.
Metoda graficzna opiera si na wykorzystaniu histogramu, na ktrym w
najwyszym supku prowadzone s dwa odcinki biegnce po przektnej do
wysokoci ssiadujcych supkw, a punkt ich przecicia zrzutowany na
o odcitych wyznacza przyblion warto dominanty. Procedur t opart
na danych z przykadu 2.5 ilustruje rys. 2.9.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

37
Rys. 2.9

Wyznaczanie dominanty metod graficzn


liczba studentw

50
45
40

32
30
26
20
15
12
10

150

158

166

174

182

190

wzrost

D(x)=170, 75cm
rdo: opracowanie wasne

Podejcie analityczne umoliwia oszacowanie wartoci dominanty metod interpolacyjn przy wykorzystaniu wzoru:

D(x ) = x0 +
gdzie:

n0 n01
h
(n0 n01 ) + (n0 n0+1 ) 0

2.9.

x0 dolna granica przedziau dominujcego,


h0 rozpito przedziau dominujcego,
n0 liczebno (czsto) przedziau dominujcego,
n01 liczebno (czsto) przedziau poprzedzajcego przedzia
n0+1

dominujcy,
liczebno (czsto) przedziau nastpnego po przedziale

dominujcym.
Przy wykorzystaniu podanego wzoru oszacujmy dominujcy wzrost dla
danych z przykadu 2.5. Przedziaem dominanty bdzie przedzia 166 174
cm, w ktrym wystpuje najwysza liczebno ( n3 = 45). Wstawiajc odpowiednie dane do wzoru 2.9. otrzymujemy:

38

Zygmunt Bobowski

D( x ) = 166 +

45 26
8 = 166 + 4,75 = 170,75 cm
(45 26) + (45 32)

Otrzymany wynik wskazuje, i dominujcy wzrost w badanej zbiorowoci wynosi okoo 170,75 cm. Jest to oczywicie wielko przybliona i w badanej zbiorowoci moe w ogle nie wystpowa. W takim przypadku dominant naley traktowa jako warto cechy, wok ktrej skupiona jest najwiksza liczba jednostek badanej zbiorowoci.
Wyznaczanie dominanty w szeregu z przedziaami klasowymi jest moliwe, gdy przedzia dominanty i przedziay bezporednio z nim ssiadujce
posiadaj jednakow rozpito. Jeli przedziaem dominanty jest jeden ze
skrajnych przedziaw w szeregu (pierwszy lub ostatni), wwczas przyj
naley liczebno rwn zero dla przedziau poprzedzajcego - w pierwszym
przypadku lub dla przedziau nastpnego - w drugim przypadku. Jeli w
szeregu wystpuj przedziay klasowe o zrnicowanej rozpitoci wwczas
dominant, a cilej ujmujc jej przedzia okrelamy przez wyznaczenie
przedziau o najwyszym nateniu liczebnoci lub czstoci.
Podsumowujc stwierdzi rwnie naley, e jakkolwiek dominanta kojarzy si najczciej z wystpowaniem w szeregu jednej wartoci dominujcej, to w praktyce mona si spotka rwnie z przypadkami wystpowania
rozkadw bimodalnych (wystpuj dwie dominanty) bd nawet trimodalnych (trzy dominanty). Takie przypadki wymagaj jednak dodatkowej analizy zebranego materiau statystycznego w celu stwierdzenia, czy ta wielomodalno ma charakter systematyczny (regularny).
Mediana
Mediana, oznaczana w dalszym cigu jako Me(x), zwana rwnie wartoci rodkow naley do grupy miar pozycyjnych okrelanych mianem
kwartyli (jest kwartylem drugim). Jest ona wartoci cechy dzielc badan
zbiorowo na dwie rwnoliczne czci: poow jednostek o wartociach cechy mniejszych lub rwnych medianie i drug poow o wartociach cechy
wikszych lub rwnych medianie. Sposb wyznaczania mediany uzaleniony jest od typu szeregu, w ktrym ujto zgromadzony materia statystyczny.
Procedura wyznaczania mediany w szeregu szczegowym i rozdzielczym punktowym jest podobna. W szeregu szczegowym procedura ta wymaga w pierwszej kolejnoci uporzdkowania (w cigu rosncym bd malejcym) takiego szeregu (szereg rozdzielczy punktowy najczciej jest ju
uporzdkowany). Dalsze postpowanie uzalenione jest od liczebnoci badanej zbiorowoci:
a) gdy liczebno ta jest nieparzysta, median stanowi warto cechy
wystpujca u jednostki rodkowej. Jeli liczebno zbiorowoci
oznaczymy jako N, to mediana bdzie wartoci cechy wystpujc
u jednostki o numerze N + 1 , co mona wyrazi nastpujco:
2

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

39

Me( x ) = x N +1 ,
2

b) w przypadku parzystej liczby jednostek mediana bdzie redni


arytmetyczn wartoci cechy wystpujcych u dwch jednostek
rodkowych o numerach: N
i N + 1 , co mona wyrazi wzo2

rem:

Me( x ) =

xN + xN
2

+1

2.10.

W przypadku wyznaczania mediany w szeregu rozdzielczym dla bardzo


licznej zbiorowoci wskazane jest skumulowanie takiego szeregu, gdy
znacznie uatwia to ustalenie tego parametru.
Procedur wyznaczania mediany dla wymienionych typw szeregw ilustruj przykady 2.6 i 2.7.
Przykad 2.6
Na podstawie informacji podanych w przykadzie 2.3 wyznaczy median uzyskanych ocen z egzaminu ze statystyki.
Rozwizanie:
Badany zbir liczy 29 ocen (liczebno nieparzysta), wobec tego median
stanowi ocena o numerze (29 + 1)/2 = 15. Aby j wyznaczy dokonujemy
uporzdkowania danych i w rezultacie otrzymujemy szereg o postaci: 2,0;
2,0; 3,0; 3,0; 3,0; 3,0; 3,0; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 4,0; 4,0;
4,0; 4,0; 4,0; 4,0; 4,0; 4,5; 4,5; 5,0; 5,0; 5,0; 5,0. Ocena zajmujca rodkowe
miejsce w szeregu (tj. ocena o numerze 15) wynosi 3,5. Ocena ta stanowi
median.
Przykad 2.7.
Na podstawie informacji podanych w przykadzie 2.4 okreli median
wielkoci gospodarstw domowych.
Rozwizanie
Informacje zostay ujte w postaci szeregu rozdzielczego punktowego.
Dla uatwienia wskazania mediany dokonujemy kumulowania liczebnoci
(kolumna 3. poniszej tabeli):

40

Zygmunt Bobowski

Liczba osb w gospodarstwie domowym


(xi)

Liczba gospodarstw
(ni)

Liczba gospodarstw
skumulowana
(cum ni)

1
2
3
4
5
6
7
Razem

3
10
25
20
12
5
5
80

3
13
38
58
70
75
80
X

Badana zbiorowo obejmuje parzyst liczb gospodarstw, median


stanowi wobec tego rednia arytmetyczna liczby osb w rodzinie dla gospodarstw o numerach: 80/2 = 40 i (80/2) +1 = 41. W szeregu skumulowanym
zauwaamy, i s to gospodarstwa o jednakowej liczbie osb wynoszcej 4,
wobec czego mediana liczby osb w gospodarstwie wynosi 4.
W przypadku szeregu rozdzielczego z przedziaami klasowymi opisujcego zwykle zbiorowoci ze wzgldu na cech liczbow cig wyznaczanie
mediany podobnie jak dominanty ma charakter szacunkowy. M. in. z
uwagi na ten fakt nie wyrnia si tu odmiennego postpowania dla parzystej i nieparzystej liczebnoci badanej zbiorowoci. Warto mediany moe
by oszacowana dwiema metodami: graficzn bd analityczn.
Metoda graficzna wymaga wykrelenia w ukadzie wsprzdnych histogramu i diagramu kumulacyjnego. Na osi rzdnych wyznaczamy punkt odN
powiadajcy wielkoci 2 (mediana dzieli zbiorowo na dwie rwne czci).
Z wysokoci tego punktu prowadzimy prost rwnoleg do osi odcitych,
a do punktu jej przecicia z lini diagramu. Ten punkt przecicia zrzutowany na o odcitych wyznacza przyblion warto mediany.
Metoda analityczna zakada interpolacj wartoci mediany wedug poniszego wzoru:

N
cumn0 1
2
Me(x ) = x0 +
h0
n0
gdzie:

2.11.

x0 dolna granica przedziau mediany,


n0 liczebno (czsto) przedziau mediany,
h0 rozpito przedziau mediany,
cumn0 1 liczebno (czsto) skumulowana do przedziau poprze-

dzajcego przedzia mediany.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

41

W przypadku obu metod zakada si rwnomierne rozoenie jednostek


w caym przedziale mediany, co uprawnia do korzystania z podanych wyej
regu postpowania.
Procedur szacowania mediany metodami analityczn i graficzn ilustruje
przykad 2.8.
Przykad 2.8.
Na podstawie informacji podanych w przykadzie 2.5 ustali median
wzrostu w badanej grupie studentw.
Rozwizanie
Dla potrzeb metody analitycznej i graficznej dokonujemy kumulowania
liczebnoci jak w kolumnie 3. poniszej tabeli:
Wzrost w cm
(xi)

Liczba studentw
(ni)

Liczba studentw
skumulowana
(cum ni)

150 158
158 166
166 174
174 182
182 190
Razem

12
26
45
32
15
130

12
38
83
115
130
X

Metoda analityczna zgodnie z wzorem 2.11 - wymaga wyznaczenia w


pierwszej kolejnoci przedziau mediany; jest to przedzia, dla ktrego
cum ni jest nie mniejsze ni N (w naszym przykadzie jest to przedzia
2

166 174 cm). Po podstawieniu odpowiednich wielkoci do podanego wzoru


otrzymujemy:

130
38
Me(x ) = 166 + 2
8 = 170,8 cm
45
Uzyskana wielko oznacza, i wzrost osoby rodkowej wynosi okoo
170,8 cm.
W przypadku metody graficznej wykrelamy histogram i diagram liczebnoci skumulowanej, a nastpnie zgodnie z podan procedur wyznaczamy warto mediany (zob. rys 2.10).

42

Zygmunt Bobowski

Rys. 2.10
Wyznaczanie mediany metod graficzn

rdo: opracowanie wasne

Oszacowana t metod warto mediany jest zbliona do uzyskanej metod


analityczn.
Podsumowujc naley wskaza, e warto mediany nie zaley od
skrajnych wartoci cechy, co oznacza, i moe by ona wyznaczana dla szeregw z otwartymi przedziaami skrajnymi. Naley rwnie podkreli najwaniejsz wasno tego parametru: suma bezwzgldnych odchyle
wszystkich wartoci cechy od mediany jest minimalna, co mona uj nastpujc relacj:
N

i =1

xi Me( x) < xi Z ,
i =1

gdzie: Z dowolna warto liczbowa.


Inne parametry pooenia
Dzielc badan zbiorowo na dowoln liczb czci uzyskujemy moliwo wyznaczenia parametrw okrelanych oglnym mianem kwantyli.
Spord nich najczciej wykorzystywane s kwartyle dzielce zbiorowo

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

43

na cztery rwnoliczne czci (inne to: decyle dzielce zbiorowo na dziesitne czci oraz centyle dzielce zbiorowo na setne czci).
Kwartyle dziel uporzdkowan zbiorowo na jednakowo liczne
wiartki: kwartyl pierwszy oddziela pierwsze 25% badanej zbiorowoci od
pozostaych 75 %, kwartyl drugi oddziela pierwsze 50% zbiorowoci od pozostaej poowy; jest to wic poznana ju mediana, kwartyl trzeci oddziela
pierwsze 75% badanej zbiorowoci od pozostaych 25%. Procedura wyznaczania kwartyli: pierwszego i trzeciego jest zbliona do metodyki ustalania
mediany; rnica sprowadza si jedynie do innego pooenia tych parametrw. Dodatkowo przyjmuje si, i parametry te winny by wyznaczane dla
licznych zbiorowoci; unika si wwczas sytuacji, gdy wyznaczona warto
parametru nie moe by przyporzdkowana konkretnej jednostce.
W przypadku wyznaczania kwartyli dla szeregu szczegowego (oczywicie w postaci uporzdkowanej) bd rozdzielczego punktowego: kwartyl
pierwszy bdzie odpowiada wartoci cechy wystpujcej u jednostki o numerze

N
3N
, za kwartyl trzeci o numerze
. W szeregu rozdzielczym z
4
4

przedziaami klasowymi mona podobnie jak w przypadku mediany zastosowa metod analityczn lub graficzn.
W przypadku metody analitycznej kwartyl pierwszy bdzie wyznaczany
zgodnie z wzorem:

N
cumn0 1
4
Q1 ( x ) = x0 +
h0
n0

2.12.

za kwartyl trzeci wedug wzoru:

3N
cumn0 1
Q3 ( x ) = x0 + 4
h0
n0
gdzie:

2.13.

x0 dolna granica przedziau zawierajcego kwartyl pierwszy bd


trzeci,
n0 liczebno (czsto) przedziau zawierajcego kwartyl pierwszy bd trzeci,

h0 rozpito przedziau zawierajcego kwartyl pierwszy bd


trzeci,

cumn0 1 liczebno (czsto) skumulowana do przedziau poprzedzajcego przedzia zawierajcy kwartyl pierwszy bd trzeci.
Metoda graficzna wymaga wykrelenia histogramu i diagramu kumulacyjnego, na ktrym podobnie jak w przypadku mediany wskazujemy
przyblion warto wymienionych kwartyli. Procedur wyznaczania kwar-

44

Zygmunt Bobowski

tyli pierwszego i trzeciego dla szeregu z przedziaami klasowymi ilustruje


przykad 2.9.
Przykad 2.9.
Na podstawie informacji podanych w przykadzie 2.5. oszacowa wartoci
kwartyli pierwszego i trzeciego dla wzrostu badanej grupy studentw.
Rozwizanie
Dla potrzeb metody analitycznej i graficznej dokonujemy kumulowania liczebnoci jak w poniszej tabeli:
Liczba studentw
Wzrost w cm
Liczba studentw
skumulowana
( xi )
( ni )
(cum ni)
1

150 158
158 166
166 174
174 182
182 190
Razem

12
26
45
32
15
130

12
38
83
115
130
X

Metoda analityczna.
Kwartyl pierwszy znajduje si w przedziale 158 166, poniewa cum ni
dla tego przedziau jest nie mniejsze ni

N
, tj. 32,5, za kwartyl trzeci w
4

przedziale 174 182, poniewa cum ni dla tego przedziau jest nie mniejsze
od

3N
, tj. 97,5. Po podstawieniu odpowiednich danych do wzorw 2.12 i
4

2.13 otrzymujemy:

Q1 ( x ) = 158 +

32,5 12
8 = 164,3 cm,
26

Q3 ( x ) = 174 +

97,5 83
8 = 177,6 cm.
32

Metoda graficzna
Po wykreleniu histogramu i diagramu powyszego szeregu kumulacyjnego dokonujemy oszacowania wartoci odpowiednich kwartyli jak na
rys 2.11.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

45

Rys. 2.11
Wyznaczenie kwartyli 1 i 3 metod graficzn

rdo: opracowanie wasne

2.3.3. Miary zmiennoci


Miary zmiennoci, okrelane rwnie mianem miar rozproszenia bd
dyspersji, su do pomiaru poziomu zrnicowania wartoci cechy w badanej zbiorowoci. Pomiar zmiennoci moe by wyraony w jednostkach
naturalnych lub stosunkowych. W zwizku z tym wyrnia si dwie grupy
tych miar:
a) absolutne miary zmiennoci, ktre maj charakter miar mianowanych,
b) wzgldne miary zmiennoci, ustalane w relacji do przecitnej wartoci badanej cechy.
Biorc pod uwag sposb ustalania wartoci tych miar mona dodatkowo wyodrbni:
a) pozycyjne miary zmiennoci, ktre s ustalane w oparciu o wartoci
cechy zajmujce okrelone miejsce (pozycj) w badanym szeregu,
b) klasyczne miary zmiennoci, ktre s ustalane przy wykorzystaniu
penego zbioru wartoci cechy.
Do absolutnych, pozycyjnych miar zmiennoci zalicza si obszar zmiennoci (rozstp) i odchylenie wiartkowe; za do absolutnych, klasycznych

46

Zygmunt Bobowski

miar zmiennoci: wariancj, odchylenie standardowe, odchylenie przecitne.


Grup wzgldnych miar zmiennoci reprezentuje wspczynnik zmiennoci,
ktry jest ilorazem absolutnych miar zmiennoci i wybranych miar rednich badanej cechy.
Obszar zmiennoci
Obszar zmiennoci zwany rwnie rozstpem wartoci cechy oznaczany
jako R ( x ) stanowi najprostsz miar zmiennoci i jest okrelany jako rnica midzy najwysz ( xmax ) i najnisz ( xmin )4 wartoci badanej cechy, co
mona wyrazi wzorem:

R( x ) = xmax xmin

2.14.

Z uwagi na fakt, e miara ta uwzgldnia jedynie dwie skrajne wartoci


cechy, moe ona mao wiarygodnie odzwierciedla poziom zrnicowania
badanej cechy (zwaszcza, gdy wartoci skrajne istotnie odbiegaj od typowych wartoci cechy). Miara ta moe by stosowana do wstpnego badania
zmiennoci. Praktyczne jej wykorzystanie ma miejsce w przypadku konstrukcji szeregu rozdzielczego z przedziaami klasowymi, gdy zachodzi
wwczas konieczno okrelenia liczby i wielkoci klas w ten sposb, by objy one ca rozpito wartoci cechy.
Odchylenie wiartkowe
Odchylenie wiartkowe oznaczane jako Oc ( x ) stanowi poow rnicy
midzy kwartylami trzecim -

Q3 ( x) i pierwszym Q1 ( x) , co mona wyrazi

wzorem:

Oc ( x ) =

Q3 ( x ) Q1 ( x )
2

2.15.

W literaturze podaje si rwnie sposb inny sposb wyznaczania odchylenia wiartkowego. Zgodnie z nim parametr ten definiuje si jako redni arytmetyczn odchyle kwartyli pierwszego i trzeciego od mediany.
Mona to wyrazi wzorem:

Oc ( x ) =

[Q3 (x ) Me(x )] + [Me(x ) Q1 (x )]


2

2.16.

Jak atwo zauway po niewielkim przeksztaceniu ta posta wzoru moe by zredukowana do postaci 2.15. W porwnaniu z poprzedni miar odchylenie wiartkowe pozbawione jest wpywu jednostek nietypowych dla
4

w przypadku szeregu rozdzielczego z przedziaami klasowymi wielkociami tymi s odpowiednio: grna granica ostatniego i dolna granica pierwszego przedziau.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

47

badanej zbiorowoci, dla ktrych wartoci cechy wyranie odbiegaj od pozostaych, na warto tej miary. Wartoci nietypowe znajd si bowiem
albo poniej kwartyla pierwszego, albo powyej kwartyla trzeciego. Mankamentem tej miary jest problem z nadaniem jej treci merytorycznej, dlatego
miara ta jest rzadko stosowana. Zalecana jest wwczas, gdy w szeregu wystpuj skrajne klasy otwarte i nie ma moliwoci zastosowania klasycznych miar zmiennoci.
Wyznaczajc omwione wyej miary zmiennoci dla danych z przykadu
2.3 otrzymujemy:

R( x) = xmax xmin = 7 1 = 6 osb


i

Q 3 ( x ) Q1 ( x ) 5 3
=
= 1 osoba
2
2

O c (x ) =

Wariancja
Wariancja (od aciskiego sowa variare- zmienia si, rni si) naley
do klasycznych, absolutnych miar zmiennoci i mona j definiowa jako
redni kwadratw odchyle poszczeglnych wartoci cechy od ich redniej
arytmetycznej. W zalenoci od postaci materiau statystycznego wariancja,
oznaczana w dalszej czci jako s
szych wzorw:
a) dla szeregu szczegowego:
N

s 2 (x ) =

(x
i =1

( x) bdzie wyznaczana wedug poni-

x)

2.17.

b) dla szeregu rozdzielczego punktowego:


k

s 2 (x ) =

(x

x ) ni
2

i =1

2.18.

c) dla szeregu rozdzielczego z przedziaami klasowymi:


k

(x ) =

(x&
i =1

x ) ni
2

2.19.

Jakkolwiek wzory 2.18 i 2.19 odnosz si do szeregw liczebnoci, to


jednak - podobnie jak w przypadku redniej arytmetycznej - liczebnoci te
( ni ) mog by zastpione czstociami ( f i ), natomiast liczebno oglna (N)
sum czstoci rwn 1 lub 100 (w zalenoci od sposobu jej wyraenia).

48

Zygmunt Bobowski

Istotnym mankamentem wariancji jest to, e jej miano nie jest naturalnym dla badanej cechy, co wynika z potgowania odchyle wartoci cechy
od redniej arytmetycznej. Utrudnia to nadanie jej wartociom treci merytorycznej. W praktyce wykorzystuje si pierwiastek kwadratowy z wariancji
okrelany mianem odchylenia standardowego. Niemniej wariancja posiada
wiele pozytywnych waciwoci, do ktrych mona zaliczy nastpujce:
a) jako klasyczna miara zmiennoci liczona jest w oparciu o wszystkie
wartoci cechy, a warunkiem jej wyznaczenia jest znajomo redniej arytmetycznej w stosunku do ktrej jest obliczana,
b) przyjmuje tylko wartoci nieujemne; warto zerow osiga w przypadku cechy staej (wwczas wszystkie wartoci cechy s identyczne),
c) jeli w szeregu rozdzielczym wszystkie wagi - wi (w szczeglnym
przypadku

ni lub f i ) pomnoymy bd podzielimy przez t sam

wielko q, to wariancja liczona przy tak zmienionym systemie wag


bdzie identyczna jak wariancja pierwotna (zauwamy, e wariancja
zachowuje si w tej sytuacji identycznie jak rednia arytmetyczna);
wasno t mona wyrazi w sposb nastpujcy:
k

(x
i =1

x ) (w i q )
k

(w

i =1

gdzie:

q)

(x
i =1

x ) wi
2

i =1

wi wagi przypisane poszczeglnym wartociom cechy (w szczeglnym przypadku bd to liczebnoci ni lub czstoci f i ,

q wielko staa,
d) jeli wszystkie wartoci cechy pomnoymy bd podzielimy przez t
sam wielko q, to wariancja tak zmienionych wartoci cechy bdzie q2 razy wiksza w przypadku mnoenia lub q2 razy mniejsza w
przypadku dzielenia od wariancji pierwotnych wartoci cechy; wasno t wyraaj ponisze rwnoci:

s (x q ) = s (x ) q
2

x s 2 (x )
s = 2
q
q
2

e) jeli do wszystkich wartoci cechy dodamy lub od wszystkich wartoci cechy odejmiemy t sam wielko q, to wariancja tak zmienionych wartoci cechy bdzie identyczna jak wariancja pierwotnych
wartoci cechy; wyraa to poniszy zapis:

s 2 (x + q ) = s 2 (x )

s 2 (x q ) = s 2 (x )

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

f)

49

jeli zbiorowo podzielimy na dowoln liczb podzbiorowoci czstkowych (grup), to wariancja oglna badanej cechy bdzie sum wariancji rednich grupowych i redniej wariancji wewntrzgrupowych,
co mona wyrazi wzorem:

s 2 (x ) = s j ( x ) + s 2 (x j ),
2

gdzie:

s 2 ( x) wariancja oglna cechy X,


s 2 j (x ) rednia wariancji wewntrzgrupowych, (j=1,2,.., k; k =
liczba wyodrbnionych grup)

s (x j ) wariancja rednich grupowych.


2

Na podstawie podanej formuy mona stwierdzi, e na oglne zrnicowanie wartoci cechy wpywa cznie wewntrzgrupowe zrnicowanie tej cechy, jak rwnie zrnicowanie midzygrupowe. Podana relacja jest okrelana mianem rwnoci wariancyjnej
g) wariancja stanowi rnic midzy redni arytmetyczn kwadratw
wartoci cechy a kwadratem redniej arytmetycznej wartoci tej cechy:

s2(x) = (x2) (x)

Jak ju wspomniano w badaniach zmiennoci wykorzystuje si pierwiastek z wariancji zwany odchyleniem standardowym. Z uwagi na t prost
zaleno procedury obliczania obu parametrw zostan zilustrowane cznie.
Odchylenie standardowe
Stanowi ono najczciej wykorzystywan miar zmiennoci. Procedur
obliczania odchylenia standardowego oznaczanego zwykle jako s ( x) mona
wyrazi oglnym wzorem:

s (x ) = s 2 ( x )

2.20.

W zalenoci od postaci materiau statystycznego odpowiednie wzory


umoliwiajce w takich przypadkach wyznaczenie odchylenia standardowego przyjm posta:
a) dla szeregu szczegowego
N

s(x ) =

(x

i =1

x)

2.21.

50

Zygmunt Bobowski

b) dla szeregu rozdzielczego punktowego


k

s (x ) =

(x

x ) ni
2

i =1

2.22.

c) dla szeregu rozdzielczego z przedziaami klasowymi


k

s (x ) =

(x&
i =1

x ) ni
2

2.23.

Wystpujce we wzorach 2.21 i 2.23 liczebnoci mog by zastpione


czstociami. Ustalona warto odchylenia standardowego informuje, o ile
przecitnie rni si wartoci cechy wystpujce u poszczeglnych jednostek statystycznych od ich wielkoci redniej.
Podstawowe wasnoci odchylenia standardowego wynikaj z odpowiednich
wasnoci wariancji; niektre stanowi ich niewielk modyfikacj.
Ustalenie wartoci redniej arytmetycznej i odchylenia standardowego
pozwala na okrelenie typowego obszaru zmiennoci dla badanej cechy.
Obszar ten zawiera si w przedziale: x s ( x ) . W obszarze tym zawiera si
okoo 2/3 wszystkich obserwacji. Jednostki, ktrym odpowiadaj te obserwacje uwaa si za typowe dla badanej zbiorowoci.
Procedur wyznaczania wariancji i odchylenia standardowego ilustruj
ponisze przykady.
Przykad 2.9.
Zebrano informacje dotyczce wieku wylosowanej grupy przestpcw
odbywajcych wyroki w Zakadzie Karnym. Uzyskano nastpujce dane (w
latach): 22; 45, 32; 48; 35; 28; 21; 29; 33; 26; 24; 30; 41; 44; 22. Okreli
zmienno wieku przestpcw za pomoc odchylenia standardowego.
Rozwizanie
Odchylenie standardowe dla informacji ujtych w szeregu szczegowym
ustalone zostanie wedug formuy 2.21. Wymaga ona wczeniejszego ustalenia wieku redniego. Wynosi on 32 lata. W dalszej kolejnoci ustalane s
kwadraty odchyle wieku poszczeglnych przestpcw od wieku redniego.
Podstawiajc sum ustalonych kwadratw odchyle do wzoru otrzymujemy:

s(x ) =

1110
= 8,6 lat.
15

Otrzymany wynik oznacza, e wiek kadego z przestpcw rni si


rednio o 8,6 lat od wieku redniego.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

51

Przykad 2.10.
Ponisza tablica zawiera informacje dotyczce liczby bdw popenianych przez osoby zdajce test teoretyczny w ramach egzaminu na prawo
jazdy w pewnym Orodku Egzaminacyjnym.
Liczba popenionych bdw ( xi )

Liczba zdajcych
(ni )

0
1
2
3
4
5
6
Razem

5
15
20
15
5
3
2
65

Zbada zmienno liczby popenionych bdw przy pomocy odchylenia


standardowego.
Rozwizanie
Dla wyznaczenia odchylenia standardowego konieczne jest ustalenie
redniej arytmetycznej liczby popenionych bdw. Obliczenia pomocnicze
zawiera ponisza tablica robocza.
Liczba popenionych bdw ( xi )

Liczba zdajcych
(ni )

x i ni

(xi x )2

( x i x )2 n i

0
1
2
3
4
5
6
Razem

5
15
20
15
5
3
2
65

0
15
40
45
20
15
12
147

5,11
1,59
0,07
0,55
3,03
7,51
13,99
X

25,55
23,85
1,40
8,25
15,15
22,53
27,98
124,71

Na podstawie oblicze zawartych w kolumnie 3 otrzymujemy:

x=

147
= 2,26
65

W kolejnych kolumnach wykonano obliczenia pomocnicze dla ustalenia


odchylenia standardowego. Po podstawieniu uzyskanych wielkoci do wzoru 2.22 otrzymujemy:

52

Zygmunt Bobowski

s(x ) =

124,71
= 1,4 bdu
65

Uzyskana warto miary oznacza, i przecitnie liczba bdw popenionych przez kadego ze zdajcych rnia si o okoo 1,4 od redniej liczby
tych bdw.
Przykad 2.11.
Dla 120 uczniw jednej ze szk podstawowych przeprowadzono badanie warunkw rodowiska domowego. Uzyskane wyniki badania ujto w
poniszej tablicy:
Wyniki pomiaru
w punktach ( xi )

Liczba
uczniw
(ni )
10
35
55
20
120

11 25
26 40
41 55
56 - 70
Razem
rdo: Badanie wasne

Na podstawie podanych informacji zbada zmienno uzyskanych wynikw pomiaru za pomoc odchylenia standardowego.
Rozwizanie
Celem ustalenia wartoci tej miary naley w pierwszej kolejnoci wyznaczy redni arytmetyczn wynikw pomiaru. Obliczenia pomocnicze wykonano w kolumnie 4 poniszej tablicy roboczej.
Wyniki
pomiaru
(w punktach) ( xi )

Liczba
uczniw
(ni )

rodki
przedziaw
( x&i )

x i ni

(x&i x )2

(x& i x )2 ni

11 25
26 40
41 55
56 - 70
Razem

10
35
55
20
120

18
33
48
63
X

180
1155
2640
1260
5235

655,4
112,4
19,4
376,4
X

6554
3934
1067
7528
19083

rednia ta wynosi:

5235
= 43,6 punktu. Kolejne obliczenia pomocnicze
120

dla wyznaczenia odchylenia standardowego - zgodnie z wzorem 2.23 - wy-

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

53

konano w kolumnach 5. i 6. tablicy. Po podstawieniu uzyskanych wynikw


oblicze do wzoru otrzymujemy:

19083
= 12,6 punktu
120

s(x ) =

Interpretacja: Przecitnie wyniki pomiaru rodowiska domowego kadego z uczniw rni si o okoo 12,6 punktu od pomiaru redniego.
Odchylenie przecitne
Odchylenie przecitne, oznaczane dalej jako d ( x ) , definiowane jest jako
rednia bezwzgldnych odchyle poszczeglnych wartoci cechy od ich
redniej arytmetycznej. W zalenoci od typu szeregu, w ktrym ujty zosta
materia statystyczny bdzie ono wyznaczane wedug poniszych wzorw:
a) dla szeregu szczegowego:
N

x x
i

d ( x) =

2.24.

i =1

b) dla szeregu rozdzielczego punktowego:


k

d ( x) =

x ni

2.25.

i =1

c) dla szeregu z przedziaami klasowymi:


k

d ( x) =

x& x n
i

2.26.

i =1

Rwnie w tym przypadku wystpujce we wzorach 2.2 i 2.26 liczebnoci mog by zastpione czstociami.
Interpretacja odchylenia przecitnego jest identyczna jak odchylenia
standardowego, co jednak nie oznacza, e wartoci obu miar s identyczne.
Odchylenie standardowe przyjmuje wartoci nie mniejsze od odchylenia
przecitnego, co mona uj nastpujc relacj:

s(x ) d (x )

54

Zygmunt Bobowski

Omawiana miara zmiennoci odgrywa niewielk rol w teorii statystyki,


dlatego te jest zdecydowanie rzadziej wykorzystywana do pomiaru rozproszenia wartoci cechy.
Wspczynnik zmiennoci
Parametr ten naley do grupy wzgldnych miar zmiennoci i jak wczeniej sygnalizowano jest on ustalany jako iloraz absolutnej miary rozproszenia i wybranej miary redniej. W zalenoci od wykorzystanych absolutnych miar zmiennoci i poziomu redniego wystpuj rne postacie wspczynnika zmiennoci. Najczciej wykorzystywana jest posta wyraajca
si wzorem:

Wz ( x ) =

s(x )
x

2.27.

Dla celw praktycznych wyraa si go czsto w procentach mnoc


otrzymany wynik przez 100. Mierzy on, jak cz wartoci redniej badanej cechy stanowi jej odchylenie standardowe, a wic ta posta oparta jest
na parametrach klasycznych. Im wysza warto tej miary tym wiksza
zmienno badanej cechy. Jest oczywiste, e przyjmuje on wartoci nieujemne.
Podana posta wspczynnika zmiennoci moe by ustalona jedynie
wwczas, gdy moliwe jest ustalenie parametrw tworzcych t miar. Gdy
jest to niemoliwe, mog by wykorzystane wspczynniki zmiennoci oparte na miarach pozycyjnych. Naley do nich m. in. kwartylowy wspczynnik
zmiennoci wyraony poniszymi wzorami:

Oc ( x )
Me( x )

2.28.

Q3 ( x ) Q1 ( x )
Q3 ( x ) + Q1 ( x )

2.29.

Wz ( x ) =
lub

Wz ( x ) =

Wspczynnik zmiennoci jest miar niemianowan i ten brak miana


umoliwia porwnywanie stopnia zrnicowania rnych cech statystycznych (wyraanych w rnych jednostkach miary). Takich porwna nie
mona w zasadzie dokonywa przy wykorzystaniu absolutnych miar rozproszenia.
Wykorzystujc wyniki badania zmiennoci uzyskane w przykadach 2.9
- 2.11 okrelimy wzgldn zmienno badanych cech. Dla wszystkich trzech
przypadkw moliwe jest wykorzystanie w tym celu wspczynnika zmiennoci o postaci 2.27. Dla przykadu 2.9 przyjmie on warto:

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

Wz ( x ) =

55

8,6
= 0,27
32

Wynik ten oznacza, e odchylenie standardowe wieku przestpcw stanowi 27% ich wieku redniego.
W przykadzie 2.10 miernik ten przyjmie posta:

Wz ( x ) =

1,4
= 0,62
2,26

Uzyskana warto wspczynnika zmiennoci oznacza, e odchylenie


standardowe liczby popenionych bdw stanowi 62% redniej ich liczby.
Dla przykadu 2.11 wspczynnik zmiennoci osignie wielko:

Wz ( x ) =

12,6
= 0,29
43,6

Otrzymana wielko oznacza, e odchylenie standardowe wynikw pomiaru rodowiska domowego stanowi 29% ich pomiaru redniego.
Jak wczeniej podkrelono, wspczynnik zmiennoci jako miara niemianowana umoliwia porwnanie rozproszenia rnych cech. W wietle tego mona stwierdzi, e w badanych przypadkach zdecydowanie najwysze
zrnicowanie wartoci cechy wystpuje w przykadzie 2 (liczba bdw
popenianych w trakcie zdawania testu teoretycznego), natomiast w pozostaych przykadach poziom zmiennoci jest zbliony.
2.3.4. Miary skonoci
Zjawisko skonoci (w literaturze uywa si zamiennie pojcia asymetrii)
okrelane jest jako brak symetrii w rozoeniu wartoci cechy wzgldem ich
redniej arytmetycznej, co jest rwnoznaczne z niesymetrycznym rozoeniem jednostek statystycznych. Jeli w zbiorowoci statystycznej opisywanej ze wzgldu na okrelon cech przewaaj liczebnie jednostki o wartociach cechy niszych od redniej arytmetycznej, to sytuacj t okrela si
mianem skonoci prawostronnej, za w przypadku dominacji jednostek o
wartociach cechy wyszych od redniej arytmetycznej - mwimy o skonoci lewostronnej. Przypadki te oraz ksztat rozkadu symetrycznego zilustrowano na rys. 2.12, na ktrym zaznaczono rwnie orientacyjne pooenie podstawowych parametrw rednich

56

Zygmunt Bobowski

Rys. 2.12
Graficzna ilustracja skonoci
Rozkad symetryczny

x
D(x )
Me( x )
Skono prawostronna

D( x ) Me( x ) x
Skono lewostronna

x
rdo: Opracowanie wasne

Me(x ) D( x )

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

57

Badanie skonoci oznacza okrelenie jej rodzaju i poziomu odchylenia


rozkadu badanej cechy od rozkadu symetrycznego. Do pomiaru tego zjawiska wykorzystywane s miary okrelane mianem miar skonoci bd
asymetrii, wrd ktrych mona wyrni miary pozycyjne oraz klasyczne.
Do pozycyjnych zalicza si mierniki oparte na badaniu relacji midzy
miarami przecitnymi, w tym pozycyjnymi. Zalicza si do nich nastpujce
miary:
a) rnic midzy redni arytmetyczn i dominant bd median,
b) kwartylowy wspczynnik skonoci,
c) standaryzowany wspczynnik skonoci.
Jako klasyczn miar skonoci wykorzystuje si rne postacie momentu centralnego trzeciego rzdu.
Rnica midzy wartoci redni i dominant
Dla stwierdzenia faktu wystpowania zjawiska asymetrii bd jej braku
i ewentualnego okrelenia jej kierunku mona wykorzysta relacj zachodzc midzy redni arytmetyczn i dominant. I tak:
jeli x = D ( x ) , czyli x D ( x ) = 0 zjawisko skonoci nie wystpuje;
rozkad jest symetryczny, tzn. wystpuje jednakowa liczba jednostek
statystycznych poniej i powyej redniej arytmetycznej (por. rys. 2.4),
jeli x > D ( x ) , czyli x D ( x ) > 0 rozkad jest asymetryczny; wystpuje skono prawostronna, tzn. w zbiorowoci dominuj jednostki o
wartociach cechy niszych od redniej (por. rys. 2.4),
jeli x < D ( x ) , czyli x D ( x ) < 0 rozkad jest asymetryczny; wystpuje
skono lewostronna, tzn. w zbiorowoci dominuj jednostki o wartociach cechy wyszych od redniej (por. rys. 2.4).
W oparciu o powysze relacje mona zaproponowa najprostsz miar
skonoci wyraajc si wzorem:

M s (x ) = x D(x )

2.30.

Okrelona w powyszy sposb miara skonoci jest wielkoci mianowan i nienormowan, co nie pozwala na ustalenie natenia skonoci. W
literaturze podaje si rwnie zmodyfikowan posta podanej wyej miary
(traktowan jako jej rwnowan) o postaci:

M s ( x ) = 3 [x Me( x)]

2.31.

Wedug Pearsona formua ta pozwala uzyskiwa wyniki zblione do


osiganych wedug wzoru 2.30, ale jedynie w przypadku rozkadw umiarkowanie skonych.

58

Zygmunt Bobowski

Wspczynniki skonoci
Badania porwnawcze skonoci rnych cech wymagaj stosowania
wzgldnych (niemianowanych) miernikw. Nale do nich wspczynniki
skonoci. Najczciej wykorzystywan formu mona wyrazi nastpujco:

x D(x )
s(x )

2.32.

3 [x Me( x)]
s(x )

2.33.

Ws1 ( x ) =
lub

Ws1 ( x ) =

W przypadku braku moliwoci wyznaczenia redniej arytmetycznej


i w konsekwencji odchylenia standardowego moe by wykorzystana podana niej posta wspczynnika skonoci oparta ona kwartylach:

Ws 2 ( x) =

[Q3 (x) Me( x] [Me( x) Q1 (x)] [Q3 (x) Me(x)] [Me( x) Q1 (x)]
=
[Q3 (x) Me( x)] + [Me( x) Q1 (x)]
2 Oc ( x)

2.34.

Podane wspczynniki skonoci s wielkociami wzgldnymi i unormowanymi. W wikszoci przypadkw przyjmuj wartoci z przedziau od -1
do +1; przy duym nateniu skonoci wspczynnik skonoci o postaci
2.32 moe przyjmowa wartoci wykraczajce poza podany przedzia.
Trzeci moment centralny
Kolejna miara skonoci oparta jest na wykorzystaniu momentu statystycznego rzdu trzeciego. W literaturze mona spotka rne propozycje
wykorzystania tego miernika do pomiaru skonoci. I tak dla stwierdzenia
jedynie faktu wystpowania skonoci moe by wykorzystany trzeci moment centralny o postaci5:
k

m3 ( x ) =

(x
i =1

x ) ni
3

2.35.

Okrelanie na jego podstawie faktu wystpowania skonoci i jego kierunku odbywa si w sposb nastpujcy:
jeli m3 ( x ) = 0 skono nie wystpuje, rozkad jest symetryczny,
5

Zjawisko skonoci badane jest gwnie w oparciu o dane ujte w szeregach rozdzielczych,
dlatego te podane w dalszej czci formuy odnosz si do tego typu szeregw. Wystpujce
w podanych wzorach liczebnoci mog by zastpione czstociami

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

59

jeli

stronna,
jeli m3 ( x ) < 0 rozkad jest asymetryczny, wystpuje skono lewo-

m3 ( x) > 0 rozkad jest asymetryczny, wystpuje skono prawo-

stronna.
W celu dodatkowego okrelenia natenia skonoci trzeci moment centralny poddajemy standaryzacji, co prezentuje ponisza formua
k

(x
m (x )
m3 (t ) = 33
=
s (x )

i =1

x ) ni
3

( x i x ) ni

i =1

2.36.

Wystpujcy w mianowniku podanej formuy szecian odchylenia standardowego umoliwia uzyskanie miary niemianowanej, ktra moe by wykorzystywana do analizy porwnawczej skonoci rozkadw cech o rnych
jednostkach miary. Mankamentem tej miary jest brak cile okrelonych
granic przedziau, z ktrego moe ona przyjmowa wartoci liczbowe. Uniemoliwia to ocen natenia skonoci. M. Krzysztofiak proponuje w tym
celu nastpujc modyfikacj powyszej postaci standaryzowanej:

m3 (t ) =
*

m3 ( x )
m3 ( x ) + s 3 ( x )

2.37.

Zaproponowana modyfikacja pozwala na uzyskanie wartoci tej miary z


przedziau <-1 ; 1>, co umoliwia okrelenie kierunku i natenia skonoci, a jej wartoci graniczne oznaczaj wystpowanie skrajnej skonoci
ujemnej bd dodatniej.
Przeprowadzajc badanie porwnawcze skonoci naley pamita, by
posugiwa si w jego trakcie tymi samymi miarami, a dokonujc wyboru
parametru skonoci naley preferowa te, ktre s oparte na klasycznej
procedurze ustalania ich wartoci. Naley rwnie doda, e wyszy poziom
skonoci jest zawsze zwizany z wiksz zmiennoci wartoci badanej cechy. Dla zilustrowania procedury badania skonoci przeledmy przykad
2.12.
Przykad 2.12.
Na podstawie informacji ujtych w przykadzie 2.11 zbada skono w
rozkadzie wynikw pomiaru warunkw rodowiska domowego dla wyodrbnionej zbiorowoci uczniw.

60

Zygmunt Bobowski

Rozwizanie
Dla badania skonoci wykorzystamy zaprezentowane wyej miary.
Wymagaj one przeprowadzenia wielu oblicze pomocniczych, ktre zostay
ujte w poniszej tablicy roboczej (pominite zostan obliczenia wykonane
w przykadzie 2.11):
Wyniki pomiaru
(w punktach)
( xi )

Liczba
uczniw
(ni )

rodki
przedziaw
( x&i )

cum ni

(x&i x )3

(x& i x )3 ni

11 25
26 40
41 55
56 - 70
Razem

10
35
55
20
120

18
33
48
63
X

180
1155
2640
1260
5235

-16777,2
-1201,6
80,8
7320,8
X

-167772,0
-42056,6
4444,0
146416,0
-59068,6

Przypomnijmy, e uzyskana warto redniej arytmetycznej wyniosa


43,6 punktu, za odchylenie standardowe 12,6 punktu.
Dla potrzeb okrelenia pierwszej z miar skonoci - M s (x ) naley dodatkowo wyznaczy wartoci dominanty i mediany. Dominanta wyniesie:

D( x ) = 41 +

(55 35)
14 = 46,1 punktu
(55 35) + (55 20)

za mediana:

120
45
2
14 = 44,8 punktu
Me(x ) = 41 +
55
Miara skonoci ustalona wedug wzoru 2.30 wyniesie:

M s ( x ) = 43,6 46,1 = 2,5 punktu


za wedug wzoru 2.31:

M s ( x ) = 3(43,6 44,8) = 3,6 punktu

Na podstawie obu miar mona stwierdzi wystpowanie w badanym szeregu skonoci lewostronnej (ujemnej), co oznacza, e w badanej zbiorowoci dominuj uczniowie, dla ktrych wyniki pomiarw warunkw rodowiska domowego s wysze od rednich.
Dla okrelenia natenia skonoci (jak rwnie jej kierunku) wykorzystamy zarwno wspczynniki skonoci jak i trzeci moment centralny
standaryzowany.
Standaryzowane wspczynniki skonoci o postaciach 2.32 i 2.33
przyjmuj odpowiednio wartoci:

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

Ws1 ( x ) =

61

43,6 46,1
3 (43,6 44,8)
= 0,20 Ws1 ( x ) =
= 0,29
12,6
12,6

Obie miary wskazuj na niewielk skono lewostronn.


Kwartylowy wspczynnik skonoci zostanie ustalony zgodnie z wzorem 2.34. Wymaga on dodatkowego ustalenia kwartyli pierwszego i trzeciego. Kwartyl pierwszy wynosi:

120
10
Q1 ( x ) = 26 + 4
14 = 34 punkty
35
za kwartyl trzeci:

3 120
45
4
Q3 ( x ) = 41 +
14 = 52,5 punktu
55
Wobec tego wspczynnik skonoci przyjmie warto:

Ws 2 ( x ) =

(52,5 44,8) (44,8 34,0) = 3,1 = 0,17


(52,5 44,8) + (44,8 34,0) 18,5

Uzyskany wynik potwierdza wystpowanie niewielkiej skonoci lewostronnej.


Spord wymienionych rnych postaci trzeciego momentu centralnego przyjmijmy t ostatni (wzr 2.37). Dla jej wyznaczenia wykonano obliczenia pomocnicze zawarte w powyszej tabeli roboczej w kolumnach 5. i
6. Podstawiajc odpowiednie dane do wzoru uzyskujemy:

59068,6
492,2
*
120
m3 (t ) =
=
= 0,20
59068,6
492,2 + 2000,4
3
+ (12,6)
120
Kolejna miara rwnie wskazuje niewielk skono lewostronn.
2.3.5. Miary koncentracji
Zjawisko koncentracji wartoci cechy jest w statystyce dwojako interpretowane. Po pierwsze, moe oznacza skupienie wartoci cechy wok
redniej arytmetycznej; po drugie moe by utosamiane z nierwnomiernym rozkadem globalnego funduszu wartoci cechy wrd jednostek statystycznych badanej zbiorowoci.

62

Zygmunt Bobowski

Koncentracja jako nierwnomierno rozoenia globalnego funduszu


wartoci cechy
Globalny fundusz wartoci cechy stanowi sum wartoci wystpujcych
u wszystkich jednostek statystycznych badanej zbiorowoci. W przypadku
szeregu rozdzielczego punktowego wyznaczany jest on jako suma iloczynw
poszczeglnych wariantw wartoci cechy i odpowiadajcych im liczebnoci
k

x n ), za w przypadku szeregu rozdzielczego z przedziaami klasowymi


i

i =1

jako suma iloczynw rodkw poszczeglnych przedziaw klasowych i odk

powiadajcych im liczebnoci

x& n ).
i

Koncentracja w tym znaczeniu

i =1

jest powizana z poziomem zrnicowania wartoci cechy oraz nateniem


skonoci; im wysza zmienno i skono tym wyszy poziom nierwnomiernoci rozoenia wartoci cechy. Skrajne przypadki tak rozumianej koncentracji naley interpretowa nastpujco: koncentracja zupena ma miejsce wwczas, gdy caym funduszem wartoci cechy dysponuje jedna jednostka, za cakowity brak koncentracji wystpuje, gdy kadej jednostce
przypada taka sama cz tego funduszu.
Badanie nierwnomiernoci odbywa si przez porwnanie rozkadu tego
funduszu i rozoenia jednostek statystycznych badanej zbiorowoci. Jeli
proporcje rozkadu globalnego funduszu s odmienne ni proporcje rozkadu jednostek statystycznych, to wystpuje koncentracja w tym znaczeniu.
Badanie natenia tak rozumianej koncentracji moe si odbywa graficznie przy wykorzystaniu krzywej Lorenza lub analitycznie przy wykorzystaniu wspczynnika koncentracji o postaci

k=

a
5000

2.38.

gdzie: a jest powierzchni zawart midzy krzyw Lorenza a lini rwnomiernego podziau globalnego funduszu wartoci cechy.
Wspczynnik ten jest wielkoci unormowan w przedziale <0 ; 1>. Im
wysza jest jego warto tym wiksza nierwnomierno rozoenia globalnego funduszu wartoci cechy, a wielkoci skrajne oznaczaj:
0 - cakowity brak koncentracji,
1 - koncentracj zupen (praktycznie nie ma ona miejsca).
Wyznaczajc analitycznie wspczynnik koncentracji mona wykorzysta informacje ujte na wykresie krzywej (w praktyce nie jest to krzywa,
lecz linia amana) Lorenza. Sposb postpowania w przypadku graficznego i
analitycznego badania koncentracji ilustruje poniszy przykad.
Przykad 2.13.
Ponisza tablica zawiera informacje dotyczce struktury przedsibiorstw
woj. D wedug wielkoci zatrudnienia:

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

Liczba
przedsibiorstw

Zatrudnienie
(

xi )

ni )

rodki przedziaw

(x&i )

x& i ni

63

f i x&i ni
i =1

f i (ni )

cumfi x&i ni
i
=
1

cumfi (ni )

1-10
11-50
51-200
201-500
501-1000
Razem

450
100
35
12
3
600

5
30
125
350
750
X

2250
3000
4375
4200
2250
16075

14,00
18,66
27,22
26,12
14,00
100,00

75,00
16,67
5,83
2,00
0,50
10,00

14,00
32,66
59,88
86,00
100,00
X

75,00
91,67
97,50
99,50
100,00
X

rdo: Dane umowne

Na podstawie powyszych danych zbada poziom nierwnomiernoci


rozoenia zatrudnienia w przedsibiorstwach woj. D.
Rozwizanie.
Globalny fundusz wartoci cechy w podanym przykadzie stanowi czna wielko zatrudnienia w badanych 600 przedsibiorstwach. Stanowi ona
sum iloczynw zawartych w kolumnie 4. i wynosi 16075 (taka jest przybliona czna wielko zatrudnienia w badanych przedsibiorstwach). W kolumnie 5. zawarto czsto wystpowania globalnego funduszu wartoci cechy f i x& i n i , ktrej kolejne wartoci oznaczaj udzia zatrudnienia pok

i =1

szczeglnych kategorii przedsibiorstw (wedug wielkoci zatrudnienia) w


zatrudnieniu cznym. W kolejnej kolumnie 5. umieszczono czsto wystpowania przedsibiorstw wedug liczby zatrudnionych w cznej ich liczbie f i (ni ) . W kolumnach 7 i 8 dokonano kumulacji czstoci zawartych w kolumnach 5 i 6. Analiza informacji zawartych w tych kolumnach pozwala na
wstpn ocen koncentracji wartoci cechy; w przypadku, gdyby czstoci
skumulowane w poszczeglnych parach z obu kolumn byy identyczne,
oznaczaoby to wystpowanie rwnomiernego rozoenia globalnego funduszu wartoci cechy. W analizowanym przykadzie czstoci te w poszczeglnych parach s zrnicowane; pozwala to na stwierdzenie faktu wystpowania koncentracji (nierwnomiernoci rozoenia). Jej poziom zostanie wyznaczony graficznie (por. rys. 2.13) oraz analitycznie.
Wykorzystujc informacje zawarte w kolumnach 7. i 8. powyszej tabeli
roboczej wykrelamy w ukadzie wsprzdnych krzyw Lorenza, przy czym
na osi odcitych nanosimy skumulowane czstoci zawarte w kolumnie 8,
za na osi rzdnych czstoci z kolumny 6. Jej przebieg wyznaczaj punkty,
ktrych wsprzdnymi s poszczeglne pary czstoci skumulowanych (np.
75,00 i 14,00; 91,67 i 32,66; itd). W ten sposb pomidzy krzyw Lorenza, a
przektn naniesionego w ukadzie wsprzdnych kwadratu o boku 100
(okrelan mianem linii rwnomiernego podziau globalnego funduszu wartoci cechy) powstao pole a, ktre jest graficznym obrazem koncentracji
(nierwnomiernoci). Oceniajc wzrokowo udzia tego pola w powierzchni
trjkta zawartego pod wykrelon przektn dokonujemy szacunku poziomu koncentracji.

64

Zygmunt Bobowski

Rys. 2.13
Krzywa Lorenza

cum f i xi ni
i

100

90

80

70

60

50

40
32,66
30

20

14
10

I
10

20

30

40

50

60

III

II
70

80

90

100

cum f i (ni )

rdo: opracowanie wasne

Pomiar natenia koncentracji metod analityczn odbywa si najczciej przy wykorzystaniu powyszego wykresu, na podstawie ktrego moliwe jest precyzyjne okrelenie powierzchni powstaego pola. Poniewa jego
ksztat nie stanowi regularnej figury geometrycznej, wobec tego zaleca si
ustalenie wielkoci pola znajdujcego si pod krzyw Lorenza, tj. dopenienia pola a. Dopenienie pola a skada si w naszym przykadzie z 5 figur
geometrycznych (ponumerowanych I - V) powstaych w wyniku zrzutowania poszczeglnych punktw wyznaczajcych przebieg krzywej Lorenza na
o odcitych (uzyskalimy 1 trjkt i 4 trapezy). Ich pola wyznaczamy posugujc si wsprzdnymi poszczeglnych punktw. I tak:
pole trjkta (figura I) = 75 14/2 = 525
pole trapezu (figura II) = (32,66 + 14) /2 16,67 = 388,91
pole trapezu (figura III) = (59,88 + 32,66)/2 5,83 = 269,75
pole trapezu (figura IV) = (86 + 59,88)/2 2,00 = 145,88
pole trapezu (figura V) = (100 + 86)/2 0,50 = 46,50

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

65

Dopenienie pola a jest sum powierzchni powyszych figur i wynosi


1376,04.
Odejmujc t powierzchni od 5000 (taka jest powierzchnia trjkta
znajdujcego si pod lini rwnomiernego podziau) otrzymujemy pole a,
czyli 5000 - 1376,04 = 3623,96
T wielko podstawiamy do wzoru 2.38 i otrzymujemy:

k=

3623,96
= 0,725
5000

Uzyskana wielko wskazuje na wystpowanie duej nierwnomiernoci


rozoenia (tj. koncentracji) cznej liczby zatrudnionych w badanym zbiorze
przedsibiorstw.
Koncentracja jako skupienie wartoci cechy wok redniej
Dokonujc prezentacji graficznej rozkadu cech statystycznych za pomoc diagramu mona zauway, i wykrelona krzywa (w praktyce najczciej jest to linia amana) jednomodalna moe mie ksztat mniej lub bardziej spaszczony i odpowiednio mniej lub bardziej wyduony. Jest to zwizane z poziomem skupienia wartoci cechy wok ich redniej. Powysz sytuacj ilustruje rys. 2.14.
Rys. 2.14
Skupienie (koncentracja) wartoci cechy wok redniej

rdo: opracowanie wasne

Zakadajc, e we wszystkich przypadkach wystpuje identyczna warto rednia zaprezentowane krzywe I - III prezentuj rny poziom skupie-

66

Zygmunt Bobowski

nia wartoci cechy wok tej redniej. W przypadku krzywej I mona mwi
o wystpowaniu normalnego skupienia (normalnej koncentracji) wok
redniej. Dwie pozostae krzywe prezentuj odpowiednio: II - poziom skupienia mniejszy od normalnego (koncentracj mniejsz od normalnej);
krzywa ta ma ksztat spaszczony, platykurtyczny, III - poziom skupienia
wikszy od normalnego (koncentracj wiksz od normalnej); krzywa ma
ksztat wysmuky, leptokurtyczny.
Pomiaru tak rozumianej koncentracji dokonujemy przy pomocy miary
kurtozy (mona rwnie spotka okrelenie miary puapu) ustalanej wedug
wzoru:
k

(x i
m 4 (t ) =

m 4 (x )
=
s 4 (x )

i =1

x ) ni
N

(x
i =1

x)
N

ni

2.39.

Jak atwo zauway w liczniku podanej miary wystpuje moment centralny rzdu czwartego, za wykorzystanie w mianowniku odchylenia standardowego podniesionego do potgi czwartej ma na celu uzyskanie miary
niemianowanej. Im wysza warto tej miary tym wikszy poziom skupienia
wartoci cechy wok redniej arytmetycznej (wie si to ze spadkiem rozproszenia wartoci cechy, jednak warto mianownika maleje szybciej ni
warto czwartego momentu centralnego). W przypadku normalnego skupienia wartoci cechy warto tej miary wynosi 3, w przypadku wartoci
wikszych od 3 wystpuje koncentracja wiksza od normalnej, za przy
wartociach mniejszych od 3 - koncentracja mniejsza od normalnej.
W literaturze spotyka si rwnie modyfikacj tak sformuowanej miary
koncentracji. Nosi ona nazw miary ekscesu. Mierzy ona poziom odchylenia
badanego przypadku koncentracji od koncentracji normalnej i wyraa si
ona wzorem:

e(t ) = m4 (t ) 3

2.40.

Gdy jej warto wynosi zero - wystpuje koncentracja normalna; wartoci dodatnie wskazuj na wystpowanie koncentracji wikszej od normalnej, za mniejsze od zera - koncentracj mniejsz od normalnej.
W literaturze zaleca si badanie tak rozumianej koncentracji jedynie w
przypadku rozkadw symetrycznych lub nieznacznie skonych. W przypadku duej skonoci naley bada poziom nierwnomiernoci rozoenia globalnego funduszu wartoci cechy
Procedur wyznaczania miary kurtozy ilustruje poniszy przykad.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

67

Przykad 2.14.
Na podstawie danych z przykadu 2.11 zbada poziom skupienia (koncentracji) wynikw pomiaru warunkw rodowiska domowego wok ich
wartoci redniej.
Rozwizanie:
Przypomnijmy, e ustalona warto rednia wynosi 43,6 punktu, a odchylenie standardowe 12,6 punktu. Obliczenia pomocnicze dla wyznaczenia
czwartego momentu centralnego wykonano w poniszej tablicy roboczej:
Wyniki
pomiaru
(w punktach)

( xi )

Liczba
uczniw
( ni )

rodki przedziaw
( x&i )

(x&i x )4

(x& i x )4 ni

11 25
26 40
41 55
56 - 70
Razem

10
35
55
20
120

18
33
48
63
X

429496,7
12624,8
374,8
141646,8
X

4294967,0
441868,0
20614,0
2832936,0
7590385,0

Podstawiajc sum iloczynw zawartych w kolumnie 5. oraz odchylenie


standardowe do wzoru 2.39 otrzymujemy:

7590395
63253,2
m4 (t ) = 120 4 =
= 2,51 ,
25204,7
(12,6 )
a ustalona na tej podstawie miara ekscesu:

e(t ) = 2,51 3 = 0,49


Zarwno czwarty moment centralny standaryzowany jak i miara ekscesu wskazuj na koncentracj nieco nisz od normalnej (rozkad ma ksztat
nieznacznie spaszczony). Inaczej ujmujc: skupienie wynikw pomiaru wok ich redniej jest nieznacznie mniejsze od normalnego.

PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI

SERIA:
NAUKI SPOECZNE

Rozdzia III

Analiza wspzalenoci zmiennych

3.1. WPROWADZENIE
Zagadnienie to stanowi segment wielowymiarowej analizy statystycznej,
ktra moe by rozpatrywana w dwch ujciach. Po pierwsze, dotyczy moe opisu zbiorowoci statystycznej, w ktrym kada jednostka statystyczna
jest charakteryzowana przez dowolnie liczny (liczcy co najmniej 2) zbir
cech statystycznych. Oznacza to, i mamy w tym przypadku do czynienia z
wielowymiarowym opisem rozkadu okrelonej zbiorowoci. Po drugie - rozpatrywa mona rwnie inn sytuacj, gdy t sam cech opisujemy kilka
zbiorowoci statystycznych.
Analizujc pierwszy przypadek (w praktyce najczciej rozpatrywany) w
zbiorze cech przyjtych do opisu badanej zbiorowoci na podstawie analizy merytorycznej - wyodrbniamy takie, ktre wystpuj we wzajemnym
powizaniu i celem prowadzonego w takim przypadku badania wspzalenoci moe by udzielenie odpowiedzi na pytanie; Czy pomidzy wybranymi cechami opisujcymi badan zbiorowo wystpuje zaleno? W
drugiej sytuacji interesuje nas odpowied na pytanie: Czy pomidzy wartociami wybranej cechy opisujcymi rne zbiorowoci wystpuje zaleno?. Ilustracj pierwszego problemu moe by prba ustalenia: Czy istnieje zaleno pomidzy czasem powicanym na nauk okrelonego
przedmiotu przez badan grup studentw a uzyskiwanymi przez nich wynikami na egzaminie? W drugim przypadku moe to by prba udzielenia
odpowiedzi na pytanie: Czy istnieje zaleno midzy poziomem wyksztacenia rodzicw a ich dzieci na podstawie zebranego materiau statystycznego o wyksztaceniu z jednej strony populacji rodzicw a z drugiej - ich dzieci?
Naley podkreli, e badanie wspzalenoci dotyczy gwnie pierwszej z
omawianych sytuacji.
Prowadzenie analizy wspzalenoci wymaga wyodrbnienia w zbiorze
cech opisujcych badan zbiorowo takich cech, co do ktrych zachodzi
podejrzenie, e wystpuje pomidzy nimi zwizek przyczynowo-skutkowy.
Z powyszego wynika, e waciwe badanie wspzalenoci musi by po-

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

69

przedzone analiz merytoryczn (okrelan rwnie mianem analizy jakociowej) badanego zwizku w celu uniknicia badania tzw. wspzalenoci
pozornej. Wspzaleno taka ma miejsce wwczas, gdy wystpuje zaleno midzy wartociami badanych cech, ale nie ma midzy nimi powiza
przyczynowo-skutkowych, np. zaleno midzy liczb przebywajcych na
okrelonym obszarze bocianw a liczb urodze dzieci. Stwierdzenie wspomnianych powiza przyczynowych pomidzy cechami upowania do prowadzenia waciwej analizy wspzalenoci. W analizie takiej wyodrbnia
si zwykle dwa rodzaje cech: niezalen (jedn bd kilka) - utosamian z
przyczyn oraz zalen stanowic skutek oddziaywania wspomnianej
przyczyny.
Z teoretycznego punktu widzenia mona mwi o dwch rodzajach zalenoci pomidzy cechami: funkcyjnej i statystycznej. W pierwszym przypadku mamy do czynienia z jednoznacznym przyporzdkowaniem wartociom cechy niezalenej odpowiednich wartoci cechy zalenej (kadej wartoci zmiennej niezalenej odpowiada tylko jedna warto zmiennej zalenej). Ten typ zalenoci nie odnosi si w zasadzie do relacji zachodzcych w
przypadku zjawisk spoeczno-gospodarczych. Wynika to midzy innymi z
nastpujcych przyczyn:
zjawiska tego typu podlegaj zwykle oddziaywaniu bardzo wielu czynnikw,
w wikszoci przypadkw trudno jednoznacznie zidentyfikowa wszystkie czynniki,
nie wszystkie z ustalonych czynnikw maj charakter mierzalny by
mona je byo uwzgldni w analizie wspzalenoci,
wpyw wielu czynnikw, nawet tych mierzalnych, trudno jednoznacznie
okreli liczbowo z uwagi na czsto wystpujce zoone powizania z
innymi czynnikami,
uwzgldnienie w badaniach zbyt duej liczby czynnikw znacznie komplikuje procedury obliczeniowe, a niekiedy wrcz je uniemoliwia.
W takich warunkach badanie wspzalenoci odbywa si zwykle na zasadzie eksperymentowania, bowiem w naukach spoeczno-ekonomicznych
niemoliwe jest wyizolowanie badanych zjawisk od oddziaywania przyczyn
nieistotnych.
W zwizku z powyszym w przypadku zjawisk spoeczno-gospodarczych
mona mwi jedynie o wystpowaniu zalenoci typu statystycznego. Jest
to zaleno niejednoznaczna, tzn. kadej wartoci zmiennej niezalenej odpowiadaj rne wartoci zmiennej zalenej.
Analizujc oba rodzaje wspzalenoci naley zauway, e o ile w
przypadku zwizku funkcyjnego nie ma uzasadnienia pytanie: czy okrelona zmienna wystpuje w silniejszej bd sabszej zalenoci funkcyjnej od
innej zmiennej, o tyle w przypadku zwizku statystycznego postawienie podobnego pytania jest sensowne. Mona bowiem mwi o mniejszym bd
wikszym nateniu zalenoci typu statystycznego.
W literaturze wyodrbnia si rne podejcia do badania wspzalenoci o zrnicowanym stopniu precyzji wynikw jej badania. Nale do nich:
a) metoda graficzna,
b) metoda tabelaryczna,

70

Zygmunt Bobowski

c) metody formalne oparte na wykorzystaniu parametrycznych i


nieparametrycznych miar zalenoci.
Punktem wyjcia dla metody graficznej s szeregi szczegowe informacji
o wartociach dwch wybranych cech Y i X opisujcych badan zbiorowo.
Sporzdzony na ich podstawie diagram korelacyjny stanowi wykres punktowy umieszczony w ukadzie wsprzdnych prostoktnych, na ktrym zaznacza si punkty o wsprzdnych xi , yi (wsprzdne te naley traktowa
jako wartoci cech X i Y zaobserwowane w i-tej jednostce). Poniszy rys. 3.1
ilustruje najczciej spotykane ksztaty diagramu korelacyjnego.
Rys. 3.1.
Typowe ksztaty diagramw korelacyjnych

rdo: opracowanie wasne na podstawie: Maka W., Urbanek-Krzysztofiak D.: Metody


opisu statystycznego. Wyd. Uniwersytetu Gdaskiego. Gdaski 1995, s. 124

Zaprezentowane sytuacje oznaczaj:

a) wystpuje zaleno funkcyjna, dodatnia (ma miejsce jednoznaczne po-

b)

c)

rzdkowanie wzajemne wartoci cech X i Y; kadej wartoci cechy X odpowiada tylko jedna warto cechy Y przy czym rosncym wartociom
cechy X odpowiadaj rosnce wartoci cechy Y lub malejcym wartociom cechy X odpowiadaj malejce wartoci cechy Y,
zaleno prostoliniow o kierunku dodatnim; w tym przypadku poszczeglnym wartociom cechy X moe odpowiada dowolna liczba wartoci
cechy Y; dodatkowo - wraz ze wzrostem wartoci cechy X wzrastaj
(rednio) wartoci cechy Y (lub odwrotnie),
ten ksztat diagramu ilustruje zaleno funkcyjn o kierunku ujemnym;
w tym przypadku rwnie wystpuje jednoznaczne, wzajemne przyporzdkowanie wartoci cech X i Y, przy czym rosncym wartociom cechy

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

71

X odpowiadaj malejce wartoci cechy Y lub malejcym wartociom cechy X odpowiadaj rosnce wartoci cechy Y,
d) ten przypadek ilustruje zaleno prostoliniow o kierunku ujemnym; poszczeglnym wartociom cechy X moe odpowiada dowolna liczba wartoci cechy Y, przy czym rosncym wartociom cechy X odpowiadaj malejce (rednio) wartoci cechy Y (lub odwrotnie),
e) ilustruje jeden z przypadkw zwizku krzywoliniowego; w tym przypadku wystpuje niejednoznaczne przyporzdkowanie wartoci obu cech, a
dodatkowo nie ma miejsca jednolita tendencja zmian wartoci tych cech,
f) ten przypadek jest ilustracj braku zalenoci midzy cechami.
Na podstawie powyszego mona stwierdzi, e metoda graficzna oprcz
informacji o charakterze zwizku (liniowy lub krzywoliniowy) i kierunku
zwizku (dodatni lub ujemny) dostarcza rwnie wskazwek umoliwiajcych wstpn ocen siy zwizku miedzy cechami. Moe ona stanowi
punkt wyjcia dla stosowania formalnych metod opisu wspzalenoci.
Metoda tabelaryczna badania wspzalenoci wykorzystujca informacje ujte zarwno w szeregach jak i tablicach statystycznych - pozwala
na uzyskanie wynikw badania o stopniu precyzji zblionym do metody graficznej. Diagram korelacyjny to przecie nic innego, jak zaprezentowany w
postaci graficznej materia statystyczny ujty w szeregach bd tablicy statystycznej. W przypadku informacji o wartociach cech ujtych w postaci
szeregw statystycznych ocena charakteru zwizku jak i natenia oraz kierunku zalenoci odbywa si na podstawie okrelenia charakteru wzajemnych powiza wartoci dwch badanych cech. Analiza taka pozwala na
wstpne wyodrbnienie jednej z powyszych sytuacji oznaczonych jako (a)
( f).
Dla licznych zbiorowoci (przyjmuje si zwykle, e ich liczebno przekracza 30) materia statystyczny opisujcy je ujmuje si w formie tablicy
statystycznej zwanej w tym przypadku tablic korelacyjn6. Tablica taka
prezentuje jednoczesny rozkad badanej zbiorowoci ze wzgldu na dwie cechy, std te spotykane w literaturze okrelenie, i przedstawia ona dwuwymiarowy rozkad zbiorowoci. W tablicy takiej dla cech typu liczbowego
ich wartoci ujmowane s najczciej w postaci przedziaw klasowych7, za
dla cech typu opisowego przyjmuje si wystpujce w zbiorowoci ich warianty. Sformuowane przedziay klasowe bd warianty cech ujmowane s
w gwce i boczku tablicy. Zgromadzony w postaci szeregw szczegowych materia statystyczny moe by przeniesiony do przygotowanej makiety tablicy korelacyjnej tzw. metod kreskow, tzn. po odczytaniu wartoci cech dla okrelonej jednostki statystycznej jest ona umieszczana za pomoc kreski w odpowiednim polu tablicy korelacyjnej. Wypenion kreskami tablic korelacyjn traktujemy jako robocz, a po ich zliczeniu
otrzymujemy wynikow tablic liczebnoci, ktra moe by przeksztacona
w tablic czstoci. W tym celu naley wszystkie liczebnoci podzieli przez

Pierwotn postaci takiego materiau s jednak szeregi statystyczne


Zasady konstrukcji takich przedziaw s identyczne jak w przypadku szeregw z przedziaami klasowymi

72

Zygmunt Bobowski

liczebno ogln (N). Ilustracj takiej tablicy liczebnoci i jej przeksztacenia w tablic czstoci jest ponisza tablica 3.1.
Tabela 3.1. Pracownicy firmy Z ze wzgldu na wiek i sta pracy
(w latach)
Sta pracy
Wiek
20 - 30
30 - 40

nj
fj

0-5

5 - 10

10 15

ni
fi

15
0,30
5
0,10

10
0,20
10
0,20

10
0,20

25
0,50
25
0,50

20
0,40

20
0,40

10
0,20

50
1,00

rdo: Badania wasne

Na jej podstawie dokonana zostanie charakterystyka podstawowych typw rozkadw wystpujcych w tablicy korelacyjnej, tj. rozkadu cznego,
brzegowych i warunkowych.
a) rozkad czny opisuje badan zbiorowo jednoczenie ze wzgldu na
obie cechy (w tablicy znajduje si w jej zacieniowanej czci). Liczebnoci w
tym rozkadzie oznaczane s symbolem nij (za czstoci f ij ) i naley je odczytywa jako liczebnoci (czstoci) i-tego wiersza i j-tej kolumny. W naszym przykadzie rozkad czny liczebnoci odczytujemy nastpujco: w
badanej zbiorowoci pracownikw 15 osb posiada wiek 20 30 lat i sta
pracy 0 5 lat, 10 osb w wieku 20 30 lat i stau 5 10 lat, 5 osb posiadajcych wiek 30 40 lat oraz sta 0 5 lat, 10 osb w wieku 30 40 lat i
stau pracy 5 10 lat jak rwnie 10 osb posiadajcych wiek 30 40 lat i
sta 10 15 lat; rozkad czny czstoci odczytywany jest zwykle w ujciu
procentowym w sposb nastpujcy: 30 % pracownikw tej firmy posiada
wiek 20 30 lat i sta pracy 0 5 lat, 20 % jest w wieku 20 30 lat i stau
5 10 lat, 10 % posiada wiek 30 40 lat oraz sta 0 5 lat, 20 % jest w
wieku 30 40 lat i stau pracy 5 10 lat, rwnie 20 % posiada wiek 30
40 lat i sta 10 15 lat,
b) w tablicy wystpuj dwa rozkady brzegowe: wierszowy i kolumnowy.
Kady z nich opisuje badan zbiorowo ze wzgldu na jedn cech. Rozkad brzegowy wierszowy tworz sumy liczebnoci (czstoci) liczone po
poszczeglnych wierszach. S one oznaczane symbolem ni (czstoci - f i ) i
naley je odczytywa jako liczebnoci (czstoci) i-tego wiersza. W naszym
przykadzie liczebnoci (czstoci) te s umieszczone w ostatniej kolumnie i
ilustruj one rozkad zbiorowoci pracownikw ze wzgldu na wiek. Na ich
podstawie mona stwierdzi, e w badanej zbiorowoci 25 pracownikw, tj.
50 % zbiorowoci pracownikw jest w wieku 20 30 lat i taka sama liczba
posiada wiek 30 40 lat. Rozkad brzegowy kolumnowy tworz sumy liczebnoci (czstoci) liczone w poszczeglnych kolumnach. Oznaczane s

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

one symbolem

73

n j (czstoci f j ). Naley je odczytywa jako liczebnoci

(czstoci) j-tej kolumny. W podanym przykadzie liczebnoci (czstoci) te


opisuj rozkad zbiorowoci pracownikw ze wzgldu na ich sta pracy. Na
podstawie tego rozkadu mona stwierdzi, e 20 pracownikw, tj. 40 %
zbiorowoci posiada sta pracy z przedziau 0 5 lat, rwnie 20 (40 %)
sta od 5 10 lat oraz 10 (20 %) sta pracy 10 15 lat,
c) rozkady warunkowe opisuj badan zbiorowo ze wzgldu na jedn z
cech przy zaoeniu okrelonego warunku naoonego na cech drug. I tak
rozkady warunkowe cechy Y charakteryzuj rozkad zbiorowoci ze wzgldu na warianty tej cechy pod warunkiem, e cecha X przyjmuje okrelon
realizacj; cecha Y posiada tyle rozkadw warunkowych, ile wariantw
przyjmuje cecha X. Z kolei rozkady warunkowe cechy X charakteryzuj
rozkad zbiorowoci ze wzgldu na realizacje tej cechy pod warunkiem, e
cecha Y przyjmuje okrelony wariant; liczba rozkadw warunkowych cechy
X jest rwna liczbie wariantw cechy Y.
W przypadku omawianej tablicy wystpuj dwa rozkady warunkowe
cechy Y (tzn. stau pracy) i odczytujemy je nastpujco: przy zaoeniu, e
pracownicy s w wieku 20 30 lat 15 z nich ma sta pracy do 5 lat i 10 ma
sta 5 10 lat, natomiast wrd pracownikw w wieku 30 40 lat 10 posiada sta do 5 lat, rwnie 10 - sta od 5 10 lat oraz 5 sta od 10 do
15 lat. Dla cechy X (tzn. wieku) wystpuj trzy rozkady warunkowe odczytywane nastpujco: przy zaoeniu, e sta pracy pracownikw zawiera si
w przedziale 0 5 lat 15 z nich jest w wieku 20 30 lat i 5 w wieku 30 40
lat; przy zaoeniu, e ich sta wynosi 5 10 lat po 10 pracownikw jest w
wieku 20 30 lat oraz 30 40 lat; wszyscy pracownicy o stau 10 15 lat
posiadaj wiek z przedziau 30 40 lat. Naley doda, e w przypadku tablicy korelacyjnej czstoci procedura ustalania rozkadw warunkowych
jest bardziej skomplikowana i zostanie tu pominita.
Wstpna ocena zalenoci na podstawie materiau statystycznego ujtego w tablicy korelacyjnej opiera si moe na ocenie rozkadu liczebnoci
(czstoci) w tablicy jak rwnie na ocenie podobiestwa rozkadw warunkowych. Koncentracja liczebnoci (czstoci) wzdu przektnych tablicy
korelacyjnej wskazuje na wystpowanie znacznego natenia zalenoci; jeli jest to przektna biegnca z lewego grnego naronika tablicy do prawego dolnego to sytuacja taka oznacza wystpowanie zalenoci o kierunku
dodatnim; w przeciwnym przypadku bdzie to zaleno o kierunku ujemnym.
Dokonujc oceny zalenoci na podstawie rozkadw warunkowych naley kierowa si zasad: im wyszy stopie podobiestwa rozkadw warunkowych okrelonej cechy (przy zmieniajcych si warunkach naoonych na cech przeciwn) tym mniejsze jest natenie zalenoci. Jeli s
one identyczne, zaleno nie wystpuje. Doda naley, i na badaniu podobiestwa rozkadw warunkowych opieraj si niektre z miar zalenoci.
Omwione wyej sposoby badania zalenoci pozwalaj jedynie na
wstpn jej ocen. Precyzyjniejszych wynikw badania dostarczaj metody
formalne wykorzystujce miary zalenoci cech. Przedmiotem dalszych rozwaa bd wyodrbniane w literaturze dwie metody badania wspzale-

74

Zygmunt Bobowski

noci statystycznej, tj. metoda nieparametrycznego (stochastycznego) i metoda parametrycznego (korelacyjnego) badania wspzalenoci. Pierwsza z
metod opiera si na badaniu podobiestwa rozkadw warunkowych (analiza dotyczy jedynie rozkadw cech a nie ich wartoci) cechy zalenej. Natenie zalenoci w tym przypadku okrelamy na podstawie stopnia podobiestwa warunkowych rozkadw tej cechy. W drugim przypadku przedmiotem analizy jest badanie podobiestwa parametrw warunkowych
(rednich warunkowych) cechy zalenej. Wysze podobiestwo rednich warunkowych cechy zalenej oznacza bdzie mniejsze natenie zalenoci. W
ramach obu metod wykorzystywanych jest wiele miar wspzalenoci cech
o cile okrelonych waciwociach i wynikajcych std warunkach ich
stosowania. Ich prezentacja zostanie dokonana na tle hipotetycznej idealnej miary zalenoci.

3.2. WASNOCI IDEALNEJ MIARY ZALENOCI


W stosunku do miar wykorzystywanych w procedurach badania wspzalenoci formuowane s okrelone postulaty dotyczce ich wasnoci. Na
ich podstawie mona sformuowa model miary idealnej, ktra winna posiada nastpujce wasnoci:
a) winna by niemianowana, gdy umoliwia to prowadzenie analizy porwnawczej zalenoci rnych cech,
b) winna by unormowana, tzn. winna przyjmowa wartoci ze skoczonego przedziau liczbowego; umoliwia to ocen natenia zalenoci pomidzy badanymi cechami. Miary speniajce ten postulat przyjmuj
najczciej wartoci z przedziau liczbowego <0 ; 1> Dla oceny natenia
zalenoci mona przyj nastpujce kryteria:
Warto miary zalenoci
0
( 0 0,33>
( 0,33 0,66>
( 0,66 1,00)
1,00

Natenie zalenoci
niezaleno (brak zalenoci)
zaleno saba
zaleno wyrana
zaleno silna
zaleno funkcyjna

c) oprcz natenia winna wskazywa rwnie kierunek zalenoci; jej warto winna informowa, czy w okrelonym przypadku mamy do czynienia z zalenoci o kierunku dodatnim bd ujemnym. W przypadku zalenoci dodatniej rosncym (malejcym) wartociom cechy niezalenej
odpowiadaj rosnce (malejce) wartoci cechy zalenej. Zaleno
ujemna oznacza, i rosncym (malejcym) wartociom cechy niezalenej
towarzysz malejce (rosnce) wartoci cechy zalenej. Miary wskazujce
kierunek zalenoci przyjmuj wartoci zarwno dodatnie jak i ujemne;
w przypadku miar unormowanych przyjmuj one wartoci z przedziau
liczbowego <-1; 1>. Badanie kierunku zalenoci odnosi si do relacji zachodzcych midzy cechami, ktrych wartoci s wyraone przynajmniej
na skali porzdkowej,

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

75

d) winna by symetryczna; wwczas warto miary jest identyczna bez


wzgldu na kierunek badania zalenoci, co oznacza, i warto miary
zalenoci Y od X jest identyczna jak miara zalenoci X od Y. Wasno
ta jest speniona w przypadku zwizkw prostoliniowych lub w przypadku badaniach zwizkw zachodzcych midzy cechami opisowymi,
e) istnieje moliwo jej stosowania do badania zalenoci w zwizkach
prosto- i krzywoliniowych. Spenienie tej wasnoci wyklucza konieczno badania charakteru zwizku przed zastosowaniem okrelonej
miary do badania zalenoci. W przypadku miar, ktre mog by stosowane do badania zalenoci w zwizkach prostoliniowych, waciwe badanie zalenoci musi by poprzedzone badaniem potwierdzajcym wystpowanie zwizku prostoliniowego midzy badanymi cechami. Negatywny wynik takiego badania zmusza nas do wyboru innej miary zalenoci. Brak moliwoci zbadania charakteru zwizku (np. gdy informacje
zawarte s w postaci tablicy korelacyjnej) wymaga przynamniej przyjcia
zaoenia o wystpowaniu zwizku prostoliniowego. Wykorzystanie miary
typowej do badania zalenoci w zwizkach krzywoliniowych w przypadku zwizku prostoliniowego nie stanowi bdu; naley tu doda oczywist uwag, i problem badania charakteru zwizku nie odnosi si do
zalenoci wystpujcych midzy cechami opisowymi,
f) istnieje moliwo jej stosowania do badania zalenoci w dowolnym
ukadzie rodzajowym cech; badanie zalenoci moe dotyczy trzech nastpujcych sytuacji: badamy zaleno midzy dwiema cechami liczbowymi, np. midzy staem pracy i zarobkami pracownikw; badanie zalenoci midzy dwiema cechami opisowymi, np. midzy poziomem wyksztacenia pracownikw a miejscem zajmowanym w strukturze organizacyjnej firmy; wreszcie zalenoci midzy cech liczbow a opisow, np.
midzy poziomem wyksztacenia pracownikw a ich zarobkami. Idealn
miar zalenoci byaby taka, ktr mona zastosowa w kadej z wymienionych sytuacji,
g) winna spenia wasno jednolitej preferencji wartoci, co oznacza, i
wzrostowi wartoci miary towarzyszy wzrost natenia zalenoci midzy
cechami,
h) winna by prosta rachunkowo.
Naley zauway, e mao prawdopodobne jest jednoczesne pogodzenie
wszystkich ww. wasnoci (zwaszcza ostatniej z wczeniej wymienionymi),
dlatego poszczeglne miary w rnym stopniu speniaj kryteria miary idealnej.

3.3. METODA NIEPARAMETRYCZNEGO BADANIA WSPZALENOCI


Ta metoda badania zalenoci polega na badaniu prawidowoci wystpujcych w zakresie wspwystpowania wariantw cechy zalenej przyporzdkowanych poszczeglnym wariantom cechy niezalenej i stwierdzaniu,
na ile rozkad wariantw cechy zalenej jest zdeterminowany zmieniajcymi
si odmianami cechy niezalenej. Praktycznie oznacza to badanie podobiestwa rozkadw warunkowych czstoci cechy zalenej. Natenie zaleno-

76

Zygmunt Bobowski

ci midzy badanymi cechami moe by oceniane na podstawie stopnia podobiestwa tych rozkadw. Jeli wszystkim wariantom cechy niezalenej
odpowiadaj identyczne rozkady warunkowe cechy zalenej, oznacza to
wystpowanie niezalenoci cech w sensie nieparametrycznym. W przypadku zrnicowanych rozkadw warunkowych wystpuje zaleno cech, a
stopie ich niepodobiestwa pozwala na wstpn ocen natenia zalenoci.
Sformuowany wyej w sposb opisowy warunek niezalenoci cech
mona sformalizowa w sposb nastpujcy:
jeli dla wszystkich kombinacji wariantw cech zalenej i niezalenej (czyli
wszystkich pl rozkadu cznego w tablicy korelacyjnej) zachodzi relacja:
f ij = f i f j , tzn. f ij f i f j = 0
wwczas wystpuje niezaleno badanych cech.
Warunek ten jest symetryczny.
3.3.1. Wspczynnik zbienoci Czuprowa
W oparciu o podany wyej warunek skonstruowany zosta wspczynnik
zbienoci Czuprowa o postaci:

d =
c

i, j

(f

fi f j )

ij

fi f j

3.1.

min(r , s ) 1

gdzie: r , s oznacza liczb wystpujcych w tablicy korelacyjnej wariantw cech X i Y


Jeli przyj jako wyjciow sytuacj, gdy materia statystyczny stanowicy podstaw do badania zalenoci jest ujty w tablicy korelacyjnej liczebnoci wwczas dla ustalenia wspczynnika Czuprowa naley wykona
kolejno nastpujce dziaania:
1) przeksztaci tablic liczebnoci w tablic czstoci zawierajc wyraenia:

f ij , f i , f j
2) ustali dla kadego pola tablicy korelacyjnej iloczyny

fi f j ,

3) dla kadego pola tablicy sprawdzi warunek niezalenoci


f ij f i f j = 0 ; jeli jest on speniony dla wszystkich pl stwierdzamy wystpowanie niezalenoci cech, w przeciwnym przypadku
kontynuujemy kolejne czynnoci,
4) w kadym polu tablicy obliczy kwadrat ustalonej rnic

(f

fi f j ) ,
2

ij

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

77

5) w kadym polu obliczy iloraz kwadratu rnicy oraz iloczynu

f i f j , tzn.

(f

fi f j )

ij

fi f j

6) dokona sumowania otrzymanych wielkoci i uzyskan wielko


wstawi do licznika podanego wzoru.
Powysz procedur postpowania ilustruje przykad 3.1.
Przykad 3.1.
Zebrane informacje dotyczce czasu pozostawania bez pracy oraz poziomu wyksztacenia badanej grupy bezrobotnych ujto w postaci nastpujcej tablicy korelacyjnej:
Tablica 3.2. Bezrobotni miasta K wedug czasu pozostawania bez
pracy (w miesicach) oraz poziomu wyksztacenia
( stan na 30.06.2003 r.)
Wyksztacenie (X)
podstawowe

rednie

wysze

ni

10
42
33
25

15
30
15
15

10
3
2
-

35
75
50
40

110

75

15

200

Czas pozostawania
bez pracy (Y)
0-6
6 - 12
12 - 18
18 24

nj
rdo: Dane umowne

Zbada, czy wystpuje zaleno czasu pozostawania bez pracy od poziomu


wyksztacenia bezrobotnych?
Rozwizanie.
Badanie zalenoci zostanie dokonane zgodnie z podanym wyej algorytmem postpowania, a wykonywanie dziaania umieszczono w poniszej
tablicy roboczej (w pierwszym polu tablicy ponumerowano kolejne dziaania zgodnie z podan wyej kolejnoci)
Suma ilorazw (wystpujcych w ostatniej pozycji kadego pola) wynosi
0,1685., za minimalna liczba wariantw obu cech 3. Wstawiajc te wielkoci do formuy 3.1. otrzymujemy:

dc =

0 ,1685
= 0 , 29
3 1

Uzyskana wielko oznacza wystpowanie niewielkiej zalenoci czasu pozostawania bez pracy od poziomu wyksztacenia bezrobotnych.

78

Zygmunt Bobowski

Wyksztacenie(X)
Czas pozostawania
bez pracy (Y)

06

6 12

12 - 18

18 24

nj
fj

rednie

wysze

15
0,075
0,0656
0,0094
~0,0001
0,0013
30
0,15
0,1406
0,0094
~0,0001
0,0006
15
0,075
0,0938
-0,0188
0,0004
0,0047
15
0,075
0,0750
0
0
0

10
0,05
0,0131
0,0369
0,0014
0,1068
3
0,015
0,0281
-0,0131
0,0002
0,0061
2
0,01
0,0188
-0,0088
0,0001
0,0041
0,0150
-0,015
0,0002
0,015

75
0,375

15
0,075

podstawowe

(1)
(2)
(3)
(4)

10
0,05
0,0963
0,0463
0,0021
0,0223
42
0,21
0,2063
0,0037
~0,0001
0,0001
33
0,165
0,1375
0,0275
0,0008
0,0055
25
0,125
0,1100
0,0150
0,0002
0,0020
110
0,55

ni
fi
35
0,175

75
0,375

50
0,25

40
0,20

200
1,00

Analizowana miara zalenoci posiada nastpujce wasnoci:


jest wielkoci niemianowan,
przyjmuje wartoci z unormowanego przedziau liczbowego < 0 ; 1>,
wskazuje natenie zalenoci,
jest miar symetryczn,
moe by stosowana do badania zalenoci w dowolnym ukadzie rodzajowym cech; naley j stosowa przede wszystkim do badania zalenoci
midzy cechami opisowymi, bd midzy opisowymi i liczbowymi.

3.3.2. Wspczynnik zalenoci Hellwiga


Pewn modyfikacj wspczynnika zbienoci Czuprowa stanowi wspczynnik zalenoci Hellwiga. Jego konstrukcja opiera si rwnie na wykorzystaniu warunku niezalenoci cech w sensie nieparametrycznym. Procedura jego wyznaczania w porwnaniu ze wspczynnikiem Czuprowa jest
mniej skomplikowana rachunkowo i wymaga wykonania pierwszych trzech

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

79

z podanych wyej dziaa, w wyniku ktrych otrzymujemy wyraenia o postaci: f ij f i f j . Wrd otrzymanych wielkoci wyodrbniamy dwa podzbiory:
G , dla ktrego

f ij f i f j > 0

M, dla ktrego

f ij f i f j < 0

Odpowiednio dla podanych dwch podzbiorw zostay zaproponowane


dwie postacie wspczynnika zalenoci Hellwiga:
a) dla podzbioru G:
d

H
G

f ij

i , j G

fi f

i , j G

3.2.

(r , s )

min

b) dla podzbioru M:
d

H
M

fi f

i , j M

f ij

i , j M

3.3.

1
min

(r , s )

Naley zaznaczy, e w obu przypadkach uzyskujemy t sam warto


wspczynnika Hellwiga. Wspczynnik ten posiada wasnoci identyczne
jak wspczynnik zbienoci Czuprowa, lecz jest mniej pracochonny. Dla
ilustracji procedury wyznaczania tego wspczynnika wykorzystamy podany
wyej przykad 3.1 i wykonane w tablicy roboczej obliczenia oznaczone jako
(1) (3).
Przyjmujemy, e w dalszym postpowaniu ograniczymy si do podzbioru
G, czyli tych pl tablicy korelacyjnej, w ktrych speniony jest warunek
f ij f i f j > 0 , pozostae pola tablicy pozostawimy puste (por. ponisza tablica robocza)
Wyksztacenie (X)
Czas pozostawania
bez pracy (Y)

podstawowe

0-6

6 - 12

12 - 18

18 24

fj

0,21
0,2063
0,0037
0,165
0,1375
0,0275
0,125
0,1100
0,0150
0,55

rednie

wysze

fi

(1) 0,075
(2) 0,0656
(3) 0,0094
0,15
0,1406
0,0094

0,05
0,0131
0,0369

0,175

0,375

0,25

0,20

0,375

0,075

1,00

80

Zygmunt Bobowski

Dla wyodrbnionych pl wyznaczamy odpowiednie sumy:

ij

= 0,775

i , j G

f j = 0,6731

i , jG

podstawiajc je do wzoru 3.2. otrzymujemy:

dG

0,775 0,6731
= 0,39
1
1
3

Uzyskana warto miary odbiega nieznacznie od otrzymanej dla wspczynnika zbienoci Czuprowa. Oznacza ona wystpowanie wyranej zalenoci czasu pozostawania bez pracy od poziomu wyksztacenia bezrobotnych.

3.4. METODA PARAMETRYCZNEGO BADANIA WSPZALENOCI


Ta metoda badania wspzalenoci cech, zwana rwnie metod korelacyjn, opiera si na analizie wzajemnych powiza wartoci cechy, a nie
jedynie jak w przypadku metody nieparametrycznej ich rozkadw warunkowych (liczebnoci bd czstoci). Najczciej wykorzystywane w ramach tej metody miary zalenoci to:
a) stosunek korelacyjny,
b) wspczynnik korelacji liniowej Pearsona,
c) wspczynnik korelacji rang Spearmana.
3.4.1. Stosunek korelacyjny
Istot tej miary zalenoci jest badanie podobiestwa rednich warunkowych cechy zalenej (Y). S to rednie arytmetyczne wartoci tej cechy
przyporzdkowane wystpujcym w tablicy korelacyjnej wariantom cechy
niezalenej. Jeli przyjmiemy je oznacza jako y x j lub y xi (w zalenoci od
ukadu tablicy korelacyjnej: w pierwszym przypadku cecha X bdzie wystpowaa w gwce tablicy, w drugim w boczku tablicy), to mona sformuowa nastpujcy formalny warunek niezalenoci cech w sensie korelacyjnym:
jeli speniona jest relacja:
y x1 = y x 2 = y x3 = ..... = y x k (gdzie: k to liczba wariantw cechy niezalenej),
to pomidzy badanymi cechami wystpuje niezaleno w sensie korelacyjnym (parametrycznym).
Jeli warunek ten nie jest speniony wwczas wystpuje zaleno w
sensie parametrycznym. Z powyszego wynika, e sama analiza rednich
warunkowych pozwala na wstpn ocen zalenoci cech. Dodatkowo, gdy
rosncym wartociom cechy niezalenej towarzysz rosnce wartoci rednich warunkowych cechy zalenej, stwierdzamy wystpowanie zalenoci o

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

81

kierunku dodatnim; natomiast, gdy rosncym wartociom cechy niezalenej


odpowiadaj malejce wartoci rednich warunkowych cechy zalenej kierunek zalenoci jest ujemny. W sytuacji, gdy rednie warunkowe nie wykazuj jednoznacznej tendencji, nie okrelamy na ich podstawie kierunku
zalenoci. Analiza rednich warunkowych pozwala zatem na wstpn ocen zalenoci cech. Dla oceny natenia zalenoci wykorzystywany jest
stosunek korelacyjny o postaci:

(y

xj

y) 2 n j

rk =

s( y x j )
s( y )

( y i y ) 2 ni

3.4.

N
lub

(y

xi

y ) 2 ni

r =
k

s ( y xi )
s( y )

( y j y) 2 n j

3.5.

N
gdzie:

( )

( )

s y x j lub s y xi - odchylenie standardowe rednich warunkowych cechy zalenej,


- odchylenie standardowe oglne cechy zalenej,

s( y )
y x j lub y xi - rednie warunkowe cechy zalenej,
y - rednia oglna cechy zalenej.

Podana pierwsza wersja tej miary jest wykorzystywana, gdy wartoci cechy zalenej (Y) wystpuj w boczku tablicy, za druga, gdy s one
umieszczone w gwce tablicy. Naley rwnie doda, i wystpujce we
wzorach liczebnoci mog by zastpione czstociami.
Algorytm obliczania tej miary mona uj w nastpujcych punktach:
1) wyznaczenie rednich warunkowych i redniej oglnej cechy zalenej (Y),
2) ustalenie wariancji, a nastpnie odchylenia standardowego rednich
warunkowych cechy zalenej,
3) ustalenie wariancji, a nastpnie odchylenia standardowego oglnego
cechy zalenej,
k

4) wyznaczenie wartoci miary r .


Podan wyej procedur postpowania ilustruje przykad 3.2.

82

Zygmunt Bobowski

Przykad 3.2.
W poniszej tablicy zawarto wyniki badania warunkw materialnych losowej grupy gospodarstw domowych miasta L uwzgldniajce wysoko
dochodw na 1 czonka gospodarstwa domowego (Y) oraz liczb osb w gospodarstwie (X).
Tablica 3.3 Gospodarstwa domowe miasta L wedug dochodw na
1 osob w z oraz liczb osb w gospodarstwie
Liczba osb w gospodarstwie (X)
13
46
7-9
2
13
20
8
17
20
20
-

Dochd na 1
osob w z (Y)
150 350
350 550
550 750

nj

30

50

20

ni
35
25
40
100

rdo: Dane umowne.

Na podstawie analizy rednich warunkowych oraz przy wykorzystaniu stosunku korelacyjnego zbada, czy w badanej zbiorowoci wystpuje zaleno wysokoci dochodu na osob od liczby osb w gospodarstwie domowym.
Rozwizanie:
rednie warunkowe cechy zalenej bd stanowiy rednie dochodw na
osob w wyodrbnionych trzech kategoriach wielkoci gospodarstw, tj. 1 3
osb, 4 6 osb oraz 7 9 osb. Dla ich wyznaczenia naley ustali rodki
przedziaw klasowych dla dochodw ( ujto je w nawiasach w pierwszej kolumnie poniszej tablicy roboczej).
Poszczeglne rednie warunkowe wyznaczone zostan w nastpujcy
sposb:

2 250 + 8 450 + 20 650 17100


=
= 570 z
30
30
13 250 + 17 450 + 20 650 23900
=
=
= 478 z
50
50
20 250
=
= 250 z
20

y13 =
y 4 6
y 7 9

Na podstawie uzyskanych rednich warunkowych mona stwierdzi:


po pierwsze, wystpuje zaleno wysokoci dochodw na 1 osob od
liczby osb w gospodarstwie domowym, poniewa rednie warunkowe
s zrnicowane,
- po drugie, wystpuje ujemna zaleno wysokoci dochodw od liczby
osb, poniewa wraz ze wzrostem liczby osb w gospodarstwie maleje
rednia wysoko dochodu na 1 osob.
Dla pomiaru natenia zalenoci wykorzystamy stosunek korelacyjny,
a obliczenia pomocnicze zostay wykonane w tablicy roboczej. Niezalenie
-

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

83

od ustalonych rednich warunkowych naley wyznaczy redni dochd na


1 osob we wszystkich gospodarstwach domowych. Dokonamy tego wedug
wzoru:

y& n
i

y=

Dochd
(rodki przedzia-

y&i )

w -

250
450
650

nj

35 250 + 25 450 + 40 650 46000


=
= 460 z
100
100

Liczba osb (

xi )

13
2
8
20
30

46
13
17
20
50

7-9
20
20

570

478

12100
363000

ni

( y&i y )2 ( y& i y )2 ni

35
25
40
100

44100
100
36100

250

324

44100

16200

882000

= 1261200

1543500
2500
1444000

= 2990000
i

(y

(y

yx j
xj

y nj
2

xj

Wyniki oblicze pomocniczych podstawiamy do wzoru 3.4 i otrzymujemy:

rk =

1261200
112 ,3
100
=
= 0,65
172 ,9
2990000
100

Uzyskana warto miary oznacza, e wystpuje wyrana zaleno wysokoci dochodw na 1 osob od liczby osb w gospodarstwie domowym.
Wykorzystana miara nie okrela kierunku zalenoci, ale na podstawie
rednich warunkowych stwierdzilimy, e jest on ujemny.
Omawiana miara zalenoci charakteryzuje si nastpujcymi wasnociami:
1) jest niemianowana,
2) jest unormowana w przedziale <0 ; 1>,
3) nie wskazuje kierunku zalenoci; w szczeglnych przypadkach moe by on okrelony w oparciu o rednie warunkowe,
4) jest w zasadzie niesymetryczna (zjawisko symetrii zachodzi tylko w
przypadku zwizku prostoliniowego),
5) jest wykorzystywana do badania zalenoci w zwizkach krzywoliniowych lub, gdy charakter zwizku nie jest znany,
6) stosuje si j do badania zalenoci, gdy przynajmniej cecha zalena
jest liczbowa,
7) spenia warunek jednolitej preferencji wartoci.

84

Zygmunt Bobowski

3.4.2. Wspczynnik korelacji liniowej Pearsona


W przypadku, gdy badanie zalenoci dotyczy dwch cech liczbowych, a
zwizek midzy nimi jest prostoliniowy, wwczas naley do tego celu wykorzysta wspczynnik korelacji liniowej Pearsona. Miara ta wystpuje w
dwch wersjach:
- opartej na danych ujtych w postaci szeregw szczegowych,
- wykorzystujcej informacje ujte w tablicy korelacyjnej.
Dla pierwszego przypadku obliczana jest ona wedug wzoru:

(x
rP =

x ) ( y i y )

c (x, y )
=
s ( x ) s ( y )

(x

x)

(y

y)

3.6.

natomiast dla drugiego:

(x
rP =

c (x, y )
=
s ( x ) s ( y )

x ) ( y i y ) n ij

i, j

(x

x) n j

(y

y ) ni
2

3.7.

gdzie:

c( x, y ) kowariancja cech X i Y,
s ( x) odchylenie standardowe cechy X,
s ( y ) odchylenie standardowe cechy Y.
Wzr o postaci 3.7. odpowiada ukadowi tablicy, w ktrej wartoci cechy
X umieszczone s w jej gwce , za cechy Y w boczku; w przypadku odwrotnego ukadu cech wystpujce w podanym wzorze indeksy i oraz j winny by zamienione miejscami. Naley rwnie doda, e wystpujce we
wzorze 3.7 liczebnoci mog by zastpione czstociami.
Jeli dla badania zalenoci wykorzystujemy wersj wspczynnika korelacji dla szeregw szczegowych, wwczas wykonujemy kolejno nastpujce dziaania:
1) wyznaczamy na podstawie szeregw szczegowych wartoci rednie
dla obu cech,
2) ustalamy wielkoci rnic poszczeglnych wartoci cech X i Y oraz
ich wartoci rednich, tj. xi x oraz yi y ,
3) ustalamy kwadraty uzyskanych rnic,
4) dokonujemy ich sumowania,
5) ustalamy iloczyny rnic uzyskanych w p. 2,

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

85

6) dokonujemy sumowania tych iloczynw,


7) uzyskane sumy podstawiamy do wzoru 3.6.
Procedur t ilustruje przykad 3.3.
Przykad 3.3.
Dla zbadania zalenoci midzy wielkoci miesicznych wydatkw na
cele kulturalne (Y) a liczb osb w gospodarstwie domowym (X) zebrano informacje dla 20 wylosowanych gospodarstw gminy Z. Otrzymano dane
zawarte w poniszej tablicy:
Tablica 3.4. Gospodarstwa domowe gminy Z wedug liczby osb
oraz wysokoci miesicznych wydatkw na cele kulturalne
Liczba osb

Wydatki w z 70 75 60 100 85 70 90 50 70 70 110 75 40 60 90 90 75 60 80 90


rdo: Dane umowne

Przy pomocy wspczynnika korelacji liniowej Pearsona zbada, czy wystpuje zaleno wysokoci wydatkw od liczby osb w gospodarstwie domowym?
Rozwizanie:
Obliczenia pomocnicze zgodnie z podan procedur zostan wykonane
w poniszej tablicy roboczej:
Liczba

Wydatki

osb ( xi )

3
5
7
2
6
4
5
3
2
2
4
6
5
3
3
7
4
2
4
3

= 80

yi )

70
75
60
100
85
70
90
50
70
70
110
75
40
60
90
90
75
60
80
90

y =
i

1510

xi x (xi x)2
-1
1
3
-2
2
0
1
-1
-2
-2
0
2
1
-1
-1
3
0
-2
0
-1

1
1
9
4
4
0
1
1
4
4
0
4
1
1
1
9
0
4
0
1

=
i

yi y ( yi y)2
-5,5
-0,5
-15,5
24,5
9,5
-5,5
14,5
-25,5
-5,5
-5,5
34,5
-0,5
-35,5
-15,5
14,5
14,5
-0,5
-15,5
4,5
14,5

50

30,25
0,25
240,25
600,25
90,25
30,25
210,25
650,25
30,25
30,25
1190,25
0,25
1260,25
240,25
210,25
210,25
0,25
240,25
20,25
210,25

=
i

5495

(xi x)( yi y)

5,5
-0,5
-46,5
-49,0
19
0
14,5
25,5
11
0
0
1
-35,5
15,5
-14,5
43,5
0
31,0
0
-14,5

15,0

86

Zygmunt Bobowski

Wartoci rednie dla obu cech bd wynosiy odpowiednio:

x=

80
= 4,0 osoby
20

y=

1510
= 75,5 z.
20

Uzyskane w tablicy roboczej wyniki oblicze podstawiamy do wzoru 3.6.


i otrzymujemy:

rP =

15
0,75
20
=
= 0,03
50 5495 1,58 16,58

20
20

Otrzymana warto miary wskazuje na wystpowanie niewielkiej zalenoci wysokoci wydatkw na cele kulturalne od liczby osb w badanych
gospodarstwach domowych.
W przypadku badania zalenoci na podstawie danych ujtych w tablicy
korelacyjnej wykorzystujemy drug wersj wspczynnika korelacji i w
zwizku z tym wykonujemy kolejno nastpujce dziaania:
1) wyznaczamy wartoci rednie dla obu cech,
2) ustalamy wielkoci rnic poszczeglnych wariantw cech X i Y oraz
ich wartoci rednich, tj. x j x oraz yi y ,
3)

obliczamy iloczyny kwadratw ustalonych wyej rnic oraz odpowiadajcych im liczebnoci brzegowych, tj.

( x j x ) 2 n j oraz

( y i y ) 2 ni
4) dokonujemy sumowania tych iloczynw,
5) dla poszczeglnych pl rozkadu cznego ustalamy iloczyny

(x

x ) ( y i y ) nij

6) dokonujemy sumowania tych iloczynw,


7) uzyskane sumy podstawiamy do wzoru 3.7.
W przypadku, gdy wartoci cech ujte s w postaci przedziaw klasowych w obliczeniach wykorzystujemy rodki tych przedziaw. Procedur t
ilustruje przykad 3.4.
Przykad 3.4.
Na podstawie danych z przykadu 3.2 zbada zaleno wysokoci dochodw na 1 osob od wielkoci gospodarstwa domowego zakadajc, e
midzy cechami wystpuje zwizek prostoliniowy.
Rozwizanie:
W tablicy korelacyjnej wartoci obu cech ujto w postaci przedziaw
klasowych, wobec czego w dalszych obliczeniach bd wykorzystywane ich
rodki (ujto je w poniszej tablicy roboczej). Ustalona w przykadzie 3.2

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

87

rednia dochodu ( y ) wynosi 460 z, a redni liczby osb w gospodarstwie


domowym ustalimy wedug wzoru:

x=

30 2 + 50 5 + 20 8 470
=
= 4,7 osoby.
100
100

Dalsze obliczenia pomocnicze wykonano w tablicy roboczej.


Dochd
(rodki przedziaw- y& i )
250

450

650

nj

Liczba osb (rodki


przedziaw
( x& j )
2
2
567
1134
8
27
216
20
-513
-10260

5
13
- 63
-819
17
-3
-51
20
57
1140

8
20
-693
-13860
-

30

50

20

ni

( y&i y ) ( y& y )2 n
i
i

35

-210

25

-10

2500

40

190

1444000

100

1543500

= 2990000
i

x& j x

-2,7

0,3

3,3

( x& j x ) 2 n j

218,7

4,5

217,8

= 441

Na podstawie wykonanych oblicze ustalamy warto kowariancji

c(x, y) =

1134+ (819) + (13860) + 216+ (51) + (10260) + 1140 22500


=
= 225 (z
100
100

c ( x, y ) :

osoby)

Podstawiajc t wielko i wyniki pozostaych oblicze pomocniczych do


wzoru 3.7 otrzymujemy:

rP =

225
441 2990000

100
100

225
= 0,62
2,1172,9

Uzyskana warto miary wskazuje na wystpowanie wyranej, dodatniej


zalenoci wysokoci dochodu na osob od liczby osb w gospodarstwie

88

Zygmunt Bobowski

domowym. Przypomnijmy, e obliczony wczeniej stosunek korelacyjny


przyj warto 0,65 (zaleno wyrana). Powstaa niewielka rnica midzy wartociami obu miar wiadczy o wystpowaniu midzy badanymi cechami zwizku o charakterze zblionym do prostoliniowego (przyjte dla
wspczynnika Pearsona zaoenie o zwizku prostoliniowym byo wobec tego uprawnione).
Podstawowe wasnoci wspczynnika Pearsona mona uj w nastpujcych punktach:
1) miara ta jest niemianowana,
2) miara jest unormowana w przedziale <-1 ; 1>,
3) wskazuje natenie i kierunek zalenoci,
4) miara ta jest symetryczna,
5) moe by stosowana do badania zalenoci w zwizkach prostoliniowych,
6) badane cechy musz mie charakter liczbowych,
7) spenia wasno jednolitej preferencji wartoci.
3.4.3. Wspczynnik korelacji rang Spearmana
Stanowi on najmniej pracochonn miar zalenoci ustalan w oparciu
o dane ujte w szeregach szczegowych. Istota badania zalenoci w tym
przypadku polega na badaniu zgodnoci uporzdkowa (rang) wartoci obu
cech. Obie cechy musz by wobec tego mierzone przynajmniej na skali porzdkowej. Dodatkowo wymaga si by zwizek midzy nimi by prostoliniowy. Porzdkowanie (rangowanie) wartoci obu cech moe si odbywa w
kierunku rosncym lub malejcym (naley jednak pamita, by kierunek
porzdkowania obu cech by ten sam). W przypadku, gdy w szeregu wystpuje kilka identycznych wartoci cechy, wwczas przyporzdkowywana jest
im rednia z rang odpowiadajcych tym wartociom cechy. Jeli wystpuje
pena zgodno uporzdkowa wartoci obu cech, to zwizek midzy nimi
ma charakter funkcyjny. Miara ta jest ustalana wedug formuy:

Sp

= 1

6 d xi d y i
i

3.8.

N3 N

gdzie:

d xi , d y i - rangi przypisane wartociom cechy odpowiadajcym i-tej


jednostce,
N liczebno badanej zbiorowoci.
Procedur obliczania tej miary zalenoci ilustruje przykad 3.5.
Przykad 3.5.
Na podstawie danych z przykadu 3.3 zbada zaleno wysokoci wydatkw na cele kulturalne od liczby osb w gospodarstwie domowym za
pomoc wspczynnika korelacji rang Spearmana. Przyj zaoenie, e
zwizek midzy cechami jest prostoliniowy.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

89

Rozwizanie:
Obliczenia pomocnicze zostan wykonane w poniszej tablicy roboczej.
W kolumnach 3. i 4. dokonano rangowania wartoci cech X i Y od wartoci
najniszych do najwyszych.
Liczba
osb ( xi )
3
5
7
2
6
4
5
3
2
2
4
6
5
3
3
7
4
2
4
3

Wydatki
( yi )
70
75
60
100
85
70
90
50
70
70
110
75
40
60
90
90
75
60
80
90
Razem

d xi

d yi

7
15
19,5
2,5
17,5
11,5
15
7
2,5
2,5
11,5
17,5
15
7
7
19,5
11,5
2,5
11,5
7

7,5
11
4
19
14
7,5
16,5
2
7,5
7,5
20
11
1
4
16,5
16,5
11
4
13
16,5

(d

xi

d yi

0,25
16
240,25
272,25
12,25
16
2,25
25
25
25
72,25
42,25
196
9
90,25
9
0,25
2,25
2,25
90,25
1139,0

Podstawiajc uzyskan sum do wzoru 3.8 otrzymujemy:

r Sp = 1

6 1139,0
6834,0
= 1
= 1 0,86 = 0,14
3
7980
20 20

Uzyskana warto miary wskazuje na wystpowanie niewielkiej, dodatniej zalenoci wydatkw na cele kulturalne od wielkoci gospodarstw domowych. Niewielka rnica w wartociach miary Pearsona i Spearmana
wie si z mniejsz precyzj tej drugiej. Wspczynnik Spearmana nie
uwzgldnia bowiem stopnia zrnicowania poszczeglnych wartoci cechy.
Stosowany jest on z reguy do wstpnego badania zalenoci. Wspczynnik
ten charakteryzuj nastpujce wasnoci:
1) jest miar niemianowan,
2) przyjmuje wartoci z unormowanego przedziau <-1; 1>,
3) wskazuje natenie i kierunek zalenoci,
4) jest miar symetryczna,

90

Zygmunt Bobowski

5) moe by stosowany do badania zalenoci w zwizkach prostoliniowych,


6) badane cechy musz by wyraone przynajmniej na skali porzdkowej,
7) spenia wasno jednolitej preferencji wartoci.

3.5. ANALIZA REGRESJI


Prezentowana wyej analiza wspzalenoci pozwala na ocen siy (i
ewentualnie kierunku) zalenoci midzy cechami opisujcymi okrelon
zbiorowo statystyczn. Uzyskany wynik badania nie pozwala jednak
okreli liczbowo, jak zmiany wartoci jednej z cech wpywaj na wartoci
cechy drugiej. Pomocna w tym zakresie jest analiza regresji. Jej celem jest
skonstruowanie poniszych funkcji regresji charakteryzujcych zwizek
cech X oraz Y:
a) funkcja regresji Y wzgldem X, ktra okrela, jakie zmiany Y powoduje wzrost X o jednostk,
b) funkcja regresji X wzgldem Y, ktra okrela jakie zmiany X powoduje wzrost Y o jednostk.
Funkcje te pozwalaj zatem na oszacowanie wartoci jednej ze zmiennych przy zaoonych wartociach drugiej z nich. Naley jednak doda, e
rzadko szacowane s obie funkcje; jest to zasadne tylko wwczas, gdy badany zwizek ma charakter dwustronny. W wikszoci przypadkw szacowana jest jedna funkcja regresji - Y wzgldem X.
Procedura szacowania parametrw funkcji regresji musi by poprzedzona analiz zebranego materiau empirycznego (w postaci szeregw statystycznych lub tablicy korelacyjnej) dla dokonania wstpnej oceny charakteru zwizku midzy cechami. Mona w tym celu wykorzysta wskazwki
podane w podrozdziale 3.1 (tabelaryczna i graficzna ocena zalenoci). Jej
celem jest dobr odpowiedniej postaci funkcji regresji: liniowej bd krzywoliniowej (np. hiperbolicznej, parabolicznej, wykadniczej).
Dla dalszych rozwaa przyjmiemy, e zwizek midzy cechami jest w
przyblieniu prostoliniowy. Wwczas szacowane funkcje regresji maj posta prostych okrelonych nastpujcymi formuami:
a) regresja Y wzgldem X:

y = a y x + b

3.9.

b) regresja X wzgldem Y:

x = a x y + b

3.10.

gdzie:
a, b parametry rwnania regresji ustalane wedug wzorw podanych niej.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

91

Dla dalszych rozwaa jako podstawowe przyjmiemy pierwsze z podanych rwna regresji, bowiem opisuje zaleno cechy Y (zalenej) od cechy
X (niezalenej). Wystpujce w nim parametry a i b ustalane s wedug
wzorw:

(x
ay =

x ) ( y i y )

C (x , y )
=
s 2 (x )

N
2
x)

(x i

3.11.

b = y ay x

3.12.

W przypadku drugiego rwnania parametry a i b bd wyznaczane


z formu:

(x
ax =

C ( x, y )
=
s 2 (y)

x ) ( y i y )

N
( y i y )2

3.13

N
b = x ax y

3.14.

gdzie:

c( x, y ) kowariancja cech X i Y,

s 2 ( x) wariancja cechy X,
s 2 ( y ) wariancja cechy Y.
Wystpujcy w podanych rwnaniach parametr a okrelany jest mianem wspczynnika regresji i oznacza skal wzrostu (lub spadku) zmiennej,
dla ktrej skonstruowano rwnanie przy wzrocie wartoci drugiej zmiennej
o jedn jednostk, za parametr b oznacza poziom tej zmiennej, gdy druga
z nich przyjmuje warto rwn zero.
Z wzorw 3.11 i 3.13 wynika oczywista zaleno:

r P = ay ax

3.15.

jak rwnie, i o znaku wspczynnika regresji decyduje znak wspczynnika korelacji liniowej Pearsona wyraajcego zaleno obu cech. Dla potrzeb szacowania rwna regresji moe by wykorzystywany materia staty-

92

Zygmunt Bobowski

styczny ujty zarwno w postaci szeregw szczegowych jak i tablic korelacyjnych.


Oszacowane rwnania regresji cechy Y wzgldem X oraz X wzgldem Y
nanoszone s zwykle na ukad wsprzdnych, a analiza ich wzajemnego
pooenia pozwala na ocen stopnia wspzalenoci obu cech. I tak, jeli
obie linie pooone s blisko siebie (kt midzy nimi jest niewielki), to taka
sytuacja oznacza wystpowanie zalenoci silnej; w przypadku pokrywania
si obu linii jest to zaleno funkcyjna. W drugim skrajnym przypadku,
gdy kt midzy liniami jest prosty, wystpuje niezaleno cech.
W praktyce oszacowane funkcje regresji jedynie z pewnym przyblieniem odzwierciedlaj faktyczne zwizki wystpujce midzy badanymi cechami (zwaszcza, gdy zakada si prostoliniowo zwizku). Powoduje to
konieczno badania stopnia dopasowania oszacowanych funkcji do danych empirycznych. W tym celu wykorzystywany moe by wspczynnik

(fi kwadrat) okrelajcy, jaka cz zmiennej zalenej (objanianej) nie


jest wynikiem oddziaywania zmiennej niezalenej (objaniajcej).
Dla funkcji regresji Y wzgldem X wspczynnik ten wyraa si wzorem:

( y y )
=
(y y)

2y

3.16.

natomiast dla funkcji regresji X wzgldem Y ma posta:

(x

2x =

x i

)2

(x i

x)

3.17.

Im nisz warto przyjmuje ten wspczynnik, tym lepsze jest dopasowanie rwnania regresji do danych empirycznych. Jako miar dopasowania funkcji wykorzystuje si rwnie tzw. wspczynnik determinacji
ktry stanowi przeciwiestwo wspczynnika zbienoci:

R2 = 1 2

R2 ,

3.18.

On z kolei okrela, jaka cz zmiennoci badanej zmiennej objanianej


(zalenej) jest zdeterminowana oddziaywaniem zmiennej objaniajcej (niezalenej). W tym przypadku wysza warto tego wspczynnika oznacza
lepsze dopasowanie funkcji regresji do danych empirycznych.
Wskaza naley rwnie na zwizek tego wspczynnika ze wspczynnikiem korelacji liniowej Pearsona. Zwizek ten wyraa si wzorem:

( )

R2 = r P

3.19

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

93

Procedur szacowania rwna regresji ilustruje przykad 3.6.


Przykad 3.6.
Dla losowej grupy pracownikw zebrano informacje dotyczce ich stau
pracy (X) - w latach oraz wydajnoci pracy (Y) - w szt./godz. Informacje te
ujto w postaci podanej tablicy:
Tabela 3.5. Pracownicy przedsibiorstwa Z wedug stau pracy
i wydajnoci pracy
Sta
Wydajno

10 2 4

25

18

17

13 5

10

22

8 4

12

13 6 7

10

15

20

19

15 9

10

14

20

12 8

rdo: Dane umowne.

Oszacowa rwnania regresji wydajnoci pracy pracownikw wzgldem


ich stau pracy i stau pracy wzgldem ich wydajnoci pracy. Dokona na
podstawie ich przebiegu stopnia zalenoci badanych cech. Dokona oceny
stopnia dopasowania uzyskanych funkcji do danych empirycznych.
Rozwizanie:
Oszacowane zostan dwa rwnania regresji o postaci 3.9 i 3.10. Dla wyznaczenia ich parametrw obliczenia pomocnicze wykonano w poniszej tablicy roboczej.
Sta pracy

Wydajno

( xi )

pracy (

yi )

xi x ( xi x ) 2 yi y ( yi y ) 2

(xi x)( yi y)

y i

( yi yi )2

8
10
4
7
7
25
18
17
13
5
7
10
22
8
4

12
13
8
10
10
15
20
19
15
9
10
14
20
12
8

-3
-1
-7
-4
-4
14
7
6
2
-6
-4
-1
11
-3
-7

9
1
49
16
16
196
49
36
4
36
16
1
121
9
49

-1
0
-5
-3
-3
2
7
6
2
-4
-3
1
7
-1
-5

1
0
25
9
9
4
49
36
4
16
9
1
49
1
25

3
0
35
12
12
28
49
36
4
24
12
-1
77
3
35

11,38
12,46
9,22
10,84
10,84
20,56
16,78
16,24
14,08
9,76
10,84
12,46
18,94
11,38
9,22

0,38
0,29
1,49
0,71
0,71
30,91
10,37
7,62
0,85
0,58
0,71
2,37
1,12
0,38
1,49

608

238

329

59,98

x =165 y =195
i

Wartoci rednie dla obu cech wynosz:

x=

165
= 11 lat
15

y=

195
= 13 szt/godz.
15

94

Zygmunt Bobowski

Na podstawie wykonanych oblicze pomocniczych wyznaczamy parametry rwna regresji:


- Y wzgldem X:

329
21,93
a = 15 =
= 0,54
608 40,53
15
b = 13 0,54 11 = 7,06
i w konsekwencji otrzymujemy rwnanie o postaci:

y = 0,54 x + 7,06
Parametry tego rwnania mona interpretowa nastpujco: wzrost stau pracy pracownika o 1 rok powoduje redni wzrost wydajnoci o 0,54
szt/godz., za przy zerowym stau pracy wydajno wyniosaby 7,06
szt/godz.
- X wzgldem Y:

329
21,93
a = 15 =
= 1,38
238 15,87
15
b = 11 1,38 13 = 6,94
a rwnanie regresji ma posta:

x = 1,38 y 6,94 .
Przebieg prostych oszacowanych powyszymi rwnaniami obrazuje
rys. 3.2.
W tym przypadku uzyskane parametry oznaczaj: wzrost wydajnoci
pracy o 1 szt/godz. wywoywany jest wzrostem stau o 1,38 roku, interpretacja drugiego z parametrw jest bezsensowna.
Podstawowe znaczenie posiada pierwsze z oszacowanych rwna, bowiem trudno uzna badany zwizek za dwustronny.
Na podstawie uzyskanego rwnania regresji mona zgodnie z wzorem
3.15 - okreli warto wspczynnika korelacji liniowej Pearsona mierzcego zaleno midzy badanymi cechami:

r P = + 0,54 1,38 0,86 .

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

95

Wskazuje on na siln dodatni zaleno wydajnoci pracy od stau


pracy.
Rys. 3.2
Proste regresji
y
14
13
12
11
10
9
8
7
6

^y=

6
7,0
4x+
0,5

^x=

1,3

5
4

4
,9
y- 6

3
2
1

-14 -13 -12 -11 -10 -9 -8 -7 -6 - 5 -4 -3

-2 -1

-1

x
5

10 11 12 13 14

-2

rdo: opracowanie wasne

Na podstawie oblicze pomocniczych zamieszczonych w tablicy roboczej


okrelimy rwnie stopie dopasowania funkcji regresji Y wzgldem X do
danych empirycznych. W kolumnie 8. ustalono wartoci hipotetyczne

yi przy wykorzystaniu oszacowanego rwnania regresji, a w kolumnie 9.


kwadraty odchyle wartoci empirycznych od odpowiadajcych im wartoci
hipotetycznych. Wspczynnik zbienoci obliczony wedug wzoru 3.16 wynosi:

2y =

59,98
= 0,25
238

Ustalony na jego podstawie wspczynnik determinacji (por. wzr 3.18)


bdzie wynosi:

R 2 = 1 0,25 = 0,75
Wobec tego mona stwierdzi, e zmienno wydajnoci pracy jest w
75 % zdeterminowana staem pracy, a w 25% innymi czynnikami.

PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI

SERIA:
NAUKI SPOECZNE

Rozdzia IV

Analiza szeregw czasowych

4.1. WPROWADZENIE
Opisu rozwoju zjawiska bd zbiorowoci mona dokona rwnie przy
pomocy szeregw czasowych (inaczej chronologicznych, dynamicznych). Szeregi takie mog mie posta tablic dwukolumnowych bd dwuwierszowych, w ktrych wartoci analizowanej zmiennej s uporzdkowane wedug
czasu. Zmienn t bdziemy w dalszym cigu oznaczali jako Y, a jej realizacje yt i , za zmienn czasow -T i jej realizacje ti . Czas jest zmienn cig,
ktrej realizacjami mog by poszczeglne momenty czasowe bd przedziay czasowe (okresy). Odpowiednio do tych dwch przypadkw mona wyrni dwa typy szeregw prezentujcych rozwj zjawiska bd zbiorowoci
w czasie.
Szereg czasowy momentw prezentuje zwykle rozwj okrelonej zbiorowoci (zjawiska), ktrej jednostki istniej w duszym okresie czasu, a szereg podaje jej stan w rnych momentach czasu (np. ludno Jeleniej Gry
w latach 1990 2000, stan na 31.12.) Sumowanie wartoci tak ujtej
zmiennej nie ma sensu (oznaczaoby ono wielokrotne dodawanie tych samych wartoci); mona je natomiast odejmowa od siebie, a rnice obrazuj zmiany stanu badanej zbiorowoci. Umoliwia to przejcie z szeregw
czasowych momentw na szeregi czasowe okresw. Informacje ujte w takim szeregu obrazuj przyrosty bd spadki poziomu badanego zjawiska w
okrelonym przedziale czasowym.
Przecitny poziom zjawiska, ktrego wielkoci ujte s w szeregu czasowym momentw ustalamy przy wykorzystaniu redniej chronologicznej o
postaci:

ychr

1
1
y1 + y2 + .... + yn
2
= 2
n 1

4.1.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

97

Szereg czasowy okresw zawiera informacje dotyczce zbiorowoci lub


zjawiska istniejcego w poszczeglnych okresach, gdy jednostki tworzce je
mog by klasyfikowane rozcznie wedug czasu. Rozwj zbiorowoci w takim przypadku podawany jest jako liczba jednostek w poszczeglnych okresach czasu (np. liczba zawartych maestw w Polsce w latach 1991 2002). Wartoci ujte w takim szeregu mog by sumowane.
Przecitny poziom zjawiska opisanego szeregiem czasowym okresw
ustalamy (przy zaoeniu rwnoci przedziaw czasowych) wykorzystujc
do tego celu redni arytmetyczn w wersji przewidzianej dla szeregw
szczegowych (zob. wzr 2.5)
Analiza danych ujtych w szeregach czasowych okresw jest moliwa
przy zapewnieniu ich porwnywalnoci. Warunki tej porwnywalnoci mona uj nastpujco:
- poziom zjawiska dla poszczeglnych okresw musi by wyraony w tych
samych jednostkach miary,
- musi wystpowa jednakowa rozpito poszczeglnych przedziaw
czasowych; w przypadku nierwnych okresw naley bada natenie
zmiennej w przeliczeniu na przedziay o okrelonej rozpitoci.
- mona porwnywa midzy sob informacje ujte w szeregach tego samego typu (szeregi okresw bd szeregi momentw) przy czym informacje musz dotyczy tych samych okresw bd momentw,
- porwnywalno danych jest moliwa, gdy dotycz one tego samego obszaru (np. niemoliwe jest porwnywanie danych dotyczcych wojewdztw sprzed i po 1999 roku).

4.2. MIARY DYNAMIKI


4.2.1. Klasyfikacja miar dynamiki
Analiza dynamiki zjawiska opisanego szeregiem czasowym prowadzona
jest przy wykorzystaniu miar dynamiki. Mog by one klasyfikowane wedug dwch kryteriw:
I.
z uwagi na sposb wyznaczania wartoci miary dynamiki moemy
wyrni:
miary dynamiki rnicowe (przyrosty)8,
miary dynamiki ilorazowe (indeksy, wskaniki dynamiki, miary stosunkowe).
Miary dynamiki rnicowe s ustalane jako rnica poziomw zjawiska w okresach (momentach) badanym i porwnawczym, natomiast
miary ilorazowe ustalane s jako iloraz poziomw zjawiska w okresach (momentach) badanym i porwnawczym.
II.
ze wzgldu na rodzaj przyjtej bazy porwnawczej wyrnia si:
miary dynamiki jednopodstawowe (miary dynamiki o podstawie staej),
miary dynamiki acuchowe (miary dynamiki o podstawie zmiennej).
8

Posugiwanie si kategori przyrostu w przypadku malejcego poziomu zjawiska (czyli


ujemnej wartoci tej miary) wydaje si by niezrcznym okreleniem

98

Zygmunt Bobowski

W przypadku miar jednopodstawowych dla celw analizy dynamiki jeden z okresw (momentw) przyjmowany jest jako staa baza porwnawcza
i poziom zjawiska kadego z pozostaych okresw (momentw) jest porwnywany (na zasadzie rnicy bd ilorazu) z poziomem zjawiska wystpujcym w okresie (momencie) bazowym. Istotny problem stanowi tutaj kwestia
wyboru bazy porwnawczej; nie powinien jej stanowi okres (moment), w
ktrym poziom zjawiska by wyjtkowo niski bd wysoki. Najczciej jako
podstaw porwna przyjmuje si poziom zjawiska w pierwszym wystpujcym w szeregu okresie (momencie).
Dokonujc analizy dynamiki przy pomocy miar acuchowych poziom
zjawiska kadego z okresw (momentw) porwnywany jest (na zasadzie
rnicy bd ilorazu) z poziomem zjawiska wystpujcym w okresie (momencie) poprzedzajcym; badamy wic w tym przypadku zmiany poziomu
zjawiska z okresu na okres.
Zarwno miary rnicowe jak i ilorazowe mog mie charakter miar
jednopodstawowych jak i acuchowych.
4.2.2. Rnicowe miary dynamiki
Wrd miar rnicowych wyrnia si dodatkowo:
rnic absolutn ,
rnic wzgldn.
Obie miary mog mie charakter miar jednopodstawowych lub acuchowych.
Rnic absolutn jednopodstawow ( R

r/s)

obliczamy wedug wzoru:

R a r / s = yr ys
natomiast rnic absolutn acuchow ( R

R a r / r 1 = yr yr 1
gdzie:

4.2.

r / r 1 )

wedug formuy:

4.3.

yr - oznacza poziom zjawiska w okresie (momencie) badanym,


ys - oznacza poziom zjawiska w okresie (momencie) bazowym,
yr 1 - poziom zjawiska w okresie (momencie) poprzedzajcym.

Wymienione miary maj charakter miar absolutnych (mianowanych);


nie mog wic by wykorzystywane w analizie porwnawczej dynamiki rnych zjawisk bd zbiorowoci. Mog one przyjmowa wartoci z przedziau
(- ; + ).
Kolejne miary dynamiki to rnica wzgldna jednopodstawowa ( R
ustalana wedug wzoru:

r/s)

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

R wr / s =

Rar / s
y ys
100 = r
100
ys
ys

i rnica wzgldna acuchowa ( R

R w r / r 1 =

99

r / r 1 )

4.4.

obliczana wedug wzoru:

R a r / r 1
y yr 1
100 = r
100
yr 1
yr 1

4.5.

Wymienione wyej miary o charakterze wzgldnym s miarami niemianowanymi i mog by wyraone w postaci dziesitnej lub w procentach (naley wwczas jak w podanych formuach ich warto pomnoy przez
100). Warto miary (moe by dodatnia bd ujemna lub zerowa) informuje, jaki by wzrost lub spadek poziomu badanego zjawiska w okresie (momencie) badanym w stosunku do porwnawczego.

4.2.3. Ilorazowe miary dynamiki (indeksy)


W literaturze wyrnia si dwa typy indeksw (miar ilorazowych): indywidualne (proste) i agregatowe (zespoowe). Indeksy indywidualne s wykorzystywane w analizie dynamiki zjawisk prostych i mog mie charakter
miar jednopodstawowych (o podstawie staej) bd acuchowych (o podi

stawie zmiennej) 9. Indeks indywidualny o podstawie staej ( w r / s ) obliczany jest wedug wzoru :

wi r / s =

yr
100
ys

za indeks indywidualny o podstawie zmiennej (

wi r / r 1 =

yr
100
yr 1

4.6.

wi r / r 1 ) wedug formuy:
4.7.

gdzie: oznaczenia jak we wzorach 4.2 i 4.3.


Podane miary mog by wyraone w postaci uamkw dziesitnych lub
w procentach (wymaga to pomnoenia indeksw jak w podanych wzorach

Naley tu zwrci uwag na sposb zapisu tych indeksw we wszelkiego rodzaju rocznikach;
zapis "rok poprzedni = 100" oznacza, i podane indeksy maj charakter miar acuchowych,
za zapis " rok s = 100" oznacza, i podane indeksy maj charakter miar jednopodstawowych , gdzie jako sta baz porwnawcz przyjto rok s.

100

Zygmunt Bobowski

- przez 100). W praktyce czciej wykorzystywana jest ta druga moliwo


wyraania wartoci indeksw z uwagi na atwo ich interpretacji.
Spord wymienionych miar dynamiki w praktyce czciej wykorzystywane s indeksy, co ma m. in. niewtpliwy zwizek z wikszymi moliwociami ich wzajemnego przeksztacania bez koniecznoci sigania do danych pierwotnych. I tak:
a) jeli zachodzi potrzeba zmiany bazy porwnawczej w szeregu indeksw
jednopodstawowych naley dokona dzielenia wszystkich indeksw wystpujcych w takim szeregu przez indeks okresu wybranego jako bazowy,
b) w celu przeksztacenia szeregu indeksw o podstawie staej w cig indeksw acuchowych indeks kadego z okresw dzielimy przez indeks
okresu poprzedzajcego,
c) dla przeksztacenia szeregu indeksw o podstawie zmiennej w cig indeksw o podstawie staej:
- dla okresw wczeniejszych od okresu obranego za bazowy odpowiednie indeksy uzyskujemy jako odwrotno iloczynu wszystkich
indeksw acuchowych poczwszy od indeksu wystpujcego bezporednio po badanym okresie do indeksu dla okresu bazowego,
- dla okresu przyjtego za bazowy indeks wyniesie 1 lub 100 %,
- dla okresw pniejszych od okresu bazowego odpowiednie indeksy
uzyskujemy jako iloczyn wszystkich kolejnych indeksw acuchowych poczwszy od indeksu okresu wystpujcego bezporednio po
bazowym na indeksie dla okresu badanego koczc.
Indeksy agregatowe (zespoowe) s wykorzystywane w analizie dynamiki
zbiorowoci (zjawisk) zoonych. W takich przypadkach wystpuje zwykle
niejednorodno jednostek tworzcych zbiorowo, w zwizku z czym analiza jej rozwoju w czasie wymaga znalezienia wsplnej jednostki miary. Najczciej tak wspln jednostk miary (czynnikiem agregujcym) jest cena,
a jej wykorzystanie umoliwia zastosowanie indeksw wartociowych w
analizie dynamiki takiej populacji bd zjawiska. Wykorzystywane w takiej
sytuacji indeksy mog mie oczywicie rwnie charakter miar jednopodstawowych bd acuchowych. W analizie zjawisk socjologicznych indeksy
te nie maj w zasadzie zastosowania.
Procedur ustalania wyej omwionych miar dynamiki jak rwnie istniejcych moliwoci ich wzajemnego przeksztacania ilustruj ponisze
przykady.
Przykad 4.1.
Ponisze zestawienie zawiera informacje dotyczce liczby zarejestrowanych bezrobotnych w miecie K w latach 1995 - 2002 (stan na 31.12.)
Rok
Bezrobotni (w tys. osb)

1995
15,5

1996
14,9

1997
14,5

1998
14,5

1999
15,1

2000
15,4

2001
15,7

2002
16,2

rdo: Dane umowne

Na podstawie powyszych danych zbada dynamik liczby bezrobotnych


przy pomocy:
a) rnicowych miar dynamiki,

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

101

b) ilorazowych miar dynamiki.


Dokona interpretacji ustalonych wartoci miar.
Rozwizanie
ad. a) Dla zbadania dynamiki wykorzystamy nastpujce miary dynamiki:
rnic absolutn o podstawie staej (wzr4.2), rnic absolutn o podstawie zmiennej (wzr 4.3), rnic wzgldn jednopodstawow (wzr 4.4) oraz
rnic wzgldn acuchow (wzr 4.5). Oblicze pomocniczych dokonano
w poniszej tabeli roboczej w kolumnach 3 - 6; w przypadku miar jednopodstawowych jako baz porwnawcz przyjto liczb bezrobotnych w 1995
roku.
Rok

Liczba
bezrobotnych

R a r / 1995

R a r / r 1

1995
1996
1997
1998
1999
2000
2001
2002

15,5
14,9
14,5
14,5
15,1
15,4
15,7
16,2

0
- 0,6
-1,0
- 1,0
- 0,4
- 0,1
0,2
0,7

- 0,6
- 0,4
0
0,6
0,3
0,3
0,5

R w r / 1995

R w r / r 1

wi r / 1995

wi r / r 1

(w %)

(w %)

(w %)

(w %)

0
- 3,87
- 6,45
- 6,45
- 2,58
- 0,65
1,29
4,52

- 3,87
-2,68
0
4,14
1,99
1,94
3,18

100
96,13
93,55
93,55
97,42
99,35
101,29
104,52

96,13
97,32
100
104,14
101,99
101,94
103,18

Przykadowo zinterpretujemy wartoci uzyskanych wyej miar dynamiki


dla roku 2000:
-

R a 2000 / 1995 = - 0,1 oznacza, e liczba bezrobotnych (wedug stanu na


31.12.) w roku 2000 bya o 100 osb nisza ni w roku 1995;
a

R w 2000 / 1995 = - 0,65 oznacza, i liczba bezrobotnych w roku 2000 bya o

2000 / 1999

= 0,3 oznacza, i liczba bezrobotnych na koniec roku 2000 bya


o 300 osb wysza ni w roku 1999;
0,65 % nisza w relacji do stanu na koniec 1995 roku;

wi 2000 / 1995 = 99,35 % oznacza, e liczba bezrobotnych na koniec 2000 roku

= 1,99 oznacza wzrost liczby bezrobotnych na koniec roku


2000 o 1,99 % w stosunku do roku poprzedniego.
ad. b) Wyznaczymy tu wartoci indeksw indywidualnych jednopodstawowych (wzr 4.6 ) oraz indeksw indywidualnych o podstawie zmiennej (
wzr 4.7). Obliczenia pomocnicze zawarte s w powyszej tablicy roboczej w
kolumnach 7 i 8.
Zinterpretujemy wartoci tych miar rwnie dla roku 2000:
2000 / 1999

stanowia 99,35 % ich stanu z roku 1995, co jednoczenie


wiadczy o spadku ich liczby o 0,65 % w stosunku do roku bazowego ( por.

R w 2000 / 1995 = - 0,65);

102
-

Zygmunt Bobowski

wi 2000 / 1999 = 101,99 % oznacza, z liczba bezrobotnych na koniec roku


2000 stanowia 101,99 % ich liczby z roku poprzedzajcego,
w

czyli bya wysza o 1,99 % ( por. R 2000 / 1999 = 1,99).


Z uzyskanych wartoci miar wynikaj oczywiste zalenoci zachodzce
midzy rnic wzgldn a indeksem indywidualnym:

R w r / s + 100 = wi r / s
R w r / r 1 + 100 = wi r / r 1
Przykad 4.2.
Ponisza tablica zawiera informacje dotyczce dynamiki stopy bezrobocia w powiecie L w latach 1995 - 2001
Rok
1995
1996
1997
1998
1999
2000
2001

R w r / 1996
(w %)

5,5

8,2

10,5

15,0

12,0

10,0

rdo: Dane umowne

Podany szereg przeksztaci w cig:


a) indeksw jednopodstawowych o podstawie: rok 1996 =100,
b) indeksw acuchowych,
c) indeksw jednopodstawowych o podstawie: rok 1999 = 100.
Rozwizanie:
Przykad ten ilustruje moliwoci ustalania rnych miar dynamiki w
przypadku posiadania jakiegokolwiek cigu miar dynamiki, bez koniecznoci sigania do danych pierwotnych. W tym celu korzystamy tu z podanych wczeniej moliwoci wzajemnego przeksztacania miar dynamiki. Poszczeglne przeksztacenia zostan wykonane w kolejnych kolumnach poniszej tabeli roboczej
Rok

R w r / 1996

wi r / 1996

wi r / r 1

wi r / 1999

(w %)

(w %)

(w %)

(w %)

1995
1996
1997
1998
1999
2000
2001

5,5
0
8,2
10,5
15,0
12,0
10,0

105,5
100,0
108,2
110,5
115,0
112,0
110,0

94,79
108,20
102,13
104,07
97,39
98,21

91,74
86,96
94,09
96,09
100
97,39
95,65

ad. a) Podany szereg charakteryzuje dynamik stopy bezrobocia za pomoc


cigu rnic wzgldnych przy zaoonym roku bazowym 1996. Dla
uzyskania cigu indeksw jednopodstawowych przy tym samym roku bazowym dodajemy 100 do wartoci rnic wzgldnych, np. dla

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

103

roku 2000: 100 + 12,0 = 112,0 %; uzyskane wielkoci zawarto w kolumnie 3,


ad. b) Indeksy acuchowe (kolumna 4) dla poszczeglnych lat ustalono
dzielc indeks jednopodstawowy danego roku przez indeks roku poprzedzajcego
(
z
kolumny
3),
np.
dla
roku
2000:
112 , 0
100 = 97 , 39 % (mnoenie tego ilorazu przez 100 daje wynik
115 , 0
dziaania wyraony w %); indeks acuchowy dla roku 1995 nie istnieje,
ad. c) Dla ustalenia indeksw o podstawie staej na poziomie roku 1999 dokonujemy zamiany bazy porwnawczej w cigu indeksw z kolumny
3. Odbywa si to poprzez dzielenie indeksw dla kadego roku (z kolumny 3) przez indeks dla roku 1999 z tej kolumny, tj. przez115 %,
np. dla roku 1995: 105 , 5 100 = 91 , 74 %
115 , 0

4.3. METODY WYODRBNIANIA TENDENCJI ROZWOJOWEJ


4.3.1. Metoda oceny wzrokowej i mechaniczna
Badanie tendencji rozwojowej wie si z analiz rozwoju zjawiska w
duszych przedziaach czasowych: kilkunasto-, kilkudziesicioletnich. Dokonujc takiej analizy naley zwrci uwag, i rozwj wikszoci zjawisk w
czasie uwarunkowany jest oddziaywaniem wielu czynnikw (przyczyn).
Mona wrd nich wyrni przyczyny gwne; efektem ich oddziaywania w duszym okresie czasu jest wystpowanie okrelonej tendencji rozwojowej (zwanej rwnie trendem). Niezalenie od wystpowania przyczyn
gwnych naley odnotowa oddziaywanie przyczyn ubocznych. Powoduj
one wystpowanie - obok wspomnianej tendencji rozwojowej - rnego rodzaju waha. Wyodrbnia si wrd nich:
wahania okresowe (cykliczne), czyli wahania regularne o okrelonym
cyklu,
wahania sezonowe, tzn. wahania okresowe o cyklu rocznym, miesicznym lub dobowym,
wahania nieregularne, wynikajce np. ze zdarze katastrofalnych bd
oddziaywania znacznej liczby przyczyn ubocznych.
W literaturze wyrnia si kilka metod wyznaczania tendencji rozwojowej. Najprostsza z nich to metoda odrczna (metoda oceny wzrokowej). Dla
potrzeb tej metody informacje zawarte w szeregu czasowym przenosimy na
ukad wsprzdnych i na podstawie uzyskanego rozrzutu punktw dokonujemy oceny charakteru tendencji rozwojowej. Odbywa si to poprzez odrczne wykrelenie linii przebiegajcej midzy naniesionymi punktami w
ten sposb by w przyblieniu bya ona najmniej oddalona od naniesionych
punktw. Tak wykrelona linia pomija oczywicie wystpujce w poszczeglnych okresach wahania. Metoda ta pozwala na efektywne okrelenie
charakteru tendencji w przypadkach, gdy punkty obrazujce poziom zjawi-

104

Zygmunt Bobowski

ska w poszczeglnych okresach ukadaj si w niezbyt szerokim pasie.


Najczciej jednak metoda ta stanowi jedynie etap wstpny analitycznej metody wyznaczania tendencji rozwojowej.
Metoda mechaniczna wyodrbniania tendencji rozwojowej (zwana rwnie metod wygadzania szeregw czasowych) polega na zastpowaniu danych empirycznych wystpujcych w szeregu wartociami rednimi. Wystpuje ona w dwch odmianach. Pierwsz z nich okrelamy mianem metody
mechanicznej opartej na rednich ruchomych liczonych dla okrelonej liczby
okresw. Taka procedura wyodrbniania tendencji rozwojowej prowadzi do
wygadzenia pierwotnego szeregu czasowego, poniewa wystpujce wahania rozkadaj si na odpowiedni liczb okresw. rednie takie mog by
one liczone dla danych z nieparzystej lub parzystej liczby okresw (w drugim przypadku rednie nosz nazw centrowanych). W przypadku rednich
liczonych z nieparzystej liczby okresw wystpuje atwo ich przyporzdkowania konkretnemu okresowi rodkowemu, co powoduje, i s one czciej wykorzystywane. Mog to by rednie 3-, 5-, 7- okresowe, przy czym
naley zwrci uwag, e wygadzenie szeregu bdzie tym wiksze im
rednia jest liczona z wikszej liczby wyrazw. rednie te maj charakter
redniej arytmetycznej i s liczonej wedug nastpujcych wzorw
- rednie ruchome 3-okresowe:
y1 + y 2 + y 3 ( 3 )
y + y3 + y 4
y
+ y n 1 + y n
;y 3 = 2
;......, y ( 3 ) n 1 = n 2
3
3
3

y (3) 2 =

4.8.

y (3) 2 ) jest przyporzdkowana okresowi


( 3)
( 3)
drugiemu, druga ( y 3 )- trzeciemu, a ostatnia ( y n 1 ) przedostatniemu,
Zauwamy, e pierwsza rednia (

- rednie 5-okresowe:

y3..

( 5)

y1 + y 2 + y3 + y 4 + y5
y + y3 + y 4 + y5 + y6
(5 )
....;.... y 4 = 2
5
5

4.9.
yn 2

( 5)

y n 4 + y n 3 + y n 2 + y n 1 + y n
5

y (5)3 ) jest przyporzdkowana okre(5)


(5)
sowi trzeciemu, druga ( y 4 ) czwartemu, a ostatnia ( y n 2 ) - trzeciemu
W tym przypadku pierwsza rednia (

od koca
rednie ruchome dla wikszej liczby okresw bd liczone wedug podobnych zasad.
Obok zalety metody mechanicznej - tj. prostoty oblicze - naley zwrci
uwag na istotny jej mankament polegajcy na skracaniu szeregu czasowego. Im rednia jest wyznaczana dla wikszej liczby okresw, tym wikszemu skrceniu ulega szereg, ale jednoczenie uzyskujemy jego wiksze

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

105

wygadzenie; w przypadku redniej 3-okresowej tracimy informacje dla


dwch skrajnych okresw, przy 5-okresowej - dla czterech, 7-okresowej a
dla szeciu okresw. Dugo okresu redniej ruchomej zaley gwnie od
dugoci szeregu czasowego. Powoduje to ograniczon praktyczn przydatno tej metody, zwaszcza w przypadku krtszych szeregw czasowych i
duej amplitudy waha.
Druga odmiana metody mechanicznej oparta jest na rednich podokresw. Polega ona na wyznaczeniu redniego poziomu badanego zjawiska dla
wyodrbnionych z szeregu czasowego dwch podokresw (w miar moliwoci rwnych) i naniesieniu uzyskanych rednich na ukad wsprzdnych, a
nastpnie wykreleniu prostej przebiegajcej przez te punkty. Taki sposb
postpowania pozwala na jednoznaczne okrelenie charakteru tendencji
rozwojowej. Metoda ta moe by stosowana, gdy metoda oparta na rednich
ruchomych nie pozwala wyodrbni tendencji rozwojowej z uwagi na zbyt
due wahania poziomu zjawiska, a stosunkowo krtki szereg czasowy nie
pozwala na wyznaczanie rednich ruchomych z duej liczby okresw.
4.3.2. Metoda analityczna i badanie redniego tempa zmian
Istot tej metody jest dopasowanie funkcji matematycznej (okrelanej
w tym przypadku funkcj trendu) do cigu danych ujtych w szeregu czasowym. Waciwe szacowanie parametrw takiej funkcji musi by poprzedzone doborem odpowiedniej klasy funkcji trendu. W tym celu mona wykorzysta metod oceny wzrokowej. Zalecany jest dobr prostej postaci
funkcji o parametrach, ktrym mona nada logiczn interpretacj. Wyznaczan na podstawie danych ujtych w szeregu czasowym (przy zaoeniu liniowego charakteru tendencji rozwojowej) ogln posta takiej funkcji trendu mona zapisa nastpujco:

yt = a t + b
gdzie:

4.10.

yt - oszacowane teoretyczne, hipotetyczne wartoci poziomu badane-

go zjawiska dla poszczeglnych okresw (momentw),


t - zmienna czasowa,
a, b - oszacowane parametry funkcji trendu (b - oznacza poziom zjawiska w okresie zerowym, za a - oznacza przecitny przyrost
bd spadek poziomu zjawiska przypadajcy na jednostk czasu).
atwo zauway, i szacowane rwnanie trendu mona traktowa jako
szczeglny przypadek rwnania regresji, w ktrym rol zmiennej niezalenej
peni czas (jej wartociami s kolejne numery okresw).
Parametry tego rwnania szacowane s wedug poniszych wzorw:
n

a =

(t
i =1

t ) yti

4.11.

(t
i =1

t )2

106

Zygmunt Bobowski

b = y at

4.12.

W przypadku liniowej funkcji trendu jej obrazem graficznym jest linia


prosta, co moe powodowa, e punkty na niej pooone mog do istotnie
odbiega od danych empirycznych wystpujcych w szeregu czasowym. W
zwizku z powyszym do czsto badana jest zgodno oszacowanych
wielkoci hipotetycznych wynikajcych z rwnania trendu z danymi empirycznymi. Do tego celu wykorzystywany jest poznany w rozdz. III wspczynnik zbienoci, ktry po odpowiedniej modyfikacji przyjmie posta:
n

2 =

(y
i =1
n

ti

( y
i =1

ti

y t i ) 2
y )2

4.13.

Mierzy on poziom niedopasowania funkcji trendu do danych empirycznych, w zwizku z czym malejca jego warto oznacza wyszy poziom
zgodnoci danych empirycznych i teoretycznych.
Charakter tendencji rozwojowej mona rwnie bada okrelajc przecitne tempo zmian poziomu badanego zjawiska. Jest ono wyznaczane jako
rednia geometryczna cigu indeksw acuchowych wedug wzoru:

wi r / r1 = n1 wi 2/1 wi 3/ 2 wi 4/ 3 ... wi n / n1 = n1 wi n /1

4.14.

Korzystajc z relacji zachodzcych midzy cigami indeksw acuchowych i jednopodstawowych zamiast iloczynu wszystkich indeksw acuchowych mona w powyszej formule wykorzysta indeks jednopodstawowy
okresu ostatniego w stosunku do okresu pierwszego. Wskazane jest tu wykorzystywanie indeksw wyraonych w postaci dziesitnej. Trudnoci pojawiaj si w przypadku wyznaczania redniego tempa dla dugiego szeregu
czasowego; zachodzi wwczas konieczno okrelenia wartoci pierwiastka
wysokiego stopnia. W takiej sytuacji wykorzystuje si posta logarytmiczn
podanego wyej wzoru:

log w i r / r 1 =

1 n
1
log wi r / r 1 =
log wi n / 1

n 1 i =2
n 1

4.15.

Procedur wykorzystania omwionych wyej metod do wyodrbniania


tendencji rozwojowej ilustruje poniszy przykad 4.3.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

107

Przykad 4.3.
W pewnym badaniu statystycznym obejmujcym obszar wojewdztwa
K zebrano m. in. informacje dotyczce ksztatowania si wskanika rozwodw (na 1000 mieszkacw) w latach 1991 2000. Informacje te ujto w
poniszej tablicy:
Rok
Wskanik rozwodw

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
2,2 2,5 2,0 2,3 2,8 3,2 3,5 3,9 4,2 4,4

rdo: Dane umowne

Okreli tendencj rozwojow wskanika rozwodw w badanym okresie:


a) metod rednich ruchomych,
b) wyznaczajc rwnanie trendu,
c) okrelajc rednie tempo zmian.
Rozwizanie:
ad. a) Dla wykonania oblicze pomocniczych przeksztacamy powyszy szereg w tablic dwukolumnow, w ktrej w kolumnach 4 i 5 wyznaczymy odpowiednie rednie ruchome; przyjmujemy, i bd to rednie 3 i 5-okresowe.

Rok

Nr
Wskanik
okresu rozwodw
( ti )

yi )

rednie
rednie
3-okresowe 5-okresowe

ti t (ti t ) 2 ( ti t ) yti wi r / r 1

1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
Razem

1
2
3
4
5
6
7
8
9
10
55

2,2
2,5
2,0
2,3
2,8
3,2
3,5
3,9
4,2
4,4
31

2,23
2,27
2,37
2,77
3,17
3,53
3,87
4,17
X

2,36
2,56
2,76
3,14
3,52
3,84
X

- 4,5
- 3,5
- 2,5
- 1,5
- 0,5
0,5
1,5
2,5
3,5
4,5
X

20,25
12,25
6,25
2,25
0,25
0,25
2,25
6,25
12,25
20,25
82,5

- 9,9
- 8,75
- 5,0
- 3,45
- 1,4
1,6
5,25
9,75
14,7
19,8
22,6

1,14
0,80
1,15
1,22
1,14
1,09
1,11
1,08
1,05
X

Wielkoci podane w kolumnach 3, 4 i 5 nanosimy na ukad wsprzdnych. Linia amana powstaa z poczenia punktw obrazujcych wielkoci
empiryczne (dane z kolumny 3) moe suy do oceny wzrokowej charakteru
tendencji rozwojowej. Na jej podstawie mona stwierdzi, i wielko
wskanika rozwodw w badanym okresie wykazuje tendencj rosnc (por.
rys. 4.1; linia 1)

108

Zygmunt Bobowski

Rys. 4.1
Wyznaczanie tendencji rozwojowej

rdo: opracowanie wasne

Linia przebiegajca przez punkty wyznaczone przez rednie trzyokresowe (dane z kolumny 4) ma ksztat bardziej wygadzony w stosunku do linii
empirycznej. Wygadzenie to jednak odbyo si kosztem skrcenia szeregu czasowego o informacje dla lat 1991 i 2000 (patrz rys. 4.1, linia 2).
Linia, ktrej przebieg wyznaczyy rednie 5-okresowe charakteryzuje si
dalszym wygadzeniem przy kolejnej stracie informacji dla dwch kolejnych okresw. Wszystkie one potwierdzaj jednak wystpowanie tendencji
rosncej wskanika rozwodw na 1000 mieszkacw na badanym obszarze
(por. rys. 4.1, linia 3).
ad. b) Wyznaczamy rwnanie trendu o postaci 4.10, a parametry tego rwnania wedug wzorw 4.11 i 4.12. Obliczenia pomocnicze wykonano w
powyszej tablicy roboczej w kolumnach 6 -8. Wartoci rednie dla
badanych zmiennych wynosz:
- dla zmiennej czasowej T: t = 5,5;
- dla zmiennej Y, tj. wskanika rozwodw: y = 3,1
Wstawiajc odpowiednie wielkoci uzyskane w tabeli roboczej do wzorw 4.11. i 4.12 uzyskujemy nastpujce wartoci parametrw rwnania
trendu:

a=

22,6
= 0,27 (rozwodw na 1000 mieszkacw/ rok)
82,5

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

109

b = 3,1 0,27 5,5 = 1,59 (rozwodw na 1000 mieszkacw)


i w konsekwencji rwnanie trendu bdzie miao posta:

yt = 0,27t + 1,59
Z oszacowanej funkcji wynika, e w badanym okresie wskanik rozwodw wykazywa tendencj rosnc (parametr a jest dodatni) i wzrasta on
redniorocznie o 0,27, za jego wielko w roku zerowym, tj. 1990 wynosia 1,59. Obraz graficzny oszacowanej tendencji rozwojowej zaprezentowano
rwnie na powyszym wykresie (por. rys. 4.1, linia .4).
ad. c) W celu okrelenia redniorocznego tempa zmian wielkoci wskanika
rozwodw dokonamy wyznaczenia redniego indeksu acuchowego
(indeksy te obliczono w tabeli roboczej w kolumnie 9). Konieczne jest
zatem obliczenie redniej geometrycznej ustalonego cigu indeksw
acuchowych. Naley tu zauway, i ich iloczyn jest identyczny jak
indeks dla roku 2000 liczony w stosunku do roku 1991. Postpujc
zgodnie z formu 4.14 otrzymujemy:

w i r / r 1 = 9 1,14 0,90 1,15 1,22 1,14 1,09 1,11 1,08 1,05 = 9 2,0 = 1,079

Uzyskana wielko oznacza:


po pierwsze, z uwagi na uzyskan warto redniego indeksu acuchowego wiksz od jednoci, i wskanik rozwodw w badanym okresie
wykazywa tendencj rosnc,
po drugie, rednie roczne tempo wzrostu wskanika rozwodw w badanym okresie wynosio 7,9 %.

4.4. ANALIZA SEZONOWOCI


Badanie sezonowoci stanowi - obok wyznaczania tendencji rozwojowej
- kolejne istotne zagadnienie z zakresu analizy szeregw czasowych. Zadaniem analizy w tym przypadku jest wyodrbnienie waha sezonowych w
takim szeregu oraz okrelenie ich natenia. Jest to zagadnienie szczeglnie
wane w przypadku zjawisk spoeczno-ekonomicznych, bowiem podlegaj
one oddziaywaniu wielu czynnikw wywoujcych nie tylko ujawnienie si
okrelonej tendencji rozwojowej, ale rwnie rnego rodzaju waha, w tym
sezonowych. Wahania sezonowe s szczeglnym przypadkiem waha okresowych, najczciej o rocznym cyklu waha. Mona wrd nich wyrni
wahania o charakterze miesicznym, kwartalnym bd procznym. Przyczyn tego typu waha moe by cykliczny ruch Ziemi wok Soca i zwizane z tym wystpowanie pr roku. Mona poda przykady wielu zjawisk
charakteryzujcych si wahaniami sezonowymi zwizanymi z wystpowaniem pr roku, np. produkcja rolinna, zapotrzebowanie na okrelony typ
odziey (letnia, zimowa), popyt na napoje chodzce, popyt na okrelony typ

110

Zygmunt Bobowski

sprztu sportowego (zimowy, letni). Podoe sezonowoci mog stanowi


rwnie czynniki o charakterze instytucjonalnym bd prawnym nakadajce wykonywanie okrelonych czynnoci w narzuconych terminach, np. organizacja roku szkolnego i zwizany z tym popyt na podrczniki i artykuy
papiernicze, konieczno sporzdzania niektrych sprawozda i rozlicze w
cile okrelonych cyklach (miesicznych, kwartalnych, rocznych). Nastpstwa wystpowania waha sezonowych s na og negatywne. Powoduj
one np. nierytmiczny przebieg procesw produkcyjnych, nierwnomierne
wykorzystanie czynnikw produkcji, nierwnomierne w cigu roku wykorzystanie bazy dydaktycznej uczelni, szk. W kadym przypadku skutkiem s ponoszone dodatkowe koszty dziaalnoci (zwizane np. z koniecznoci gromadzenia zapasw rodkw rzeczowych bd przechowywania
wyrobw gotowych, utrzymania zbdnej bazy).
Prowadzona analiza sezonowoci pozwala na jej identyfikacj, okrelenie
skali tego zjawiska i w konsekwencji podjcie dziaa, ktrych celem bdzie
przynajmniej czciowe zagodzenie negatywnych jej nastpstw np. poprzez
waciwe planowanie dostaw surowcw lub zbytu wyrobw gotowych,
uwzgldnienie zatrudnienia ewentualnych pracownikw sezonowych, planowanie gospodarki remontowej. Skal sezonowoci ustala si poprzez wyznaczanie wskanikw sezonowoci, ktre najczciej obrazuj odchylenia
poziomu badanego zjawiska w poszczeglnych wyodrbnionych okresach od
poziomu redniego.
Wahania sezonowe mog by wyodrbniane rnymi metodami. Najprostsza z nich to metoda oparta na rednich okresw jednoimiennych. Dla
potrzeb tej metody analizy sezonowoci szereg czasowy musi ujmowa materia empiryczny w ukadzie umoliwiajcym badanie okrelonego typu sezonowoci (np. w ukadzie miesicznym, kwartalnym bd procznym).
Wskanik sezonowoci dla j-tego okresu ( S j ) w przypadku tej metody wyznaczany jest wedug wzoru:

Sj =

yj
y

100

4.16.

gdzie :

y j - redni poziom zjawiska dla j-tego okresu,


y - redni poziom zjawiska dla wszystkich okresw.
Wskanik ten najczciej wyraany jest w %, co znacznie uatwia jego
interpretacj, bowiem informuje on jak - przecitnie biorc - ksztatowa si
poziom zjawiska w okrelonym okresie w stosunku do poziomu redniego.
Metoda ta jest zalecana w przypadku, gdy badane zjawisko (a tym samym
poziom waha) nie wykazuje okrelonej tendencji rozwojowej.
Kolejna metoda oparta jest na wyznaczaniu rednich ruchomych centrowanych. Zastosowanie rednich ruchomych powoduje wygadzenie waha
przypadkowych w szeregu czasowym, przy czym typ redniej ruchomej zdeterminowany jest charakterem badanej sezonowoci; i tak w przypadku badania sezonowoci miesicznej wyznaczamy rednie 12-okresowe, kwartal-

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

111

nej - rednie 4-okresowe. Wyznaczone rednie posiadaj ten mankament, i


istnieje problem z ich przyporzdkowaniem konkretnemu okresowi z uwagi
sposb ich liczenia (z parzystej liczby wyrazw szeregu czasowego). T niedogodno eliminuje si wyznaczajc rednie ruchome centrowane 2okresowe z wyznaczonych uprzednio rednich ruchomych. Centrowanie to
powoduje przyporzdkowanie uzyskanych w ten sposb rednich konkretnym wartociom empirycznym wystpujcym w szeregu czasowym, a to z
kolei umoliwia wyznaczenie wskanikw sezonowoci wedug poniszego
wzoru:

Sj =

( j)
ti

( j)

100

4.17.

ci

gdzie:

( j)

( j)

ti

- oznacza sum wartoci empirycznych dla j-tego okresu,

ci

- oznacza sum rednich ruchomych centrowanych dla j-tego


okresu.

Tak liczony wskanik sezonowoci jest zatem ilorazem sumy wartoci


empirycznych i sumy rednich ruchomych centrowanych dla badanego
okresu.
Naley tu zwrci uwag, i podobnie jak w przypadku metody mechanicznej wyodrbniania tendencji rozwojowej zastpowanie wartoci empirycznych rednimi ruchomymi powoduje skracanie szeregu informacji. W
przypadku rednich 4-okresowych strata dotyczy dwch pierwszych i
dwch ostatnich okresw, w przypadku rednich 12-okresowych - szeciu
pierwszych i szeciu ostatnich okresw. Z uwagi na sposb liczenia wskanika sezonowoci wielkoci wystpujce w liczniku tej formuy musz pomija wartoci yt i , dla ktrych nie jest moliwe przyporzdkowanie rednich
ruchomych centrowanych. Wartoci ustalonych wskanikw interpretowane s podobnie jak w przypadku pierwszej metody. Metod t zaleca si
stosowa, gdy ujte w szeregu czasowym zjawisko charakteryzuje si okrelon tendencj rozwojow.
Kolejna metoda oparta jest na wykorzystaniu rwnania trendu oszacowanego dla szeregu czasowego, dla ktrego bdzie badana sezonowo. Procedura tej metody wymaga - w pierwszej fazie oszacowania rwnania
trendu dla analizowanego szeregu czasowego wedug zasad poznanych w
podrozdziale 4.3. Nastpnie na podstawie oszacowanego rwnania wyznaczane s wartoci teoretyczne ( y t i ) dla kadego z wyodrbnionych okresw
( ti ). Konstrukcja wskanika sezonowoci zakada porwnywanie uzyskanych wartoci teoretycznych (

yt i ) z odpowiadajcymi im wielkociami empi-

rycznymi przy wykorzystaniu do tego celu nastpujcej postaci wskanika


sezonowoci:

112

Zygmunt Bobowski

Sj =

( j)
ti

100

( j)
y ti

4.18.

gdzie:

( j)

ti

- suma wartoci empirycznych dla j-tego okresu,

ti

( j)

- suma wartoci teoretycznych dla jtego okresu oszacowanych za pomoc rwnania trendu

Wskanik sezonowoci stanowi w tym przypadku iloraz sum wartoci


empirycznych i oszacowanych wartoci teoretycznych dla badanego okresu.
Interpretacja uzyskanych wskanikw moe mie podobny charakter jak
wyej.
Podsumowujc naley wskaza na jeszcze jeden problem zwizany z badaniem sezonowoci. Dotyczy on tzw. oczyszczania wskanikw sezonowoci. Uzyskiwane wartoci wskanikw sezonowoci winny spenia wasno, ktr mona wyrazi nastpujco:
suma wskanikw sezonowoci winna by rwna iloczynowi liczby wyodrbnionych okresw i liczby 100.
W praktyce czsto zdarza si, i warunek ten nie jest speniony; wyznaczone wwczas wskaniki traktujemy jako surowe, ktre bd podlegay
procedurze oczyszczenia. W tym celu wyznaczany jest wskanik korygujcy o postaci:

k=

4.19.

r 100

gdzie:

S j - surowe wskaniki sezonowoci dla wyodrbnionych okresw,


r - liczba wyodrbnionych okresw.
Nastpnie dokonujemy korekty surowych wskanikw dzielc kady z
nich przez ustalony wskanik korygujcy.
Procedur badania sezonowoci przy wykorzystaniu omwionych metod
ilustruje poniszy przykad.
Przykad 4.4.
W trakcie analizy zatrudnienia w firmie Z w Warszawie dokonano m.
in. zestawienia liczby zatrudnionych w ujciu kwartalnym w latach 1996 2000. Uzyskano nastpujce dane (przecitne zatrudnienie w poszczeglnych kwartaach):

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

Lata
1996
1997
1998
1999
2000

113
Kwartay

I
171
160
154
146
143

II
191
174
168
158
148

III
297
276
249
221
213

IV
223
214
202
192
186

rdo: Dane umowne

Na podstawie powyszych danych zbada, czy poziom zatrudnienia w tej


firmie charakteryzuje si sezonowoci kwartaln i ewentualnie okreli jej
skal posugujc si metodami opartymi na:
a) rednich okresw jednoimiennych,
b) rednich ruchomych centrowanych,
c) rwnaniu trendu.
Dokona interpretacji uzyskanych wskanikw sezonowoci. W przypadku koniecznoci dokona oczyszczenia ustalonych wskanikw.
Rozwizanie:
ad. a) Dla potrzeb tej metody wyznaczamy rednie dla poszczeglnych
kwartaw y j oraz redni liczon dla wszystkich kwartaw ( y ) .

( )

Obliczenia pomocnicze wykonano w poniszej tabeli roboczej:


Lata

Kwartay

1996
1997
1998
1999
2000
Suma

I
171
160
154
146
143
774

II
191
174
168
158
148
839

III
297
276
249
221
213
1256

IV
223
214
202
192
186
1017

yj

154,8

167,8

251,2

203,4

rednia liczona dla wszystkich kwartaw wynosi:

y=

154,8 + 167,8 + 251,2 + 203,4


= 194,3
4

Zrnicowane rednie dla poszczeglnych kwartaw wskazuj na wystpowanie sezonowoci kwartalnej w poziomie zatrudnienia pracownikw
w badanej firmie. Skal tego zjawiska okrelimy wyznaczajc wskaniki sezonowoci dla poszczeglnych kwartaw zgodnie z wzorem 4.16:

114

Zygmunt Bobowski

154,8
100 = 79,67%
194,3

SI =

167,8
100 = 86,36%
194,3
251,2
=
100 = 129,28%
194,3
203,4
=
100 = 104,68%
194,3

S II =
S III
S IV

Uzyskane wielkoci wskanikw interpretujemy nastpujco:


w kwartale pierwszym (przecitny) poziom zatrudnienia ksztatowa si
zwykle okoo 20 % poniej redniego poziomu dla caego roku,
- w kwartale drugim poziom zatrudnienia ksztatowa si okoo 14 % poniej poziomu redniego,
- w kwartale trzecim przecitne zatrudnienie ksztatowao si okoo 30 %
powyej poziomu redniego,
- w kwartale czwartym liczba zatrudnionych ksztatowaa si okoo 5 %
powyej redniej rocznej.
Suma obliczonych wskanikw sezonowoci wynosi 399,99 %, tj. w
przyblieniu 400 %, a wic nie zachodzi konieczno ich korygowania.

ad. b) Dla potrzeb tej metody wyznaczamy - zgodnie z jej reguami - rednie
ruchome 4-okresowe, a nastpnie poddajemy je centrowaniu. Dokonano tego w poniszej tablicy roboczej. w kolumnach 4 i 5.
Wykorzystujc wzr 4.17 wyznaczamy wskaniki sezonowoci dla poszczeglnych kwartaw (dla kwartau I podano szczegowo sposb liczenia wskanika sezonowoci):

SI =

160 + 154 + 146 + 143


603
100 =
100 = 78,24%
210,875 + 199,625 + 185,25 + 175
770,75
S II =

648
100 = 85,76%
755,625

S III =
S IV =

1043
100 = 131,11%
795,5

831
100 = 105,64%
786,625

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

Rok/
kwarta

Nr
Zaokresu trudnie
nie
( ti )
( yt )
i

1996/ I

171

II

191

115

rednie
ruchome
4okresowe

rednie
ruchome
4-okresowe
centrowane

- 9,5

90,25

- 1624,5

216,65

- 8,5

72,25

- 1623,5

214,3

219,125

- 7,5

56,25

- 2227,5

211,95

215,625

- 6,5

42,25

- 1449,5

209,6

210,875

- 5,5

30,25

- 880

207,25

207,125

- 4,5

20,25

- 1749

204,9

205,25

-3,5

12,25

- 966

202,55

203,75

- 2,5

6,25

- 535

200,2

199,625

- 1,5

2,25

- 231

197,85

194,75

- 0,5

0,25

- 84

195,5

192,25

0,5

0,25

124,5

193,15

190,00

1,5

2,25

303

190,8

185,25

2,5

6,25

365

188,45

180,50

3,5

12,25

553

186,1

178,875

4,5

20,25

994,5

183,75

177,25

5,5

30,25

1056

181,4

175,00

6,5

42,25

929,5

179,05

173,25

7,5

56,25

1110

176,7

8,5
9,5
X

72,25
90,25
665

1810,5
1767
- 1565

174,35
172
X

ti t ( ti t )2

(t i t ) y ti yt i

220,5

III

297
217,75

IV

223
213,5

1997/ I

160
208,25

II

174
206

III

276
204,5

IV

214
203

1998/ I

154
196,25

II

10

168
193,25

III

11

249
191,25

IV

12

202
188,75

1999/ I

13

146
181,75

II

14

158
179,25

III

15

221
178,5

IV

16

192
176

2000/ I

17

143
174

II

18

148
172,5

III
IV
Suma

19
20
X

213
186
X

Suma wyznaczonych wskanikw sezonowoci wynosi 400,72 %, czyli


nieznacznie przekracza wielko teoretyczn. Oznacza to, i w zasadzie nie
jest konieczne dokonywanie korekty uzyskanych wskanikw. Jednak dla
ilustracji tej procedury dokonamy ich korygowania. Wskanik korygujcy
ustalony zgodnie z wzorem 4.19 wynosi:

k=

400,72
= 1,001875
4 100

Przy jego pomocy dokonujemy korekty otrzymanych surowych wskanikw sezonowoci:

116

Zygmunt Bobowski

SI =

78,24
= 78,09%
1,001875

S II =

85,76
= 85,60%
1,001875

S III =

131,11
= 130,86%
1,001875

S IV =

105,64
= 105,44%
1,001875

Interpretacja uzyskanych skorygowanych wskanikw odbywa si podobnie jak w przypadku poprzedniej metody.
ad. c) W celu zastosowania tej metody konieczne jest oszacowanie rwnania
trendu o postaci 4.10. dla analizowanego szeregu czasowego okresw,
gdzie okresami s poszczeglne kwartay. Obliczenia pomocnicze dla
okrelenia parametrw rwnania zgodnie z wzorami 4.11 i 4.12 zawarto w powyszej tablicy roboczej w kolumnach 6 - 8. Wartoci rednie wynosz:
- dla zmiennej czasowej T : t = 10,5,
- dla zmiennej Y:
y = 194,3.
Parametry rwnania wyznaczane wedug podanych wzorw bd wynosiy:

1565
= 2,35
665
b = 194,3 + 2,35 10,5 = 219
a=

a rwnanie trendu przyjmie posta

yt = 2,35t + 219
Wykorzystujc oszacowane rwnanie wyznaczamy wartoci teoretyczne
( y t i ) dla poszczeglnych okresw podstawiajc do rwnania kolejne ich
numery (por. kolumna 9 tabeli roboczej). Po podstawieniu do wzoru 4.18
odpowiednich wartoci empirycznych i odpowiadajcych im wartoci teoretycznych otrzymujemy wskaniki sezonowoci dla poszczeglnych kwartaw (dla kwartau I podano szczegowo sposb wyznaczania wskanika):

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

SI =

117

171 + 160 + 154 + 146 + 143


774 =
100 =
100 = 78,24%
216,65 + 207,25 + 197,85 + 188,45 + 179,05
989,25
839
S Ii =
100 = 85,83%
977,5
S III =
S IV =

1256
100 = 130,05%
965,75
1017
100 = 106,60%
954

Suma uzyskanych wskanikw nieznacznie przekracza warto teoretyczn ( wynosi 400,72 %), a wic nie zachodzi potrzeba ich korygowania.
Na podstawie przeprowadzonych bada uzyskano podobne wielkoci
wskanikw sezonowoci przy wykorzystaniu wszystkich trzech metod ich
wyodrbniania.

PRACE DYDAKTYCZNE
WABRZYSKIEJ WYSZEJ SZKOY ZARZDZANIA I PRZEDSIBIORCZOCI

SERIA:
NAUKI SPOECZNE

Rozdzia V

Wnioskowanie statystyczne

5.1. ISTOTA I METODY WNIOSKOWANIA STATYSTYCZNEGO


Metody wnioskowania o caej zbiorowoci statystycznej na podstawie informacji zebranych w trakcie badania prby statystycznej (reprezentacyjnej)
s przedmiotem teorii statystyki matematycznej. Proponuje ona metody,
ktre takie wnioskowanie umoliwiaj. Wnioskowanie to moe dotyczy:
1) oceny, do jakiej klasy naley rozkad badanej zmiennej,
2) wartoci parametrw badanej zmiennej w populacji generalnej,
3) wystpowania niezalenoci bd zalenoci okrelonych zmiennych.
Podejcie klasyczne wyrnia dwie metody wnioskowania:
teori szacowania (teori estymacji), ktra daje przede wszystkim
moliwo szacowania okrelonych parametrw populacji generalnej
na podstawie prby. W tym przypadku przystpujc do wnioskowania nie posiadamy adnych pochodzcych spoza prby informacji o
populacji generalnej, ktre mogyby znacznie ucili wyniki wnioskowania; w rezultacie jako wynik wnioskowania przyjmujemy taki
rozkad lub takie wartoci parametrw, ktre s najbardziej naturalne dla analizowanej prby statystycznej.
teori weryfikacji hipotez statystycznych, gdzie statystyk z gry formuuje pewne przypuszczenia dotyczce okrelonych wasnoci populacji generalnej (np. typu rozkadu zmiennych, wartoci parametrw, niezalenoci zmiennych). Metody statystyki matematycznej
umoliwiaj na podstawie wynikw z prby wnioskowanie o przyjciu bd odrzuceniu tych przypuszcze.
Z powyszego wynika, i omawiane metody s cile zwizane z badaniami czciowymi. Okolicznoci, w jakich takie badania s prowadzone,
zostay wskazane w rozdziale I.
Teoria wnioskowania statystycznego opiera si na grupie twierdze
zwanych granicznymi. Podstawowe wrd nich to twierdzenie LindebergaLevy`ego: Jeli zmienne losowe X 1 , X 2 ,...., X n s niezalene i posiadaj jed-

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

119

nakowy rozkad z wartoci oczekiwan E(x) i wariancj ( x ) to przy


n rozkad redniej tych zmiennych ma rozkad asymptotycznie nor2

malny o parametrach:

( x)
N E ( x);
. Twierdzenie to zasuguje na uwag,
n

poniewa stwierdza zmierzanie rozkadu redniej z prby do rozkadu


normalnego niezalenie od rozkadu populacji, z ktrej prba zostaa pobrana. Przyjmuje si jednak zastrzeenie, e prba winna by dostatecznie
liczna, tzn. winna liczy powyej 30 jednostek. Jest to regua do arbitralna. Wiksza minimalna liczebno jest wymagana, gdy rozkad w populacji
daleko odbiega od rozkadu normalnego, gdy za jest zbliony mona przyj mniejsz prb.
Szczeglnym przypadkiem twierdzenia granicznego jest twierdzenie
Moivre'a - Laplace'a. Zgodnie z nim rozkad normalny jest rozkadem granicznym dla rozkadu dwumianowego, gdy n ronie nieograniczenie, co
mona uj nastpujco: zmienna o rozkadzie dwumianowym i parametrach n oraz p przy n ma asymptotycznie rozkad normalny o parametrach:

E ( x) = n p oraz ( x) = n p q . Twierdzenie to moe by formuo-

wane jako twierdzenie lokalne lub integralne; w pierwszym przypadku, przy


duych wartociach n prawdopodobiestwa rozkadu dwumianowego mog
by obliczone za pomoc funkcji gstoci rozkadu normalnego, natomiast
w drugim, dla duych n dystrybuanta rozkadu dwumianowego moe by
zastpiona dystrybuant rozkadu normalnego.
Wnioski wynikajce z twierdze granicznych mona uj nastpujco:
jeli zmienn losow traktowa jako sum znacznej liczby zmiennych losowych, z ktrych adna nie posiada dominujcego wpywu na wielko tej
sumy, to posiada ona najczciej charakter rozkadu normalnego.
W konsekwencji losowan prb mona rwnie traktowa jako sum
zmiennych i jej rozkad dla duych n jest zbliony do normalnego, co praktycznie oznacza moliwo przyjcia odpowiednich parametrw ustalonych
dla prby jako parametrw rozkadu normalnego dla populacji generalnej.

5.2. PRBA STATYSTYCZNA I SCHEMATY JEJ LOSOWANIA


Prba statystyczna, na podstawie ktrej odbywa si wnioskowanie o populacji, moe by z niej rozmaicie pobierana, a zasadniczym postulatem jest
by miaa ona charakter losowy. Nie moe zatem mie miejsca wiadomy
wybr jednostek do prby. Wnioski o populacji generalnej otrzymane na
podstawie zbadanej prby s suszne tylko wtedy, gdy prba jest podobna
do populacji, z ktrej pochodzi. O prbie, ktra dobrze odzwierciedla
wszystkie interesujce nas wasnoci populacji generalnej mwimy, e jest
prb reprezentatywn. Warunki, ktre musi spenia taka prba, ujmuje
si nastpujco:
prba musi by podzbiorem populacji generalnej,
elementy prby musz by dobrane w sposb losowy,

120

Zygmunt Bobowski

prba musi by dostatecznie liczna.


W oparciu o powysze warunki Gliwienko sformuowa nastpujce
twierdzenie: Jeeli prba jest dostatecznie liczna to z prawdopodobiestwem
bliskim 1 mamy prawo oczekiwa, e rozkad empiryczny cechy w prbie
mao rni si od rozkadu teoretycznego w populacji generalnej.
Jednym z warunkw reprezentatywnoci prby jest losowy sposb jej
pobierania, tzn. o wyborze jednostek do prby decyduje przypadek. Winien
to gwarantowa waciwy mechanizm doboru jednostek do prby zwany
mechanizmem lub schematem losowania.
Dobry mechanizm losowania - gwarantujcy uzyskanie takiej prby winien spenia nastpujce warunki:
kryterium doboru elementw do prby winno by tak skonstruowane, aby byo niezalene od tych zmiennych, ktre bd badane w
prbie,
kryterium doboru musi jednoznacznie okrela, czy okrelony element populacji naley wczy do prby, czy te z niej wykluczy,
kryterium doboru musi zapewnia kademu elementowi populacji
dodatnie prawdopodobiestwo trafienia do prby i wyklucza moliwo trafienia do niej elementu spoza populacji,
w przypadku losowania bardzo duej prby przy wykorzystaniu licznego zbioru badaczy konieczne jest ustalenie prostych zasad losowania by zapobiec pomykom.
Omawiane w literaturze schematy doboru jednostek do prby mona
podzieli na:
arbitralne,
losowe.
Dobr arbitralny dobierajcy prb przy jej wyborze kieruje si jedynie
wasn wiedz i intuicj. Nie ma moliwoci zweryfikowania susznoci doboru, a wic pobrana prba moe mie charakter tendencyjny. Jako nielosowy naley rwnie okreli dobr oparty na wiedzy ekspertw. Uzyskane
w taki sposb prby maj charakter subiektywny i nie mona w stosunku
do wynikw uzyskanych z takich prb stosowa metod statystyki matematycznej, gdy uzyskane zmienne nie musz mie charakteru losowego.
W praktyce najczciej wykorzystywane s nastpujce losowe schematy kwalifikowania jednostek do prby:
losowanie indywidualne ze zwracaniem, tzw. losowanie niezalene po
wylosowaniu elementu z populacji i zapisaniu wartoci interesujcej
nas cechy powraca on do populacji; moe wic on by powtrnie wylosowany; prawdopodobiestwo wylosowania kadego kolejnego elementu
do prby jest stae. Taki sposb losowania posiada nastpujce wasnoci:
- kady element populacji ma t sam szans (czyli to samo prawdopodobiestwo) dostania si do prby,
- wynik pierwszego i kadego kolejnego losowania nie ma wpywu na
wynik nastpnego losowania.
Schemat ten jest stosowany przy losowaniu prby z populacji mao licznej.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

121

losowanie indywidualne bez zwracania tzw. losowanie zalene element


raz wylosowany nie powraca do populacji generalnej, wobec czego skad
populacji po kadym losowaniu jest inny (jej liczebno jest pomniejszona o jeden); zmienia si wic prawdopodobiestwo trafienia do prby
kadego kolejnego elementu (jest to istotne w przypadku populacji mao
licznych). Poniewa schematy losowania maj gwarantowa jednakow
szans dostania si do prby kadego elementu populacji generalnej, to
zastosowanie tego schematu w przypadku populacji bardzo licznych lub
nieskoczonych nie ma praktycznego wpywu na prawdopodobiestwo
trafienia do prby kadego kolejnego elementu. Ten schemat losowania
jest zalecany dla populacji bardzo licznych.
Porwnujc obie metody losowania naley stwierdzi, i przy losowaniu
prby z populacji mao licznych metoda losowania bez zwracania jest bardziej efektywna, poniewa pozwala na uzyskanie w oparciu o prb wikszej
iloci informacji o badanej populacji (w przypadku losowania ze zwracaniem elementy prby mog si powtarza, przy losowaniu bez zwracania nie
jest to moliwe). W przypadku populacji bardzo licznych sposb pobierania
prby nie ma znaczenia, chocia naley zauway, e metody wnioskowania
statystycznego zakadaj przede wszystkim zwrotny sposb pobierania prby.
W przypadku populacji skoczonych efektywn metod pobierania prby gwarantuje dobr przy wykorzystaniu tablic liczb losowych cztero- picio- lub szeciocyfrowych. Tablice takie zawieraj liczby 4, 5, 6 cyfrowe
zgrupowane w losowej kolejnoci w wierszach i kolumnach. W celu pobrania prby po ponumerowaniu jednostek, tj. sporzdzeniu tzw. operatu losowania i okreleniu liczebnoci prby - wybieramy dowolny wiersz i dowoln kolumn, w ktrym rozpoczynamy odczytywanie i kolejno (w zalenoci od liczebnoci prby: jeli jej liczebno wyraa si w dziesitkach bierzemy pod uwag dwie ostatnie cyfry odczytywanej liczby, a jeli w setkach
trzy ostatnie cyfry) typujemy jednostki do prby stosujc schemat losowania ze zwracaniem (bierzemy wwczas pod uwag jednostki o numerach
powtarzajcych si) lub bez zwracania (w tym przypadku numery powtarzajce si pomijamy). Odczytane numery, ktrym nie odpowiadaj adne jednostki s pomijane. Odczytywanie koczymy, gdy prba zawiera dan
liczb elementw.
Niezalenie od powyszych schematw prba moe by pobierana drog
losowania warstwowego lub systematycznego.
Dobr warstwowy winien by stosowany wwczas, gdy populacja generalna nie jest jednorodna. Dokonywany jest podzia tej populacji na rozczne czci zwane warstwami. Poszczeglne warstwy winny by w miar
jednorodne. Prba losowa jest pobierana z kadej warstwy oddzielnie, a jej
skad jest proporcjonalny do liczebnoci poszczeglnych warstw. W ten sposb kada z warstw ma zapewniony udzia w wylosowanej prbie.
Schemat losowania systematycznego wymaga sporzdzenia uporzdkowanego wykazu wszystkich jednostek populacji generalnej (tzw. operatu losowania) i nadania kadej jednostce okrelonego numeru: 1, 2, , N. Dobr
systematyczny polega na zakwalifikowaniu do prby co k tego elementu
poczynajc od wylosowanego numeru pierwszej jednostki. Wielko k

122

Zygmunt Bobowski

zwana jest interwaem losowania i jest ustalana jako iloraz liczebnoci populacji generalnej i losowanej prby.

5.3. ESTYMACJA PARAMETRYCZNA


5.3.1. Pojcie i wasnoci estymatora. Metody estymacji
Parametry populacji generalnej szacowane s przy wykorzystaniu statystyk z pobranej prby. Statystyka z prby wykorzystywana do oszacowania
parametru populacji generalnej (tzw. parametru estymowanego) nosi nazw
estymatora tego parametru. Estymatorem Z n parametru Q bdziemy nazy-

Z n = f ( X 1 , X 2 ,..., X n ) okrelon na prbie, ktra ma t wasno, e prawdopodobiestwo zdarzenia Z n = Q jest tym blisze jednoci,
wali funkcj

im wiksza jest liczebno prby.


Parametr estymowany i estymator s najczciej parametrami tego samego typu, np. rednia z prby jest estymatorem redniej w populacji generalnej. Poza redni rol estymatorw dla odpowiednich parametrw mog
peni rwnie takie statystyki, jak np. wariancja, odchylenie standardowe w przypadku cech liczbowych. W przypadku cech opisowych moe interesowa nas czsto (wskanik struktury bd frakcja) wystpowania okrelonej kategorii elementw w populacji generalnej.
Od estymatorw oczekuje si by speniay one okrelone wasnoci. Zalicza si do nich przede wszystkim takie jak:
Zgodno jest oczywiste, e im mniejsza jest liczebno prby tym
trudniej jest dokona oszacowania na jej podstawie odpowiedniego parametru populacji generalnej (z ca pewnoci nisze jest w tym przypadku zaufanie do wynikw takiego oszacowania). Inna jest sytuacja w
przypadku prby do licznej. Estymator bdziemy uwaali za zgodny,
jeeli przy wzrastajcej liczebnoci prby ( n ) prawdopodobiestwo, e bezwzgldna warto rnicy midzy estymatorem
metrem estymowanym Q przekroczy dowolnie ma liczb
0) zmierza bdzie do zera. Mona to uj nastpujco:

Z n , a para(gdzie

>

lim P{Z n Q < } = 1

Praktycznie relacja ta oznacza, e ze wzrostem liczebnoci prby warto estymatora bdzie si zbliaa do wartoci szacowanego parametru.
Nieobciono wykorzystujc wartoci estymatora uzyskiwane z rnych prb do oszacowania parametru estymowanego mona uzyska
rne jego oceny (oszacowania). Podane jest by oszacowania te nie
zawieray bdu systematycznego tzn. nie odchylay si przecitnie ani
poniej ani powyej wartoci tego parametru. Estymator bdziemy uwaali za nieobciony, jeeli jego warto oczekiwana jest rwna parame-

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

123

trowi populacji, do oszacowania ktrego suy. Formalnie mona to zapisa:

E (Z n ) = Q

Praktyczny aspekt tej relacji w przypadku szacowania wartoci redniej


oznacza, e jeeli bdziemy powtarzali wielokrotnie pobieranie prby z
populacji i obliczali redni dla kolejnych prb, to w kocowym efekcie
warto przecitna z tych rednich bdzie si pokrywaa z interesujc
nas redni dla caej populacji, czyli nie wystpi systematyczne odchylanie si wartoci estymatora od szacowanego parametru.
Efektywno spord nieobcionych estymatorw Z n parametru Q
najlepszym bdzie ten, ktry posiada najmniejsz wariancj, gdy gwarantuje on, e uzyskane wyniki oszacowania bd mao rniy si od
faktycznej wartoci szacowanego parametru. Problem ten ilustruje
rys. 5.1. Spord dwch zaprezentowanych estymatorw efektywniejszy
jest estymator

Z n , poniewa w porwnaniu z estymatorem Z n

cha-

rakteryzuje si mniejsz zmiennoci. Estymator o najmniejszej wariancji spord wszystkich moliwych nieobcionych estymatorw parametru Q jest nazywany estymatorem najefektywniejszym. Miar efektywnoci dowolnego estymatora jest iloraz wariancji estymatora najefektywniejszego i wariancji tego estymatora. Jeli efektywno estymatora
wzrasta wraz ze wzrostem liczebnoci prby, to o estymatorze mwimy,
e jest asymptotycznie najefektywniejszy.
Rys. 5.1.
Efektywno estymatorw

Zn
Q
rdo: opracowanie wasne

Zn

124

Zygmunt Bobowski

Dostateczno - estymator jest dostateczny (wystarczajcy), jeeli wykorzystuje wszystkie informacje o szacowanym parametrze, ktre s zawarte w prbie.
Teoria szacowania parametrw obejmuje dwie metody estymacji: punktow i przedziaow. Estymacja punktowa polega na tym, e jako ocen
nieznanego parametru Q populacji generalnej przyjmujemy uzyskan z wylosowanej prby warto estymatora Z n . Szacowanie polega w tym przypadku na podaniu jednej konkretnej wartoci liczbowej parametru estymowanego. Taki sposb postpowania oznacza, e jeli z populacji bdziemy
pobierali kolejne prby, wyznaczali dla kadej z nich warto estymatora, to
mona si spodziewa zrnicowanych wartoci liczbowych, a to z kolei moe oznacza, i dla tej samej populacji istnieje kilka wartoci tego samego
parametru estymowanego (np. kilka wartoci rednich tej samej zmiennej),
co jest przecie niemoliwe. Prawdopodobiestwo zajcia zdarzenia, e uzyskana z dowolnej prby warto estymatora jest identyczna jak faktyczna
warto szacowanego parametru jest praktycznie rwne zero, co mona zapisa nastpujc relacj:

P (Z n = Q ) = 0
Dyskwalifikuje ona t metod estymacji.
W przypadku estymacji przedziaowej, na podstawie wynikw z wylosowanej prby, konstruowany jest przedzia liczbowy, ktry z okrelonym z
gry prawdopodobiestwem pokrywa warto parametru estymowanego.
Przedzia ten jest okrelany mianem przedziau ufnoci, natomiast prawdopodobiestwo poziomem (wspczynnikiem) ufnoci. Poziom ufnoci (oznaczany dalej jako ) mona zdefiniowa jako prawdopodobiestwo, e skonstruowany przedzia ufnoci zawiera warto parametru estymowanego.
Przyjmuje si, e prawdopodobiestwo to spenia warunek: 0,90 . Istnieje okrelona relacja midzy wielkoci poziomu ufnoci a precyzj szacowania parametru estymowanego: im wyszy jest poziom ufnoci, tym
mniejsza precyzja szacowania (wikszy bd szacunku, wiksza rozpito
przedziau ufnoci).
Oglny schemat postpowania w procedurze szacowania parametrw
metod przedziaow mona uj w nastpujcych punktach:
1) z populacji generalnej losowana jest prba statystyczna,
2) na podstawie wynikw uzyskanych z prby ustalana jest warto estymatora odpowiedniego dla szacowanego parametru estymowanego,
3) zakadany jest poziom ufnoci uwzgldniajcy wynikajce z tego
faktu konsekwencje w postaci okrelonej precyzji szacowania parametru estymowanego,
4) z tablic statystycznych odpowiedniego rozkadu odczytywana jest
waciwa dla przyjtego poziomu ufnoci warto statystyki teoretycznej

tt ,

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

125

5) uzyskane dla prby wartoci odpowiednich parametrw oraz odczytana z tablic wielko statystyki teoretycznej wstawiane s do odpowiedniej formuy szacowania przedziau ufnoci dla okrelonego parametru estymowanego; przedzia ten zostaje okrelony poprzez wyznaczenie jego dolnej i grnej granicy.
Poniej zostan omwione metody estymacji podstawowych parametrw
statystycznych.
5.3.2. Estymacja przedziaowa wartoci redniej
W literaturze wymienia si zazwyczaj dwa modele szacowania wartoci
redniej cile powizane z liczebnoci prby, na podstawie ktrej jest ono
dokonywane, tj. modele oparte na wynikach z maej i duej prby.
Model dla maej prby
Jako ma przyjmuje si traktowa prb o liczebnoci n 30 . Estymatorem dla oszacowania wartoci redniej w populacji generalnej E (x ) jest
rednia z prby x . Przyjmuje si zaoenie, e rozkad badanej zmiennej w
populacji generalnej ma charakter rozkadu normalnego. Z populacji tej losowana jest prba i na podstawie uzyskanych z niej danych wyznaczana
jest warto rednia x i odchylenie standardowe s (x) . Z gry zakadany
jest poziom ufnoci . Przedzia ufnoci dla wartoci redniej E (x ) w populacji generalnej szacowany jest wedug wzoru:

x tt

s(x )
n 1

< E (x ) < x + t t

s(x )
n 1

5.1

tt jest wartoci statystyki


odczytywan z tablic rozkadu t Studenta dla k = n 1 oraz 1 . UzyskaWystpujca w powyszym wzorze wielko

ny przedzia z prawdopodobiestwem rwnym poziomowi ufnoci pokrywa


nieznan warto redni w populacji generalnej. Warto zwrci uwag, i
otrzymany przedzia jest symetryczny wzgldem redniej z prby.
Naley zaznaczy, i bdna byaby interpretacja, e szacowana rednia
znajduje si w uzyskanym przedziale z prawdopodobiestwem rwnym ,
poniewa to przedzia jest zmienny, a nie szacowana warto rednia (ona
jest wielkoci sta). Uwaga ta dotyczy estymacji wszelkich parametrw
szacowanych metod przedziaow.
Przykad 5.1.
W badaniach rozwoju czytelnictwa wrd modziey szkolnej dla losowej
prby 15 uczniw klas I III pewnej szkoy zebrano informacje dotyczce
liczby przeczytanych ksiek w roku szkolnym. Otrzymano nastpujce informacje: 2; 6; 12; 10; 5; 4; 20; 22; 10; 15; 9; 8; 21; 14.; 7; Zakadajc, e
rozkad przeczytanej liczby ksiek w caej populacji uczniw jest zbliony

126

Zygmunt Bobowski

do normalnego - przy poziomie ufnoci 0,98 - oszacowa metod przedziaow redni roczn liczb przeczytanych ksiek dla tej populacji.
Rozwizanie
Wylosowana prba jest maa, a wic dla oszacowania przedziau ufnoci
wykorzystamy formu 5.1. W pierwszej kolejnoci wymaga ona wyznaczenia
redniej i odchylenia standardowego liczby przeczytanych ksiek w prbie.
Korzystajc z odpowiednich wzorw otrzymujemy:

165
= 11 ksiek
15
550
s(x ) =
= 6,1 ksiki.
15
x=

Dla przyjtego poziomu ufnoci odczytujemy z tablic rozkadu t Studenta


(tablica 2. w Aneksie) warto statystyki teoretycznej tt dla k = 15 1 = 14
oraz 1 = 1 0,98 = 0,02 . Wynosi ona 2,624. Uzyskane wielkoci podstawiamy do podanej formuy :

11 2,624

6,1
15 1

< E ( x ) < 11 + 2,624

6,1
15 1

11 4,30 < E ( x ) < 11 + 4,30


6,7 < E ( x ) < 15,3 ksiek
Przedzia ufnoci o kocach 6,7 i 15,3 ksiek z prawdopodobiestwem
0,98 zawiera nieznan redni roczn liczb przeczytanych ksiek przez
wszystkich uczniw klas I III tej szkoy.
Zauwamy, e przedzia ten jest symetryczny wzgldem redniej z prby
rwnej 11 ksiek; poowa jego rozpitoci, tj.

15,3 6,7
= 4,3 jest okrela2

na mianem maksymalnego bdu szacunku bd tolerancj lub precyzj


szacowania (oznaczana jest zwykle jako d).
Model dla duej prby
Wylosowana prba winna posiada liczebno przekraczajc 30 elementw. Przyjmuje si podobnie jak w poprzednim modelu - zaoenie o
normalnym rozkadzie populacji generalnej. Na podstawie wynikw uzyskanych z prby ustalana jest rednia x i odchylenie standardowe s (x) . Z
gry zakadany jest poziom ufnoci . Przedzia ufnoci dla redniej E (x )
w populacji generalnej szacowany jest wedug wzoru:

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

x tt
gdzie:

s(x )
n

127

< E (x ) < x + t t

s(x )

5.2

tt jest wartoci statystyki odczytywan z tablic dystrybuanty roz


kadu normalnego dla prawdopodobiestwa
.
2

Przykad 5.2.
W badaniach struktury wydatkw gospodarstw domowych zebrano m.
in. informacje dotyczce wydatkw na zakup artykuw przemysowych. Dla
losowej prby 200 gospodarstw uzyskano roczne kwoty wydatkw na zakup
tych artykuw podane w tablicy 5.1.
Tablica 5.1. Gospodarstwa domowe miasta K wedug rocznej
kwoty wydatkw na zakup artykuw przemysowych
Kwota wydatkw w z
500 - 1000
1000 1500
1500 - 2000
2000 2500
2500 - 3000

Liczba gospodarstw
40
65
55
30
10

rdo: Dane umowne

Zakadajc, e w caej populacji gospodarstw wydatki te maj charakter


rozkadu normalnego przy poziome ufnoci 0,99 oszacowa metod przedziaow rednie roczne wydatki na zakup artykuw przemysowych
w caej populacji gospodarstw domowych.
Rozwizanie
Z uwagi na du prb oszacowania przedziau ufnoci dla redniej dokonamy zgodnie z wzorem 5.2. W poniszej tablicy roboczej wykonano obliczenia pomocnicze dla ustalenia wartoci redniej x i odchylenia standardowego

s (x ) wydatkw w wylosowanej prbie.

Kwota
wydatkw
w z (xi )
500 - 1000
1000 1500
1500 - 2000
2000 2500
2500 - 3000
Razem

Liczba
gospodarstw
(ni )
40
65
55
30
10
200

x& i ni

x&i x

(x& i x )2 ni

30.000
81.250
96.250
67.500
27.500
302.500

- 762,5
- 262,5
237,5
737,5
1237,5
X

23.255.487,5
4.478.643,75
3.102.581,25
16.317.925,0
15.315.300,0
62.469.937,5

128

Zygmunt Bobowski

Otrzymujemy:

302500
= 1512,50 z
200
62469937,5
s(x ) =
= 558,9 z
200
x=

Z tablic dystrybuanty rozkadu normalnego (tablica 1. w Aneksie) odczy-

0,99
= 0,495 ; jako warto najbardziej zblion do tej wielko2
ci przyjmujemy 0,4951, ktrej odpowiada tt =2,58. Podstawiajc uzyskane

tujemy

tt dla

wielkoci do wzoru 5.2 otrzymujemy:

1512,5 2,58

558,9
200

< E ( x ) < 1512,5 + 2,58

558,9
200

1512,5 101,98 < E ( x ) < 1512,5 + 101,98


1410,52 < E ( x ) < 1614,48 z
Otrzymany przedzia z prawdopodobiestwem 0,99 pokrywa nieznan
redni roczn kwot wydatkw na zakup artykuw przemysowych przez
wszystkie gospodarstwa domowe.
5.3.3. Wyznaczanie minimalnej liczebnoci prby w procedurze szacowania wartoci redniej
Jest to problem czsto wystpujcy w badaniach statystycznych. Pojawia si pytanie, jak liczn prb naleaoby zbada, by uzyska zadowalajce wyniki oszacowania okrelonego parametru. W przypadku szacowania
wartoci redniej problem ten mona uj nastpujco: jaka winna by minimalna liczebno pobranej prby, by przy zaoonym poziomie ufnoci
oszacowa warto redni dla populacji generalnej z dan dokadnoci
(precyzj)? Proponowana procedura przyjmuje zaoenie, e rozkad populacji generalnej jest normalny, a jego parametry nieznane. Z populacji tej losowana jest wstpna maa prba o liczebnoci n. Na podstawie wynikw z
tej prby okrelana jest wariancja o postaci:

s 2 ( x ) =

(x

x)

n 1

w przypadku szeregu szczegowego

5.3

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

lub o postaci

s 2 ( x ) =

(x

129

x ) ni
2

w przypadku szeregu rozdzielczego

n 1

5.4

Zakadany jest poziom ufnoci oraz dana dokadno szacunku


wartoci redniej d. Minimaln liczebno prby wyznaczamy z wzoru:

t t s 2 ( x )
=
d2
2

n min

5.5

Wystpujc w podanym wzorze warto statystyki

tt odczytujemy z ta-

blic rozkadu t Studenta dla k = n 1 oraz 1 . Z uwagi na fakt, e liczebno prby musi by liczb cakowit w zwizku z tym w przypadku
koniecznoci - dokonujemy zawsze jej zaokrglenia do penej jednostki w
gr.
Przykad 5.3.
Traktujc wylosowan w przykadzie 5.1 prb uczniw jako prb
wstpn ustali, jaka minimalna liczba uczniw pozwoliaby oszacowa
redni roczn liczb przeczytanych ksiek dla wszystkich uczniw klas I
III z bdem maksymalnym 2 ksiki przy poziomie ufnoci 0,95.
Rozwizanie
Na podstawie wynikw z prby wstpnej ustalamy zgodnie z wzorem 5.3
wariancj

s 2 ( x ) liczby przeczytanych ksiek:


s 2 ( x ) =

550
= 39,28 (ksiek)2
14

Z tablic rozkadu t Studenta odczytujemy warto statystyki

tt dla

k = 15 1 = 14 oraz 1 0,95 = 0,05 ; wynosi ona 2,145. Zaoony bd szacunku d = 2.


Podstawiajc te wielkoci do wzoru 5.5 otrzymujemy:

n min

2
(
2,145) 39,28 180,7
=
=
= 45,17
4
(2)2

uczniw

Oznacza to, e dla oszacowania redniej rocznej liczby przeczytanych


ksiek z bdem maksymalnym 2 ksiek przy poziomie ufnoci 0,95 nale-

130

Zygmunt Bobowski

y wylosowa do prby co najmniej 46 uczniw (wynik zaokrglamy w gr).


Do prby wstpnej naley wobec tego dolosowa jeszcze 31 uczniw.
5.3.4. Estymacja przedziaowa wskanika struktury
W przypadku cechy opisowej gdy okrelanie typowych parametrw
statystycznych jest niemoliwe procedura szacowania moe dotyczy
udziau okrelonego wariantu tej cechy w populacji generalnej. W tym celu
z populacji tej losowana jest dua prba ( n > 100 ), dla ktrej okrela si
wskanik struktury o postaci

m
, gdzie m jest liczb wyrnionych w prbie
n

elementw, a n jej liczebnoci. Zakadany jest poziom ufnoci . Przedzia ufnoci dla wskanika struktury (p) w populacji generalnej wyznaczany jest wedug formuy:

m m
m m
1
1
m
m
n
n
n
n
tt
< p < + tt
n
n
n
n
Wystpujc w podanym wzorze warto statystyki
blic dystrybuanty rozkadu normalnego dla

5.6

tt odczytujemy z ta-

Przykad 5.4.
W badaniach warunkw socjalnych studentw pewnej uczelni zebrano
midzy innymi informacje dotyczce miejsca ich zamieszkania w okresie
studiw. Uzyskano dane ujte w tablicy 5.2.
Tablica 5.2. Studenci Akademii Medycznej w K wedug miejsca
zamieszkania w czasie studiw
Miejsce zamieszkania
Dom studencki
Stancja
Dom rodzinny
Razem

Liczba studentw
120
60
40
220

rdo: Dane umowne

Przyjmujc poziom ufnoci 0,95 oszacowa metod przedziaow:


a) udzia studentw zamieszkujcych w domu studenckim,
b) udzia studentw zamieszkujcych poza domem rodzinnym.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

131

Rozwizanie
ad. a) W celu oszacowania przedziau ufnoci dla wskanika struktury wykorzystamy wzr 5.6. Wymaga on wyznaczenia z prby wskanika
struktury dla studentw zamieszkujcych w domu studenckim.
Wskanik ten wynosi

m 120
=
= 0,5455
n 220
Z tablic dystrybuanty rozkadu normalnego odczytujemy warto statystyki

tt dla

0,95
= 0,475 ; wynosi ona 1,96. Podstawiamy otrzymane wiel2

koci do wzoru 5.6 i otrzymujemy

0,5455 1,96

0,5455(1 0,5455)
0,5455(1 0,5455)
< p < 0,5455 + 1,96
220
220
0,5455 0,0669 < p < 0,5455 + 0,0669
0,4786 < p < 0,6124

Wyraajc koce przedziau w procentach otrzymujemy:

47,86% < p < 61,24% .


Przedzia liczbowy o kocach 47,86 % i 61,24 % z prawdopodobiestwem 0,95 zawiera nieznany udzia studentw tej uczelni zamieszkujcych
w domu studenckim.
ad. b) W stosunku do punktu a zmianie ulegnie wskanik struktury dla
prby i wyniesie on:

m 120 + 60
=
= 0,8182
n
220
Warto

tt bdzie identyczna jak wyej. Podstawiajc otrzymane wielko-

ci do wzoru 5.6 otrzymujemy

0,8182 1,96

0,8182(1 0,8182 )
0,8182(1 0,8182)
< p < 0,8182 + 1,96
220
220
0,8182 0,0516 < p < 0,8182 + 0,0516
0,7666 < p < 0,8698 ,

132

Zygmunt Bobowski

a w ujciu procentowym:

76,66% < p < 86,98%


Uzyskany wynik oznacza, e przedzia o kocach 76,66 % i 86,98 %
z ufnoci 0,95 zawiera nieznany udzia studentw tej uczelni zamieszkujcych w czasie studiw poza domem rodzinnym.
5.3.5. Estymacja przedziaowa wariancji i odchylenia standardowego
Z uwagi na cise powizania obu parametrw ich szacowanie odbywa
si zwykle cznie. W zalenoci od wielkoci prby, na podstawie ktrej dokonywane jest ono, mona wyrni dwa modele postpowania.
Model oparty na wynikach z maej prby
Zakada si, e populacja generalna posiada rozkad normalny. Z populacji tej losowana jest maa prba ( n 30 ). Na jej podstawie ustalana jest
wariancja s (x ) uzyskanych wynikw. Stanowi ona estymator dla szacowanej wariancji populacji generalnej. Zakadany jest poziom ufnoci . Przedzia ufnoci dla wariancji populacji generalnej szacowany jest wedug wzoru:
2

n s 2 (x )
n s 2 (x )
2
< (x ) <
t t1
t t2
gdzie:

5.7

tt1 i tt 2 s wartociami statystyki teoretycznej odczytywanymi z tablic


rozkadu
wiednio:

2 (chi-kwadrat)

przy zaoonym poziomie ufnoci odpo-

1
,
2
1+
.
- tt 2 dla k = n 1 oraz
2
-

tt1 dla k = n 1 oraz

W celu uzyskania przedziau ufnoci dla odchylenia standardowego wyznaczamy pierwiastki kwadratowe z kocw przedziau oszacowanego dla
wariancji (korzystamy tu z oczywistej relacji zachodzcej midzy tymi parametrami).
Przykad 5.5.
Na wylosowanej grupie 10 dzieci w wieku przedszkolnym przeprowadzono test pamici. Otrzymano nastpujcy rozkad liczby zapamitanych
przez nie elementw: 15; 34; 45; 32; 18; 52; 25; 50; 40; 29. Zakadajc, e w
populacji generalnej rozkad liczby zapamitanych elementw ma charakter
rozkadu normalnego oszacowa granice przedziau ufnoci dla wariancji i

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

133

odchylenia standardowego liczby zapamitanych elementw przy poziomie


ufnoci 0,96
Rozwizanie
Ze wzgldu na ma prb korzystamy z podanej wyej procedury postpowania. Na podstawie uzyskanych wynikw z prby ustalamy w pierwszej kolejnoci redni x , a nastpnie wariancj
nych elementw. Warto rednia wyniesie:

x=

s 2 (x ) liczby zapamita-

340
= 34 elementy
10

za wariancja (wyznaczona wedug wzoru dla szeregu szczegowego):

s 2 (x ) =

1464
= 146,4
10

Dla przyjtego poziomu ufnoci z tablic rozkadu

2 odczytujemy:

1 0,96
= 0,02 i otrzymujemy 19,679
2
1 + 0,96
= 0,98 i wynosi ono 2,532.
- tt 2 dla k = 10 1 = 9 oraz
2
-

tt1 dla k = 10 1 = 9 oraz

Uzyskane wielkoci podstawiamy do formuy 5.7 i otrzymujemy:

10 146,4
10 146,4
< 2 (x ) <
19,679
2,532
74,39 < 2 ( x ) < 578,20 (elementw)2
Oszacowany przedzia o kocach 74,39 i 578,2 (elementw)2 zawiera
wariancj liczby zapamitanych elementw dla wszystkich dzieci w wieku
przedszkolnym przy poziomie ufnoci 0,96.
Przedzia ufnoci dla odchylenia standardowego liczby zapamitanych
elementw uzyskamy ustalajc pierwiastki kwadratowe z kocw oszacowanego powyej przedziau. Otrzymujemy:

74,39 < ( x ) < 578,2


8,6 < ( x ) < 24,0 elementy.

134

Zygmunt Bobowski

Przedzia o kocach 8,6 i 24 elementy z prawdopodobiestwem 0,96


zawiera nieznane odchylenie standardowe liczby zapamitanych elementw
przez wszystkie dzieci w wieku przedszkolnym.
Model dla duej prby
Model ten rwnie zakada, e populacja generalna ma rozkad co najmniej zbliony do normalnego. W odrnieniu od poprzedniego modelu losowana jest w tym przypadku dua prba ( n > 30 ) i na jej podstawie usta-

lana jest warto odchylenia standardowego s (x ) . Zakadany jest poziom


ufnoci . Przedzia ufnoci dla odchylenia standardowego populacji generalnej szacowany jest wedug formuy:

s (x )
s(x )
< (x ) <
t
t
1+ t
1 t
2n
2n
gdzie:

5.8

tt jest wartoci statystyki odczytan z tablic dystrybuanty rozkadu


normalnego dla

Korzystajc z relacji zachodzcej midzy odchyleniem standardowym a


wariancj przedzia ufnoci dla wariancji populacji generalnej uzyskamy
ustalajc kwadraty kocw przedziau oszacowanego dla odchylenia standardowego.
Przykad 5.6.
W badaniach dostpnoci pacjentw do lekarzy - specjalistw na terenie
miasta K zebrano informacje dotyczce czasu ich oczekiwania na wizyt u
lekarza. Otrzymano dane ujte w poniszej tablicy.
Tablica 5.3. Pacjenci wedug czasu oczekiwania ( w dniach) na wizyt u lekarza specjalisty w miecie K.
Czas oczekiwania w dniach
05
5 - 15
15 - 30
Razem

Liczba pacjentw
20
30
25
75

rdo: Dane umowne

Zakadajc poziom ufnoci 0,90 oszacowa metod przedziaow odchylenie standardowe i wariancj czasu oczekiwania pacjentw na wizyt u lekarza specjalisty.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

135

Rozwizanie
Z uwagi na du prb dla oszacowania przedziau ufnoci dla odchylenia standardowego i wariancji wykorzystamy formu 5.8. Na podstawie danych zawartych w tablicy 5.3 obliczamy odchylenie standardowe s (x ) czasu
oczekiwania z prby. Obliczenia pomocnicze zawarto w poniszej tablicy roboczej
Czas oczekiwania Liczba
pax& i ni
x&i x
( x& i x ) 2 ni
w dniach
cjentw
05
20
50
- 9,7
1872,1
5 - 15
30
300
- 2,2
145,2
15 - 30
25
562,5
10,3
2662,55
Razem
75
912,5
X
4679,85
Otrzymujemy

x=

912,5
= 12,2 dnia oraz s ( x ) =
75

4679,85
= 7,9 dnia.
75

Z tablic dystrybuanty rozkadu normalnego odczytujemy warto staty-

0,90
= 0,45 ; jako warto najblisz tej wielkoci przyjmijmy
2
0,4505, co oznacza przyjcie tt = 1,65. Na podstawie wzoru 5.8, w pierwszej

styki

tt dla

kolejnoci oszacujemy przedzia ufnoci dla odchylenia standardowego. Bdzie on wynosi:

1+

7,9
< (x ) <
1,65
2 75

7,9
1,65
2 75

7,9
7,9
< (x ) <
1 + 0,13
1 0,13
7,0 < ( x) < 9,1 dni
Przedzia liczbowy o kocach 7 i 9,1 dni z ufnoci 0,90 pokrywa odchylenie standardowe czasu oczekiwania na wizyt u lekarza specjalisty dla
wszystkich pacjentw.
Przedzia ufnoci dla wariancji czasu oczekiwania otrzymamy ustalajc
kwadraty kocw powyszego przedziau. Otrzymamy:

(7,0)2 < 2 (x ) < (9,1)2


49,0 < 2 ( x ) < 82,8 (dni)2

136

Zygmunt Bobowski

Przedzia liczbowy 49 82,8 (dni)2 z ufnoci 0,90 zawiera wariancj


czasu oczekiwania na wizyt u lekarza specjalisty dla wszystkich pacjentw.
5.3.6. Estymacja przedziaowa wspczynnika korelacji
Badanie wspzalenoci cech statystycznych odbywa si najczciej w
warunkach bada czciowych, co oznacza, i interpretacja uzyskanych
wynikw odnosi si do badanej prby. Zasadne jest w tej sytuacji postawienie pytania: Jakie wobec tego - natenie i kierunek wspzalenoci wystpuj pomidzy badanymi zmiennymi w przypadku populacji generalnej?
Odpowiedzi na to pytanie udzielimy dokonujc oszacowania przedziau ufnoci dla wspczynnika korelacji dla tej populacji.
Zakada si, e rozkad badanych cech (koniecznie liczbowych) w populacji generalnej ma rozkad w przyblieniu normalny, a zwizek midzy nimi
jest prostoliniowy. Z populacji tej losowana jest dua prba (co najmniej
kilkaset elementw), a wyniki dla niej uzyskane ujmowane s w formie tablicy korelacyjnej. Dla tak ujtych wynikw ustalane jest natenie i kierunek zalenoci midzy badanymi cechami za pomoc wspczynnika korelacji liniowej Pearsona. Nastpnie przyjmowane jest zaoenie o wielkoci poziomu ufnoci . Przedzia ufnoci dla wspczynnika korelacji szacowany
jest wedug wzoru:

r tt
P

gdzie:

1 (r P ) 2
n

< < r + tt
P

( )

1 r P

5.9

r P wspczynnik korelacji liniowej Pearsona ustalony dla prby,

(czytaj: ro) wspczynnik korelacji liniowej Pearsona dla popula-

tt

cji generalnej,
- warto statystyki odczytywana z tablic dystrybuanty rozkadu
normalnego dla

Oszacowany przedzia z prawdopodobiestwem rwnym poziomowi ufnoci pokrywa nieznan warto wspczynnika korelacji dla populacji generalnej.
Przykad 5.7.
W pewnym badaniu socjologicznym zebrano m. in. informacje dotyczce
wieku kobiet i mczyzn wstpujcych w zwizek maeski. Dla wylosowanych 200 par maeskich stwierdzono, i pomidzy badanymi cechami wystpuje zaleno mierzona wspczynnikiem korelacji liniowej Pearsona
rwna + 0,75. Przy poziomie ufnoci 0,99 oszacowa metod przedziaow
wspczynnik korelacji dla wieku wszystkich kobiet i mczyzn zawierajcych zwizek maeski.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

137

Rozwizanie
Przedzia ufnoci dla wspczynnika korelacji oszacujemy zgodnie z formu 5.9. Dla przyjtego wspczynnika ufnoci z tablic rozkadu normalnego odczytujemy tt = 2,58.
Podstawiajc odpowiednie dane do wzoru otrzymujemy

0,75 2,58

1 (0,75) 2
200

< < 0,75 + 2,58

1 (0,75)

200

0,75 0,08 < < 0,75 + 0,08


0,67 < < 0,83
Przedzia liczbowy o kocach 0,67 i 0,83 z prawdopodobiestwem 0,99
zawiera wspczynnik korelacji wieku kobiet i mczyzn zawierajcych zwizek maeski.

5.4. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH


5.4.1. Istota procedury hipotez statystycznych
Weryfikacja hipotez statystycznych stanowi drug metod wnioskowania statystycznego. Mianem hipotezy statystycznej okrela si jakiekolwiek
przypuszczenie dotyczce rozkadu populacji generalnej. Dokonujc weryfikacji postawionej hipotezy rozstrzygamy o jej susznoci. Procedura weryfikacji odbywa si przy wykorzystaniu narzdzi statystycznych zwanych testami. Szczeglnie miejsce wrd nich zajmuj testy istotnoci. Procedura
tego typu testw pozwala, na podstawie wynikw uzyskanych z prby losowej, na podjcie jednej z dwch alternatywnych decyzji:
a) o odrzuceniu hipotezy sprawdzanej,
b) o stwierdzeniu braku podstaw do jej odrzucenia.
Praktycznie oznacza to, e upowaniaj one do odrzucenia sprawdzanej
hipotezy, gdy jest ona faszywa, natomiast nie daj podstaw do stwierdzenia, e postawiona hipoteza moe by uznana za prawdziw. Pierwsza z decyzji ma charakter jednoznaczny, naley jednak zauway, i jest ona podejmowana jedynie w oparciu o wyniki uzyskane z prby. Zakada wic
naley moliwo podjcia decyzji bdnej polegajcej na odrzuceniu hipotezy pomimo, e jest ona prawdziwa (bd ten okrelany jest mianem bdu
pierwszego rodzaju). Prawdopodobiestwo popenienia tego bdu okrelane
jest mianem poziomu istotnoci i bdziemy je oznaczali jako 1 . Przyjmuje si, e jest to prawdopodobiestwo nie wiksze od 0,10, a jego wielko
jest ustalana przez prowadzcego badanie.
Algorytm postpowania w procedurze weryfikacji hipotez przy wykorzystaniu testu istotnoci mona uj w nastpujcych punktach:

138

Zygmunt Bobowski

1) stawiamy hipotez zerow i konkurencyjn wobec niej hipotez alternatywn; w zalenoci od postaci hipotezy alternatywnej wykorzystywany jest test dwustronny bd jednostronny (prawo- lub lewostronny); naley tu doda, e w przypadku testu istotnoci hipoteza zerowa jest zawsze formuowana w postaci rwnoci,
2) arbitralnie przyjmujemy poziom istotnoci 1 ,
3) z populacji generalnej losowana jest prba statystyczna i na podstawie wynikw z tej prby ustalana jest warto statystyki empirycznej temp ,
4) dla przyjtego poziomu istotnoci z odpowiednich tablic odczytywana jest warto statystyki teoretycznej tt okrelanej rwnie mianem wartoci krytycznej,
5) porwnujemy wartoci statystyki empirycznej i teoretycznej i w
przypadku:
a) testu dwustronnego;
- jeli

temp tt podejmujemy decyzj o odrzuceniu hipotezy zerowej,

- jeli

temp < tt stwierdzamy brak podstaw do odrzucenia hipotezy

zerowej,
b) testu prawostronnego:
- jeli temp tt podejmujemy decyzj o odrzuceniu hipotezy zerowej,
- jeli

temp < tt stwierdzamy brak podstaw do odrzucenia hipotezy

zerowej,
c) testu lewostronnego:
- jeli temp tt podejmujemy decyzj o odrzuceniu hipotezy zerowej,
- jeli

temp > tt stwierdzamy brak podstaw do odrzucenia hipotezy

zerowej.
Procedura weryfikacji hipotez, a zwaszcza ostatnia z wymienionych
czynnoci moe by rwnie zilustrowana graficznie. Wwczas dla przyjtej
postaci hipotezy alternatywnej konstruowany jest tzw. obszar krytyczny odpowiadajcy poziomowi istotnoci. Ilustruje to poniszy rys.5.2.
W przypadku (a) mamy do czynienia z testem dwustronnym i odpowiadajcym mu pooeniem obszaru krytycznego. Przypadek (b) odpowiada testowi prawostronnemu i takiemu rwnie pooeniu obszaru krytycznego,
za przypadek (c) testowi lewostronnemu i odpowiedniemu pooeniu obszaru krytycznego. Jeli ustalona na podstawie prby warto statystyki empirycznej wpada w obszar krytyczny wwczas podejmowana jest decyzja o
odrzuceniu hipotezy zerowej, w przeciwnym przypadku brak jest podstaw
do jej odrzucenia.
Jakkolwiek podany wyej algorytm postpowania ma charakter oglny,
to jednak wymienione czynnoci s charakterystyczne dla wszystkich niej
omwionych przypadkw weryfikacji hipotez.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

139

Rys. 5.2
Relacje midzy postaci hipotezy alternatywnej
a pooeniem obszaru krytycznego

rdo: Opracowanie wasne

140

Zygmunt Bobowski

5.4.2. Weryfikacja hipotezy dla wartoci redniej


Celem postpowania jest sprawdzenie hipotezy dotyczcej wartoci
redniej w populacji generalnej. Przyjmuje si zaoenie, e populacja ta ma
charakter rozkadu normalnego o nieznanej redniej i odchyleniu standardowym. W zalenoci od wielkoci losowanej z tej populacji prby wyrnia
si dwa modele postpowania.
Model dla maej prby
Kolejne czynnoci wykonujemy zgodnie z podanym wyej algorytmem
postpowania.
1) stawiamy hipotez zerow o postaci:

H 0 : E ( x ) = E0 ( x )

i jedn z niej wymienionych hipotez alternatywnych:


a) H1 : E ( x ) E0 ( x )

H1 : E ( x ) > E0 (x )
c) H1 : E ( x ) < E0 ( x ) ,
gdzie: E ( x ) warto rednia dla populacji generalnej,
E0 ( x) zaoona hipotetyczna warto rednia.
b)

W przypadku uwzgldnienia pierwszej wersji hipotezy alternatywnej postpowanie bdzie si odbywao przy wykorzystaniu testu dwustronnego,
drugiej testu prawostronnego, trzeciej lewostronnego.
2) zakadamy poziom istotnoci 1 ,
3) z populacji generalnej losujemy ma prb o liczebnoci n 30 i na
podstawie uzyskanych z niej wynikw wyznaczamy warto redni
x i odchylenie standardowe s (x ) . Parametry te wykorzystujemy do
wyznaczenia statystyki empirycznej zgodnie z wzorem:

t emp =

x E 0 (x )
n 1
s(x )

5.10

4) z tablic rozkadu t Studenta odczytujemy warto statystyki teoretycznej tt wedug reguy:


- w przypadku testu dwustronnego: dla k = n 1 oraz poziomu
istotnoci 1 ,
- w przypadku testu jednostronnego: dla k = n 1 oraz 2( 1 ).
5) zgodnie z podanymi zasadami podejmujemy decyzj odnonie
sprawdzanej hipotezy.
Przykad 5.8.
Dokonujc analizy przestpczoci nieletnich dla wylosowanej prby
zgromadzono m. in. informacje dotyczce ich wieku. Uzyskano nastpujce

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

141

dane (wiek w latach): 17; 16; 18; 15; 17; 19; 16; 15; 17; 14; 13; 15; 16; 14;
18. Zakadajc, e rozkad wieku nieletnich przestpcw ma charakter rozkadu normalnego przy poziomie istotnoci 0,01 zweryfikowa hipotez, i
redni wiek dla caej ich populacji jest rwny 17 lat.
Rozwizanie
Zgodnie z procedur stawiamy hipotezy o postaci:
H 0 : E ( x ) = 17 lat

H1 : E ( x ) 17 lat

W treci zadania zaoono poziom istotnoci 1 = 0,01. Na podstawie


wynikw z prby ustalamy redni i odchylenie standardowe wieku nieletnich przestpcw:

x=

240
= 16 lat
15

s(x ) =

40
= 1,63 lat
15

Na podstawie ustalonych parametrw wyznaczamy warto statystyki


empirycznej wedug wzoru 5.10:

t emp =

16 17
15 1 = 0,61 3,74 = - 2,28
1,63

Przy zaoonym poziomie istotnoci odczytujemy z tablic rozkadu t


Studenta (tablica 2. w Aneksie) warto statystyki teoretycznej tt dla k = 15
1 = 14 oraz

1 = 0,01, poniewa test ma charakter dwustronny. Wynosi

ona 2,977. Zachodzi zatem relacja

t emp < tt , co oznacza, e nie ma podstaw

do odrzucenia hipotezy zerowej. W tej sytuacji przy poziomie istotnoci 0,01


mona twierdzi, e redni wiek nieletnich przestpcw wynosi 17 lat.
Model dla duej prby.
Czynnoci wstpne oznaczone wyej jako 1 i 2 s identyczne jak w poprzednim modelu. W dalszej kolejnoci z populacji generalnej losowana jest
dua prba o liczebnoci n > 30 i na podstawie uzyskanych danych ustalana jest warto rednia x i odchylenie standardowe
to statystyki empirycznej wedug wzoru:

t emp =

x E0 (x )
n
s(x )

s (x ) , a nastpnie war-

5.11

142

Zygmunt Bobowski

Dla przyjtego poziomu istotnoci z tablic dystrybuanty rozkadu normalnego ustalana jest warto statystyki teoretycznej tt zgodnie z regu:

1
,
2
- w przypadku testu jednostronnego: tt odczytujemy dla 0,5 (1 ) .
- w przypadku testu dwustronnego:

tt odczytywane jest dla 0,5

Decyzja o odrzuceniu hipotezy zerowej bd stwierdzeniu braku podstaw do takiej decyzji podejmowana jest jak w podanym algorytmie.
Przykad 5.9.
Zebrano informacje dla grupy kierowcw, ktrzy w okresie ostatnich 8
lat na terenie miasta K spowodowali wypadek drogowy znajdujc si pod
wpywem alkoholu. Uzyskano nastpujce zestawienie:
Poziom alkoholu we krwi
(w promilach)
0,40 1,0
1,0 1,6
1,6 2,2
2,2 2,8

Liczba kierowcw
15
120
180
85

Zakadajc, e badana populacja ma charakter rozkadu normalnego


przy poziomie istotnoci 0,05 zweryfikowa hipotez, e rednie stenie alkoholu we krwi w caej populacji nietrzewych kierowcw, ktrzy spowodowali wypadek drogowy, jest wiksze od 2,3 promila.
Rozwizanie
Stawiane hipotezy bd miay posta:

H 0 : E ( x ) = 2,3
H1 : E ( x ) > 2,3

Zaoony poziom istotnoci wynosi 0,05. Dla wyznaczenia wartoci statystyki empirycznej na podstawie uzyskanych danych ustalamy redni x i

odchylenie standardowe s (x ) stenia alkoholu we krwi kierowcw. Obliczenia pomocnicze zawarto w tablicy roboczej.
Poziom alkoholu we
krwi (w promilach)
0,40 1,0
1,0 1,6
1,6 2,2
2,2 2,8
Razem

Liczba
kierowcw
15
120
180
85
400

x& i ni

(x& i x )2 ni

10,5
156,0
342,0
212,5
721

18,15
30,0
1,8
41,65
91,6

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

143

Otrzymujemy:

x=

s(x ) =

721
= 1,80 promila
400

91,6
= 0,48 promila
400

Statystyk empiryczn obliczamy wedug wzoru 5.11:

t emp =

1,80 2,30
400 = 20,83
0,48

Z tablic rozkadu normalnego odczytujemy warto statystyki teoretycznej tt dla 0,5 0,05 = 0,45 (test ma charakter prawostronny). Wynosi ona
1,65. Zachodzi relacja:

temp < tt , a wic nie ma podstaw do odrzucenia hipotezy zerowej, e rednie stenie alkoholu we krwi nietrzewych kierowcw,
ktrzy spowodowali wypadek jest rwne 2,3 promila.
5.4.3. Weryfikacja hipotezy dla dwch rednich
Test dla dwch rednich dotyczy weryfikacji hipotezy o rwnoci rednich w dwch populacjach o rozkadzie normalnym. W zalenoci od wielkoci wylosowanych z tych populacji prb wyrnia si dwa modele postpowania.
Model oparty na wynikach z dwch maych prb.
Zakada si, e rozkady obu populacji s normalne o nieznanych wartociach rednich i nieznanych, ale jednakowych odchyleniach standardowych. Procedura weryfikacji odbywa si wedug nastpujcego schematu:
1) stawiana jest hipoteza zerowa o postaci H 0 : E1 ( x ) = E2 ( x )
i jedna z niej podanych postaci hipotezy alternatywnej:
a) H1 : E1 ( x ) E2 ( x )

H1 : E1 ( x ) > E2 ( x )
c) H1 : E1 ( x ) < E2 (x )
gdzie: E1 ( x ) i E2 ( x ) s hipotetycznymi wartociami rednimi dla pierwb)

szej i drugiej populacji.


2) zakadany jest poziom istotnoci 1 ,
3) z obu populacji generalnych losujemy dwie mae prby o liczebnociach n1 i n2 ; na ich podstawie wyznaczamy wartoci rednie x1 i

144

Zygmunt Bobowski

x2 oraz wariancje s1 ( x ) i s2 (x ) , a w dalszej kolejnoci warto sta2

tystyki empirycznej wedug wzoru

temp =

x1 x2
2
n s ( x ) + n2 s2 ( x ) 1 1
+
n1 + n2 2
n1 n 2
2
1 1

5.12

Dla przyjtego poziomu istotnoci z tablic rozkadu t Studenta odczytujemy warto statystyki teoretycznej wedug zasady:
a) dla testu dwustronnego: dla k = n1 + n2 2 oraz poziomu istotnoci

1 ,

b) dla testu jednostronnego: dla k = n1 + n2 2 oraz 2( 1 ).


Decyzj dotyczc sprawdzanej hipotezy podejmujemy zgodnie z podanymi wskazwkami oglnymi.
Przykad 5.10.
W badaniach absencji pracowniczej w pewnym przedsibiorstwie w miesicu lipcu zebrano informacje dla dwch wylosowanych grup pracownikw. Dla grupy 10 kobiet uzyskano nastpujc liczb dni nieobecnoci w
pracy: 0; 2; 3; 5; 7; 6; 8; 3; 5;1, natomiast dla prby 12 mczyzn odpowiednio: 0; 1; 2; 3; 2; 4; 3; 4; 7; 5; 6; 0. Na poziomie istotnoci 0,05 zweryfikowa hipotez, e rednia dni nieobecnoci w pracy kobiet jest wysza ni
mczyzn.
Rozwizanie
Zgodnie z podanym schematem postpowania na wstpie stawiamy hipotezy o postaci

H 0 : E1 ( x) = E2 ( x)
H1 : E1 ( x) > E2 ( x)
gdzie: subskryptem 1 oznaczono populacj kobiet, natomiast 2 populacj
mczyzn.
Zakadamy poziom istotnoci 1 = 0,05
Warto statystyki empirycznej wyznaczamy wedug wzoru 5.12, co
wymaga wyznaczenia rednich i wariancji absencji dla obu prb:

- dla kobiet:

- dla mczyzn:

x1 =

40
62
2
= 4 dni i s1 ( x ) =
= 6,2 (dni)2
10
10

x2 =

54,92
37
2
= 4,58 (dni)2
= 3,1 dni i s 2 ( x ) =
12
12

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

145

Podstawiajc uzyskane wielkoci do wzoru 5.12 uzyskujemy warto


statystyki empirycznej:

4,0 3,1

t emp =

10 6,2 + 12 4,58 1
1
+
10 + 12 2 10 12

0,9
116,92
0,18
20

0,9
= 0,87
1,03

Z tablic rozkadu t Studenta odczytujemy warto statystyki

tt dla

k = 10 + 12 2 = 20 oraz 2*0,05 = 0,10 (z uwagi na fakt, e wykorzystujett = 1,725.

my test jednostronny) i otrzymujemy

temp < tt wobec tego przy poziomie istotnoci

Poniewa zachodzi relacja

0,05 nie ma podstaw do odrzucenia hipotezy zerowej, e rednia absencja


kobiet jest identyczna jak absencja mczyzn.
Model oparty na wynikach z dwch duych prb
Przyjmuje si, podobnie jak w poprzednim modelu, e obie populacje
generalne posiadaj rozkad normalny o nieznanych wariancjach. Po postawieniu hipotezy zerowej i alternatywnej i zaoeniu okrelonego poziomu
istotnoci 1 z obu populacji generalnych losowane s dwie due prby o
liczebnociach

n1 i n2 > 30 . Na podstawie danych dla obu prb ustalamy

rednie arytmetyczne x1 i x2 oraz wariancje s1 ( x ) i s2 (x ) . Parametry te


wykorzystujemy do wyznaczenia statystyki empirycznej wedug wzoru
2

temp =

x1 x2
s1 ( x ) s2 ( x )
+
n1
n2
2

Warto statystyki teoretycznej

5.13

tt odczytujemy z tablic dystrybuanty

rozkadu normalnego:

1
,
2
b) w przypadku testu jednostronnego - dla 0,5 (1 ) .
a)

w przypadku testu dwustronnego - dla

0,5

Kocowa czynno polegajca na podjciu odpowiedniej decyzji odnonie hipotezy zerowej jest podejmowana zgodnie z wczeniej podanymi zasadami.
Przykad 5.11.
W badaniach efektywnoci szkolenia zawodowego pracownikw bezporednio produkcyjnych w pewnym przedsibiorstwie dla losowo wybranej
prby 60 pracownikw dokonano pomiaru ich wydajnoci pracy

146

Zygmunt Bobowski

(w szt./zmian) przed i po przejciu szkolenia. Uzyskano dane ujte w tablicy 5.4.


Tablica 5.4. Pracownicy przedsibiorstwa Z wedug wydajnoci
pracy
Wydajno pracy w
szt./zmian
10 14
14 - 18
18 - 22
22 - 26

Liczba pracownikw
przed szkoleniem
po szkoleniu
28
5
18
20
12
25
2
10

rdo: Dane umowne

Zakadajc, e w caej populacji pracownikw wydajno pracy ma rozkad zbliony do normalnego przy poziomie istotnoci 0,01 zweryfikowa
hipotez, i szkolenie zawodowe istotnie zwiksza wydajno pracy pracownikw.
Rozwizanie
Stawiane hipotezy bd miay posta:

H 0 : E1 ( x) = E2 ( x)
H1 : E1 ( x) < E2 ( x) ; (subskryptem 1 oznaczono populacj przed odbyciem szkolenia, natomiast 2- po jego odbyciu)
Przyjty poziom istotnoci 1 wynosi 0,01. Wyznaczenie statystyki
empirycznej wymaga obliczenia dla obu sytuacji (przed i po odbyciu szkolenia) redniej i wariancji wydajnoci pracy. Dokonamy tego w poniszej tablicy roboczej
Wydajno
(xi )
10 - 14
14 - 18
18 - 22
22 26
Razem

Liczba pracownikw
n2i
n1i
28
5
18
20
12
25
2
10
60
60

x& i n1i

x& i n2 i

336
288
240
48
912

60
320
500
240
1120

(x& i x1 )2 n1i (x& i x 2 )2 n2i


286,72
11,52
276,48
163,68
738,4

224,45
145,8
42,25
280,9
693,4

Otrzymujemy:

912
738,4
2
= 15,2 szt., s1 ( x ) =
= 12,3 (szt.)2
60
60
1120
693,4
2
- po odbyciu szkolenia: x2 =
= 18,7 szt. i s2 ( x ) =
= 11,6 (szt.)2
60
60
- przed odbyciem szkolenia: x1

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

147

Warto statystyki empirycznej ustalimy wedug wzoru 5.13:

temp =

3,5
15,2 18,7
=
= 5,56
12,3 11,6
0,398
+
60
60

Warto statystyki teoretycznej

tt zostanie odczytana z tablic rozkadu

normalnego dla 0,5 0,01 = 0,49 (test ma charakter jednostronny) i wynosi


ona 2,33.
Zachodzi relacja: temp < tt , co oznacza, e hipotez zerow naley odrzuci, czyli przy poziomie istotnoci 0,01 mona twierdzi, e szkolenie zawodowe istotnie wpywa na wzrost wydajnoci pracy
5.4.4. Weryfikacja hipotezy dla wskanika struktury
Ten typ hipotezy odnosi si najczciej do przypadkw badania populacji generalnej ze wzgldu na cech opisow (por. rwnie estymacja przedziaowa wskanika struktury). Wnioskowanie dotyczy wwczas gwnie jej
struktury. Zakada si, e populacja ta ma rozkad dwupunktowy o parametrach p i q, gdzie p jest wskanikiem struktury dla wyrnionych elementw populacji. Stawiana jest hipoteza zerowa o postaci: H 0 : p = p0 ,
ktra oznacza, e wskanik struktury w populacji przyjmie pewn hipotetyczn warto p0 . Wobec niej stawiana moe by jedna z trzech postaci
hipotezy alternatywnej:
a) H 1: p p0

H 1: p > p0
c) H 1: p < p0 .

b)

Zakadany jest poziom istotnoci 1 . Z populacji losowana jest dua


prba o liczebnoci przekraczajcej 100 elementw. Na podstawie wynikw
z prby obliczana jest warto statystyki empirycznej wedug wzoru:

t emp

gdzie:

m
p0
n
=
p 0 q0
n

5.14

n liczebno prby,
m liczba wyrnionych elementw w prbie,
p 0 hipotetyczny wskanik struktury dla wyrnionych elementw,
q0 = 1 p0

148

Zygmunt Bobowski

Statystyk teoretyczn odczytujemy z tablic dystrybuanty rozkadu normalnego:

1
,
2
b) w przypadku testu jednostronnego - dla 0,5 (1 ) .

a) w przypadku testu dwustronnego - dla

0,5

Decyzj dotyczc postawionej hipotezy podejmujemy zgodnie z oglnymi zasadami.


Przykad 5.12.
Wrd mieszkacw pewnego miasta przeprowadzono badanie ankietowe dotyczce ulubionego sposobu spdzania wolnego czasu. Uzyskano dane
zawarte w poniszym zestawieniu:
Sposb spdzania wolnego czasu
Ogldanie telewizji, suchanie radia
Czytanie prasy, ksiek
Czynny wypoczynek (zajcia sportowe)
Sen

Liczba odpowiedzi
120
60
55
5

Przy poziomie istotnoci 0,10 zweryfikowa hipotez, e odsetek osb


czynnie spdzajcych wolny czas wynosi 0,30.
Rozwizanie
Stawiamy hipotezy o postaci:

H 0 : p = 0,30
H1 : p 0,30
Przyjty poziom istotnoci wynosi 0,10.
Ustalamy wskanik struktury dla czynnie wypoczywajcych w prbie:

m
55
=
= 0,229 . Wielko t podstawiamy do wzoru 5.14 i otrzymujemy
n 240
t emp =

0,229 0,30

Statystyk teoretyczn

0,30 0,70
240

0,071
= 2,37
0,030

tt odczytujemy z tablic rozkadu normalnego dla

0,1
= 0,45 (test ma charakter dwustronny) i wynosi ona 1,65. Zacho2
dzi relacja temp > tt , co oznacza, e hipotez zerow naley odrzuci, czyli
0,5

odsetek osb czynnie wypoczywajcych jest rny od 0,30 (tj. 30 %).

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

149

5.4.5. Weryfikacja hipotezy dla wspczynnika korelacji


Omawiany test suy weryfikacji hipotezy, e midzy dwiema cechami
populacji generalnej wystpuje niezaleno w sensie parametrycznym.
Przyjmuje si zaoenie, e rozkad badanych cech jest przynajmniej zbliony do normalnego. Stawiana jest hipoteza zerowa o postaci: H 0 : = 0 , zakadajca, e pomidzy badanymi zmiennymi w populacje generalnej wystpuje niezaleno w sensie parametrycznym wobec jednej z poniszych
wersji hipotezy alternatywnej:
a) H1 : 0 (wystpuje zaleno w sensie parametrycznym),

H1 : > 0 (wystpuje zaleno o kierunku dodatnim),


c) H1 : < 0 (wystpuje zaleno o kierunku ujemnym).

b)

Kolejna czynno dotyczy zaoenia okrelonego poziomu istotnoci


1 . Nastpnie z populacji generalnej losowana jest maa prba. Na podstawie uzyskanych dla niej wynikw przy pomocy wspczynnika korelacji
P

liniowej Pearsona r (w wersji dla szeregw szczegowych) ustalana jest


sia i kierunek zalenoci midzy badanymi cechami. Uzyskan warto
wspczynnika wykorzystujemy dla wyznaczenia statystyki empirycznej wedug wzoru:

t emp =

rP

( )

1 rP

n2

5.15

Graniczn warto statystyki teoretycznej odczytujemy z tablic rozkadu t Studenta:


a) w przypadku testu dwustronnego: dla k = n 2 oraz poziomu istotnoci 1 ,
b) w przypadku testu jednostronnego: dla k = n 2 oraz 2 (1 ) .
Decyzj dotyczc prawdziwoci hipotezy zerowej podejmujemy zgodnie
z oglnymi zasadami.
Naley podkreli, e podana procedura moe by wykorzystana jedynie
w warunkach stosowalnoci wspczynnika korelacji liniowej Pearsona, tzn.
obie cechy musz mie charakter liczbowy, a zwizek midzy nimi prostoliniowy. W pozostaych przypadkach naley stosowa prezentowany dalej test
niezalenoci.
Przykad 5.13.
Dla losowej prby 20 maestw zebrano informacje dotyczce wieku
wspmaonkw w momencie zawierania przez nich zwizku maeskiego
i przy pomocy wspczynnika korelacji liniowej Pearsona zbadano zaleno
ich wieku. Uzyskano r = 0,80 . Zweryfikowa hipotez, e istnieje istotna
dodatnia zaleno midzy wiekiem kobiet i mczyzn wstpujcych w zwizek maeski. Przyj poziom istotnoci 0,01
P

150

Zygmunt Bobowski

Rozwizanie
Stawiamy hipotezy o postaci:
H 0 : = 0 , tzn. midzy badanymi cechami wystpuje niezaleno,

H 0 : > 0 ,czyli midzy badanymi cechami wystpuje zaleno dodatnia.


Zaoono poziom istotnoci 1 = 0,01. Warto statystyki empirycznej
ustalamy wedug wzoru 5.15:

t emp =

0,80
2
1 (0,80 )

20 2 = 5,65

Statystyk teoretyczn odczytujemy z tablic rozkadu t Studenta dla


k = 20 2 = 18 oraz 2 0,01 = 0,02 ; otrzymujemy tt = 2,552 . Zachodzi relacja:

temp > tt , co oznacza, e przy poziomie istotnoci 0,01 mona twierdzi,

i wystpuje istotna dodatnia zaleno midzy wiekiem osb zawierajcych


zwizek maeski.
5.4.6. Test niezalenoci

2 (chi-kwadrat)

Test ten suy weryfikacji hipotezy, e dwie zmienne opisujce populacj


generaln s niezalene. Stawiana hipoteza zerowa ma posta:
H 0 : f ij = f i f j i zakada niezaleno badanych zmiennych. Zauwamy, i
zosta w niej wykorzystany warunek niezalenoci cech w sensie nieparametrycznym. Alternatywna wobec niej hipoteza zakada wystpowanie zalenoci i ma posta: H 1 : f ij f i f j . Z populacji generalnej losowana jest
dua prba, a wyniki dla niej uzyskane ujmowane s w postaci tablicy korelacyjnej o l wierszach i s kolumnach. Liczebno prby (przy uwzgldnieniu liczby wariantw obu cech) winna by na tle dua, by kade nij byo nie
mniejsze od 8. Zakada si poziom istotnoci 1 . Na podstawie tablicy
korelacyjnej wyznaczana jest warto statystyki empirycznej wedug wzoru:

t emp =
i, j

(n

N fi f j )

ij

N fi f j

Warto statystyki teoretycznej

dla

cja

temp

5.16

tt odczytywana jest z tablic rozkadu

k = (l 1) (s 1) oraz poziomu istotnoci 1 . Gdy zachodzi rela tt odrzucamy hipotez zerow o niezalenoci cech w populacji ge-

neralnej; w przeciwnym przypadku wystpuje brak podstaw do jej odrzucenia.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

151

Przykad 5.14.
Dla losowej prby bezrobotnych zarejestrowanych w Powiatowym Urzdzie Pracy w K zebrano informacje dotyczce ich poziomu wyksztacenia
(X) oraz czasu pozostawania bez pracy (Y). Wyniki badania ujto w poniszej tablicy korelacyjnej.
Tablica 5.4. Bezrobotni zarejestrowani w Powiatowym Urzdzie
Pracy w K wedug poziomu wyksztacenia i czasu pozostawania bez pracy.
Czas pozostawania bez
pracy w miesicach
do 6
6 - 12
12 - 24

Poziom wyksztacenia
podstawowe

rednie

wysze

ni

15
25
30

15
25
15

15
10
10

45
60
55

70

55

35

160

nj
rdo: Dane umowne

Na poziomie istotnoci 0,05 zweryfikowa hipotez o niezalenoci czasu


pozostawania bez pracy od poziomu wyksztacenia bezrobotnych.
Rozwizanie
Stawiamy hipotez zerow o niezalenoci czasu pozostawania bez pracy od poziomu wyksztacenia bezrobotnych o postaci H 0 : f ij = f i f j i hipotez wobec niej alternatywn

H 1 : f ij f i f j zakadajc, e taka zale-

no wystpuje.
Statystyk empiryczn obliczamy w poniszej tablicy roboczej zgodnie z
wzorem 5.16 wykonujc nastpujce dziaania (ich kolejno ponumerowano w pierwszym wierszu poniszej tablicy roboczej):
1) przeksztacenie rozkadw brzegowych liczebnoci w rozkady czstoci,
2) ustalenie iloczynw czstoci brzegowych f i f j dla kadego pola
tablicy korelacyjnej,
3) okrelenie dla kadego pola tablicy liczebnoci hipotetycznych poprzez wyznaczenie iloczynw N f i f j ,
4) ustalenie dla kadego pola tablicy wielkoci rnic liczebnoci empirycznych i hipotetycznych , a nastpnie kwadratw tych rnic
zgodnie z formu

(n

N fi f j ) ,
2

ij

5) okrelenie dla kadego pola tablicy ilorazu


stpnie ich sumy.

(n

N fi f j )

ij

N fi f j

, a na-

152

Zygmunt Bobowski

Czas pozostawania bez pracy


w miesicach

do 6

6 - 12

12 - 24

fj

Poziom wyksztacenia
podstawowe

rednie

wysze

15
2) 0,123
3) 19,7
4) 22,09
5) 1,12
25
0,164
26,2
1,44
0,05
30
0,151
24,2
33,64
1,39

15
0,097
15,5
0,25
0,02
25
0,129
20,6
19,36
0,94
15
0,118
18,9
15,2
0,80

15
0,061
9,8
27,04
2,76
10
0,082
13,1
9,61
0,73
10
0,075
12
4
0,33

0,438

0,344

0,218

fi

1) 0,281

0,375

0,344

1,00

Na podstawie wykonanych oblicze otrzymujemy zgodnie z wzorem 5.16

t emp = 1,12 + 0,02 + 2,76 + 0,05 + 0,94 + 0,73 + 1,39 + 0,80 + 0,33 = 8,14.
k = (3 1) (3 1) = 4 oraz 1- = 0,05 z tablic rozkadu 2 odczytujemy warto statystyki tt = 9,488. Poniewa zachodzi relacja t emp < t t

Dla

stwierdzamy brak podstaw do odrzucenia hipotezy zerowej, co oznacza, e


przy poziomie istotnoci 0,05 mona twierdzi, i wystpuje niezaleno
czasu pozostawania bez pracy od poziomu wyksztacenia bezrobotnych.
5.4.7. Test zgodnoci

(chi-kwadrat)

Moe by on wykorzystywany do weryfikacji hipotez dwojakiego rodzaju:


a) populacja posiada okrelony typ rozkadu,
b) dwie wylosowane prby pochodz z populacji o takim samym rozkadzie.
Rozwaania ograniczymy do pierwszego przypadku. Stawiana jest w tym
przypadku hipoteza zerowa, e dystrybuanta empiryczna F ( x ) , ustalana
na podstawie wynikw z wylosowanej duej prby, jest zgodna z dystrybuant teoretyczn F0 ( x ) okrelonego typu rozkadu; mona to wyrazi zapi-

H 0 : F ( x ) = F0 ( x ) . Wobec tak sformuowanej hipotezy stawiana jest


hipoteza alternatywna: H1 : F (x ) F0 ( x ) . Zgromadzony na podstawie wylo-

sem:

sowanej prby materia statystyczny ujmowany jest w postaci szeregu rozdzielczego punktowego bd przedziaowego. Liczebno prby, przy

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

153

uwzgldnieniu liczby klas, winna by tak dobrana, by liczebno kadej z


klas bya nie mniejsza ni 5. Nastpnie zakada si poziom istotnoci 1 .
Warto statystyki empirycznej ustalana jest wedug wzoru:

t emp =
i

gdzie:

(ni N pi )2

5.17

N pi

ni - oznacza liczebno i-tej klasy,


pi - prawdopodobiestwo teoretyczne, e badana zmienna przyjmie

wartoci nalece do i-tej klasy; prawdopodobiestwa te mog by


odczytywane z tablic odpowiedniego rozkadu teoretycznego.
Analizujc powyszy wzr naley zauway, i ma w tym przypadku miejsce porwnywanie szeregu liczebnoci empirycznych z oszacowanymi liczebnociami hipotetycznymi (teoretycznymi). Statystyk teoretyczn t t
odczytujemy z tablic rozkadu

dla

k = r 1 lub k = r l 1 (gdzie: r

liczba klas w szeregu rozdzielczym, l liczba szacowanych z prby parametrw) i poziomu istotnoci 1 . Kocow decyzj podejmujemy zgodnie
z oglnymi zasadami.
Przykad 5.15.
W badaniach warunkw ycia mieszkacw pewnego miasta zebrano m.
in. informacje o wysokoci dochodw przypadajcych na 1 czonka gospodarstwa domowego. Dla losowej prby 200 gospodarstw uzyskano nastpujce wyniki bada:
Dochd na 1 osob w z
150 350
350 550
550 750
750 - 950
950 - 1150
1150 - 1350

Liczba gospodarstw
5
25
80
70
15
5

Na poziomie istotnoci 0,01 zweryfikowa hipotez, e rozkad dochodw w gospodarstwach domowych ma charakter rozkadu normalnego.
Rozwizanie
Stawiana jest hipoteza zerowa o postaci

H 0 : F ( x ) = F0 ( x ) zakadajca,

e rozkad dochodw ma charakter rozkadu normalnego i przeciwstawna


niej hipoteza alternatywna H1 : F (x ) F0 ( x ) . Z uwagi na du prb, warto redni i odchylenie standardowe dochodw ustalone z prby, moemy
przyj jako parametry rozkadu normalnego. Otrzymujemy:

154

Zygmunt Bobowski

E ( x) = x =

146000
= 730 z
200

6599000
= 181,6 z
200

(x ) = s(x ) =

W wyniku tych ustale hipotetyczny rozkad normalny posiadaby parametry: N(730 z; 181,6 z). Dalsze obliczenia pomocnicze dla wyznaczenia
statystyki empirycznej zgodnie z wzorem 5.17 zostan wykonane w poniszej tablicy roboczej, w ktrej:
- w kolumnie 1. poszczeglne przedziay klasowe zastpiono ich grnymi kracami,
- w kolumnie 2. podano liczebnoci empiryczne poszczeglnych klas,
- w kolumnie 3. dokonano standaryzacji grnych kocw przedziaw
klasowych wedug formuy: t i

xi E ( x)
,
( x)

- w kolumnie 4. umieszczono wartoci dystrybuanty teoretycznej rozkadu normalnego dla poszczeglnych ti odczytane z tablic rozkadu
normalnego,
- w kolumnie 5. na podstawie odczytanych wartoci dystrybuanty ustalono prawdopodobiestwa teoretyczne uzyskania dochodw mieszczcych si w poszczeglnych przedziaach klasowych,
- w kolumnie 6. ustalono teoretyczne liczebnoci dla poszczeglnych
klas,
- w kolumnie 7. dokonano obliczenia statystyki empirycznej.
Dochd
na
1 osob
w z ( xi )

Liczba
gospodarstw
( ni )

ti

F0i ( x) = F (ti )

pi

N pi

(ni N pi )2
N pi

350
550
750
950
1150
1350
Razem

5
25
80
70
15
5
200

- 2,09
- 0,99
0,11
1,21
2,31
3,41
X

0,0183
0,1611
0,5438
0,8869
0,9896
~ 1,00
X

0,0183
0,1428
0,3827
0,3431
0,1027
0,0104
1,0000

3,7
28,6
76,5
68,6
20,5
2,1
X

1,76
0,45
0,16
0,03
1,48
4,00
7,88

Warto statystyki empirycznej temp wynosi 7,88. Statystyk teoretyczn

tt odczytujemy z tablic rozkadu 2 dla k = 6 2 1 = 3 i poziomu istotnoci 1 = 0,01. Otrzymujemy tt = 11,345. Zachodzi relacja: temp < tt ,
wobec czego przy poziomie istotnoci 0,01nie ma podstaw do odrzucenia

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

155

hipotezy, e rozkad dochodw na jedn osob w gospodarstwach domowych ma charakter rozkadu normalnego
5.4.8. Test zgodnoci Komogorowa
Ma on podobny charakter do wyej omawianego testu. Zadaniem testu
Komogorowa jest weryfikacja hipotezy o zgodnoci rozkadu okrelonej populacji z rozkadem normalnym. Badanie zgodnoci odbywa si poprzez porwnywanie wartoci dystrybuanty empirycznej i dystrybuanty hipotetycznej rozkadu normalnego. Test ten ma zastosowanie do zmiennych typu
cigego, dla innego typu zmiennych naley wykorzysta podany wyej test
zgodnoci 2 .

Stawiana na wstpie hipoteza zerowa ma posta H 0 : F ( x ) = F0 ( x ) ,


gdzie dystrybuanta empiryczna F(x) ustalana na podstawie wynikw z wylosowanej duej prby, za F0 ( x ) jest dystrybuant teoretyczn rozkadu
normalnego. Zakada ona, e rozkad badanej zmiennej w populacji generalnej jest zgodny z rozkadem normalnym. Wobec tak sformuowanej hipotezy stawiana jest hipoteza alternatywna o postaci H 1 : F ( x ) F0 ( x ) o bra-

ku takiej zgodnoci. Z populacji generalnej losowana jest dua prba, a jej


wyniki ujmowane s w szeregu rozdzielczym przedziaowym. Zalecane jest
tworzenie duej liczby klas, gdy daje to moliwo badania zgodnoci w
wielu punktach. Dla utworzonego szeregu wyznaczamy wartoci dystrybuanty empirycznej F ( x ) . Tworzy je szereg czstoci skumulowanej. Dua
prba pozwala na przyjcie jej redniej

(x )

[s(x )] jako parametrw rozkadu normalnego

i odchylenia standardowego

E ( x) i ( x ) . Z tablic dystry-

buanty rozkadu normalnego dla grnych kracw poszczeglnych przedziaw klasowych odczytujemy wartoci dystrybuanty hipotetycznej F0 ( x ) .
W dalszej kolejnoci porwnujemy parami wartoci obu dystrybuant i maksymalna rnica midzy nimi stanowi podstaw do ustalenia statystyki empirycznej zgodnie z wzorem:

t emp = D n

5.18

gdzie: D = max Fi (x ) F0 i ( x ) oznacza maksymaln rnic odpowiadajcych sobie wartoci dystrybuant empirycznej i teoretycznej,
n liczebno wylosowanej prby.
Warto statystyki teoretycznej

tt - przy zaoeniu poziomu istotnoci

1 - odczytujemy z tablic granicznego rozkadu Komogorowa dla . Jeli zachodzi relacja: temp tt hipotez zerow naley odrzuci, w przeciwnym
przypadku brak jest podstaw do jej odrzucenia, co oznacza wystpowanie
zgodnoci rozkadu badanej zmiennej w populacji generalnej z rozkadem

156

Zygmunt Bobowski

normalnym. Naley rwnie doda, e istnieje odmiana tego testu pozwalajca na weryfikacj hipotezy o zgodnoci rozkadw dwch populacji okrelana mianem testu zgodnoci Komogorowa Smirnowa.
Przykad 5.16.
Na podstawie danych z przykadu 5.15 - przy poziomie istotnoci 0,05 zweryfikowa hipotez, e rozkad dochodw w caej populacji gospodarstw
domowych jest normalny.
Rozwizanie
Stawiane hipotezy maj posta identyczn jak w przykadzie 5.15, tj.
H 0 : F ( x ) = F0 ( x ) i H1 : F (x ) F0 ( x ) . Z uwagi na du prb podobnie
jak poprzednio - redni i odchylenie standardowe z prby moemy przyj
jako parametry rozkadu normalnego. Wobec tego hipotetyczny rozkad
normalny posiada bdzie parametry: N(730 z; 181,6 z). Dalsze obliczenia
pomocnicze dla wyznaczenia statystyki empirycznej zgodnie z wzorem 5.18
zostay wykonane w poniszej tablicy roboczej, w ktrej:
- w kolumnie 1.poszczeglne przedziay klasowe zastpiono ich grnymi
kracami,
- w kolumnie 2. podano liczebnoci empiryczne poszczeglnych klas,
- w kolumnie 3. dokonano standaryzacji grnych kocw przedziaw
klasowych wedug formuy: t i =

xi E ( x)
,
( x)

- w kolumnie 4. umieszczono wartoci dystrybuanty teoretycznej rozkadu normalnego dla poszczeglnych ti odczytane z tablic dystrybuanty rozkadu normalnego,
- w kolumnie 5. umieszczono wartoci dystrybuanty empirycznej odpowiadajce czstociom skumulowanym,
- w kolumnie 6. ustalono bezwzgldne odchylenia wartoci dystrybuant
empirycznej i teoretycznej.
Dochd
na
1 osob
w z ( xi )

Liczba
gospodarstw
( ni )

ti

F0i ( x) = F (ti )

Fi ( x ) = cumf i

F0i Fi ( x)

350
550
750
950
1150
1350
Razem

5
25
80
70
15
5
200

- 2,09
- 0,99
0,11
1,21
2,31
3,41
X

0,0183
0,1611
0,5438
0,8869
0,9896
~ 1,00
X

0,025
0,15
0,55
0,90
0,975
1,00
X

0,0067
0,0111
0,0062
0,0131
0,0146
0
X

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

157

Na podstawie oblicze wykonanych w ostatniej kolumnie otrzymujemy


D = max F0 i Fi ( x ) = 0,0146. Podstawiajc t warto do wzoru 5.18 uzyskujemy: t emp = 0 , 0146 200 = 0 , 206 . Statystyk teoretyczn odczytujemy
z tablic granicznego rozkadu Komogorowa (tablica 4 w Aneksie) dla
1 0 , 05 = 0 , 95 . Wynosi ona 1,36. Zachodzi relacja temp < tt , a wic przy poziomie istotnoci 0,05 mona przyj, e rozkad dochodw w badanej populacji jest normalny.
5.4.9. Test serii
Ten rodzaj testu posiada szerokie zastosowanie w procedurach weryfikacji hipotez statystycznych. Moe by stosowany do weryfikacji hipotez:
a) o losowoci prby,
b) o liniowej postaci funkcji regresji,
c) e dwie populacje posiadaj ten sam typ rozkadu.
Dalsze rozwaania ograniczymy do pierwszego przypadku, poniewa warunek losowoci prby jest podstaw metod wnioskowania statystycznego.
Seri okrela si kady podcig kolejnych wyrazw cigu n- elementowego,
ktry ma identyczne wartoci oraz ktry poprzedza, ewentualnie za ktrym
wystpuje inna warto ni w okrelonym podcigu. Jako szczeglny przypadek serii mona przyj cig elementw pobieranych do prby. Test ten
jest szczeglnie zalecany, gdy elementy te s pobierane w pewnych momentach czasowych, a w miar upywu czasu istnieje moliwo zmiany rozkadu populacji bd zmiany prawdopodobiestwa wylosowania kolejnych
elementw.
Populacja generalna moe mie dowolny rozkad. Pobierana jest z niej
prba liczca n elementw. Dla uzyskanych wynikw z prby ujtych w szeregu szczegowym wyznaczamy warto mediany wedug zasad poznanych
w rozdziale II. Nastpnie w szeregu pierwotnym (nieuporzdkowanym) kademu wynikowi xi speniajcemu warunek xi < Me( x ) przypisujemy symbol a, natomiast gdy

xi > Me( x ) - symbol b. W ten sposb pierwotny

cig wyrazw x1 , x2 ,...., xn zostaje zastpiony cigiem symboli a i b. W


cigu tym ustalamy liczb serii (podcigw skadajcych si z jednakowych
symboli) oznaczan dalej jako k. Liczb t naley traktowa jako statystyk
empiryczn. Statystyk teoretyczn (hipotetyczn liczb serii) wyznaczamy z
tablic rozkadu serii okrelajc dwie wielkoci k1 i k 2 w nastpujcy sposb:

1
,
2
1
- k 2 dla n1 i n2 oraz 1
,
2
gdzie: n1 i n2 odpowiadaj liczbie wystpujcych w cigu symboli a i b.
-

k1 dla n1 i n2 oraz

158

Zygmunt Bobowski

Jeli speniona jest relacja, e:

k1 < k < k2

5.20

wwczas nie ma podstaw do odrzucenia hipotezy o losowoci prby.


W przeciwnym przypadku hipotez tak naley odrzuci.
Przykad 5.17.
W badaniach wynikw studiowania osiganych przez studentw pewnej
uczelni z ich populacji wylosowano prb 25 studentw, dla ktrej ustalono
nastpujce rednie z caego toku studiw: 3,11; 4,05; 3,75; 3,33; 4,25;
3,15; 3,96; 4,02; 2,99; 3,28; 3,65; 4,12; 3,48; 3,73; 3,26; 2,87; 4,54; 3,24;
4,15; 3,66; 3,74; 4,28; 3,90; 3,45; 4,67. Na poziomie istotnoci 0,10 zweryfikowa hipotez, e dobr prby by losowy.
Rozwizanie
Dla uzyskanych wynikw ustalamy warto mediany Me( x ) zgodnie z
zasadami obowizujcymi dla szeregw szczegowych. W analizowanym
przypadku median jest trzynasta w kolejnoci ( po uprzednim uporzdkowaniu) rednia i wynosi ona 3,73. Uzyskane wyniki zastpujemy symbolami: gdy xi < Me( x ) przypisujemy symbol a, natomiast gdy xi > Me( x ) symbol b. W ten sposb otrzymujemy nastpujcy cig symboli:
abbababbaaabaaabababbbab,
w ktrym liczba serii k wynosi 16. Liczba elementw a wynosi 12 i elementw b rwnie 12. Z tablic rozkadu liczby serii (tablica 5. w Aneksie)
odczytujemy:

0,10
= 0,05 ; wynosi ono 8
2
0,10
- k 2 dla n1 =12 i n2 =12 oraz 1
= 0,95 ; otrzymujemy 17
2
Zachodzi relacja k1 < k < k 2 , co oznacza, e dobr prby by losowy.

k1 dla n1 =12 i n2 =12 oraz

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

159

BIBLIOGRAFIA
[1]

Badania marketingowe. Podstawowe metody i obszary zastosowa. Pod red.


K. Mazurek-opaciskiej. Wrocaw: AE 2002

[2]

Bazarnik J., Grabiski T. (i inni); Badania marketingowe. Metody i oprogramowanie komputerowe. Warszawa Krakw: Canadian Consortium of
Management Schools. AE w Krakowie

[3]

Bk I., Mankowicz I., Mojsiewicz M., Wawrzyniak K.: Statystyka w zadaniach. Cz. I i II. Warszawa: WN-T 2001

[4]

Blalock H. M.: Statystyka dla socjologw. PWN Warszawa 1975

[5]

Clauss G., Ebnmer H.: Podstawy statystyki dla psychologw, pedagogw


i socjologw. Warszawa: PZWS 1972

[6]

Forlicz S. Rozkady asymetryczne zmiennej losowej. Prace Naukowe AE we


Wrocawiu nr 348. Wrocaw: AE 1986

[7]

Gralski A.: Metody opisu i wnioskowania statystycznego w psychologii. Warszawa: PWN 1976

[8]

Gre J.: Statystyka matematyczna. Modele i zadania. Warszawa: PWE 1974

[9]

Gruziski R.: Opis statystyczny w badaniach prawoznawczych. Warszawa:


Wydawnictwo Prawnicze 1981

[10]

Krzysztofiak M., Urbanek D.: Metody statystyczne. Warszawa: PWE 1981

[11]

Lange O., Banasiski A.: Teoria statystyki. Warszawa: PWE 1970

[12]

Luszniewicz A.: Statystyka oglna. Warszawa: PWE 1987

[13]

Maka W., Urbanek-Krzysztofiak D.: Metody opisu statystycznego. Gdask:


Wyd. Uniwersytetu Gdaskiego 1995

[14]

Nowaczyk C.: Podstawy metod statystycznych dla pedagogw. Jelenia Gra:


VIS 1995

[15]

Ostasiewicz S., Rusnak Z., Siedlecka U.: Statystyka. Materiay do wicze.


Ksika ekonomiczna. Wrocaw: AE 1994

[16]

Rocznik Statystyczny RP. Warszawa: GUS 2001

[17]

Rusnak Z.: Problemy bada ankietowych. w: Metody ilociowe w ekonomii.


Praca zbiorowa pod red. W. Ostasiewicza. Wrocaw: AE 1999

160

Zygmunt Bobowski

[18]

Sadowski W.: Statystyka dla ekonomistw. Wnioskowanie statystyczne. Warszawa: PWE 1972

[19]

Sadowski W.: Statystyka matematyczna. Warszawa: PWE 1969

[20]

Sobczyk M.: Statystyka. Warszawa: PWE 1997

[21]

Szulc B.: Statystyka dla ekonomistw. Opis statystyczny. Warszawa: PWE


1968

[22]

Walter J., McLean M.: Statystyka dla kadego. Warszawa: WSiP 1994

[23]

Wawrzynek J.: Wybrane metody opisu i wnioskowania statystycznego w biznesie. Wrocaw: AE 1995

[24]

Zajc K.: Zarys metod statystycznych. Warszawa: PWE 1994

[25]

Zastosowanie
metod
statystycznych.
A. Luszniewicza. Warszawa: PWE 1983

Praca

zbiorowa

pod

red.

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

161

PODSTAWOWE WZORY
Wzr

Liczba klas

N
R( x)
h=
k

Rozpito klas
l

x n
i

M 1 (x ) =

N
k

(x

=x

x ) ni

Moment centralny rzdu


drugiego

i =1

N
k

m3 ( x ) =

Moment zwyky rzdu


pierwszego

i =1

m2 (x ) =

(x

x ) ni

Moment centralny rzdu


trzeciego

i =1

N
k

(x

m4 (x ) =

x ) ni

Moment centralny rzdu


czwartego

i =1

rednia arytmetyczna w
szeregu szczegowym

x=

i =1

N
k

x=

x i ni
i =1

x f
i

x=

i =1

i =1

x=

x& i ni
i =1

x=

x& i f i
i =1

i =1

x g = N x1 x 2 ... x N
ychr

Zastosowanie

1
1
y1 + y2 + .... + yn
2
= 2
n 1

rednia arytmetyczna w
szeregu rozdzielczym
punktowym
rednia arytmetyczna w
szeregu rozdzielczym z
przedziaami
klasowymi
rednia geometryczna
rednia chronologiczna

162

Zygmunt Bobowski

n0 n01
D(x ) = x0 +
h
(n0 n01 ) + (n0 n0+1 ) 0
N
cumn0 1
2
h0
Me(x ) = x0 +
n0
N
cumn0 1
4
Q1 ( x ) = x0 +
h0
n0
3N
cumn0 1
h0
Q3 ( x ) = x0 + 4
n0
R( x ) = xmax xmin
Oc (x ) =

Q3 (x ) Q1 (x ) , O
c
2
N

s (x ) =
2

(x x )

Wariancja w
szeregu rozdzielczym
punktowym
Wariancja w
szeregu rozdzielczym z
przedziaami
klasowymi
Rwno wariancyjna
Odchylenie
standardowe
w szeregu
szczegowym

i =1

N
k

s 2 (x ) =

x ) ni

N
i

(x&

x ) ni
2

i =1

s 2 (x ) = s j ( x ) + s 2 (x j )
2

s(x ) =

(x

i =1

Odchylenie
wiartkowe
Wariancja w
szeregu szczegowym

i =1

(x

[Q3 (x ) Me(x )] + [Me(x ) Q1 (x )]

s 2 (x ) =

(x ) =

Dominanta w
szeregu rozdzielczym z
przedziaami
klasowymi
Mediana w
szeregu rozdzielczym z
przedziaami
klasowymi
Kwartyl pierwszy w szeregu
rozdzielczym z
przedziaami
klasowymi
Kwartyl trzeci
w szeregu rozdzielczym z
przedziaami
klasowymi
Obszar zmiennoci

x)

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

(x

s(x ) =

x ) ni
2

i =1

N
k

(x&

s(x ) =

x ) ni
2

i =1

N
N

d (x ) =

x x
i

i =1

N
k

d (x ) =

N
k

d (x ) =

x ni

i =1

x&

x ni

i =1

s(x )
x
O (x )
;
Wz ( x ) = c
Me( x )
Wz ( x ) =

M s (x ) = x D(x ) ;

Wz ( x ) =

Q3 ( x ) Q1 ( x )
Q3 ( x ) + Q1 ( x )

M s ( x ) = 3[x Me( x)]

3[x Me( x)]


x D(x )
; Ws1 ( x ) =
s(x )
s( x )
[Q (x ) Me( x)] [Me( x) Q1 (x )] =
Ws 2 ( x ) = 3
[Q3 (x ) Me( x)] + [Me( x) Q1 (x )]

Ws1 ( x ) =

[Q3 (x ) Me( x)] [Me( x) Q1 (x )]


2Oc ( x )
m3 ( x )
*
m3 (t ) =
m3 ( x ) + s 3 ( x )

163
Odchylenie
standardowe
w szeregu rozdzielczym
punktowym
Odchylenie
standardowe
w szeregu rozdzielczym z
przedziaami
klasowymi
Odchylenie
przecitne w
szeregu szczegowym
Odchylenie
przecitne w
szeregu rozdzielczym
punktowym
Odchylenie
przecitne w
szeregu rozdzielczym z
przedziaami
klasowymi
Klasyczny
wspczynnik
zmiennoci
Kwartylowy
wspczynnik
zmiennoci
Absolutna miara skonoci
Wspczynnik
skonoci

Kwartylowy
wspczynnik
skonoci
Trzeci moment
centralny
standaryzowany

164

k=

Zygmunt Bobowski

a
5000

Wspczynnik
koncentracji
4

(x
m4 (x )
=
s 4 (x )
e(t ) = m4 (t ) 3

Miara kurtozy

m 4 (t ) =

d =
c

(f

dG

rk =

N
4
s (x )
Miara ekscecsu

fi f j )

ij

Wspczynnik
Czuprowa

fi f j

i, j

min(r , s ) 1

x ) ni

i =1

ij

i , jG

( )

s yxj

s( y )

fj

i , jG

dM

1
1
min(r , s )

(y

y n j

fi f j

i , jM

( yi y )

rk =
ni

1
1
min (r , s )

(y

( )

s y xi

s( y )

y ni

(y

y n j
2

xi

Stosunek korelacyjny

(x

x ) ( y i y )
N

(x

x)

(y

(x

y)

x ) ( y i y ) n ij

(x

x) n j

6 d x i d y i
i

N3 N

(y

Wspczynnik
korelacji liniowej Pearsona
dla szeregw
szczegowych

i, j

y = a y x + b

c ( x, y )
rP =
=
s (x ) s( y )

c ( x, y )
rP =
=
s ( x ) s ( y )

= 1

Wspczynnik
Hellwiga

xi

ij

Sp

i , jM

xj

y ) ni
2

Wspczynnik
korelacji liniowej Pearsona
dla tablicy korelacyjnej
Wspczynnik
korelacji rang
Spearmana
Rwnanie regresji Y wzgldem X

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

(x

x ) ( y i y )

C ( x, y )
=
s 2 (x )

ay =

165

N
( x i x )2
i

Parametr rwnania regresji


(wspczynnik
regresji)

N
b = y ay x

( y y )
=
(y y)

Parametr rwnania regresji

2y

Wspczynnik
zbienoci

R2 = 1 2
R a r / s = yr ys

R a r / r 1 = yr yr 1
Rar / s
y ys
100 = r
100
ys
ys

R wr / s =

R w r / r 1 =
wi r / s =

R a r / r 1
y yr 1
100 = r
100
yr 1
yr 1

yr
100
ys

wi r / r 1 =

yr
100
yr 1

y1 + y2 + y3 (3) y2 + y3 + y4
; y3 =
;.....,
3
3
y + yn 1 + yn
= n2
3

y2(3) =
yn(3)1
y3..

(5)

yn 2

(5)

y1 + y2 + y3 + y4 + y5
y + y3 + y4 + y5 + y6
(5)
....;.... y4 = 2
5
5

yn 4 + yn 3 + yn 2 + yn 1 + yn
5

yt = a t + b

Wspczynnik
determinacji
Rnica absolutna jednopodstawowa
Rnica absolutna acuchowa
Rnica
wzgldna jednopodstawowa
Rnica
wzgldna acuchowa
Indeks indywidualny jednopodstawowy
Indeks indywidualny acuchowy
rednie ruchome trzyokresowe

rednie ruchome piciookresowe


Rwnanie trendu

166

Zygmunt Bobowski

a=

(t

t ) yti

i =1

(t

Parametr rwnania trendu

t )2

i =1

Parametr rwnania trendu

b = y a t
n

=
2

(y

ti

i =1
n

y t i ) 2

( y

y )2

ti

i =1

w i r / r 1 = n1 wi 2 / 1 wi3 / 2 wi 4 / 3 ... wi n / n1 = n1 wi n / 1
Sj =

Sj =

yj
y

100

( j)
ti

ci

ti

ti

( j)

100

Sj =

( j)

( j)

100

k=

r 100

x tt
x tt

s(x )
s(x )
E (x ) x + tt
n 1
n 1

s(x )
s(x )
E ( x ) x + tt
n
n

s 2 ( x ) =

(x

x)

n 1

Wspczynnik
zbienoci dla
rwnania trendu
rednie tempo
zmian
Wskanik sezonowoci
oparty na
rednich okresw jednoimiennych
Wskanik sezonowoci
oparty na
rednich ruchomych centrowanych
Wskanik sezonowoci
oparty na rwnaniu trendu
Wspczynnik
korygujcy surowe wskaniki sezonowoci
Przedzia ufnoci dla redniej
(maa prba)
Przedzia ufnoci dla redniej
(dua prba)

Wariancja dla
maej prby

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

167
Minimalna liczebno prby
dla szacowania
redniej

t s 2 ( x )
= t 2
d
2

n min

m m
m m
1
1
m
m
n
n
n
n
tt
< p < + tt
n
n
n
n

n s2 (x ) 2
n s2 (x )
( x )
t t1
t t2
2

s (x )
s(x )
( x )
t
t
1+ t
1 t
2n
2n
r tt
P

1 (r P ) 2
n

r + tt
P

t emp =

x E 0 (x )
n 1
s(x )

t emp =

x E0 (x )
n
s(x )

temp =

temp =

( )

1 r P
n

x1 x2
2
n s ( x ) + n2 s2 ( x ) 1 1
+
n1 + n2 2
n1 n 2
2
1 1

x1 x2
s1 ( x ) s2 ( x )
+
n1
n2
2

Przedzia ufnoci dla wskanika struktury


Przedzia ufnoci dla wariancji/ odchylenia
standardowego
(maa prba)
Przedzia ufnoci dla odchylenia standardowego / wariancji (dua prba)
Przedzia ufnoci dla wspczynnika korelacji
Statystyka empiryczna przy
weryfikacji hipotezy dla
redniej (maa
prba)
Statystyka empiryczna przy
weryfikacji hipotezy dla
redniej (dua
prba)
Statystyka empiryczna przy
weryfikacji hipotezy dla
dwch rednich
(maa prba)
Statystyka empiryczna przy
weryfikacji hipotezy dla
dwch rednich
(dua prba)

168

t emp

Zygmunt Bobowski

m
p0
= n
p 0 q0
n
rP

t emp =

( )

1 r

t emp =
ij

t emp =
i

(n

P 2

n2

N fi f j )

ij

N fi f j

(ni N pi )2
N pi

t emp = D n ; D = max Fi ( x ) F0i ( x )

Statystyka
empiryczna
przy weryfikacji hipotezy dla
wskanika
struktury
Statystyka
empiryczna
przy weryfikacji hipotezy dla
wspczynnika
korelacji
Statystyka
empiryczna dla
testu niezalenoci chikwadrat
Statystyka
empiryczna dla
testu zgodnoci
chi-kwadrat
Statystyka
empiryczna dla
testu zgodnoci
Komogorowa

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

169

ANEKS
Tablica 1. Dystrybuanta rozkadu normalnego (dla
tt

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,00 t < 3,10 )1

0,07

0,08

0,09

0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891
1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41308 0,41466 0,41621 0,41774
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574
2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361
2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861
3,0 0,49865 0,49873 0,049878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49898 0,4990
1

dla ujemnych wartoci t naley wykorzystywa wasno symetrii rozkadu normalnego

170

Zygmunt Bobowski

Tablica 2. Rozkad t Studenta


k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

1
0,8
0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257
0,257
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,255
0,255
0,255
0,255
0,255
0,255
0,255
0,255
0,255

0,6
0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542
0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533
0,532
0,532
0,532
0,531
0,531
0,531
0,531
0,530
0,530
0,530
0,530
0,530
0,530
0,529
0,529
0,529
0,529
0,529
0,529
0,529

0,4
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,853
0,853
0,853
0,852
0,852
0,852
0,851
0,851
0,851
0,851

0,2
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,309
1,309
1,308
1,307
1,306
1,306
1,305
1,304
1,304
1,303

0,1
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,696
1,694
1,692
1,691
1,690
1,688
1,687
1,686
1,685
1,684

0,05
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,040
2,037
2,035
2,032
2,030
2,028
2,026
2,024
2,023
2,021

0,02
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,453
2,449
2,445
2,441
2,438
2,434
2,431
2,429
2,426
2,423

0,01
63,656
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,744
2,738
2,733
2,728
2,724
2,719
2,715
2,712
2,708
2,704

0,001
636,578
31,600
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,633
3,622
3,611
3,601
3,591
3,582
3,574
3,566
3,558
3,551

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

Tablica 3. Rozkad
0,95

0,90

171

(chikwadrat)

0,99

0,98

0,80

0,70

0,50

0,30

0,20

0,10

0,05

0,02

0,01 0,001

0,0002

0,0006

0,004

0,016

0,064

0,148 0,455 1,074 1,642 2,706 3,841 5,412 6,635 10,827

0,020

0,040

0,103

0,211

0,446

0,713 1,386 2,408 3,219 4,605 5,991 7,824 9,210 13,815

0,115

0,185

0,352

0,584

1,005

1,424 2,366 3,665 4,642 6,251 7,815 9,837 11,345 16,266

0,297

0,429

0,711

1,064

1,649

2,195 3,357 4,878 5,989 7,779 9,488 11,668 13,277 18,466

0,554

0,752

1,145

1,610

2,343

3,000 4,351 6,064 7,289 9,236 11,070 13,388 15,086 20,515

0,872

1,134

1,635

2,204

3,070

3,828 5,348 7,231 8,558 10,645 12,592 15,033 16,812 22,457

1,239

1,564

2,167

2,833

3,822

4,671 6,346 8,383 9,803 12,017 14,067 16,622 18,475 24,321

1,647

2,032

2,733

3,490

4,594

5,527 7,344 9,524 11,030 13,362 15,507 18,168 20,090 26,124

2,088

2,532

3,325

4,168

5,380

6,393 8,343 10,656 12,242 14,684 16,919 19,679 21,666 27,877

10

2,558

3,059

3,940

4,865

6,179

7,267 9,342 11,781 13,442 15,987 18,307 21,161 23,209 29,588

11

3,053

3,609

4,575

5,578

6,989

8,148 10,341 12,899 14,631 17,275 19,675 22,618 24,725 31,264

12

3,571

4,178

5,226

6,304

7,807

9,034 11,340 14,011 15,812 18,549 21,026 24,054 26,217 32,909

13

4,107

4,765

5,892

7,041

8,634

9,926 12,340 15,119 16,985 19,812 22,362 25,471 27,688 34,527

14

4,660

5,368

6,571

7,790

9,467

10,821 13,339 16,222 18,151 21,064 23,685 26,873 29,141 36,124

15

5,229

5,985

7,261

8,547

10,307 11,721 14,339 17,322 19,311 22,307 24,996 28,259 30,578 37,698

16

5,812

6,614

7,962

9,312

11,152 12,624 15,338 18,418 20,465 23,542 26,296 29,633 32,000 39,252

17

6,408

7,255

8,672

10,085

12,002 13,531 16,338 19,511 21,615 24,769 27,587 30,995 33,409 40,791

18

7,015

7,906

9,390

10,865

12,857 14,440 17,338 20,601 22,760 25,989 28,869 32,346 34,805 42,312

19

7,633

8,567

10,117

11,651

13,716 15,352 18,338 21,689 23,900 27,204 30,144 33,687 36,191 43,819

20

8,260

9,237

10,851

12,443

14,578 16,266 19,337 22,775 25,038 28,412 31,410 35,020 37,566 45,314

21

8,897

9,915

11,591

13,240

15,445 17,182 20,337 23,858 26,171 29,615 32,671 36,343 38,932 46,796

22

9,542

10,600

12,338

14,041

16,314 18,101 21,337 24,939 27,301 30,813 33,924 37,659 40,289 48,268

23 10,196

11,293

13,091

14,848

17,187 19,021 22,337 26,018 28,429 32,007 35,172 38,968 41,638 49,728

24 10,856

11,992

13,848

15,659

18,062 19,943 23,337 27,096 29,553 33,196 36,415 40,270 42,980 51,179

25 11,524

12,697

14,611

16,473

18,940 20,867 24,337 28,172 30,675 34,382 37,652 41,566 44,314 52,619

26 12,198

13,409

15,379

17,292

19,820 21,792 25,336 29,246 31,795 35,563 38,885 42,856 45,642 54,051

27 12,878

14,125

16,151

18,114

20,703 22,719 26,336 30,319 32,912 36,741 40,113 44,140 46,963 55,475

28 13,565

14,847

16,928

18,939

21,588 23,647 27,336 31,391 34,027 37,916 41,337 45,419 48,278 56,892

29 14,256

15,574

17,708

19,768

22,475 24,577 28,336 32,461 35,139 39,087 42,557 46,693 49,588 58,301

30 14,953

16,306

18,493

20,599

23,364 25,508 29,336 33,530 36,250 40,256 43,773 47,962 50,892 59,702

172

Zygmunt Bobowski

Tablica 4. Rozkad graniczny Komogorowa


t

1,01
1,02
1,03
1,04
1,05
1,06
1,07
1,08
1,09
1,10
1,11
1,12
1,13
1,14
1,15
1,16
1,17
1,18
1,19
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
1,13
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40

0,740566
0,750826
0,760780
0,770434
0,779794
0,788860
0,797636
0,806128
0,814342
0,822282
0,829950
0,837356
0,844502
0,851394
0,858038
0,864442
0,870612
0,876548
0,882258
0,887750
0,893030
0,898104
0,902972
0,907648
0,912132
0,916432
0,920556
0,924505
0,928288
0,931908
0,935370
0,938682
0,941848
0,944872
0,947756
0,950512
0,953142
0,955650
0,958040
0,960318

1,41
1,42
1,43
1,44
1,45
1,46
1,47
1,48
1,49
1,50
1,51
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
1,60
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,79
1,80

0,962486
0,964552
0,966516
0,968382
0,970158
0,971846
0,973448
0,974970
0,976412
0,977782
0,979080
0,980310
0,981476
0,982578
0,983622
0,984610
0,985544
0,986426
0,987260
0,988048
0,988791
0,989492
0,990154
0,990777
0,991364
0,991917
0,992928
0,992928
0,993389
0,993828
0,994230
0,994612
0,994972
0,995309
0,995625
0,995922
0,996200
0,996460
0,996704
0,996932

1,81
1,82
1,83
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,91
1,92
1,93
1,94
1,95
1,96
1,97
1,98
1,99
2,00
2,01
2,02
2,03
2,04
2,05
2,06
2,07
2,08
2,09
2,10
2,11
2,12
2,13
2,14
2,15
2,16
2,17
2,18
2,19
2,20

0,997146
0,997346
0,997533
0,997707
0,997870
0,998023
0,998145
0,998297
0,998421
0,998536
0,998644
0,998744
0,998837
0,998924
0,999004
0,999079
0,999149
0,999213
0,999273
0,999329
0,999380
0,999428
0,999474
0,999516
0,999552
0,999588
0,999620
0,999650
0,999680
0,999705
0,999723
0,999750
0,999770
0,999790
0,999806
0,999822
0,999838
0,999852
0,999864
0,999874

2.21
2,22
2,23
2,24
2,25
2,26
2,27
2,28
2,29
2,30
2,31
2,32
2,33
2,34
2,35
2,36
2,37
2,38
2,39
2,40
2,41
2,42
2,43
2,44
2,45
2,46
2,47
2,48
2,49
2,50
2.55
2,60
2,65
2,70
2,75
2,80
2,85
2,90
2,95
3,00

0,999886
0,999896
0,999904
0,999912
0,999920
0,999926
0,999934
0,999940
0,999944
0,999949
0,999954
0,999958
0,999962
0,999965
0,999968
0,999970
0,999973
0,999976
0,999978
0,999980
0,999982
0,999984
0,999986
0,999987
0,999988
0,999989
0,999990
0,999991
0,999992
0,99993
0,999995
0,999974
0,999998
0,999999
0,9999994
0,9999997
0,9999998
0,9999999
0,99999994
0,99999997

WYBRANE METODY STATYSTYKI OPISOWEJ


I WNIOSKOWANIA STATYSTYCZNEGO

173

Tablica 5. Rozkad serii


dla

n2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

n1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

10

11

12

13

14

15

16

17

18

19

20

2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3

2
2
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4

3
3
3
3
4
4
4
4
4
5
5
5
5
5
5
5

3
4
4
4
5
5
5
5
5
6
6
6
6
6
6

4
4
5
5
5
6
6
6
6
6
7
7
7
7

5
5
6
6
6
6
7
7
7
7
8
8
8

6
6
6
7
7
7
8
8
8
8
8
8

6
7
7
8
8
8
8
9
9
9
9

7
8
8
8
9
9
9
10
10
10

8
9
9
9
10
10
10
10
11

9
9
10
10
10
11
11
11

10
10
11
11
11
12
12

11
11
11
12
12
12

11
12
12
13
13

12
13
13
13

13
14
14

14
14

15

dla

n2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

= 0,05

= 0,95
n1

2
4
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5

10

11

12

13

14

15

16

17

18

19

20

6
6
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7

7
8
8
8
9
9
9
9
9
9
9
9
9
9
9
9
9

8
9
9
10
10
10
11
11
11
11
11
11
11
11
11
11

10
10
11
11
11
12
12
12
12
13
13
13
13
13
13

11
12
12
12
13
13
13
13
14
14
14
14
14
14

12
13
13
14
14
14
15
15
15
15
15
15
16

13
14
14
15
15
16
16
16
16
17
17
17

15
15
16
16
16
17
17
17
18
18
18

16
16
17
17
18
18
18
19
19
19

17
17
18
18
19
19
20
20
20

18
19
19
20
20
20
21
21

19
20
20
21
21
22
22

20
21
21
22
22
23

22
22
23
23
24

23
23
24
24

24
24
25

25
26

26

You might also like