Professional Documents
Culture Documents
___________________________________________________________________________________________________________
Materiay dydaktyczne 17
ARTUR ZIMNY
STATYSTYKA OPISOWA
Materiay pomocnicze do wicze
wydanie drugie zmienione
Konin 2010
Tytu
Statystyka opisowa
Materiay pomocnicze do wicze
wydanie drugie zmienione
Autor
Artur Zimny
Recenzja naukowa
dr Kazimierz Kruszka
Rada Wydawnicza
prof. nadzw. dr hab. Wojciech Poznaniak przewodniczcy,
prof. nadzw.dr hab. Jan Grzesiak prof. PWSZ, dr Marek Naglewski,
prof. nadzw.dr hab. Mirosaw Pawlak, prof. dr hab. Marian Walczak,
mgr in. Ewa Kapyszewska sekretarz Rady
Opracowanie redakcyjne i korekta
Maria Sierakowska
Projekt okadki
Agnieszka Jankowska
amanie i skad
Krzysztof Przybylak
Druk i oprawa
ISBN 978-83-88335-56-3
SPIS TRECI
OD AUTORA ......................................................................................................... 5
1. WPROWADZENIE ........................................................................................... 7
1.1. Informacje oglne ......................................................................................... 7
1.2. Zbiorowo, jednostka i cecha statystyczna ................................................. 7
1.3. Istota i etapy badania statystycznego ............................................................ 8
1.4. Materia statystyczny i sposoby jego prezentacji .......................................... 8
1.5. Metody analizy statystycznej ........................................................................ 9
1.6. Zastosowanie programw komputerowych w statystyce............................ 10
1.7. Suby statystyki publicznej w Polsce i Unii Europejskiej ......................... 11
1.8. Przykady .................................................................................................... 12
2. ANALIZA STRUKTURY ZBIOROWOCI ................................................ 21
2.1. Informacje oglne ....................................................................................... 21
2.2. Wskaniki struktury i natenia .................................................................. 21
2.3. Miary przecite (pooenia) ........................................................................ 22
2.3.1. rednie klasyczne ............................................................................. 23
2.3.2. rednie pozycyjne ............................................................................ 24
2.4. Miary zmiennoci (dyspersji) ..................................................................... 28
2.4.1. Klasyczne miary zmiennoci............................................................ 29
2.4.2. Pozycyjne miary zmiennoci............................................................ 31
2.5. Miary asymetrii (skonoci) ........................................................................ 32
2.5.1. Bezwzgldne miary asymetrii .......................................................... 34
2.5.2. Wzgldne miary asymetrii ............................................................... 35
2.6. Miary koncentracji ...................................................................................... 36
2.6.1. Kurtoza (eksces) ............................................................................... 37
2.6.2. Nierwnomierno podziau zjawiska w zbiorowoci ..................... 38
2.7. Przykady .................................................................................................... 39
2.8. Zadania ........................................................................................................ 50
Spis treci
OD AUTORA
Opracowanie, ktre znalazo si w Pastwa rkach, jest efektem mojego
kilkuletniego dowiadczenia w prowadzeniu wicze ze statystyki opisowej na
specjalnociach ekonomicznych w Pastwowej Wyszej Szkole Zawodowej
w Koninie. Jest przeznaczone przede wszystkim dla studentw specjalnoci ekonomicznych PWSZ, cho oczywicie mog z niego korzysta rwnie poszukujcy wiedzy o podstawowych narzdziach statystycznych potrzebnych np. w pracy
zawodowej.
Przygotowujc ten podrcznik chciaem przybliy podstawowe metody
analizy statystycznej i ich praktyczne wykorzystanie. Mimo e Czytelnik zetknie
si z wieloma wzorami i formuami obliczeniowymi, to ich zastosowanie nie wymaga pogbionej wiedzy z matematyki. Wystarczy znajomo podstawowych
dziaa arytmetycznych i kolejnoci ich wykonywania. Obok niezbdnej wiedzy
teoretycznej, ktr przedstawiem w moliwie zwizy i przystpny sposb, zawarem w opracowaniu rwnie liczne przykady i zadania przeznaczone zarwno do
rozwizywania podczas wicze, jak i do samodzielnej pracy. Przy ich konstruowaniu korzystaem, gdy tylko byo to moliwe z dydaktycznego punktu widzenia,
z danych empirycznych obrazujcych aktualne problemy spoeczno-ekonomiczne
kraju i regionu. rdem tych danych byy przede wszystkim publikacje Gwnego
Urzdu Statystycznego oraz Bank Danych Regionalnych GUS.
Opracowanie skada si z piciu rozdziaw, a jego ukad i tre s cile
zwizane z tematyk wicze ze statystyki opisowej na specjalnociach ekonomicznych w PWSZ w Koninie. W rozdziale pierwszym przedstawione zostay
podstawowe pojcia i zagadnienia, ktrych znajomo jest konieczna dla zrozumienia materiau prezentowanego w dalszej czci opracowania. Rozdzia drugi
powicono metodom analizy struktury zbiorowoci, omawiajc przy tym podstawowe grupy miar charakteryzujcych rozkad jednej zmiennej. Rozdzia trzeci
wprowadza Czytelnika w problematyk analizy wspzalenoci zjawisk, czyli
sposobw okrelania kierunku, siy oraz ksztatu zalenoci midzy badanymi
zjawiskami. W rozdziale czwartym natomiast gwnym tematem s metody analizy dynamiki zjawisk. W podsumowaniu zawarto zestaw zada, ktre pozwol
usystematyzowa i utrwali wiedz oraz umiejtnoci zdobyte przez studentw
w trakcie cyklu wicze ze statystyki opisowej. Z kolei doczona bibliografia
przedmiotu powinna uatwi zainteresowanym pogbienie wiedzy poprzez dotarcie do innych podrcznikw ze statystyki.
Od Autora
Mam nadziej, e to opracowanie speni swoje zadanie. Jednoczenie majc wiadomo, e nie jest pozbawione bdw i niecisoci, bd bardzo
wdziczny za ich wskazanie, co pozwoli na wprowadzenie odpowiednich udoskonale i modyfikacji.
Artur Zimny
1. WPROWADZENIE
1.1. Informacje oglne
Statystyka to nauka zajmujca si metodami badania prawidowoci zachodzcych
w procesach masowych oraz ich ilociow lub jakociow analiz z punktu widzenia dyscypliny naukowej, w ktrej skad procesy te wchodz. Zadaniem statystyki
jest dostarczanie wiarygodnych informacji niezbdnych do podejmowania decyzji
w rnych dziedzinach.
Statystyka jako nauka dzieli si na:
statystyk opisow (opis statystyczny), ktra zajmuje si metodami gromadzenia, opracowania i prezentacji danych wraz z ich sumarycznym opisem,
statystyk matematyczn (wnioskowanie statystyczne), ktra zajmuje si
metodami wnioskowania o caej zbiorowoci na podstawie zbadania pewnej jej
czci, czyli prby.
1.2. Zbiorowo, jednostka i cecha statystyczna
Zbiorowo statystyczna (populacja) to zbir jednostek (osb, przedmiotw, zdarze) objtych badaniem statystycznym, ktre maj jedn lub kilka cech wsplnych oraz wiele cech rnicujcych (zmiennych). Zbiorowo statystyczna musi
by jednoznacznie okrelona pod wzgldem rzeczowym, przestrzennym oraz czasowym.
Jednostka statystyczna to najmniejszy element zbiorowoci statystycznej objtej
badaniem.
Cechy statystyczne (zmienne) to waciwoci jednostek statystycznych tworzcych
badan zbiorowo. Dzieli si je na cechy:
jakociowe (niemierzalne),
ilociowe (mierzalne)
o skokowe (dyskretne),
o cige,
o quasi cige.
1. Wprowadzenie
10
1. Wprowadzenie
Analiza wspzalenoci
zjawisk
Analiza dynamiki
zjawisk
Wskaniki struktury
i natenia
Analiza korelacji
Metody indeksowe
Miary pooenia
(przecitne)
Analiza regresji
Dekompozycja szeregu
czasowego
Miary zmiennoci
(dyspersji)
Miary asymetrii
(skonoci)
Miary koncentracji
11
mona byo poprawnie uywa zawarte w nich procedury oraz interpretowa uzyskane wyniki.
1.7. Suby statystyki publicznej w Polsce i Unii Europejskiej
Centralnym organem administracji rzdowej w Polsce, waciwym w sprawach
statystyki, jest Prezes Gwnego Urzdu Statystycznego, ktry wykonuje swoje
zadania przy pomocy sub statystyki publicznej. Zgodnie z ustaw z 29 czerwca
1995 r. o statystyce publicznej, suby statystyki publicznej stanowi Prezes Gwnego Urzdu Statystycznego, podlegli mu dyrektorzy szesnastu urzdw statystycznych oraz inne jednostki statystyki1. Do zada sub statystyki publicznej
naley:
rozpoznawanie zapotrzebowania na informacje i analizy statystyczne oraz
przygotowywanie na tej podstawie projektw programw bada statystycznych
statystyki publicznej,
organizowanie i prowadzenie bada statystycznych oraz ustalanie ich metodologii,
zbieranie, gromadzenie i opracowywanie danych statystycznych oraz ich analizowanie,
przeprowadzanie spisw powszechnych,
przechowywanie danych statystycznych,
opracowywanie standardowych klasyfikacji, nomenklatur i definicji podstawowych kategorii, ustalanie wzajemnych relacji midzy nimi oraz ich interpretacja,
udostpnianie i rozpowszechnianie wynikowych informacji statystycznych,
w tym podstawowych wielkoci i wskanikw,
opracowywanie i ogaszanie prognoz demograficznych oraz statystycznych
prognoz gospodarczych i spoecznych,
przedstawianie Prezydentowi, Sejmowi i Senatowi, organom administracji rzdowej, Najwyszej Izbie Kontroli, Narodowemu Bankowi Polskiemu, organom
jednostek samorzdu terytorialnego oraz innym instytucjom rzdowym wynikowych informacji statystycznych w zakresie, terminach i formach okrelonych
w programie bada statystycznych,
prowadzenie krajowych rejestrw urzdowych: podmiotw gospodarki narodowej i podziau terytorialnego kraju,
prowadzenie bada i analiz statystycznych wynikajcych z przyjtych przez
Rzeczpospolit Polsk zobowiza midzynarodowych,
Ustawa z 29 czerwca 1995 r. o statystyce publicznej, Dz.U. z 1995 r., nr 88, poz. 439, art. 22-29.
12
1. Wprowadzenie
<www.ec.europa.eu/eurostat>
13
studenci I roku
PWSZ w Koninie
w dniu 15 lutego
2010 r.
Cecha
statystyczna
Warianty cechy
Okrelenie cechy
wiek
ilociowa
(mierzalna), ciga
pe
kobieta, mczyzna
jakociowa
(niemierzalna)
wzrost
ilociowa
(mierzalna), ciga
0, 2, 3, 1, 2, 0 itd.
jakociowa
(niemierzalna)
rd o : Dane umowne.
Przykad 1.8.2.
Obserwacji poddano 30 pracownikw koniskiej firmy Zet biorc pod uwag
liczb posiadanych dzieci. Wyniki obserwacji przedstawiaj si nastpujco (stan
z 1 lutego 2010 r.)
3, 1, 0, 2, 3, 0, 5, 1, 2, 5, 4, 5, 1, 0, 3, 2, 4, 6, 4, 2, 1, 0, 0, 1, 1, 2, 3, 2, 1, 3
Zbiorowo statystyczna pracownicy koniskiej firmy Zet w dniu 1 lutego
2010 r.
Jednostka statystyczna pracownik koniskiej firmy Zet w dniu w dniu 1 lutego
2010 r.
Cecha statystyczna (zmienna) liczba posiadanych dzieci
14
1. Wprowadzenie
Liczba
pracownikw (ni)
5
7
6
5
3
3
1
30
rd o : Dane umowne.
Przykad 1.8.3.
Obserwacji poddano 30 pracownikw koniskiej firmy Zet ze wzgldu wysoko pacy netto w styczniu 2010 r. (w z). Uzyskane wyniki uporzdkowano
wzrastajco, otrzymujc poniszy cig informacji szereg prosty:
1220, 1249, 1258, 1280, 1290, 1310, 1310, 1315, 1318, 1320, 1320, 1320, 1320,
1320, 1328, 1380, 1385, 1385, 1390, 1395, 1395, 1398, 1410, 1420, 1420, 1430,
1430, 1450, 1480, 1499
Zbiorowo statystyczna pracownicy koniskiej firmy Zet w styczniu 2010 r.
Jednostka statystyczna pracownik koniskiej firmy Zet w styczniu 2010 r.
Cecha statystyczna (zmienna) wysoko pacy netto (w z)
Okrelenie rozstpu
R = x max x min = 1499 1220 = 279
Ustalenie liczby przedziaw klasowych: przyjcie k = 6
15
max
xmin
= 279/6 = 46,5
po zaokrgleniu 47
Grupowanie materiau statystycznego szereg rozdzielczy wielostopniowy
(przedziaowy)
Wysoko pacy
netto w z (xi)
1220-1266
1267-1313
1314-1360
1361-1407
1408-1454
1455-1501
Razem
Liczba
pracownikw (ni)
3
4
8
7
6
2
30
rd o : Dane umowne.
Grna granica przedziau nie pokrywa si z doln granic przedziau nastpnego, wic
nie ma problemu z zakwalifikowaniem jednostki do odpowiedniego przedziau.
Zaokrglenie rozpitoci przedziaw klasowych do 50, w celu atwiejszego obliczenia miernikw statystycznych.
Wysoko pacy
netto w z (xi)
Liczba
pracownikw (ni)
1200-1250
1250-1300
1300-1350
1350-1400
1400-1450
1450-1500
2
3
10
7
5
3
Razem
30
rd o : Dane umowne.
16
1. Wprowadzenie
Liczba wojewdztw
7-10
10-13
13-16
16-19
4
6
5
1
Razem
16
poniej 20
20-40
40-60
60-80
80 i wicej
8 449,7
11 841,3
10 765,8
5 878,8
1 200,2
Razem
38 135,9
17
Liczba miast
492
180
134
47
22
17
892
Przykad 1.8.5.
Tablica prosta
Podmioty gospodarki narodowej zarejestrowane w Polsce
wedug wielkoci w roku 2008 (stan na 31 grudnia)
Wielko
(liczba zatrudnionych)
0-9
10-49
50-249
250-999
1 000 i wicej
Ogem
Liczba podmiotw
3 568 137
154 833
29 323
3 996
804
3 757 093
18
1. Wprowadzenie
Ogem
Mczyni
Kobiety
0
1-9
10-19
20-29
30-39
40-49
50-59
60 i wicej
2 338
635
1 711
4 615
7 279
19 718
52 011
291 092
1 305
373
1 206
3 721
5 723
14 705
36 916
138 394
1 033
262
505
894
1 556
5 013
15 095
152 698
Ogem
379 399
202 343
177 056
Nauczyciele akademiccy
Studenci
31 460
19 527
5 505
9 922
4 514
10 011
607
1 821
3 402
729
12 639
526 381
322 111
87 556
356 561
107 668
10 103
58 015
28 184
15 736
7 392
391 813
100 137
1 911 520
19
Przykad 1.8.6.
Wykres liniowy
30
25
mln
20
15
10
5
0
1997
1998
1999
2000
Wiek przedprodukcyjny
2001
Wiek produkcyjny
2002
2003
2004
Wiek poprodukcyjny
Wykresy bryowe
odsetek wskaza
60
40
20
0
Zdrowie
P ienidze
Rodzina
P raca
(dobrobyt)
Mio
P ozytywne Stabilizacja
relacje z
Mczyni
Kobiety
yciowa
ludmi
20
1. Wprowadzenie
adnego
Jedno
Dwoje
T roje
Czworo
Picioro i wicej
T yle, ile si zdarzy
T rudno powiedzie
0
10
20
30
40
50
odsetek wskaza
Potrzeby prokreacyjne Polakw (ile dzieci chcieliby mie w swoim yciu Polacy?)
rd o : Opracowanie wasne na podstawie Potrzeby prokreacyjne oraz preferowany i realizowany model rodziny, komunikat z bada CBOS, Warszawa, marzec 2006, s. 2, <www.cbos.pl>.
Wykres powierzchniowy
W ogle nie
imprezuj
2%
Pub, kawiarnia
24%
Grill, ognisko
40%
Dom
34%
ni
,
N
gdzie:
ni liczebno czstkowa okrelajca, ile jednostek zbiorowoci przypada na dan
warto cechy zmiennej,
N liczebno zbiorowoci.
22
xi
,
xi
gdzie:
xi warto cechy zmiennej,
xi suma wartoci cechy zmiennej.
Wskanik natenia to stosunek liczby jednostek (wartoci cechy) danej zbiorowoci do liczby jednostek (wartoci cechy) innej zbiorowoci, ktre pozostaj
w przyczynowym lub logicznym zwizku
ni
,
mi
gdzie:
ni liczba jednostek jednej zbiorowoci,
mi liczba jednostek drugiej zbiorowoci.
2.3. Miary przecite (pooenia)
Miary przecitne (pooenia) charakteryzuj zbiorowo statystyczn niezalenie
od rnic wystpujcych midzy poszczeglnymi jednostkami wchodzcymi w jej
skad. Dokonuj one charakterystyki podobiestw zbiorowoci ze wzgldu na wyrnion cech zmienn.
Podzia miar pooenia:
klasyczne
o rednia arytmetyczna (zwyka, waona),
o rednia chronologiczna,
o rednia harmoniczna,
o rednia geometryczna,
pozycyjne
o dominanta,
o kwantyle,
kwartyle (kwartyl pierwszy, mediana, kwartyl trzeci),
decyle,
percentyle (centyle).
23
xmin x x max ,
gdzie:
xmin minimalna warto cechy zmiennej,
xmax maksymalna warto cechy zmiennej,
ale nie musz (cho mog) pokrywa si z pewn wartoci badanej cechy zmiennej. Najbardziej popularna jest rednia arytmetyczna. Charakteryzuje ona redni
(przecitny) poziom cechy zmiennej w zbiorowoci. Robi to tym lepiej, im mniejsze jest zrnicowanie midzy wartociami badanej zmiennej (wartoci skrajne
mog bowiem znieksztaci rezultat oblicze).
Sposb obliczania redniej arytmetycznej:
szereg prosty (wyliczajcy) rednia arytmetyczna zwyka
N
xa
i 1
gdzie:
xi warto cechy zmiennej,
N liczebno zbiorowoci;
szereg rozdzielczy jednostopniowy (punktowy) rednia arytmetyczna waona
k
xa
x n
i
i 1
gdzie:
ni liczebno czstkowa okrelajca, ile jednostek zbiorowoci przypada na dan
warto cechy zmiennej;
24
xa
x' n
i
i 1
gdzie:
xi rodek przedziau klasowego,
ni liczebno czstkowa okrelajca, ile jednostek zbiorowoci przyjmuje warto cechy zmiennej z danego przedziau klasowego.
W szeregu przedziaowym redni arytmetyczn mona obliczy jeeli przedziay
klasowe s rwne, a szereg jest zamknity doem i gr (jeeli tak nie jest, to mona dokona zamknicia szeregu pod warunkiem, e w otwartym przedziale znajduje si nie wicej ni 5% ogu jednostek badanej zbiorowoci).
2.3.2. rednie pozycyjne
Przecitne pozycyjne oparte s na wartociach cechy zmiennej wybranych jednostek zbiorowoci charakteryzujcych si szczeglnym pooeniem. Mona je dokadnie wyznaczy w szeregach prostych (wyliczajcych) i rozdzielczych jednostopniowych (punktowych), natomiast w szeregach rozdzielczych wielostopniowych (przedziaowych) mona wskaza jedynie przedzia, w ktrym znajduje si
przecitna pozycyjna, a nastpnie oszacowa jej wartoci przy wykorzystaniu
wzoru interpolacyjnego.
2.3.2.1. Dominanta
Dominanta to warto cechy zmiennej, ktra wystpuje najczciej w badanej
zbiorowoci (warto dominujca).
Sposb wyznaczania dominanty:
szereg prosty (wyliczajcy) wyznaczenie dominanty polega na wskazaniu
najczciej powtarzajcej si wartoci cechy zmiennej,
szereg rozdzielczy jednostopniowy (punktowy) wyznaczenie dominanty polega na wskazaniu wartoci cechy zmiennej, ktrej odpowiada maksymalna liczebno,
25
D x0 c0
nd nd 1
(nd nd 1 ) (nd nd 1 )
gdzie:
x0 dolna granica przedziau dominanty,
c0 rozpito przedziau dominanty,
nd liczebno przedziau dominanty,
nd-1 liczebno przedziau poprzedzajcego przedzia dominanty,
nd+1 liczebno przedziau nastpujcego po przedziale dominanty.
W szeregu przedziaowym dominant mona oszacowa tylko wtedy, gdy przedzia dominanty oraz przedziay ssiednie (poprzedzajcy i nastpujcy) maj tak
sam rozpito. Jeeli rozkad jest symetryczny, to mona skorzysta z formuy
Kwantyle to wartoci cechy zmiennej, ktre dziel badan zbiorowo na okrelone czci pod wzgldem liczby jednostek. Wyrnia si kwartyle dzielce zbiorowo na cztery czci, decyle dzielce zbiorowo na 10 czci oraz percentyle
(centyle) dzielce zbiorowo na 100 czci.
Mediana (kwartyl drugi) to warto cechy zmiennej, ktra dzieli badan zbiorowo na dwie czci w taki sposb, e poowa jednostek zbiorowoci charakteryzuje si wartociami nie wyszymi, a poowa nie niszymi od mediany.
Sposb wyznaczania mediany:
szereg prosty (wyliczajcy):
o nieparzysty mediana jest wartoci rodkow w szeregu
N 1
,
2
M e xk ,
26
gdzie:
N liczebno zbiorowoci,
xk warto danej cechy zmiennej;
o
N
,
2
Me
xk xk 1
;
2
M e Q2 x0
c0 N
( cumn1 ) ,
n0 2
gdzie:
x0 dolna granica przedziau mediany,
c0 rozpito przedziau mediany,
n0 liczebno przedziau mediany,
N liczebno zbiorowoci,
cumn-1 skumulowana liczebno przedziau poprzedzajcego przedzia mediany.
Kwartyl pierwszy (dolny) to warto cechy zmiennej, ktra dzieli badan zbiorowo w taki sposb, e 25% jednostek zbiorowoci charakteryzuje si wartociami
nie wyszymi, a 75% jednostek nie niszymi od kwartyla pierwszego.
Sposb wyznaczania kwartyla pierwszego:
szereg prosty (wyliczajcy):
o nieparzysty
N 1
,
4
Q1 xk ,
gdzie:
N liczebno zbiorowoci,
xk warto danej cechy zmiennej;
o parzysty
N
,
4
Q1
xk xk 1
;
2
27
szereg rozdzielczy jednostopniowy (punktowy) wyznaczenie kwartyla pierwszego polega na wskazaniu w kolumnie cechy zmiennej wartoci odpowiadajcej cum N/4 (dla szeregu parzystego) lub cum (N+1)/4 (dla szeregu nieparzystego);
szereg rozdzielczy wielostopniowy (przedziaowy) wyznaczenie kwartyla
pierwszego polega na wskazaniu przedziau, w ktrym znajduje si kwartyl,
a nastpnie oszacowaniu jego wartoci w oparciu o wzr interpolacyjny
Q1 x0
c0 N
( cumn1 ) ,
n0 4
gdzie:
x0 dolna granica przedziau, w ktrym znajduje si kwartyl pierwszy,
c0 rozpito przedziau, w ktrym znajduje si kwartyl pierwszy,
n0 liczebno przedziau, w ktrym znajduje si kwartyl pierwszy,
N liczebno zbiorowoci,
cumn-1 skumulowana liczebno przedziau poprzedzajcego przedzia kwartyla pierwszego.
Kwartyl trzeci (grny) to warto cechy zmiennej, ktra dzieli badan zbiorowo
w taki sposb, e 75% jednostek zbiorowoci charakteryzuje si wartociami nie
wyszymi od kwartyla trzeciego, a 25% jednostek nie niszymi od kwartyla trzeciego.
Sposb wyznaczania kwartyla trzeciego:
szereg prosty (wyliczajcy):
o nieparzysty
3( N 1)
,
4
Q3 xk ,
gdzie:
N liczebno zbiorowoci,
xk warto danej cechy zmiennej;
o
parzysty
3N
,
4
Q3
xk xk 1
;
2
szereg rozdzielczy jednostopniowy (punktowy) wyznaczenie kwartyla trzeciego polega na wskazaniu w kolumnie cechy zmiennej wartoci odpowiadajcej cum 3N/4 (dla szeregu parzystego) lub cum 3(N+1)/4 (dla szeregu nieparzystego);
28
Q3 x0
c0 3 N
(
cumn1 ) ,
n0
4
gdzie:
x0 dolna granica przedziau, w ktrym znajduje si kwartyl trzeci,
c0 rozpito przedziau, w ktrym znajduje si kwartyl trzeci,
n0 liczebno przedziau, w ktrym znajduje si kwartyl trzeci,
N liczebno zbiorowoci,
cumn-1 skumulowana liczebno przedziau poprzedzajcego przedzia kwartyla trzeciego.
W szeregu przedziaowym kwartyle mona wyznaczy graficznie, za pomoc
krzywej liczebnoci skumulowanych (zob. przykad 2.7.3).
2.4. Miary zmiennoci (dyspersji)
Miary zmiennoci (dyspersji) charakteryzuj zbiorowo statystyczn, uwzgldniajc rnice midzy poszczeglnymi jednostkami wchodzcymi w jej skad.
Dokonuj one charakterystyki stopnia zrnicowania zbiorowoci ze wzgldu na
wyrnion cech zmienn.
Podzia miar zmiennoci:
klasyczne:
o wariancja,
o odchylenie standardowe,
o typowy obszar zmiennoci,
o klasyczny wspczynnik zmiennoci;
pozycyjne:
o rozstp,
o odchylenie wiartkowe,
o kwartylowy obszar zmiennoci,
o kwartylowy wspczynnik zmiennoci.
29
x x
N
s 2 ( x)
i 1
gdzie:
xi warto cechy zmiennej,
x rednia arytmetyczna cechy zmiennej,
N liczebno zbiorowoci;
x x
N
ni
s ( x)
i 1
gdzie:
ni liczebno czstkowa okrelajca, ile jednostek zbiorowoci przypada na
dan
warto cechy zmiennej;
szereg rozdzielczy wielostopniowy (przedziaowy)
x'
N
s 2 ( x)
i 1
x ni
N
gdzie:
xi rodek przedziau klasowego,
ni liczebno przedziau klasowego.
30
x x
N
s( x)
i 1
lub
s ( x)
gdzie:
xi warto cechy zmiennej,
x rednia arytmetyczna cechy zmiennej,
N liczebno zbiorowoci;
x
i 1
( x) 2 ,
x x
k
s ( x)
i 1
ni
,
gdzie:
ni liczebno czstkowa okrelajca, ile jednostek zbiorowoci przypada na
dan warto cechy zmiennej;
x' x
k
s( x)
i 1
ni
,
gdzie:
xi rodek przedziau klasowego,
ni liczebno przedziau klasowego.
31
x s( x) xtyp x s( x) .
Z odchyleniem standardowym wie si tzw. regua 3 sigm (twierdzenie Czebyszewa), ktra mwi, e jeeli rozkad cech w zbiorowoci jest rozkadem normalnym, to wyniki obserwacji ukadaj si tak, e w przedziale:
Vx
s ( x)
100 .
x
R xmax xmin ,
gdzie:
xmin minimalna warto cechy zmiennej,
xmax maksymalna warto cechy zmiennej.
32
Q3 Q1
,
2
gdzie:
Q1 kwartyl pierwszy,
Q3 kwartyl trzeci.
2.4.2.3. Kwartylowy obszar zmiennoci
W granicach kwartylowego obszaru zmiennoci mieci si 50% jednostek badanej
zbiorowoci
Me Q < kwartylowy obszar zmiennoci < Me + Q.
2.4.2.4. Kwartylowy wspczynnik zmiennoci
Kwartylowy wspczynnik zmiennoci jest wzgldn miar zrnicowania, ktra
informuje o sile zrnicowania badanej zbiorowoci pod wzgldem cechy zmiennej oraz umoliwia ocen mediany. Im warto wspczynnika jest wysza, tym
zrnicowanie jest silniejsze, i odwrotnie
VQ
Q
100 .
Me
33
34
As x D
Jeeli:
rozkad jest symetryczny, to As = 0,
rozkad jest asymetryczny prawostronnie, to As > 0,
rozkad jest asymetryczny lewostronnie, to As < 0.
2.5.1.2. Kwartylowy wskanik asymetrii
AQ Q1 Q 3 2Me
Jeeli:
rozkad jest symetryczny, to AQ = 0,
rozkad jest asymetryczny prawostronnie, to AQ > 0,
rozkad jest asymetryczny lewostronnie, to AQ < 0.
2.5.1.3. Trzeci moment centralny
Sposb obliczania trzeciego momentu centralnego:
szereg prosty (wyliczajcy)
3
x x
N
i 1
x x
k
35
i 1
ni
;
x' x
k
i 1
ni
.
Jeeli:
rozkad jest symetryczny, to 3 = 0,
rozkad jest asymetryczny prawostronnie, to 3 > 0,
rozkad jest asymetryczny lewostronnie, to 3 < 0.
2.5.2. Wzgldne miary asymetrii
Wzgldne miary asymetrii okrelaj zarwno kierunek, jak i si asymetrii. Im
warto bezwzgldna poszczeglnych miar (wspczynnikw) jest wysza, tym
asymetria jest silniejsza, i odwrotnie.
2.5.2.1. Klasyczno-pozycyjny wspczynnik skonoci
Was
xD
s (x)
Jeeli:
rozkad jest symetryczny, to Was = 0,
rozkad jest asymetryczny prawostronnie, to Was > 0,
rozkad jest asymetryczny lewostronnie, to Was < 0.
2.5.2.2. Kwartylowy wspczynnik skonoci
WQ
Q1 Q 3 2 Me
2Q
36
Jeeli:
rozkad jest symetryczny, to WQ = 0,
rozkad jest asymetryczny prawostronnie, to WQ > 0,
rozkad jest asymetryczny lewostronnie, to WQ < 0.
2.5.2.3. Trzeci moment centralny standaryzowany
s 3 ( x)
Jeeli:
rozkad jest symetryczny, to 3 = 0,
rozkad jest asymetryczny prawostronnie, to 3 > 0,
rozkad jest asymetryczny lewostronnie, to 3 < 0.
2.6. Miary koncentracji
Miary koncentracji okrelaj stopie skupienia poszczeglnych jednostek zbiorowoci ze wzgldu na badan cech zmienn wok redniej arytmetycznej tej
zmiennej (kurtoza) lub stopie nierwnomiernoci podziau zjawiska w zbiorowoci.
Podzia miar koncentracji:
skupienie zbiorowoci wok redniej (kurtoza):
o czwarty moment centralny,
o czwarty moment centralny standaryzowany;
nierwnomierny podzia zjawiska w zbiorowoci:
o wielobok koncentracji Lorenza,
o wspczynnik koncentracji.
37
x x
N
i 1
x x
k
i 1
ni
;
38
x' x
k
i 1
ni
.
s ( x)
Jeeli:
rozkad jest wysmuky, o skupieniu silniejszym od normalnego, to 4 > 3,
rozkad jest normalny (3= 0), to 4 = 3,
rozkad jest spaszczony, o skupieniu sabszym od normalnego, to 4 < 3.
2.6.2. Nierwnomierno podziau zjawiska w zbiorowoci
Koncentracja rozumiana jako nierwnomierny podzia zjawiska w zbiorowoci
oznacza nierwnomierne rozoenie wartoci cechy zmiennej pomidzy poszczeglne jednostki tej zbiorowoci. Jeli wszystkie jednostki zbiorowoci dysponuj
tak sam wartoci cechy zmiennej, to koncentracja nie wystpuje, natomiast jeli
jedna jednostka zbiorowoci dysponuje ca sum wartoci cechy zmiennej to wystpuje wwczas koncentracja zupena.
2.6.2.1. Wielobok koncentracji Lorenza
Wielobok koncentracji Lorenza pozwala oceni koncentracj zjawiska w sposb
graficzny, za pomoc krzywej Lorenza. Koncentracja zjawiska jest tym wiksza,
im wiksza jest powierzchnia zawarta midzy krzyw Lorenza, a lini rwnomiernego rozdziau (krzywa Lorenza jest bardziej wypuka w stosunku do linii rwnomiernego rozdziau), i odwrotnie. Jeeli krzywa Lorenza pokrywa si z lini rwnomiernego rozdziau to koncentracja nie wystpuje (zob. przykad 2.7.4).
2.6.2.2. Wspczynnik koncentracji
Wspczynnik koncentracji to stosunek powierzchni zawartej midzy krzyw Lorenza a lini rwnomiernego rozdziau do powierzchni trjkta, ktry powstaje
39
5000 Pi
5000
gdzie:
Pi pole powierzchni pod krzyw koncentracji Lorenza (suma pola trjkta i pl
trapezw),
pole trjkta: (a*h)/2,
pole trapezu: [(a+b)*h]/2.
2.7. Przykady
Przykad 2.7.1.
Wartoci temperatur (w stopniach C) zaobserwowanych w dniu 18 lipca 2009 r.
o godzinie 12.00 w miastach wojewdzkich byy nastpujce (rdo:
www.pogoda.onet.pl): 19, 24, 27, 27, 28, 29, 28, 29, 26, 19, 22, 25, 23, 25, 28, 26.
Na podstawie powyszych informacji naley:
okreli zbiorowo, jednostk i cech statystyczn,
obliczy redni arytmetyczn oraz wskaza przecitne pozycyjne (dominant,
median, kwartyle).
Rozwizanie
Zbiorowo statystyczna miasta wojewdzkie
Jednostka statystyczna miasto wojewdzkie
Cecha statystyczna (zmienna) temperatura (w stopniach C) zaobserwowana
18 lipca 2009 r. o godzinie 12:00
Porzdkowanie wariantw cechy (rosnco): 19, 19, 22, 23, 24, 25, 25, 26, 26, 27,
27, 28, 28, 28, 29, 29
rednia arytmetyczna zwyka
N
xa
i 1
405 / 16 25,31
40
Speniony jest warunek x min 19 x 25,31 x max 29 , ale rednia jest wartoci
abstrakcyjn.
rednia temperatura 18 lipca 2009 r. o godzinie 12:00 w miastach wojewdzkich
wynosia 25,31oC.
Dominanta
D = 28
Wrd miast wojewdzkich dominoway te, w ktrych temperatura 18 lipca
2009 r. o godzinie 12:00 wynosia 28oC.
Mediana
Szereg parzysty (n = 16), wic4:
k
xk xk 1 x8 x9 26 26
N
26 .
16 / 2 8 , M e
2
2
2
2
x xk 1 x4 x5 23 24
N
23,5 .
16 / 4 4 , Q1 k
2
2
2
4
W 1/4 miast wojewdzkich temperatura 18 lipca 2009 r. o godzinie 12:00 bya nie
wysza ni 23,5oC, a w 3/4 nie nisza ni 23,5oC.
Kwartyl trzeci
Szereg parzysty (n = 16), wic6:
M e x k x8 26
5
Q1 xk x4 23
6
k ( N 1) / 2 (15 1) / 2 8 ,
k ( N 1) / 4 (15 1) / 4 4 ,
Q3 xk x12 28
41
x x k 1 x12 x13 28 28
3N
28 .
48 / 4 12 , Q3 k
2
2
2
4
W 3/4 miast wojewdzkich temperatura 18 lipca 2009 r. o godzinie 12:00 bya nie
wysza ni 28oC, a w 1/4 nie nisza ni 28oC.
Przykad 2.7.2.
W dniu 20 kwietnia 2009 r. grupie studentw PWSZ w Koninie dano do rozwizania zadanie ze statystyki. Czas rozwizywania tego zadania (w minutach) przez
poszczeglne osoby zosta przedstawiony w poniszej tabeli.
Czas rozwizywania
zadania (w min.)
Liczba studentw
rd o : Dane umowne.
xi ni
cum ni
4
5
6
7
8
6
4
3
2
2
24
20
18
14
16
6
10
13
15
17
17
92
42
x n
i
xa
i 1
92 / 17 5,41 .
Speniony jest warunek xmin 4 x 5,41 xmax 8 , ale rednia jest wartoci
abstrakcyjn.
Przecitny czas rozwizywania zadania ze statystyki przez studentw PWSZ
w Koninie wynosi 5,41 minut.
Dominanta
D=4
W grupie studentw PWSZ w Koninie dominoway osoby, ktre rozwizay zadanie w cigu 4 minut.
Mediana
Szereg nieparzysty (n = 17), wic7:
k
N 1
(17 1) / 2 9 , cumn i k cumn i 9 M e 5 .
2
Poowa studentw rozwizywaa zadanie nie duej ni 5 minut, a poowa nie krcej ni 5 minut.
Kwartyl pierwszy
Szereg nieparzysty (n = 17), wic8:
k
N 1
(17 1) / 4 4,5 , cumn i k cumni 4,5 Q1 4 .
4
1/4 studentw rozwizywaa zadanie nie duej ni 4 minuty, a 3/4 nie krcej ni
4 minuty.
Gdyby
szereg
by
parzysty
cumn i k cumn i 9 M e 5 .
8
(np.
18),
to
k N / 2 18 / 2 9 ,
cumni 4,5 Q1 4 .
cumn i k
43
Kwartyl trzeci
Szereg nieparzysty (n = 17), wic9:
3 * ( N 1)
3 * (17 1) / 4 13,5 , cumn i k cumni 13,5 Q3 7 .
4
3/4 studentw rozwizywao zadanie nie duej ni 7 minut, a 1/4 nie krcej ni
7 minut.
Przykad 2.7.3.
30-40
40-50
50-60
60-70
70-80
80-90
90-100
12
25
37
62
34
22
rd o : Dane umowne.
cumni 13,5 Q1 7 .
cumn i k
44
xa
x' n
i
i 1
Przecitne wydatki na pieczywo poniesione w grudniu 2009 r. przez losowo wybrane gospodarstwa domowe wynosiy 63,95 z.
Dominanta
D x0 c0
n d n d 1
62 37
60 10 *
64,72
(n d n d 1 ) (n d n d 1 )
(62 37) (62 34)
Mediana
Szereg parzysty (n = 200), wic:
N
200 / 2 100 , cumn i k cumni 100 ,
2
c N
10
M e Q2 x0 0 ( cumn 1 ) 60 (100 74) 64,19 .
n0 2
62
45
Kwartyl pierwszy
Szereg parzysty (n = 200), wic:
k
N
200 / 4 50 , cumn i k cumni 50 ,
4
Q1 x0
10
c0 N
( cumn 1 ) 50 (50 37) 53,51 .
37
n0 4
3N
600 / 4 150 , cumn i k cumni 150 ,
4
10
c 3N
Q3 x0 0 (
cumn 1 ) 70 (150 136) 74,12 .
4
34
n0
k
46
Odchylenie standardowe
2
x' x
k
s ( x)
i 1
ni
43679
14,78
200
Wydatki na pieczywo w grupie losowo wybranych gospodarstw domowych odchylay si od wydatkw rednich przecitnie o 14,78 z.
Typowy obszar zmiennoci
x s( x) xtyp x s( x)
63,95 14,78 xtyp 63,95 14,78
49,17 xtyp 78,73
Vx
s( x)
14,78
100
100 23,11%
63,95
x
10
47
0,05
s ( x)
14,78
Was
Rozkad wydatkw poniesionych na pieczywo przez losowo wybrane gospodarstwa domowe jest asymetryczny lewostronnie (ujemnie), tzn. wikszo gospodarstw poniosa wydatki wysze od wydatkw przecitnych, a nasilenie tej asymetrii jest bardzo mae12.
Czwarty moment centralny standaryzowany
4
x' x
k
ni
i 1
s ( x)
24152669,64
120763,35
200
120763,35
2,53
47719,70
Rozkad wydatkw poniesionych na pieczywo przez losowo wybrane gospodarstwa domowe ma charakter spaszczony, tzn. koncentracja wysokoci wydatkw
wok wydatkw przecitnych jest sabsza ni w rozkadzie normalnym13.
Obliczenia pomocnicze przykad 2.7.3.
Wydatki
w z (xi)
Liczba
gospodarstw (ni)
xi
30-40
12
35
420
12
-28,95
838,10
10 057,20
702 415,80
8 428 989,60
40-50
25
45
1 125
37
-18,95
359,10
8 977,50
128 954,61
3 223 865,25
50-60
37
55
2 035
74
-8,95
80,10
2 963,70
6 416,41
237 407,17
60-70
62
65
4 030
136
1,05
1,10
68,20
1,22
75,64
70-80
34
75
2 550
170
11,05
122,10
4 151,40
14 909,02
506 906,68
80-90
22
85
1 870
192
21,05
443,10
9 748,20
19 6339,83
4 319 476,26
90-100
95
760
200
31,05
964,10
7 712,80
929 493,63
7 435 949,04
24 152 669,64
12
200
xi ni
12 790
cumni
xi
(xi
x )2
(xi
x )2 ni
43 679,00
(xi
x )4
(xi
x )4 ni
48
Liczba
wojewdztw
Liczba
spek
Odsetek
wojewdztw
Odsetek
spek
Skumulowany odsetek
wojewdztw
spek
poniej 200
275
12,50
1,48
12,50
1,48
200-500
1 329
25,00
7,18
37,50
8,66
500-1000
2 121
18,75
11,46
56,25
20,12
1000-2000
6 812
31,25
36,79
87,50
56,91
2000 i wicej
7 978
12,50
43,09
100,00
100,00
16
18 515
100,00
100,00
Przykad 2.7.4.
Na podstawie danych zawartych w poniszej tabeli naley ustali za pomoc metody graficznej i rachunkowej koncentracj spek z udziaem kapitau zagranicznego w polskich wojewdztwach w 2007 r.
Grupy wojewdztw wg liczby
spek z udziaem kapitau
zagranicznego
Liczba wojewdztw
Liczba spek
poniej 200
275
200-500
1 329
500-1000
2 121
1000-2000
6 812
2000 i wicej
7 978
Rozwizanie
O wystpowaniu koncentracji spek z udziaem kapitau zagranicznego w polskich wojewdztwach wiadczy zarejestrowanie w dwch wojewdztwach (mazowieckie i dolnolskie) ponad 40% wszystkich spek.
49
linia
rwnomiernego
rozdziau
krzywa Lorenza
3
1
5000 Pi
5000 2590,59
0,482
5000
5000
Wspczynnik rwny 0,482 wiadczy o do silnej koncentracji spek z udziaem
kapitau zagranicznego w polskich wojewdztwach w 2007 r.
k
14
Koncentracja jest tym wiksza, im wiksza jest powierzchnia zawarta midzy krzyw Lorenza
a lini rwnomiernego rozdziau.
50
2.8. Zadania
Zadanie 2.8.1.
2005
2006
2007
2008
AKTYWA
A. Aktywa trwae
B. Aktywa obrotowe
101 979
153 506
124 594
175 468
158 078
200 820
191 989
213 731
Aktywa razem
255 485
300 062
358 898
405 720
PASYWA
A. Kapita wasny
B. Zobowizania i rezerwy na
zobowizania
88 654
166 831
116 012
184 050
178 263
180 635
211 890
193 830
Pasywa razem
255 485
300 062
358 898
405 720
51
Zadanie 2.8.2.
2005
2006
2007
2008
4 093
6 036
5 785
9 459
4 650
9 056
4 954
10 372
10 129
15 244
13 706
15 326
7 693
2 436
11 382
3 862
10 124
3 582
11 201
4 125
10 129
15 244
13 706
15 326
AKTYWA
A. Aktywa trwae
B. Aktywa obrotowe
Aktywa razem
PASYWA
A. Kapita wasny
B. Zobowizania i rezerwy na
zobowizania
Pasywa razem
52
Zadanie 2.8.4.
W styczniu 2010 r. odnotowano nastpujce zuycie wody (w m3) wrd gospodarstw domowych zamieszkaych w budynku przy ulicy Wesoej 4 w Koninie
(rdo: dane umowne):
10, 12, 4, 15, 7, 6, 8, 4, 9, 7, 12, 6, 13, 3, 11, 10, 12, 5, 2, 8.
W oparciu o powysze informacje naley:
okreli zbiorowo, jednostk i cech statystyczn,
obliczy redni arytmetyczn oraz wskaza przecitne pozycyjne (dominant,
median, kwartyle).
Zadanie 2.8.6.
Cena kilograma truskawek (w z) na 19 stoiskach koniskiego targowiska ksztatoway si 20 czerwca 2009 r. ceny kilograma truskawek (w z) na 19 stoiskach
zlokalizowanych na koniskim targowisku ksztatoway si nastpujco (rdo:
dane umowne):
3,50; 3,40; 4,60; 3,70; 3,20; 4,10; 5,00; 4,80; 3,60; 3,50; 3,90; 4,00; 4,30; 4,70;
4,50; 3,50; 3,70; 4,00; 3,50.
W oparciu o powysze informacje naley:
okreli zbiorowo, jednostk i cech statystyczn,
obliczy redni arytmetyczn oraz wskaza przecitne pozycyjne (dominant,
median, kwartyle).
53
Zadanie 2.8.7.
Liczba pracownikw
rd o : Dane umowne.
Pracownikw firmy Igrek zapytano o wielko ich gospodarstw domowych mierzon liczb osb. Uzyskane informacje pogrupowano, tworzc poniszy szereg
(stan na 31 grudnia 2009 r.).
Liczba osb
w gospodarstwie
Liczba pracownikw
14
25
32
17
10
rd o : Dane umowne.
54
Zadanie 2.8.9.
15-25
25-35
35-45
45-55
55-65
65-75
75-85
14
18
28
10
Liczba mieszka
rd o : Dane umowne.
Zadanie 2.8.10.
0-50
7
12
rd o : Dane umowne.
Zadanie 2.8.11.
0-4
4-8
8-12
12-16
16-20
20-24
24-28
28-32
30
25
15
10
rd o : Dane umowne.
55
Czas obsugi przy kasie 200 losowo wybranych klientw koniskiego hipermarketu Zet w dniu 30 wrzenia 2009 r. przedstawia si nastpujco:
Czas obsugi
(w sekundach)
20-40
40-60
60-80
80-100
Liczba klientw
16
32
50
20
10
rd o : Dane umowne.
Dysponujc informacjami na temat wieku pracownikw dwch firm (A i B) zlokalizowanych w Koninie, naley przeprowadzi kompleksow analiz porwnawcz
badanych zbiorowoci (stan na 31 grudnia 2009 r.).
Wiek (w latach)
24-26
26-28
28-30
30-32
32-34
34-36
36-38
38-40
40-42
Liczba pracownikw
firmy A
44
56
92
31
27
25
14
Liczba pracownikw
firmy B
29
35
47
56
64
79
32
rd o : Dane umowne.
56
Zadanie 2.8.14.
0-2
2-4
4-6
6-8
8-10
10-12
12-14
14-16
16-18
Liczba studentw
specjalno FiRP
18
34
27
Liczba studentw
Specjalno ZIiN
17
20
18
11
rd o : Dane umowne.
Zadanie 2.8.15.
Struktura Polakw ze wzgldu na przynaleno do poszczeglnych grup wiekowych w 2008 r. przedstawiaa si nastpujco:
Wiek (w latach)
Liczba osb (w tys.)
19 i mniej
20-39
40-59
60-79
80 i wicej
8 449,7
11 841,3
10 765,8
5 878,8
1 200,2
W drodze badania ankietowego zapytano uytkownikw 50 gospodarstw domowych o wysoko ich miesicznych wydatkw na ywno (w z). Otrzymano nastpujce informacje (rdo: dane umowne):
6 gospodarstw wydaje mniej ni 800 z,
16 gospodarstw wydaje mniej ni 1000 z,
34 gospodarstwa wydaj mniej ni 1200 z,
44 gospodarstwa wydaj mniej ni 1400 z.
57
Biorc po uwag, e maksymalna wysoko wydatkw wrd gospodarstw objtych badaniem wynosi nie wicej ni 1600 z, a minimalna nie mniej ni 600 z,
wyznaczy redni wysoko miesicznych wydatkw na ywno.
Zadanie 2.8.17.
Znane s informacje o stau pracy pracownikw pewnego przedsibiorstwa (rdo: dane umowne):
xmin = 4 lata,
xmax = 17 lat.
Ktra z podanych niej liczb jest redni arytmetyczn stau pracy wszystkich
pracownikw tego przedsibiorstwa?
3, 20, 9.
Zadanie 2.8.18.
Struktura wieku osb, ktre zawary zwizek maeski w Polsce w 2008 r.,
przedstawiaa si nastpujco:
Wiek nowoecw
(w latach)
19 i mniej
Liczba nowoecw
16 173
20-24
25-29
30-39
40-49
50 i wicej
94 643
18 198
18 158
58
Zadanie 2.8.19.
Obserwacj objto pracownikw pewnego zakadu ze wzgldu na ich wzrost. Rezultaty obserwacji prezentuje ponisza tabela.
Parametry
Wzrost w cm
xa
175,0
Me
173,5
D
s(x)
172,0
9,0
rd o : Dane umowne.
Mczyni
Kobiety
xa
50
45
Me
44
D
s(x)
52
6
rd o : Dane umowne.
59
Mczyni
Kobiety
xa
1800
1600
Me
1900
1500
D
s(x)
2000
1400
200
300
rd o : Dane umowne.
Dysponujc poniszymi wielkociami wyznaczonymi na podstawie szeregu przedziaowego, naley scharakteryzowa za pomoc parametrw opisowych rozkad
dochodw (w tys. z) w prbie 100 gospodarstw domowych oraz naszkicowa
przybliony wykres krzywej liczebnoci i zaznaczy pooenie miar tendencji centralnej.
k
x
i 1
'
i
ni 760 ,
(x
i 1
k
(x
i 1
'
i
x) 2 ni 484 ,
'
i
x) 4 ni 7196,82 ,
D 7,5 ,
M e 7,6 .
60
Zadanie 2.8.24.
24 i mniej
25-29
30-39
40-49
50 i wicej
4,21
15,95
39,21
24,34
16,29
Liczba miast
Liczba ludnoci
(w tys. osb)
poniej 10
492
2 273,4
10-20
180
2 643,9
20-50
134
4 192,3
50-100
47
3 211,0
100-200
22
3 044,4
200 i wicej
17
7 923,1
rdo: Ludno. Stan i struktura w przekroju terytorialnym. Stan w dniu 31 XII 2008 r.,
<www.stat.gov.pl>.
61
Zadanie 2.8.26.
Na podstawie danych zawartych w poniszej tabeli naley ustali za pomoc metody graficznej i rachunkowej koncentracj powierzchni gospodarstw rolnych
w Polsce w 2007 r.
Grupy gospodarstw
wg powierzchni (w ha)
Liczba gospodarstw
poniej 2
1 193 583
944 139
2-5
613 978
1 989 940
5-10
399 868
2 836 174
10-20
243 909
3 352 972
20-50
102 315
2 955 545
50 i wicej
21 461
2 339 429
Analiza korelacji pozwala okreli si zalenoci midzy zmiennymi, a w przypadku zalenoci liniowej dwch zmiennych take kierunek tej zalenoci.
Si zwizku midzy zmiennymi okrela si za pomoc szeregu miar, ktrych wybr zaley od tego, czy zmienne maj charakter mierzalny, czy te niemierzalny.
W pierwszym przypadku mona wykorzysta wspczynnik korelacji liniowej
Pearsona, natomiast w drugim m.in. skorygowany wspczynnik kontyngencji,
wspczynnik Czuprowa i wspczynnik zbienoci V-Cramera.
63
Wspczynnik korelacji Pearsona okrela kierunek i si zalenoci dwch zmiennych mierzalnych. Przyjmuje on wartoci z przedziau <1; 1>, przy czym im jego
warto jest blisza 1 lub 1, tym zaleno jest silniejsza, a im blisza 0, tym zaleno jest sabsza.
n
r xy
i 1
( x i x )( y i y )
n s( x) s( y)
lub
r xy
1
n
xy
i 1
xy
s( x) s( y)
64
gdzie:
2
x x
n
s ( x)
i 1
lub
s ( x)
y y
i
s( y )
i 1
lub
s( y)
( x) 2 ,
i 1
y
i 1
( y) 2 ,
xi warto zmiennej x,
yi warto zmiennej y,
x rednia arytmetyczna zmiennej x,
y rednia arytmetyczna zmiennej y,
n liczba par obserwacji.
Wspczynnik korelacji mona wyznaczy rwnie na podstawie wspczynnikw
kierunkowych liniowej funkcji regresji15:
r xy b y b x ,
gdzie:
65
C skor
C xy
C max
gdzie:
C xy
2 n
r 1
k 1
r
k
,
2
C max
r
i 1 j 1
(nij n ij ) 2
^
n ij
n ij
ni. n. j
n
n ij liczebno teoretyczna,
16
Przy obliczaniu testu niezalenoci chi-kwadrat naley oprze si na dostatecznie duej prbie, oraz w taki sposb podzieli obszar wartoci X i Y na grupy, aby w kadej kratce tablicy wielodzielczej znalaza si dostatecznie dua liczebno teoretyczna (5).
66
ni. nij liczebno brzegowa liczona dla i-tego wiersza po wszystkich koj
lumnach,
n. j nij liczebno brzegowa liczona dla j-tej kolumny po wszystkich wierszach.
Txy
2
n (r 1)(k 1)
Vc
2
n g
gdzie:
g = min (r 1, k 1).
3.3. Analiza regresji
Analiza regresji pozwala okreli powizania midzy zmiennymi, tj. zmienn niezalen (objaniajc) a zmienn zalen (objanian), za pomoc odpowiedniej
funkcji matematycznej (funkcji regresji).
3.3.1. Metoda Najmniejszych Kwadratw (MNK)
y a y by x ,
x a x bx y ,
67
gdzie:
ax, ay wyraz wolny,
bx wspczynnik regresji zmiennej x wzgldem y,
by wspczynnik regresji zmiennej y wzgldem x.
Parametry powyszych funkcji mona oszacowa posugujc si metod najmniejszych kwadratw. Pozwala ona znale takie wspczynniki rwna regresji, aby
suma kwadratw odchyle poszczeglnych wartoci empirycznych od wartoci
teoretycznych zmiennej bya jak najmniejsza
n
(y
i 1
(x
i 1
y i ) ( y i a y b y x) min ,
i 1
x i ) ( xi a x bx y ) min .
i 1
Powysze wyraenia s funkcjami dwch zmiennych a i b, wic problem sprowadza si do znalezienia minimum tych funkcji. Obliczajc pochodne czstkowe
wzgldem a i b oraz przyrwnujc je do zera (w celu sprawdzenia warunku koniecznego istnienia ekstremum funkcji dwch zmiennych) otrzymujemy tzw. ukad
rwna normalnych:
dla funkcji regresji zmiennej y wzgldem x:
yi na y by xi
i 1
n
x y
i 1
i 1
a y xi b y x
i 1
i 1
2
i
xi na x bx yi
i 1
n
i 1
xi yi a x yi bx yi2
i 1
i 1
i 1
68
by
i 1
i 1
i 1
n xi y i xi y i
n
n xi2 xi
i 1
i 1
n
a y y by x
a x x bx y .
oraz
bx
i 1
i 1
i 1
n xi y i xi y i
n
n yi2 yi
i 1
i 1
n
Wspczynniki rwna regresji mona oszacowa rwnie porednio, wykorzystujc relacj midzy wspczynnikiem korelacji linowej i odchyleniami standardowymi badanych zmiennych
b y rxy
s( y)
,
s ( x)
bx rxy
s ( x)
.
s( y )
Sx
(x
i 1
xi )2
n2
s( x) 1
2
xy
Sy
69
( yi y i )2
i 1
s( y) 1
;
xy
n2
wspczynnik determinacji okrelajcy stopie, w jakim oszacowana funkcja
regresji wyjania zmienno zmiennej y lub x; wspczynnik przyjmuje wartoci z przedziau <0, 1>; im bliej 1, tym oszacowana funkcja regresji jest lepiej
dopasowana do danych empirycznych, i odwrotnie:
R2
xy
Sy
100 .
y
3.4. Przykady
Przykad 3.4.1.
Zbadano zaleno midzy powierzchni nieruchomoci zlokalizowanych w okolicach Konina a ich wartoci. Uzyskane informacje przedstawiono w poniszej
tabeli.
Powierzchnia nieruchomoci (w m2)
219
80
222
100
211
133
182
269
Warto (w tys. z)
380
140
390
265
370
230
248
420
rd o : Dane umowne.
70
50
100
150
200
250
300
xi
xi x
yi y
219
80
222
100
211
133
182
269
380
140
390
265
370
230
248
420
42,00
-97,00
45,00
-77,00
34,00
-44,00
5,00
92,00
1416
2443
Powierzchnia
w m2 (xi)
y i y )2
xi x )
*(
yi y )
x i x )2
74,62
-165,38
84,62
-40,38
64,62
-75,38
-57,38
114,62
1 764,00
9 409,00
2 025,00
5 929,00
1 156,00
1 936,00
25,00
8 464,00
5 568,14
27 350,54
7 160,54
1 630,54
4 175,74
5 682,14
3 292,46
13 137,74
3 134,04
16 041,86
3 807,90
3 109,26
2 197,08
3 316,72
-286,90
10 545,04
30 708,00
67 997,84
41 865,00
71
xa
i 1
ya
1416 / 8 177 ,
i 1
2443 / 8 305,38
Odchylenie standardowe
2
x x
n
s ( x)
i 1
30708
61,96 ,
8
2
y y
n
s( y )
i 1
67997,84
92,19
8
r xy
(x
i 1
x )( y i y )
n s( x) s( y)
41865
0 , 92
8 61 ,96 92 ,19
Midzy powierzchni nieruchomoci a ich wartoci zachodzi bardzo silna, dodatnia zaleno17.
Wspczynnik determinacji
R2
2
xy
0 , 92 2 0 ,85
Zmiany wartoci nieruchomo s w 85% uwarunkowane zmianami ich powierzchni, a w 15% zmianami innych czynnikw o charakterze losowym lub pozalosowym.
Linie regresji
y a y by x
17
Zarwno w przedstawionym przykadzie, jak i zaproponowanych zadaniach oparto si na maych prbach. W zwizku z tym, naleaoby zweryfikowa istotno zalenoci midzy zmiennymi
za pomoc testu dla wspczynnika korelacji liniowej. Kwestia ta zostaa jednak pominita w niniejszym opracowaniu, bo stanowi element wnioskowania statystycznego, a nie statystyki opisowej.
72
s( y)
(x x)
s( x)
92 ,19
y 305 , 38 0 , 92
( x 177 )
61 , 96
y y r xy
y 1, 37 x 63 , 09
x a x bx y
s(x)
( y y)
s( y)
61 ,96
x 177 0 ,92
( y 305 , 38 )
92 ,19
x x r xy
x 0 , 62 y 11 ,82
y 1, 37 x 63 , 09
x 0 , 62 y 11 ,82
73
y 1, 37 x 63 , 09
x = 150
y 1, 37 150 63 , 09 268 , 59
x 0 , 62 y 11 ,82
y = 200
74
Sy
36 ,13
100
100 11 ,83 %
305 ,38
y
34
46
60
82
86
90
100
Jednostkowe koszty
produkcji (w z)
120
100
76
68
64
60
56
rd o : Dane umowne.
75
Rozwizanie
Diagram korelacyjny
yi 150
120
90
60
30
0
0
20
40
60
80
100
120
xi
Z diagramu korelacyjnego wynika, e midzy wielkoci produkcji a jednostkowym kosztem produkcji pewnego dobra zachodzi ujemny zwizek korelacyjny,
tzn. wraz ze wzrostem wielkoci produkcji maleje koszt jednostkowy, i odwrotnie.
Obliczenia pomocnicze
Jednostkowe
koszty
produkcji
w z (yi)
xi x
yi y
( x i x )2
34
120
-37,14
42,29
1 379,59
1 788,08
-1 570,61
46
100
-25,14
22,29
632,16
496,65
-560,33
60
76
-11,14
-1,71
124,16
2,94
19,10
82
68
10,86
-9,71
117,88
94,37
-105,47
86
64
14,86
-13,71
220,73
188,08
-203,76
90
60
18,86
-17,71
355,59
313,80
-334,04
100
56
28,86
-21,71
832,73
471,51
-626,61
498
544
3 662,84
3 355,43
-3 381,72
Wielko
produkcji
w tys. szt.
(xi)
yi
y )2
( xi x )
*(
yi y )
76
xa
i 1
ya
498 / 7 71,14
i 1
544 / 7 77,71
Odchylenie standardowe
2
x x
n
s ( x)
i 1
y y
n
3662,84
22,87
7
s( y )
i 1
3355,43
21,89
7
r xy
(x
i 1
x )( y i y )
n s( x) s( y)
3381 , 72
0 ,97
7 22 ,87 21 ,89
R2
xy
( 0 , 97 ) 2 0 , 94
Zmiany jednostkowych kosztw produkcji pewnego dobra s w 94% uwarunkowane zmianami wielkoci produkcji, a w 6% zmianami innych czynnikw o charakterze losowym lub pozalosowym.
Linie regresji
y a y by x
y y r xy
s( y)
(x x)
s(x)
y 77 , 71 ( 0 , 97 )
21 ,89
( x 71 ,14 )
22 ,87
y 0 , 93 x 143 , 76
77
x a x bx y
s(x)
( y y)
s( y)
22 ,87
x 71 ,14 ( 0 ,97 )
( y 77 , 71 )
21 ,89
x x r xy
x 1, 01 y 149 ,89
y 0 , 93 x 143 , 76
x 1, 01 y 149 ,89
78
y 0 , 93 x 143 , 76
x = 70
y 0 , 93 70 143 , 76 78 , 66
Koszt jednostkowy w przedsibiorstwie produkujcym 70 tys. sztuk pewnego dobra, wynosiby 78,66 z, gdyby korelacja bya doskonaa (zaleno funkcyjna,
linie regresji pokrywayby si, r = 1). Poniewa tak nie jest, dokonany szacunek
naley skorygowa o bd standardowy szacunku (odchylenie standardowe skadnika resztowego):
S y s ( y ) 1 r xy 21 ,89 1 ( 0 ,97 ) 2 5 ,32 ,
2
x 1, 01 y 149 ,89
y = 80
x 1, 01 80 149 ,89 69 , 09
79
Sy
5 ,32
100
100 6 ,85 %
77 , 71
y
34,0
22,0
14,8
13,9
7,8
8,6
10,0
Liczba orzeczonych
rozwodw (w tys.)
9,2
4,4
1,9
2,3
1,8
1,3
2,8
W siedmiu wojewdztwach zachodniej Polski (lubuskie, wielkopolskie, zachodniopomorskie, dolnolskie, opolskie, kujawsko-pomorskie, pomorskie) odnotowano w 2007 r. nastpujc liczb zarejestrowanych samochodw osobowych
oraz liczb wypadkw drogowych:
80
Liczba samochodw
(w tys. sztuk)
405,9
1 483,1
570,6
1 097,2
429,6
733,8
852,9
Liczba wypadkw
drogowych (w tys.)
0,9
4,9
1,9
3,1
1,1
2,0
3,1
rdo: Transport wyniki dziaalnoci w 2007 r., GUS, Warszawa 2008 oraz Bank Danych Regionalnych GUS.
W serwisie internetowym motoAllegro odnaleziono kilka ofert sprzeday samochodw marki Volkswagen Golf, odnotowujc jednoczenie rok produkcji aut oraz
ich cen. Informacje te przedstawiono w poniszej tabeli.
Wiek samochodu
(w latach)
Cena (w tys. z)
55
38
36
33
25
20
81
Zadanie 3.5.4.
15
20
25
30
35
40
440
430
430
380
360
350
rd o : Dane umowne.
y 15,6 1,4 x ,
x 11 0,7 y ,
gdzie:
x sta pracy robotnikw (w latach),
y odsetek brakw powstaych przy wytwarzaniu przez robotnikw pewnego wyrobu (w szt.).
Okrel kierunek i si zwizku korelacyjnego.
82
Zadanie 3.5.6.
y 1,66 0,3 x ,
x 4,6 2,9 y .
y 3,
x 5.
Zadanie 3.5.8.
y 0,98 x 2,64 .
Ile powinien wynosi czas przeznaczony na konserwacj i naprawy 4-letniej kserokopiarki, przy zaoeniu, e r = 1?
83
Zadanie 3.5.10.
Ponisze rwnanie regresji przedstawia zaleno pomidzy powierzchni sklepw obuwniczych w pewnym miecie (x w m2) a wysokoci ich dziennego
utargu (y w tys. z):
x 3,5 y 27,2 .
Ile powinna wynosi powierzchnia sklepu, ktry osiga dzienny utarg na poziomie
800 z, przy zaoeniu, e r = 1.
Zadanie 3.5.11.
s( x) 676,23
s ( y ) 14,32
Wyznacz rwnanie regresji przedstawiajce zaleno odsetka mieszkacw obsugiwanych przez komunalne oczyszczalnie ciekw od wysokoci dochodw
wasnych uzyskiwanych przez gminy oraz oszacuj odsetek mieszkacw obsugiwanych przez oczyszczalnie ciekw w gminie, ktra osiga dochody wasne na
poziomie 1 tys. z w przeliczeniu na mieszkaca.
Zadanie 3.5.12.
y 2,7 x 19,12 ,
99,74% studentw mieszkao w odlegoci od 1,48 do 37,35 km od uczelni,
zrnicowanie czasu dojazdu do szkoy, mierzone odchyleniem standardowym, wynosio 17,84 minut.
84
Badanie przeprowadzone w 10 spkach pomidzy cen ich akcji (x w z) a wysokoci dywidendy wypaconej akcjonariuszom (y w z) dostarczyo nastpujcych wynikw:
przecitna cena akcji wynosia 65,5 z , a rednia wysoko dywidendy wypaconej od jednej akcji bya rwna 6,8 z,
wspczynnik zmiennoci cen akcji wynosi 37,78%, natomiast wzgldna dyspersja wysokoci dywidendy bya rwna 48,24%,
wspczynnik korelacji miedzy wyrnionymi zmiennymi wynosi 0,99.
Na podstawie powyszych informacji naley:
wyznaczy lini regresji prezentujc zaleno wysokoci dywidendy od ceny
akcji,
oszacowa wysoko dywidendy dla akcji, ktrej cena wynosiaby 200 z,
okreli, w jakim stopniu zmienno cen akcji wyjania zmienno wysokoci
dywidendy.
Zadanie 3.5.14.
Zbadano zaleno midzy wysokoci dziennego obrotu (y w z) a liczb zatrudnionych ekspedientek (x w osobach) w 10 sklepach spoywczych. Liczba
ekspedientek w sklepach objtych badaniem wynosia ogem 50 osb, a suma ich
kwadratw 310. Dzienne obroty sklepw natomiast wynosiy cznie 20880 z,
a poowa sklepw osigna obroty nie wysze ni 2072 z. Wiadomo te, e rozkad dziennych obrotw jest asymetryczny prawostronnie, a natenie tej asymetrii
wynosi 0,05. Ponadto, okazao si, e przy wzrocie liczby ekspedientek o 1 osob
mona spodziewa si wzrostu dziennego obrotu rednio o 381 z. Na podstawie
tych informacji naley:
okreli si badanego zwizku i jego kierunek,
oszacowa dzienny obrt w sklepie zatrudniajcym 12 ekspedientek,
wyjani, czy jest moliwe, by wicej ni 10% zmiennoci dziennego obrotu
nie zostao wyjanione przez oszacowan funkcj regresji.
85
Zadanie 3.5.15.
86
Zadanie 3.5.17.
2-3 razy
w tygodniu
raz w tygodniu
rzadziej
Konin
68
26
19
31
miasta powiatowe
13
17
13
22
inne miejscowoci
28
41
56
108
Posugujc si powyszymi informacjami naley ustali, czy o czstotliwoci korzystania z internetu decyduje miejsce zamieszkania studentw (wykorzysta skorygowany wspczynnik kontyngencji, wspczynnik Czuprowa oraz wspczynnik zbienoci V-Cramera).
Analiza struktury zbiorowoci i analiza wspzalenoci zjawisk pozwalaj scharakteryzowa zbiorowo statystyczn pod wzgldem jednej lub kilku cech zmiennych (w izolacji lub powizaniu), ale tylko w ujciu statycznym. Z kolei zmiany
poziomu cechy zmiennej w czasie mona oceni dziki analizie dynamiki zjawisk.
Zakres analizy dynamiki zjawisk:
metody indeksowe,
dekompozycja szeregu czasowego.
4.2. Metody indeksowe
88
Pab / 0 yt y0 ,
gdzie:
yt poziom zjawiska w badanym okresie,
y0 poziom zjawiska w okresie bazowym,
jeeli:
o nastpi spadek poziomu zjawiska, to Pab/0 < 0,
o nastpi wzrost poziomu zjawiska, to Pab/0 > 0,
o zjawisko pozostao na niezmienionym poziomie, to Pab/0 = 0;
Pab / t 1 yt yt 1 ,
gdzie:
yt poziom zjawiska w badanym okresie,
yt-1 poziom zjawiska w okresie bezporednio poprzedzajcym okres badany,
jeeli:
o nastpi spadek poziomu zjawiska, to Pab/t-1 < 0,
o nastpi wzrost poziomu zjawiska, to Pab/t-1 > 0,
o zjawisko pozostao na niezmienionym poziomie, to Pab/t-1 = 0.
4.2.2. Przyrosty wzgldne
Pwz / 0
yt y0
y0
lub
Pwz / 0
89
yt y0
100 ,
y0
gdzie:
yt poziom zjawiska w badanym okresie,
y0 poziom zjawiska w okresie bazowym,
jeeli:
o nastpi spadek poziomu zjawiska, to Pwz/0 < 0,
o nastpi wzrost poziomu zjawiska, to Pwz/0 > 0,
o zjawisko pozostao na niezmienionym poziomie, to Pwz/0 = 0;
Pwz / t 1
y t y t 1
y t 1
lub
Pwz / t 1
y t y t 1
100 ,
y t 1
gdzie:
yt poziom zjawiska w badanym okresie,
yt-1 poziom zjawiska w okresie bezporednio poprzedzajcym okres badany,
jeeli:
o nastpi spadek poziomu zjawiska, to Pwz/t-1 < 0,
o nastpi wzrost poziomu zjawiska, to Pwz/t-1 > 0,
o zjawisko pozostao na niezmienionym poziomie, to Pwz/t-1 = 0.
4.2.3. Indywidualne indeksy dynamiki
it / 0
yt
y0
lub
it / 0
yt
100 ,
y0
90
gdzie:
yt poziom zjawiska w badanym okresie,
y0 poziom zjawiska w okresie bazowym,
jeeli:
o nastpi spadek poziomu zjawiska, to it/0 < 1 lub it/0 < 100%,
o nastpi wzrost poziomu zjawiska, to it/0 > 1 lub it/0 > 100%,
o zjawisko pozostao na niezmienionym poziomie, to it/0 = 1 lub it/0 = 100%;
it / t 1
yt
lub
y t 1
it / t 1
yt
100 ,
y t 1
gdzie:
yt poziom zjawiska w badanym okresie,
yt-1 poziom zjawiska w okresie bezporednio poprzedzajcym okres badany,
jeeli:
o nastpi spadek poziomu zjawiska, to it/t-1 < 1 lub it/t-1 < 100%,
o nastpi wzrost poziomu zjawiska, to it/t-1 > 1 lub it/t-1 > 100%,
o zjawisko pozostao na niezmienionym poziomie, to it/t-1 = 1 lub it/t-1 = 100%.
redniookresowe tempo zmian to wskanik, ktry informuje, o ile procent, przecitnie biorc, zmienia si poziom zjawiska z okresu na okres w caym przedziale
czasowym objtym obserwacj. Wskanik ten mona wyznaczy tylko wtedy, gdy
zmiany w poziomie badanego zjawiska miay charakter jednokierunkowy (albo
wzrosty, albo spadki).
S t / t 1
n 1
i
t 2
t / t 1
100 ,
91
gdzie:
it/t-1 indywidualny indeks dynamiki o podstawie zmiennej (w postaci
uamka dziesitnego),
n liczba badanych okresw;
S t / t 1 n 1
yn
100 ,
y1
gdzie:
yn poziom zjawiska w ostatnim badanym okresie,
y1 poziom zjawiska w pierwszym badanym okresie,
jeeli:
o nastpowa spadek poziomu zjawiska z okresu na okres, to
S t / t 1 < 100%,
o nastpowa wzrost poziomu zjawiska z okresu na okres, to
S t / t 1 > 100%.
Na podstawie danych o redniookresowym tempie zmian mona prognozowa
poziom badanego zjawiska w przyszoci wykorzystujc w tym celu formu:
( p n )
ytp y n S t / t 1 ,
gdzie:
S t / t 1 redniookresowe tempo zmian (wyraone w postaci uamka dziesitnego),
yn poziom zjawiska w ostatnim badanym okresie,
n liczba badanych okresw,
p numer okresu, ktrego dotyczy prognoza.
92
q p
i
Iw
i 1
n
p0
100 ,
i 1
gdzie:
qi ilo w okresie badanym,
q0 ilo w okresie podstawowym,
pi cena w okresie badanym,
p0 cena w okresie podstawowym;
agregatowe indeksy iloci, ktre informuj, o ile wzrosa lub spada ilo
badanej grupy dbr w okresie badanym w porwnaniu z okresem podstawowym, przy unieruchomieniu cen na poziomie z okresu:
o podstawowego agregatowy indeks iloci Laspeyresa
n
q p
i
Iq
i 1
n
p0
100
i 1
q p
i
Iq
i 1
n
pi
100 .
i 1
Iq
Iq P Iq ;
93
agregatowe indeksy cen, ktre informuj, o ile wzrosy lub spady ceny badanej grupy dbr w okresie badanym w porwnaniu z okresem podstawowym,
przy unieruchomieniu iloci na poziomie z okresu:
o podstawowego agregatowy indeks cen Laspeyresa
n
p q
i
Ip
i 1
n
q0
100 ,
i 1
p q
i
Ip
i 1
n
qi
100 .
i 1
Ip
I p P Ip .
94
Wyodrbnienia tendencji rozwojowej (wygadzenia szeregu dynamicznego) mona dokona, wykorzystujc m.in. metody mechaniczne i analityczne.
4.3.1.1. Metoda mechaniczna rednia ruchoma
Czsto stosowana mechaniczna metoda wyrwnywania szeregw czasowych polega na obliczeniu tzw. rednich ruchomych, czyli rednich arytmetycznych
z okrelonej liczby wyrazw szeregu. Wyznaczenie rednich ruchomych polega na
zastpowaniu danych empirycznych z kolejnych okresw rednimi poziomami
z okresu badanego i kilku okresw ssiednich, dziki czemu eliminuje si wystpujce wahania.
Jeeli kolejne wartoci szeregu dynamicznego (chronologicznego) oznaczymy
jako y1, y2 yn , to redni ruchom oblicza si w nastpujcy sposb:
rednia ruchoma trzyokresowa
_
yn 1
yn 2 yn 1 yn
,
3
yn2
yn 4 yn 3 yn 2 yn 1 yn
.
5
95
onego szeregiem danych miesicznych stosuje si rednie ruchome dwunastookresowe, a dla cyklu wyraonego szeregiem danych kwartalnych czterookresowe). Poniewa liczba okresw jest wtedy zazwyczaj parzysta, pojawia si problem z przyporzdkowaniem uzyskanych rednich do odpowiednich okresw. Oblicza si wwczas tzw. rednie ruchome scentrowane.
Jeeli kolejne wartoci szeregu dynamicznego (chronologicznego) oznaczymy
jako y1, y2 yn , to redni ruchom scentrowan czterookresow oblicza si
w nastpujcy sposb:
y n2
1
1
yn 4 yn 3 yn 2 yn 1 yn
2
2
.
4
y t a bt ,
18
96
z tego:
n
y
t 1
yt b t
t 1
b t
n
n y t t y t t
t 1
t 1
t 1
2
n t t
t 1
t 1
n
gdzie:
a poziom badanego zjawiska w okresie wyjciowym (tzn. dla t = 0),
b okresowy wzrost (b > 0) lub spadek (b < 0) wielkoci badanego zjawiska,
t numer okresu, gdzie t = 1, 2,...,n,
n liczba okresw;
Sy
1
nk
t 1
yt y t ,
gdzie:
k liczba szacowanych parametrw (w przypadku funkcji liniowej k = 2),
nk liczba stopni swobody,
o wspczynnika zbienoci wskazujcego, jaka cz zmiennoci badanego
zjawiska nie zostaa wyjaniona przez skonstruowan funkcj trendu;
wspczynnik przyjmuje wartoci z przedziau <0,1>, przy czym uznaje
si, e funkcja jest dobrze dopasowana do danych empirycznych, gdy
wspczynnik nie przekracza wartoci 0,2:
n
t 1
n
t
y
y
t 1
yt
97
o wspczynnika determinacji okrelajcego stopie, w jakim skonstruowana funkcja trendu wyjania zmienno badanego zjawiska; wspczynnik przyjmuje wartoci z przedziau <0,1>:
R2 1 2 ,
o wspczynnika zmiennoci resztowej informujcego, jaki odsetek redniego poziomu zjawiska w badanym okresie stanowi wahania przypadkowe:
V Sy
Sy
yt
100 .
Wahania okresowe to systematyczne wahania powtarzajce si w cile okrelonych odstpach czasu. Na ich wystpowanie wpyw ma najczciej pora dnia, pora
roku, zwyczaje, unormowania prawne itp.
98
Metoda rednich jednoimiennych okresw jest stosowana w przypadku niewystpowania trendu. Polega na ustaleniu wzgldnych wskanikw sezonowoci dla
kolejnych podokresw, ktre informuj, o ile procent poziom badanego zjawiska
w danym podokresie rni si od przecitnego poziomu tego zjawiska w caym
badanym okresie. Wzgldny wskanik sezonowoci wyznacza si za pomoc formuy:
w
gi
yi
y
gdzie:
y i redni poziom zjawiska dla i-tego podokresu w caym badanym okresie,
y redni poziom zjawiska dla caego badanego okresu.
99
g i y ( w g i 1) .
Metoda wskanikw jest stosowana w przypadku wspwystpowania waha sezonowych z trendem. Polega na wyznaczeniu urednionych wskanikw sezonowoci dla poszczeglnych faz cyklu waha. Procedura wyznaczania wskanikw
rni si w zalenoci od amplitudy waha (rodzaju sezonowoci):
sezonowo addytywna charakteryzuje si sta absolutn amplitud waha;
w celu wyodrbnienia waha oblicza si tzw. surowe wskaniki sezonowoci
addytywnej, ktre informuj, o ile poziom badanego zjawiska w danym podokresie rni si (w wartociach absolutnych) od poziomu tego zjawiska wynikajcego z trendu, na skutek oddziaywania zarwno waha sezonowych, jak
i przypadkowych; wskaniki wyznacza si za pomoc nastpujcej formuy:
gi
1
ni
ni
( yt y t ) ,
i 1
gdzie:
yt faktyczny poziom badanego zjawiska,
Jeeli suma obliczonych wskanikw dla wszystkich podokresw nie jest rwna 0, wwczas naley wyznaczy czyste wskaniki sezonowoci addytywnej,
ktre informuj, o ile poziom badanego zjawiska w danym podokresie rni
si (w wartociach absolutnych) od poziomu tego zjawiska wynikajcego
z trendu, na skutek oddziaywania wycznie waha sezonowych:
S i g i wkor ,
gdzie:
wkor
g
i 1
n liczba podokresw;
100
1
gi
ni
ni
i 1
yt
yt
gdzie:
yt faktyczny poziom badanego zjawiska,
Jeeli suma obliczonych wskanikw dla wszystkich podokresw nie jest rwna liczbie podokresw, wwczas naley wyznaczy czyste wskaniki sezonowoci multiplikatywnej, ktre informuj, o ile procent poziom badanego
zjawiska w danym podokresie rni si od poziomu tego zjawiska wynikajcego z trendu, na skutek oddziaywania wycznie waha sezonowych:
S i g i wkor ,
gdzie:
wkor
g
i 1
n liczba podokresw.
4.3.3. Wyodrbnianie waha przypadkowych (losowych)
Wahania przypadkowe s wywoane przyczynami ubocznymi lub katastroficznymi. Nie maj one wpywu na tendencj rozwojow, gdy powodujc zarwno
spadki, jak i wzrosty badanego zjawiska, w duszym okresie znosz si wzajemnie.
Dysponujc funkcj trendu oraz informacjami na temat waha sezonowych o staej
absolutnej amplitudzie (sezonowo addytywna), mona wyodrbni wahania
przypadkowe za pomoc formuy
101
z t yt y t S i ,
a przecitne zrnicowanie siy ich oddziaywania ustali przy wykorzystaniu
formuy
n
Sz
z
t 1
2
t
n ni 2
gdzie:
n liczba podokresw,
ni liczba jednoimiennych podokresw.
4.4. Przykady
Przykad 4.4.1.
Skup zb podstawowych
(w kg na 1 ha uytkw rolnych)
2004
371
2005
433
2006
398
2007
352
2008
350
Rozwizanie
Przyrosty absolutne
Pab / 0 yt y0
102
Pab / t 1 yt yt 1
rok 2004 371 X = X
rok 2005 433 371 = 62
Pwz / 0
yt y 0
100
y0
Pwz / t 1
yt yt 1
100
yt 1
103
it / 0
yt
100
y0
it / t 1
yt
100
y t 1
Wielko sprzeday
(w tys. szt.)
Ceny jednostkowe (w z)
2005
2009
2005
2009
kuchnia
3,0
4,5
1300
900
lodwka
4,5
4,0
1000
1200
pralka
1,5
3,5
1100
800
104
q p
i
Iw
i 1
n
100
p0
11650
100 115,92%
10050
i 1
Laspeyresa
n
q p
i
Iq
i 1
n
100
p0
13700
100 136,32%
10050
i 1
Wielko sprzeday trzech artykuw gospodarstwa domowego w pewnej hurtowni wzrosa w roku 2006 o 36,32% w porwnaniu z rokiem 2002, przy zaoeniu
staych cen z roku 2002.
Paaschego
n
q p
i
Iq
i 1
n
pi
100
11650
100 125,27%
9300
i 1
Wielko sprzeday trzech artykuw gospodarstwa domowego w pewnej hurtowni wzrosa w roku 2009 o 25,27% w porwnaniu z rokiem 2005, przy zaoeniu
staych cen z roku 2005.
105
Fishera
L
Iq
Wielko sprzeday trzech artykuw gospodarstwa domowego w pewnej hurtowni wzrosa w roku 2009 w porwnaniu z rokiem 2005 rednio o 30,68%.
Agregatowe indeksy cen
Laspeyresa
n
p q
i
Ip
i 1
n
100
q0
9300
100 92,54%
10050
i 1
Paaschego
n
p q
i
Ip
i 1
n
qi
100
11650
100 85,04%
13700
i 1
Fishera
Ip
106
Lata
2004
371
0,00
100,00
2005
433
62
62
16,71
16,71
116,71
116,71
2006
398
27
-35
7,28
-8,08
107,28
91,92
2007
352
-19
-46
-5,12
-11,56
94,88
88,44
2008
350
-21
-2
-5,66
-0,57
94,34
99,43
Wielko sprzeday
(w tys. szt.)
Ceny jednostkowe
(w z)
q0 * p0
qi * pi
qi * p0
q0 * pi
900
1200
800
3 900
4 500
1 650
4 050
4 800
2 800
5 850
4 000
3 850
2 700
5 400
1 200
10 050
11 650
13 700
9 300
2005 (q0)
2009 (qi)
2005 (p0)
2009 (pi)
3,0
4,5
1,5
4,5
4,0
3,5
1300
1000
1100
Przykad 4.4.3.
Liczba aptek
(w tys.)
8,3
9,0
9,3
9,6
9,8
10,0
10,3
10,6
10,6
107
2001
2002
2003
2004
2005
2006
2007
2008
t
t 1
t 1
t 1
2
n y t t y t t
n
n
n t 2 t
t 1
t 1
9 453,9 87,5 45
0,27
9 285 45 2
y
t 1
b t
n
t 1
87,5 0,27 45
8,37
9
108
Liczba aptek w roku 1999 wynosia teoretycznie 8,37 tys.; teoretycznie, tzn. gdyby
na zjawisko nie oddziayway wahania przypadkowe (gdyby przebiegao ono
zgodnie z oszacowan funkcj trendu).
Funkcja trendu
y t a bt
y t 0,27t 8,37
Liczba aptek w roku 2011, tj. t = 12
y t 0,27t 8,37
y 12 0,27 12 8,37
y 12 11,61
Uwzgldniajc przecitny roczny wzrost liczby aptek w Polsce mona szacowa,
e w roku 2011 liczba ta wyniesie 11,61 tys. Jest to jednak szacunek obarczony
pewnym bdem i w zwizku z tym naley obliczy bd szacunku, czyli odchylenie standardowe skadnika resztowego.
Sy
1
nk
Sy
1
0 , 21 0 ,17
92
yt y t
t 1
yt y t
0 , 21 0 , 04
t 1n
2
4 , 70
y t yt
t 1
109
Tylko 4% zmiennoci liczby aptek w Polsce w latach 2000-2008 nie zostao wyjanione przez skonstruowan funkcj trendu.
Wspczynnik determinacji
R 2 1 1 0 , 04 0 ,96
2
Okoo 96% zmiennoci liczby aptek w Polsce w latach 2000-2008 zostao wyjanione przez skonstruowan funkcj trendu.
Wspczynnik zmiennoci resztowej
Sy
0 ,17
Sy
100
100 1, 75 %
9 , 72
yt
Wahania losowe stanowiy 1,75% redniej liczby aptek w Polsce w latach 20002008.
Obliczenia pomocnicze przykad 4.4.3.
Lata
2000
2001
2002
2003
2004
2005
2006
2007
2008
Liczba
aptek
(w tys.)
8,3
9,0
9,3
9,6
9,8
10,0
10,3
10,6
10,6
87,5
yt * t
t2
yt
yt y t
( yt y t ) 2
y y
1
2
3
4
5
6
7
8
9
45
8,30
18,00
27,90
38,40
49,00
60,00
72,10
84,80
95,40
453,90
1
4
9
16
25
36
49
64
81
285
8,64
8,91
9,18
9,45
9,72
9,99
10,26
10,53
10,80
X
-0,34
0,09
0,12
0,15
0,08
0,01
0,04
0,07
-0,20
X
0,12
0,01
0,01
0,02
0,01
0,00
0,00
0,00
0,04
0,21
2,02
0,52
0,18
0,01
0,01
0,08
0,34
0,77
0,77
4,70
110
4.5. Zadania
Zadanie 4.5.1.
Na podstawie danych dotyczcych wysokoci dochodw budetowych wielkopolskich gmin w latach 1997-2001 naley ustali przyrosty absolutne, wzgldne oraz
indywidualne indeksy dynamiki. Otrzymane wyniki zinterpretowa.
1997
Dochody budetowe
w mln z
3 181
1998
3 775
1999
2 709
2000
2 938
2001
3 176
Lata
Zadanie 4.5.2.
Na podstawie danych dotyczcych wysokoci wydatkw budetowych wielkopolskich gmin w latach 1997-2001 naley ustali przyrosty absolutne, wzgldne oraz
indywidualne indeksy dynamiki. Otrzymane wyniki zinterpretowa.
1997
Wydatki budetowe
w mln z
3 287
1998
3 917
1999
2 788
2000
3 108
2001
3 326
Lata
111
Zadanie 4.5.3.
Liczba mieszkacw miasta Konina w latach 2003-2008 przedstawiaa si nastpujco (stan na 31 grudnia):
Lata
2003
2004
2005
2006
2007
2008
Liczba mieszkacw
81 774
81 266
80 838
80 471
80 140
79 829
99,38
99,47
99,55
99,59
99,61
Indeksy (rok
poprzedni = 100)
rdo: Ludno. Stan i struktura w przekroju terytorialnym z lat 2003-2008, GUS, Warszawa.
Wielko spoycia
Ceny jednostkowe (w z)
2004
2009
2004
2009
440
400
1,20
1,50
maso (w kg)
12
10
6,20
7,10
jaja (w szt.)
350
325
0,35
0,25
mleko (w litrach)
Posugujc si indeksami zespoowymi, przeanalizowa dynamik wartoci i wielkoci spoycia oraz cen w 2009 r. w stosunku do roku 2004 dla trzech artykuw
cznie. Otrzymane wyniki zinterpretowa.
112
Zadanie 4.5.5.
Wielko sprzeday
Ceny jednostkowe (w z)
2005
2008
2005
2008
kawa (w opak.)
900
1 100
4,2
3,8
dem (w szt.)
660
620
2,5
2,2
cukier (w kg)
860
800
3,0
3,3
Posugujc si indeksami zespoowymi przeanalizowa dynamik wartoci i wielkoci sprzeday oraz cen w 2008 r. w stosunku do roku 2005 dla trzech artykuw
cznie. Otrzymane wyniki zinterpretowa.
Zadanie 4.5.6.
Wykorzystujc dane zawarte w poniszej tabeli, zbada dynamik wartoci i wielkoci sprzeday oraz cen czterech produktw rolnych oferowanych przez pewnego
rolnika w sierpniu 2008 r. w porwnaniu z sierpniem 2007 r. Otrzymane wyniki
zinterpretowa.
Produkt
VIII 2007
VIII 2007
VIII 2008
ziemniaki
0,5
2 000
ogrki
3,0
500
pomidory
4,5
1 000
papryka
5,0
200
VIII 2008
113
Zadanie 4.5.7.
Wykorzystujc dane zawarte w poniszej tabeli zbada dynamik wartoci i wielkoci importu oraz cen czterech wyrobw papierniczych w pewnej hurtowni
w lutym 2009 r. w porwnaniu z lutym 2006 r. Otrzymane wyniki zinterpretowa.
Wyrb
Ceny zakupu
(w euro/opak.)
II 2006
II 2009
Wielko importu
(w tys. opakowa)
II 2006
papier
13
karton
15
tektura
11
bibua
12
II 2009
114
Zadanie 4.5.8.
1999
967,0
2000
908,2
2001
869,0
2002
851,7
2003
704,8
2004
703,8
2005
707,1
2006
715,4
2007
737,9
Wyznacz tendencj rozwojow w sposb mechaniczny, wykorzystujc redni ruchom trzy- i piciookresow.
Sporzd wykres szeregu pierwotnego
(danych empirycznych) i szeregw
rednich ruchomych (danych teoretycznych).
Zadanie 4.5.9.
1999
82,0
2000
87,8
2001
106,0
2002
97,6
2003
162,7
2004
108,1
2005
114,1
2006
115,4
2007
133,7
2008
165,2
115
Zadanie 4.5.10.
Lata
2003
2004
2005
Pora roku
wiosna
lato
jesie
zima
wiosna
lato
jesie
zima
wiosna
lato
jesie
zima
Liczba turystw
(w tys.)
649
999
721
332
801
1275
886
424
910
1389
956
467
Zadanie 4.5.11.
Lata
2003
2004
2005
Kwarta
Stopa bezrobocia (w %)
I
II
III
IV
I
II
III
IV
I
II
III
IV
20,6
19,4
19,4
19,3
20,7
19,1
18,2
18,0
18,9
18,1
17,4
16,7
116
Zadanie 4.5.12.
Liczba uczniw
(w tys.)
2001
1 743,1
2002
1 709,0
2003
1 681,2
2004
1 648,7
2005
1 596,8
2006
1 528,8
2007
1 453,2
2008
1 381,4
Wyznacz tendencj rozwojow w sposb analityczny. Oszacuj liczb gimnazjalistw w roku 2011 oraz oce stopie dopasowania funkcji trendu do
danych empirycznych.
Zadanie 4.5.13.
Dugo sieci
kanalizacyjnej (w tys. km)
1999
46,8
2000
51,1
2001
55,5
2002
61,0
2003
68,9
2004
73,9
2005
80,1
2006
84,9
2007
89,5
2008
94,7
117
Zadanie 4.5.14.
Warto sprzeday (w z)
Pn
Wt
Cz
Pt
So
Nd
540
558
532
544
366
350
372
364
426
448
434
444
402
396
390
410
660
678
638
646
234
248
252
240
106
98
94
102
2005
2006
2007
Kwarta
Liczba
zakadw
I
II
III
IV
I
II
III
IV
I
II
III
IV
167
304
305
335
93
118
154
153
61
81
102
107
118
Zadanie 4.5.16.
Lata
2005
2006
2007
Kwarta
Liczba ofert
(w tys.)
192
II
240
III
260
IV
193
237
II
326
III
313
IV
242
300
II
366
III
323
IV
253
5. PODSUMOWANIE
Zadanie 5.1.
Emeryci
z Konina
z Koa
xa
15
12
Me
14
13
D
xtyp
13
14
Vx
55%
Was
0,4
rd o : Dane umowne.
Zadanie 5.2.
Gospodarstwa
w Kramsku
w Krzymowie
xa
8,0
6,0
Me
8,6
5,4
D
xtyp
9,0
5,0
Vx
20%
Was
-0,2
rd o : Dane umowne.
120
5. Podsumowanie
Zadanie 5.3.
miasto A: y 3,5 x 5 ,
miasto B: y 2,5 x 5 .
Wska i uzasadnij, w ktrym miecie s tasze mieszkania. Oszacuj cen 40-metrowego mieszkania w miecie A, wiedzc, e:
rxy = 0,95 ,
s(y) = 32,05 .
Zadanie 5.4.
Ponisze rwnania regresji przedstawiaj zaleno pomidzy wysokoci rocznych dochodw uytkownikw gospodarstw domowych (x w tys. euro) a spoyciem ryb w cigu roku (y w kg/osob) w dwch krajach A i B:
Wska i uzasadnij, w ktrym kraju spoywa si wicej ryb. Oszacuj spoycie ryb
(w przeliczeniu na osob) w gospodarstwie z kraju B uzyskujcym roczne dochody na poziomie 20 tys. euro, wiedzc, e:
rxy = 0,93 ,
s(y) = 10 .
Zadanie 5.5.
Wspzaleno midzy miesicznymi dochodami czonkw gospodarstw domowych (x w tys. z) a ich wydatkami na zakup kaszanki (y w z) opisuj nastpujce linie regresji:
y 3 x 23,5
x 0,25 y 6,7
121
y 20 x 277 ,
x 0,045 y 12 .
2004
2005
2006
2007
2008
Indeksy
(rok 2004 = 100)
100
99,13
96,74
94,85
94,09
122
5. Podsumowanie
Zadanie 5.8.
2004
2005
2006
2007
2008
Indeksy
(rok 2004 = 100)
100
92,45
76,99
58,23
49,13
Zinterpretuj indeks liczby zarejestrowanych bezrobotnych w 2008 r. w porwnaniu z 2004 r. wiedzc, e w 2005 r. liczba bezrobotnych wynosia 2 mln 773 tys.
osb, ustal:
absolutn liczb zarejestrowanych bezrobotnych w poszczeglnych latach,
przyrost absolutny liczby bezrobotnych w 2008 r. w porwnaniu z rokiem
2004.
Zadanie 5.9.
Liniowa funkcja trendu dla liczby osb w wieku poprodukcyjnym (w tys.) w Polsce w latach 1995-2008 ma nastpujc posta (rdo: obliczenia wasne na podstawie Banku Danych Regionalnych GUS):
y t 5280,96 60,51t
Zinterpretuj parametry rwnania oraz oszacuj liczb osb w wieku poprodukcyjnym w 2011 r., wiedzc, e Sy = 33,10.
Zadanie 5.10.
Liniowa funkcja trendu dla liczby podmiotw sektora prywatnego (w tys.) zarejestrowanych w Polsce w latach 1998-2008 ma nastpujc posta (rdo: obliczenia wasne na podstawie Banku Danych Regionalnych GUS):
y t 2846,98 77,41t
Zinterpretuj parametry rwnania oraz oszacuj liczb podmiotw zarejestrowanych
w 2012 r., wiedzc, e Sy = 92,14.
ROZWIZANIA ZADA
_
2.8.16. xa 1100
2.8.19. 166 x typ 184 ; V x 5,14% ; Was 0,33
2.8.20. M e 8,5
2.8.21. mczyni: Me = 50,67; 44 xtyp 56 ; V x 12% ; Was 0,33
2.8.22. xa 1750
124
Rozwizania zada
_
WQ 0,16
2.8.25. k 0,684
2.8.26. k 0,64
3.5.9. y 6 ,56
3.5.10. x 30
125
9
78685
4.5.3. S t / t 1 99,52% ; y 2011
Sy
1, 67 %
Sy
1, 44 %
BIBLIOGRAFIA
Chromiska M., Ignatczyk W., Statystyka. Teoria i zastosowanie, WSB, Pozna
2004.
Jwiak J., Podgrski J., Statystyka od podstaw, PWE, Warszawa 2009.
Kukua K., Elementy statystyki w zadaniach, PWN, Warszawa 2003.