You are on page 1of 114

1

STATISTIKA


ECTS: 5 bodova (tjedno optereenje: 2 sata predavanja + 2 sata vjebi)

Cilj kolegija: Osposobiti studenta za primjenu statistikih metoda radi utvrivanja,
analiziranja i praktinog primjenjivanja zakonitosti promatranih pojava u pomorskom
prometu.

Sadraj predavanja:

1. Osnovni pojmovi
2. Ureivanje podataka
3. Srednje vrijednosti statistikog niza
4. Mjere disperzije
5. Mjere asimetrije i mjere zaobljenosti
6. Osnovni pojmovi vjerojatnosti
7. Teorijske distribucije
8. Metoda uzoraka
9. Procjena parametara
10. Testiranje hipoteza o parametru
11. Usporedba parametara osnovnih skupova
12. Hikvadrat test
13. Regresijska analiza
14. Linearna korelacija
15. Modeli vremenskih serija

Literatura:

oi, I. (2006): Primijenjena statistika (2. izdanje), kolska knjiga, Zagreb,
oi, I. (2000): Uvod u Statistiku (11. izdanje), kolska knjiga, Zagreb

Provjere znanja:

3 kolokvija (svaki 25% zavrne ocijene)
3 seminarska rada (ukupno 25% zavrne ocjene)

Pravo potpisa: Prisutnost na nastavi 73% (11/15)


Nastavnik: mr.sc. eljka Domijan

2

populacija
uzorak






1. UVOD


1. to je statistika?


Statistika je znanstvena disciplina koja se bavi metodama prikupljanja i analiziranja
podataka, te izvoenjem zakljuaka na temelju tih podataka.

Deskriptivna statistika ukljuuje metode ureivanja, grupiranja, tabeliranja, grafikog
prikazivanja statistikih podataka te izrauna razliitih statistiko-analitikih veliina.

Inferencijalna statistika bavi se metodama koje omoguavaju procjenu karakteristika
populacije ili donoenje odluka o populaciji, zasnovanih na generaliziranju rezultata iz
statistike uzorka. Veina metoda zasnovana je na teoriji vjerojatnosti.


1.2. Statistiki skup


Statistiki skup predstavlja skup elemenata kojim se ispituje jedno ili vie svojstava
(obiljeja, varijabli) ije se vrijednosti mijenjaju od elementa do elementa.

Podaci o danoj varijabli za svaki element statistikog skupa tvore skup podataka koji se
naziva statistikom populacijom (osnovnim skupom). S obzirom na broj elemenata
populacija moe biti konana i beskonana. Podskup osnovnog skupa je uzorak.











U statistikom istraivanju statistiki skupovi se definiraju pojmovno, prostorno i
vremenski.


3
1.3. Statistika obiljeja (varijable)


Statistika obiljeja (varijable) su ope karakteristike elemenata statistikog skupa po
kojima su elementi jedni drugima slini ili se meusobno razlikuju.

Varijable se dijele na kvalitativne i kvantitativne.

Kvantitativne varijable mogu biti kontinuirane i diskretne. Kontinuirane varijable
dobivaju se mjerenjem pa mogu poprimiti bilo koju vrijednost iz nekog intervala.
Diskretne varijable dobivaju se brojanjem i poprimaju konaan broj vrijednosti.

Kvalitativne varijable mogu biti nominalne i redoslijedne. Nominalne varijable dane su
opisno u obliku atributa (kategorija) ili prostornih (zemljopisnih) jedinica. Redoslijedne
(ordinalne) varijable fluktuiraju prema intenzitetu ili rangu.



1.4. Raunalni programski paketi u statistici


Razvojem raunalne tehnike obrada i analiza podataka u statistici je znatno olakana.
Brojnim korisnicima danas su na raspolaganju grupe statistikih programa dizajnirane u
obliku programskih paketa. Meu najpopularnije spadaju SAS, SPSS, STATISTICA i
MINITAB.

Raunala se javljaju gotovo u svakoj fazi statistike djelatnosti: pohranjivanje i
manipuliranje podataka, grafiko i tabelarno prikazivanje, provoenje izrauna,
modeliranje i simuliranje.

Vei broj statistikih procedura deskriptivne i inferencijalne statistike dostupan je u
razliitoj programskoj potpori, primjerice u EXCEL-u.



Vjebe


1. Pogledajte stranice na navedenim adresama imajui na umu potrebe za razliitim
statistikim podacima:

4
A B C D E F G H I
0001 2 30 2 1 45 1 11 6 12
0002 1 61 3 3 90 5 17 35 15
0003 2 21 1 1 0 1 12 1 0
0004 2 27 1 1 40 1 12 2 5
0005 1 50 2 2 72 2 14 28 6
0006 1 32 2 3 65 1 14 7 7
0007 1 45 2 4 80 3 12 20 3
0008 2 28 4 2 38 1 15 4 2
0009 1 23 1 1 32 6 16 1 0
www.dsz.hr
www.hnb.hr
www.kgh.hr
www.census.gov
www.unctad.org
www.worldbank.org


2. Pogledajte publikaciju Statistiki ljetopis Dravnog zavoda za statistiku. Prouite
metodoloka objanjenja koja se odnose na podatke o registru poslovnih subjekata,
stanovnitvu, zaposlenosti, plaama, investicijama, transportu i komunikacijama i drugim
podrujima.


3. Koristei se programskom potporom EXCEL-a unesite podatke iz odabrane tablice i
pohranite ih u datoteku odabranog imena. Pomou opcija Help prouite nain unosa i
editiranja statistikih podataka u programskoj potpori EXCEL-a.


4. Ispituju se obiljeja radne snage (u dobi od 15 i vie godina) na temelju uzorka 7550
kuanstava. Meu varijablama (obiljejima) u istraivanju su i sljedee:

(1) Spol (1 - muki, 2 - enski)
(2) Navrene godine ivota
(3) Brano stanje (1 neoenjen / neudana, 2 oenjen / udana, 3 rastavljen /
rastavljena, 4 udovac / udovica)
(4) Broj lanova kuanstva
(5) Veliina stana (u m
2
)
(6) Poloaj u zanimanju (1 zaposlenik, osoba koja prima plau, 2 vlasnik bez
zaposlenika, 3 vlasnik - suvlasnik, 4 - pomaui lan domainstva, 5 nije aktivna
osoba, umirovljenik, primatelj invalidnine, stipendije i sl., 6 bez zanimanja)
(7) Broj godina kolovanja
(8) Radni sta (navrene godine)
(9) Udaljenost od mjesta na kojemu se obavlja posao (u km)

Protumaite sadraj nie navedenog dijela matrice prikupljenih podataka:











5
2. STATISTIKI NIZOVI



Jedna od prvih zadaa deskriptivne statistike jest organizacija i prikaz prikupljenih
podataka. Ureenjem statistikih podataka nastaju statistiki nizovi.

Ureeni podaci prikazuju se statistikim tabelama i grafikim prikazima koji daju prve
informacije o strukturi pojave predoene statistikim nizom. Elementarna analiza
podataka u sklopu deskriptivne statistike provodi se pomou relativnih brojeva (postoci,
proporcije i sl.)



2.1. Niz kvantitativnih podataka


Kvalitativni niz nastaje ureenjem podataka o modalitetima nominalne ili rang varijable.

Broj podataka istog oblika varijable naziva se frekvencijom (f
i
). Zbroj frekvencija jednak
je opsegu statistikog skupa. Relativna frekvencija (p
i
) omjer je frekvencije i ukupnog
broja podataka (zbroja frekvencija).

Nizovi kvalitativnih podataka prikazuju se povrinskim grafikonima: uspravnim i poloenim
stupcima, strukturnim krugovima i polukrugovima, razdijeljenim stupcima i sl.


Primjer 2.1

Raspolaete sljedeim podacima:

Studenti sveuilinih studija u RH kolske godine 2000/2001.

Studijsko podruje Broj studenata Od toga studentice
prirodne znanosti 2367 1285
tehnike znanosti 18398 5252
medicinske znanosti 4693 3079
biotehnike znanosti 3334 1416
drutvene znanosti 40048 26445
umjetnike akademije 997 559

Izvor: Statistiki ljetopis RH, 2001, str.435

a) Kojoj vrsti pripada niz u tabeli? Niz studenata prema studijskom podruju prikaite
jednostavnim stupcima. Uz grafikon navedite sve potrebne oznake.
6
Studenti sveuilinih studija u RH prema studijskom podruju
kolske godine 2000/2001.
0
5.000
10.000
15.000
20.000
25.000
30.000
35.000
40.000
45.000
Prirodne
znanosti
Tehnike
znanosti
Medicinske
znanosti
Biotehnike
znanosti
Drutvene
znanosti
Umjetnike
akademije
Studijsko podruje
B
r
o
j

s
t
u
d
e
n
a
t
a
Struktura studenata prema spolu i studijskom podruju u RH
kolske godine 2000/2001
0%
20%
40%
60%
80%
100%
Prirodne
znanosti
Tehnike
znanosti
Medicinske
znanosti
Biotehnike
znanosti
Drutvene
znanosti
Umjetnike
akademije
Studentice Studenti
Studentice
Tehnike
znanosti
14%
Medicinske
znanosti
8%
Biotehnike
znanosti
4%
Umjetnike
akademije
1%
Prirodne
znanosti
3%
Drutvene
znanosti
70%
Studenti
Drutvene
znanosti
44%
Medicinske
znanosti
5%
Tehnike
znanosti
41%
Umjetnike
akademije
1%
Prirodne
znanosti
3%
Biotehnike
znanosti
6%

Studenti po spolu i studijskim podrujima u RH kolske godine 2000/2001.















b) Izraunajte relativni udjel (postotak) studentica u ukupnom broju studenata po studijskim
podrujima. Strukturu studenata po spolu i studijskim podrujima prikaite razdijeljenim
stupcima.
c) Usporedite obujam i strukturu studenata po spolu i studijskim podrujima proporcionalnim
strukturnim krugovima.


a) Nominalni niz.












b)












c)












7
Ukupan broj studentica (38.036 ili 100%) predstavljen je povrinom kruga. Sektori kruga (s
i
)
raunaju se pomou izraza 360 =
N
f
s
i
i
. Radijusi: r

= 2,2 cm, r
m
= 2 cm



2.2. Niz kvalitativnih podataka


Ureenjem kvantitativnih podataka nastaju numeriki nizovi. Nain ureivanja
numerikih nizova ovisi o broju podataka, te da li je numerika varijabla diskretna ili
kontinuirana.


Grupiranje i prikaz diskretnih podataka

Pojedinane vrijednosti numerike varijable prikazuju se dijagramom stablo-list (Stem-
and-Leaf Diagram, ili S-L dijagram)


Primjer 2.2

Intervjuirano je 75 sluajno odabranih graana. Na pitanje: "Koliko puta ste proteklog mjeseca
svibnja koristili prijevoz gradskim autobusom?" prikupljeni su sljedei odgovori:

2, 47, 22, 3, 52, 0, 28, 50, 11, 31, 22, 59, 27, 24, 52, 55, 21, 24, 31, 1, 6, 17, 10, 30, 31,
42, 27, 4, 14, 29, 7, 23, 21, 44, 2, 30, 3, 43, 27, 64, 49, 25, 51, 19, 45, 38, 51, 23, 5, 29,
24, 7, 30, 6, 21, 55, 51, 20, 18, 41, 26, 30, 21, 57, 33, 60, 24, 9, 23, 5, 46, 51 12, 10, 22.

Rezultate intervjua prikaite tabelarno i grafiki.



Prikupljeni podaci su neureeni. Brz nain ureenja podataka postie se uporabom dijagrama
stablo- list. On osigurava ispis pojedinanih podataka ureenih po veliini, od najmanjeg do
najveeg. Popis prvih znamenki brojeva tvori stupac koje zovemo "stablo" (Stem). S desne
strane nasuprot vodeoj znamenci (u "stablu") ispisuje se posljednja znamenka broja to tvori
"list" (leaf).

"Stem" "Leaf" Broj putnika (f
i
)


0 0,1,2,2,3,3,4,5,5,6,6,7,7,9 14
1 0,0,1,2,4,7,8,9 8
2 0,1,1,1,1,2,2,2,3,3,3,4,4,4,4,5,6,7,7,7,8,9,9 23
3 0,0,0,0,1,1,1,3,8 9
4 1,2,3,4,5,6,7,9 8
5 0,1,1,1,1,2,2,5,5,7,9 11
6 0,4 2
8
Kod manjeg broja kvantitativnih podataka S-L dijagram omoguuje brzi nain grupiranja
podataka u razrede i odreivanja veliine razreda. Tabela distribucije frekvencija s razredima i
njen grafiki prikaz dobiveni su pomou MS Excela.

















Kod velikog broja podataka, broj razreda (k) se aproksimira izrazom N log , k 3 3 + 1 ,
gdje je N = ukupan broj podataka. Veliina razreda (x) odreuje se izrazom
k
x - x
= x
min max


gdje je: x
max
= najvea, a x
min
= najmanja vrijednost u nizu, k = broj razreda.


Grupiranje i prikaz kontinuiranih podataka

Granice razreda su prave ako je donja granica tekueg razreda jednaka gornjoj granici
prethodnog razreda. U protivnom rije je o nominalnim granicama koje treba pretvoriti u
prave.


Primjer 2.3

Mjerenjem su prikupljeni sljedei podaci o visini studenata

171.4, 168.9, 183.7, 192.0, 158.2, 167.4, 178.2, 165.3, 183.8, 162.8, 173.5, 156.3, 188.2,
175.8, 171.3, 168.7, 164.7, 177.2, 163.5, 179.2, 169.4, 173.1, 168.4, 156.8, 180.3,
176.0, 179.4, 168.3, 178.3, 173.9, 174.0, 177.6, 169.4, 172.1, 173.6, 168.0, 191.1,
180.4, 163.7, 170.6

Podatke prikaite tabelarno i grafiki.



9
Distribucija studenata po visini
0
1
2
3
4
5
6
7
8
9
10
155-160 160-165 165-170 170-175 175-180 180-185 185-190 190-195
visina (u cm)
b
r
o
j

s
t
u
d
e
n
a
t
a


Visina Broj studenata
(u cm) f
i

155 - 160 3
160 - 165 4
165 - 170 9
170 - 175 9
175 - 180 8
180 - 185 4
185 - 190 1
190 - 195 2
Ukupno 40




Za grafiki prikaz distribucije frekvencija s razredima koristi se histogram.



Vjebe:

1. Vrijeme od dana primitka narudbe do dana isporuke posebne vrste brodskog motora
bilo je kako slijedi (u danima):

145, 177, 117, 125, 185, 154, 140, 182, 132, 131, 140, 156, 161, 141, 200,
136, 157, 164, 123, 192

Konstruirajte S-L dijagram.

2. Provedena je anketa o dnevnoj potronji stranih turista u Republici Hrvatskoj tijekom
kolovoza 2010. godine. Prosjeni dnevni trokovi anketiranih turista bili su kako slijedi:

100 600 100 500 100 150 400 170 2000 100 400 300
1500 100 1300 500 100 200 250 400 500 800 700 1400
220 510 180 800 250 100 1500 380 2600 1000 800 250
500 250 1000 1500 250 500 700 100 100 100 1500 200
100 500 600 100 250 150 1000 500 1600 2000 350 100
200 200 100 100 150 500 100 2000 150 1500 100 200
800 1100 400 700 300 200 2400 100 1500 600 200 200
200 400 300 300 500 200 600 500 800 100 200 300
300 500 800 200 300 300 800 1000 1500 1800 200 250
100 200 2000 100 200 100 260 500 500 150 1000 1250

a) Formirajte distribuciju frekvencija i prikaite je u tabeli
b) Distribuciju frekvencija prikaite povrinskim grafikonom.
10
3. SREDNJE VRIJEDNOSTI



3.1. Aritmetika sredina (prosjena vrijednost)


a) Jednostavna sredina
(pojedinani, negrupirani podaci)

N
x
N
x x x x x
x
N
i
i
N

1 4 3 2 1 =
=
+ + + + +
=
K
, gdje je N = broj vrijednosti

Primjer 3.1

Izraunajte aritmetiku sredinu niza: 105, 100, 110, 112, 108, 100, 104, 115, 96, 120

107
10
1070
10
120 96 115 104 100 108 112 110 100 105

1
= =
+ + + + + + + + +
= =
=
N
x
x
N
i
i



b) Vagana ili ponderirana sredina
(grupirani podaci, distribucije frekvencija s razredima)


N
x f
x
k
i
i i

1 =
= ,
1 =
=
k
i
i
f N

Primjer 3.2

Test iz statistike sadri pet zadataka. Broj rijeenih zadataka 43 studenta bio je ovakav:

Broj rijeenih zadataka 0 1 2 3 4 5
Broj studenata 3 7 12 16 3 2

Izraunajte prosjean broj rijeenih zadataka.




11
Broj rijeenih zadataka Broj studenata
x
i
f
i
x
i
f
i

0 3 0
1 7 7
2 12 24
3 16 48
4 3 12
5 2 10
Ukupno 43 101
3488 2
43
101

1
1
,
f
x f
x
k
i
i
k
i
i i
= = =
=
=
rijeena zadatka po studentu

Primjer 3.3

Nezaposlene osobe prijavljene u Hrvatskom zavodu za zapoljavanje krajem 1999. godine:

Navrene godine ivota Broj osoba
15 - 19 67.170
20 - 24 48.482
25 - 29 119.819
30 - 39 82.263
40 - 49 10.604
50 i vie 13.392

Izraunajte prosjenu starost nezaposlenih osoba


Godine ivota Broj osoba Prave granice Razredne sredine
f
i
x
i
x
i
f
i

15 - 19 67.170 15 - 20 17,5 1.175.475,0
20 - 25 48.482 20 - 25 22,5 1.090.845,0
25 - 29 119.819 25 - 30 27,5 3.295.022,5
30 - 39 82.263 30 - 40 35 2.879.205,0
40 - 49 10.604 40 - 50 45 477.180,0
50 i vie 13.392 50 - (65) 57,5 770.040,0
Ukupno 341.730 9.687.767,5
3492 28
730 341
5 767 687 9

1
1
,
.
, . .
f
x f
x
k
i
i
k
i
i i
= = =
=
=
godina
12
Aritmetika sredina posjeduje sljedea svojstva:

Vrijednost aritmetike sredine nalazi se izmeu najmanje i najvee vrijednosti niza za koji
je izraunana.
Zbroj odstupanja vrijednosti numerike varijable od njezine aritmetike sredine jedak je
nuli
Zbroj kvadrata odstupanja vrijednosti numerike varijable od njezine sredine minimalan je



3.2. Mod (vrijednost koja se najee pojavljuje u nizu)


U Primjeru 3.1 mod je 100.

U Primjeru 3.2 mod je 3 jer je najvei broj studenata ima 3 rijeena zadatka.


Mod distribucije frekvencija s razredima

i
) c - b ( ) a - b (
) a - b (
L M
O

+
+ =
1


gdje je: L
1
= donja granica razreda s najveom frekvencijom
b = najvea frekvencija
a = frekvencija ispred nje
c = frekvencija iza najvee frekvencije
i = veliina razreda (= L
2
L
1
)

Primjer 3.4

Na osnovi podataka iz Primjera 3.3 izraunajte vrijednost moda distribucije i objasnite
njegovo znaenje.


Prave granice razreda Broj osoba Veliina razreda Korigirane frekvencije
f
i
i
i
f
ci

15 - 20 67.170 5 67.170
20 - 25 48.482 5 48.482
25 - 30 119.819 5 119.819
30 - 40 82.263 10 41.131,5
40 - 50 10.604 10 5.302
50 - (65) 13.392 15 4.464
Ukupno 341.730
13
M
o

( )
( ) ( )
3775 , 27 = 5
1.131,5 4 - 19.819 1 + 48.482 - 119.819
48.482 - 119.819
+ 25 =

Najea dob nezaposlenih osoba bila je (zaokrueno) 27 godina.



3.3. Medijan (srednja vrijednost koja niz ureen po veliini dijeli na
dva jednaka dijela)


U Primjeru 3.1 podaci poredani po veliini su: 96, 100, 100, 104, 105, 108, 110, 112, 115, 120.

5 106 =
2
108 + 105
= , M
e



U Primjeru 3.2 broj podataka je neparan. (43). Medijan je broj rijeenih zadataka studenta s
rednim brojem 22 (= 43/2 = 21,5), pa je M
e
= 2 rijeena zadatka.

Broj rijeenih zadataka Broj studenata Kumulativni niz
x
i
f
i
manje od
0 3 3
1 7 10
2 12 22
3 16 38
4 3 41
5 2 43
Ukupno 43

U tabeli student pod rednim brojem 22 nalazi se u kumulativnoj frekvenciji 22 pa je medijan 2
rijeena zadatka.


Medijan distribucije frekvencija s razredima

i
f
f -
N
L M
med
1
e

2
+ =

1


gdje je: N = zbroj frekvencija
f
med
= frekvencija medijalnog razreda
i = veliina medijalnog razreda
f
1
= zbroj svih frekvencija ispred medijalnog razreda
L
1
= donja granica medijalnog razreda
14
Poligon kumulativnih frekvencija
0
50
100
150
200
250
300
350
15 20 25 30 35 40 45 50 55 60 65
Godine starosti
K
u
m
u
l
a
t
i
v
n
i

b
r
o
j

o
s
o
b
a

(
u

t
i
s
u

a
m
a
)
N/2
Medijalni razred je onaj ija kumulativna frekvencija prvi put ukljuuje vrijednost N/2.

U Primjeru 3.3 za izraun medijana formira se kumulativni niz manje od

Prave granice razreda Broj osoba Kumulativni niz Veliina razreda
f
i
manje od i
i

15 - 20 67.170 67.170 5
20 - 25 48.482 115.652 5
25 - 30 119.819 235.471 5
30 - 40 82.263 317.734 10
40 - 50 10.604 328.338 10
50 - (65) 13.392 341.730 15
Ukupno 341.730

865 170 =
2
730 341
=
2
.
. N
, te se nalazi u kumulativnoj frekvenciji 235.471. Medijalni razred je
25-30 godina.

L
1
= 25 f
1
= 115.652 f
med
= 119.819 i = 5

3040 27 = 5
819 119
652 115 865 170
+ 25 = ,
.
. - .
M
e
godina

Medijan je (zaokrueno) 27 godina, prema tome prva polovica nezaposlenih osoba imala je 27
i manje godina, a druga polovica bila je starija od 27 godina.

Medijan se moe grafiki odrediti pomou poligona kumulativnih frekvencija.


















15
Medijan se ubraja meu kvantile. Kvantili su vrijednosti varijable koje dijele niz ureen po
veliini na jednake dijelove. Decili ralanjuju niz na deset jednakih dijelova, a percentili na
sto dijelova. Kvantili koji dijele niz na etiri jednaka dijela nazivaju se kvartilima. Naini
odreivanja ovih kvantila analogni su onima za odreivanje medijana.


Kvartili distribucije frekvencija s razredima
Prvi ili donji kvartil (Q
1
) i
f
N
L Q
var k
+ =
1
1 1
f -
4


Drugi kvartil (Q
2
) = M
e
Trei ili gornji kvartil (Q
3
) i
f
f -
N
L Q
var k
1

4
3
+ =

1 3


gdje je f
kvar
= frekvencija medijalnog razreda
i = veliina kvartilnog razreda
f
1
= zbroj svih frekvencija ispred kvartilnog razreda
L
1
= donja granica kvartilnog razreda

Donji kvartil je 25-ti percentil, medijan je 50-ti percentil, gornji kvartil je 75-ti percentil


Vjebe


1. U servisu brodskih motora registriran je broj dana od primitka do predaje popravljenog
motora. Podaci su sljedei:

1, 2, 2, 1, 1, 3, 2, 0, 3, 2, 1, 4, 0, 3, 3, 2, 4, 1, 0, 1, 1, 2, 1, 5, 2

Izraunajte: aritmetiku sredinu niza, mod , medijan i kvartile.

2. Broj dana zadravanja jedrilica na suhom doku u marini prikazan je S-L dijagramom

#
11 7 1
12 3,5 2
13 1,2,2,6 4
14 0,0,1,5 4
15 4,6,7 3
16 1,4 2
17 5,7 2
18 2,5 2
16
x
i
f
i
500 36
550 77
600 22
700 14
750 11
800 3
Razredi f
i
0 - 5 123
5 - 10 158
10 - 15 26
15 - 25 9
Razredi f
i
0,5 - 0,9 79
1,0 - 1,4 68
1,5 - 1,9 30
2,0 - 2,9 14
3,0 - 4,9 11
5,0 - 7,9 4
Potronja turista Broj anketiranih
100-400 63
400-700 23
700-1000 10
1000-1300 7
1300-1600 9
1600-1900 2
1900-2200 4
2200-2500 1
2500-2800 1
x
i
17
21
34
35
40
41
42
50
50
53
55
Izraunajte:
a) Prosjean broj dana zadravanja jedrilica na suhom doku
b) Mod, medijan i kvartile
c) Komentirajte dobivene rezultate.

3. Za svaki od navedenih numerikih nizova odredite aritmetiku sredinu, mod i medijan

a)
b)










d)


c)







4. Anketa o dnevnoj potronji stranih turista iz zadataka 2 (predavanje2.) dala je sljedeu
distribuciju












a) Na temelju podataka iz tabele izraunajte prosjenu potronju i kvartile.
b) Dobivene rezultate usporedite s rezultatima dobivenim iz originalnih podataka.
17
4. MJERE DISPERZIJE



4.1. Raspon varijacije (razlika izmeu najvee i najmanje vrijednosti)

min max
x x R =

U Primjeru 3.1 x
max
= 120, x
min
= 96 R = 120 96 = 24


Raspon varijacije distribucije frekvencija s razredima

R = gornja granica posljednjeg razreda - donja granica prvog razreda.

U Primjeru 3.3 x
max
= 65, x
min
= 15 R = 65 15 = 50



4.2. Interkvartil (razlika izmeu gornjeg i donjeg kvartila)

1 3
Q Q I
Q
=

Primjer 4.1

Provedena je anketa meu studentima o satima provedenom na internetu tijekom mjeseca
listopada. Prikupljeni su sljedei podaci: 5, 9, 14, 15, 16, 17, 18, 21, 22, 23, 24, 27, 28, 31, 34,
37, 37, 39, 40, 40, 41, 43, 44, 45, 47, 48, 53, 57, 59, 63.

Izraunajte srednje vrijednosti, raspon varijacije i interkvartile. Izraunate vrijednosti prikaite
pomou B-W dijagrama (Box-and-Whisker diagram)



N = 30 x
max
= 63 x
min
= 5 x
i
= 997

x = 33,2333 M
o
= 40 M
e
= 36,5 Q
1
= 21 Q
3
= 44

min max
x x R = = 63 5 = 58

1 3
Q Q I
Q
= = 44 21 = 23



18
B W dijagram




















4.3. Varijanca (sredina kvadrata odstupanja vrijednosti numerike
varijable od sredine)

( ) ( ) ( )
( )
N
x x
N
x x x x x x
N
i
i
N

1
2
2 2
2
2
1 2 =

=
+ + +
=
L


Primjer 4.2

Izraunajte varijancu niza 19, 15, 13, 12, 11



14
5
70
5
11 12 13 15 19
= =
+ + + +
= x
( ) ( ) ( ) ( ) ( )
8
5
40
5
14 11 14 12 14 13 14 15 14 19
2 2 2 2 2
2
= =
+ + + +
=


Za izraun varijance moe se koristiti sljedei izraz.

( )
N
x N x
N
i
i

1
2 2
2 =

=
19
Varijanca distribucije frekvencija s razredima

( )
N
x x f
k
i
i i

1
2
2 =

=
1 =
=
k
i
i
f N

Primjer 4.3

Na temelju podataka iz Primjera 3.3 izraunajte varijancu


Navrene godine Broj osoba Razredne sredine
(prave granice) f
i
x
i
x
i
f
i

( )
2
x x f
i i

15 - 20 67.170 17,5 1175475 7.906.234,6
20 - 25 48.482 22,5 1090845 1.658.713,8
25 - 30 119.819 27,5 3295022,5 86.403,6
30 - 40 82.263 35 2879205 3.638.765,6
40 - 50 10.604 45 477180 2.939.954,7
50 - (65) 13.392 57,5 770040 11.380.118,9
Ukupno 341.730 9687767,5 27.610.191,2

= = =
=
=
341730
5 9687767

6
1
6
1
,
f
x f
x
i
i
i
i i
28,3492 godina
( )
341730
2 27610191

6
1
6
1
2
2
,
f
x x f
i
i
i
i i
=

=
=
=
= 80,7953

Za izraun moe se koristiti sljedei izraz

N
f x x f
k
i
k
i
i i i
= =

=
1 1
2 2
2

1 =
=
k
i
i
f N


4.4. Standardna devijacija (prosjeno odstupanje vrijednosti numerike
varijable od njezine sredine)

2
=

U Primjeru 4.2 8 = = 2,8284

U Primjeru 4.3 0 7953 80 = , = 8,9886 godina
20
4.5. Koeficijent varijacije (omjer standardne devijacije i aritmetike
sredine pomnoen sa sto)

100 =
x
V



U Primjeru 4.2 = 2,8284 = x 14 100
14
8284 2
100 = =
,
x
V

= 20,20

U Primjeru 4.3 = 8,9886 = x 28,3492 100
3492 28
9886 8
=
,
,
V = 31,7068



Vjebe


1. Mjereno je vrijeme (u minutama) rjeavanja zadataka iz statistike. Rezultati su sljedei:

15, 25, 22, 31, 20, 24, 19, 17, 18, 18, 29, 28, 21, 10, 20, 17, 20, 33, 16, 38, 40, 30, 24, 22, 27

a) Odredite prosjeno vrijeme rjeavanja zadataka i nacrtajte dijagram odstupanja vrijednosti
varijable od aritmetike sredine.
b) Izraunajte vrijednost raspona varijacije, interkvartila i standardne devijacije.
c) Nacrtajte B-W dijagram.

2. U tabeli su podaci o osuenim punoljetnim osobama u Republici Hrvatskoj tijekom
2000. godine za kazneno djelo protiv sigurnosti platnog prometa i poslovanja .

Dob Broj osoba
18 - 20 23
21 - 24 63
25 -29 108
30 - 39 236
40 - 49 192
50 - 59 74
60 i vie 25

a) Izraunajte prosjenu dob osuenih osoba. Koliko je odstupanje od prosjeka
b) Odredite dob koja niz dijeli na dva jednaka dijela. Koja je najea dob osuenih osoba
c) Koliki su kvartili i interkvartil
d) Prikaite distribuciju poligonom kumulativnih frekvencija i oznaite poloaj izraunanih
srednjih vrijednosti

21
5. MJERE ASIMETRIJE I ZAKRIVLJENOSTI



5.1. Mjere asimetrije (nagnutost distribucije na lijevu ili desnu stranu s
obzirom na vrh distribucije)


a) Koeficijent asimetrije
3
3
3
=



gdje je: =
3
trei moment oko sredine
= standardna devijacija

Momenti oko sredine definiraju se izrazom

( )
N
x x
N
i
r
i
r

1 =

= r = 0, 1, 2, 3, 4,

za grupirane podatke i distribuciju frekvencija:

( )

1
1
k
i
i
k
i
n
i i
n
f
x x f
=
=

=

( )
0

1
1
1
=

=
=
N
x x
N
i
i
,
( )
2 1
2
2

=
=
N
x x
N
i
i


U simetrinoj distribuciji 0 =
3
. U pozitivno ili negativno asimetrinim distribucijama
3

poprima vrijednosti iz intervala 2.


b) Pearsonova mjera asimetrije

( )

M x
S
e
k

=
3
odnosno
( )

M x
S
k
0

=
22
U simetrinoj distribuciji kontinuirane varijable
0
M M x
e
= = . U pozitivno ili negativno
asimetrinim distribucijama S
k
poprima vrijednosti iz intervala 3.


c) Bowleyeva mjera asimetrije

1 3
3 1
2
Q Q
M Q Q
S
e
kQ

+
=

U simetrinim distribucijama 0 2
3 1
= +
e
M Q Q . U pozitivno asimetrinim distribucijama
( )
e
M Q
3
>( )
1
Q M
e
, a u negativno asimetrinim ( )
e
M Q
3
<. ( )
1
Q M
e
. Mjera
kQ
S
poprima vrijednosti iz intervala 1.


Primjer 5.1

U Primjeru 3.3
3492 28, x = ; 3775 27 = , M
o
; 3040 27 = , M
e
; =
1
Q 21,8834; =
3
Q 32,5317; = 8,9886.
Izraunajte vrijednost koeficijenta asimetrije
3
te Pearsonove i Bowleyeve mjere asimetrije.


Navrene godine Broj osoba Razredne sredine
(prave granice) f
i
x
i

( )
3
- x x f
i i

15 - 20 67.170 17,5 - 85.776.213,73
20 - 25 48.482 22,5 - 9.702.126,49
25 - 30 119.819 27,5 - 73.372,77
30 - 40 82.263 35 24.200.751,60
40 - 50 10.604 45 48.952.636,72
50 - (65) 13.392 57,5 331.739.723,11
Ukupno 341.730 309.341.398,43

Trei moment oko sredine je:

( )
= =

=
=
=
341730
43 309341398

6
1
6
1
3
3
,
f
x x f
i
i
i
i i
905,22166
Koeficijent asimetrije je: =
9886 8
22166 905
= =
3 3
3
3
,
,

1,2465.

Distribucija je pozitivno simetrina (
3
> 0).

Vrijednost Pearsonove mjere asimetrije je
23
( ) ( )
=

=

=
9886 8
3040 27 3492 28 3 3
,
, ,

M x
S
e
k
1,2465

Distribucija je srednje pozitivno asimetrina (0 < S
k
< 3)

Vrijednost Bowleyeve mjere asimetrije je:

=

+
=

+
=
8834 21 5317 32
3040 27 2 5317 32 8834 21 2
1 3
3 1
, ,
, , ,
Q Q
M Q Q
S
e
kQ
-0,0181

Raspored sredinjih 50% podataka je blago negativno asimetrian ( )
e
M Q
3
<. ( )
1
Q M
e
.

Koeficijent asimetrije prua najvjerniju sliku o asimetriji. Izravna usporedba stupnja
asimetrije mjerena izraunanim pokazateljima nije mogua jer se oni temelje na razliitim
principima.



5.2. Mjera zaobljenosti (zaobljenost modalnog vrha, kurtoza)


Koeficijent zaobljenosti
4
4
4
=



Kod normalne distribucije
4
= 3. Ako vrh iljatiji nego kod normalne distribucije
4
> 3. Kod
tupog oblika distribucije
4
poprima vrijednosti izmeu 1,8 i 3, dok je kod U-distribucije
4
<
1,8.

Primjer 5.1

U Primjeru 3.3 ( 3492 28, x = ; = 8,9886) izraunajte vrijednost koeficijenta zaobljenosti.


Navrene godine Broj osoba Razredne sredine
(prave granice) f
i
x
i

( )
4
- x x f
i i

15 - 20 67.170 17,5 930.602.139,36
20 - 25 48.482 22,5 56.749.547,22
25 - 30 119.819 27,5 62.307,17
30 - 40 82.263 35 160.954.685,62
40 - 50 10.604 45 815.101.224,75
50 - (65) 13.392 57,5 9.670.482.801,41
Ukupno 341.730 11.633.952.705,52
24
etvrti moment oko sredine je:
( )
= =

=
=
=
341730
52 5 1163395270

6
1
6
1
4
4
,
f
x x f
i
i
i
i i
34.044,2826
Koeficijent zakrivljenosti je: =
9886 8
2826 34044
= =
4 4
4
4
,
,

5,2152

Distribucija je iljatija od normalne (
4
> 3).



Vjebe


1. Za sljedei numeriki niz:

72, 65, 89, 56, 74, 45, 23, 65, 53, 89, 78, 84, 98, 24, 31, 63, 45, 32, 31, 23

a) Odredite vrijednost koeficijenta asimetrije
3
, Pearsonove i Bowleyeve mjere ovog niza
b) Nacrtajte dijagram s tokama i na njemu naznaite poloaj aritmetike sredine.
c) Nacrtajte B-W dijagram.


2. Zadana je sljedea distribucija frekvencija

Granice razreda Frekvencije
15 - 20 96
20 - 25 272
25 -35 504
35 - 45 483
45 - 55 175
55 - 65 38

a) Kolika je vrijednost koeficijenta zaobljenosti distribucije?
b) Izraunajte vrijednost koeficijenta asimetrije, Pearsonove i Bowleyeve mjere asimetrije
c) Koliki je koeficijent varijacije i interkvartil?
d) Prikaite distribuciju poligonom frekvencija i oznaite poloaj aritmetike sredine,
medijana i moda.





25
6. OSNOVNI POJMOVI VJEROJATNOSTI



6.1. Definicije vjerojatnosti


Sluajni pokus je proces (postupak mjerenja, opaanja) iji rezultat ovisi o sluajnosti i
ne moe se unaprijed predvidjeti. Primjerice bacanje kocke moe se shvatiti kao
izvoenje sluajnog pokusa (uvjeti: kocka je pravilna, bacanje se moe ponavljati, postoji
vie rezultata, rezultati su neizvjesni). Rezultat pokusa naziva se ishodom (npr. kod
jednokratnog bacanja kocke dobiven je broj 4).

Prostor dogaaja S je skup od svih moguih ishoda pokusa. Za pravilnu kocku prostor
elementarnih dogaaja je {1, 2, 3, 4, 5, 6}.

Sluajni dogaaj ili sluajni uzorak je podskup prostora dogaaja. Primjerice prostor
sluajnog dogaaja da se pri bacanju kocke dobije neparni broj je podskup {1,3,5}.


Odreivanje vjerojatnosti nastupa sluajnih dogaaja temelji se na klasinoj i
statistikoj definiciji.

Klasina definicija polazi od pretpostavke da sluajni pokus ima konaan broj jednako
moguih ishoda. Vjerojatnost nastupa dogaaja A jednaka je omjeru broja za njega
povoljnih ishoda m i ukupnog broja ishoda n, tj,

( )
n
m
A P =

Tako raunana vjerojatnost naziva se i vjerojatnost a priori jer je unaprijed poznat
broj svih povoljnih ishoda i ukupno moguih.

Statistika vjerojatnost (vjerojatnost a posteriori) je granina vrijednost relativne
frekvencije povoljnog ishoda dogaaja A ako se broj ponavljanja pokusa izvedenih u istim
uvjetima poveava u beskonanost, tj.

( )
n
m
A P
x
lim =



gdje je: m = broj povoljnih ishoda u pokuajima
n = ukupan broj pokuaja

26

S

S

S
A

S

A
A'
a) Vennovi dijagrami

Siguran dogaaj obuhvaa sve dogaaje. Vjerojatnost sigurnog dogaaja je:



P(S) = 1



Dogaaj A je nemogu ako je A= (prazan skup). Vjerojatnost nemogueg dogaaja je:



P( ) = 0




Sluajni dogaaj A predstavljen je krugom. Vjerojatnost dogaaja A je:



0 P(A) 1




Komplement sluajnog dogaaja A jest dogaaj A' koji sadri sve elemente prostora
uzoraka S koji ne ine dogaaj A. Vjerojatnost da nee nastupiti dogaaj A je :



P(A') = 1 P(A)




Ako su sluajni dogaaji A i B definirani na skupu S, tada je njihova unija (A B)
dogaaj koji nastane ako nastane dogaaj A, ili dogaaj B, ili oba.

Istodobni nastanak dogaaja A i B jest je dogaaj A B, a tvore ga elementi njihova
presjeka.
27

S
A B
Meusobno iskljuivi dogaaji u jednom izvoenju pokusa ne mogu nastati istovremeno.
Vjerojatnost da e nastupiti dogaaj A ili dogaaj B je:



P(A B) = P(A) + P(B)




Za dogaaje koji se meusobno ne iskljuuju vjerojatnost nastupa barem jednog od njih
je:



P(A B) = P(A) + P(B) P(A B)





Dogaaji su neovisni ako u jednom pokusu mogu nastati istodobno. Vjerojatnost da e
nastupiti dogaaj A i dogaaj B je:



P(A B) = P(A) P(B)





Primjer 6.1

Prostor dogaaja S su brojevi od 1 do 20. Sluajni pokus: iz skupa S bira se jedan broj. Kolika
je vjerojatnost da je to: a) paran broj, b) broj djeljiv sa 3.
Vjerojatnosti prikaite pomou Vennovog dijagrama


A = {parni brojevi}
B = {brojevi djeljivi sa 3}.
AB = {parni brojevi i brojevi djeljivi sa 3}
AB = {parni brojevi ili brojevi djeljivi sa 3}



28

( )
5 0 =
20
10
= , A P
( )
3 0 =
20
6
= , B P
( ) ( ) ( )
15 0 =
20
3
= = , B P A P B A P
( ) ( ) ( ) ( ) 65 0 15 0 3 0 5 0 P , , , , B A B P A P B A P = + = + =

Vjerojatnost dobivanja broja koji nije paran i nije djeljiv sa 3 je:
( ) 35 0 65 0 1 1 , , B A P = =


b) Stabla vjerojatnosti

Stabla vjerojatnosti su dijagrami koji po granama pokazuju razliite razine
vjerojatnosti. Dogaaji se zapisuju s lijeva na desno po redoslijedu pojavljivanja.
Vjerojatnosti ishoda na kraju (tj. vjerojatnost da su se dogodila sva tri dogaaja, A i B i
C) rauna se na nain da se pomnoe vjerojatnosti ovih dogaaja po granama. Na bilo
kojoj razini, zbroj vjerojatnosti po vertikali mora iznositi 1.





C
B
Nije C
C
Nije B
Nije C
C
B
Nije C
C
Nije B
Nije C


Primjer 6.2

Koarkaki tim igra 2/5 utakmica kod kue. Ako igraju na domaem terenu vjerojatnost da
pobijede je 0,7 a ako igraju u gostima vjerojatnost da pobijede je samo 0,5. Izraunajte
vjerojatnost da e dobiti sljedeu utakmicu bez obzira gdje igraju.


Stablo vjerojatnosti izgleda ovako
A
Nije A
A i B i C
se pojavljuju
29


Pobijediti
Kod kue
Izgubiti

Pobijediti
U gostima
Izgubiti

0,4
0,6
0,7
0,3
0,5
0,5

A i B
P(B/A) B P(A B)
A
P(A) Nije B

B
Nije A
Nije B










Dogaaj "pobijediti" je zadan:
{pobijediti} = {kod kue i pobijediti} ili {u gostima i pobijediti}

P(pobijediti) = 0,4 0,7 + 0,6 0,5 = 0,58








6.2. Uvjetna vjerojatnost


Vjerojatnosti esto ovise o pojavljivanju ili nepojavljivanju prethodnog dogaaja. Takve
vjerojatnosti nazivamo uvjetnim. Pojavljivanje dogaaja A moe utjecati da pojavljivanje
dogaaja B bude nemogue, manje vjerojatno, vie vjerojatno ili sigurno. Primjerice,
bacanjem dvije pravilne kocke zbroj dobivenih brojeva ne moe biti 11 ukoliko na prvoj
kocki nisu dobiveni brojevi 5 ili 6.

Vjerojatnost dogaaja B uz uvjet da se dogodio dogaaj A oznaava se sa P(B/A), pa
vjerojatnosti na desnim granama stabla vjerojatnosti mogu biti uvjetne vjerojatnosti.










Mnoenjem vjerojatnosti po gornjim granama dobiva se:
( ) ( ) ( )
B A P A / B P A P =
Ako su dogaaji povezani s "i" vjerojatnosti se pomnoe.
Ako su dogaaji povezani s "ili" vjerojatnosti se zbrajaju.
30


0,7 P (= pobijedio) K P

0,4 K
0,3 I (= izgubio)

0,5 P (= pobijedio) G P
0,6 G
0,5 I (= izgubio)

Odatle slijedi:
( )
( )
( )
A P
B A P
A / B P

=


Primjer 6.3

U Primjeru 6.2 koarkaki tim igra 2/5 utakmica kod kue (K). Vjerojatnost da pobijedi na
domaem terenu je 0,7 a kad igra u gostima (G) je 0,5. Ako je prolu utakmicu pobijedio,
izraunajte vjerojatnost da je tim igrao kod kue.











Vjerojatnost da tim pobijedi P(P) je:

P(P) = P(KP) + P(GP) = 0.4 0,7 + 0,6 0,5 = 0,28 + 0,30 = 0,58

Uvjetna vjerojatnost da je igrao kod kue (K) uz uvjet da je pobijedio (P) je

4828 0 =
58 0
28 0
=

= ,
,
,
) P ( P
) P K ( P
) P / K ( P


Ako su dogaaji A i B nezavisni, tada dogaaj B nee biti uvjetovan dogaajem A, stoga
P(B/A) mora biti jednaka P(B)

( )
( )
) B ( P
) A ( P
) A ( P ) B ( P
) A ( P
A B P
A / B P =

=


Vjebe

1. Pokus se sastoji u jednom bacanju triju pravilnih novia. Odredite sve lanove prostora
uzorka.

31
2. Zaposlenik osiguravajueg drutva namjerava tijekom dana posjetiti dva potencijalna
kupca ivotnog osiguranja. Posjet zavrava ili ne zavrava sklapanjem ugovora o osiguranju.
Moe li se posjet zaposlenika smatrati sluajnim dogaajem? Ako je odgovor potvrdan,
navedite sve lanove prostora uzorka.

3. Zadan je prostor uzorka S = {3, 8, 11, 17, 25, 29}. Na tom prostoru definirani su
dogaaji: A = {3, 17, 29} i B = {11, 17, 25}.

a) Prikaite dogaaj A i B Vennovim dijagramom
b) Odredite vjerojatnost nastanka dogaaja AB, AB

4. Zadane su ove vjerojatnosti za dogaaje A i B: P(A) = 0,30; P(B) = 0,45; P(AB) =0,25.

a) Da li su dogaaji meusobno iskljuivi?
b) Da li su neovisni?
c) Odredite vjerojatnost dogaaja AB.

5. ara sadri 5 zelenih kuglica, 4 plave i 3 crvene kuglice. Kolika je vjerojatnost da se
sluajno izabere:

a) jedna kuglice crvene boje
b) da se ne izabere zelena kuglica
c) da se izabere zelena i plava kuglica

6. Dogaaji A i B su meusobno iskljuivi, s ovim vjerojatnostima nastanka: P(A) = 0,3
P(B) = 0,2. Odredite ove vjerojatnosti: P(A'), P(B'), P(AB), P(A/B), P(B/A).

7. Zadane su vjerojatnosti nastanka dogaaja: P(A) = 0,30; P(B) = 0,75; P(AB) =0,25.
Izraunajte vjerojatnosti nastanka ovih dogaaja: P(A'), P(B'), P(AB), P(A'B'), P(A/B),
P(B/A).

8. Strojevi A
1
, A
2
i A
3
,izrauju isti proizvod. U ukupnoj proizvodnji prvi stroj sudjeluje sa
40%, drugi sa 35% i trei sa 25%. Stroj A
1
radi priblino konstantnim kartom od 2%, stroj
A
2
sa 3% i stroj A
3
sa 4% karta. Ako se sluajno izabere jedan proizvod, kolika je
vjerojatnost da e biti neispravan? Ako je izabran neispravan proizvod, kolika je vjerojatnost
da je proizveden na stroju A
3
?

9. Ispituje se uestalost kupnje proizvoda A tijekom jednog mjeseca. Anketirano je 1000
osoba. Grupirani podaci dani su u tabeli.

Broj nabavljenih proizvoda 0 1 2 3 4 5 6
Broj anketiranih osoba 40 100 170 310 180 150 50

Kolika je vjerojatnost da sluajno izabrani anketirani potroa:
a) ne kupuje proizvod,
b) da kupuje 2 ili 3 proizvoda,
c) da u tijeku mjeseca nabavi 5 i manje proizvoda?

32
7. TEORIJSKE DISTRIBUCIJE



7.1 Sluajna varijabla i distribucije vjerojatnosti


Sluajna varijabla X numerika je funkcija koja svakim ishodu sluajnog pokusa
pridruuje realan broj. Sluajna varijabla je diskretna ako poprima konaan broj
vrijednosti ili prebrojivo mnogo njih. Kontinuirana sluajna varijabla poprima bilo koju
vrijednost iz nekog intervala.

Distribucija vjerojatnosti diskretne sluajne varijable je skup ureenih parova
razliitih vrijednosti te varijable i pripadajuih vjerojatnosti.

{x
i
, p(x
i
)}, i = 1, 2, , k

Funkcija distribucije definira se izrazom:

( ) ( )

=
i
x x
i i
x p x F

Distribucija vjerojatnosti kontinuirane sluajne varijable opisuje razdiobu vjerojatnosti
na intervalu vrijednosti varijable. Funkcija distribucije
( )
x X F ili
( )
x F kontinuirane
sluajne varijable je oblika:
( ) ( )dx x f x F
x


=

Oekivana vrijednost sluajne varijable definira se na sljedei nain:

( ) ( )

1
k
i
i i
x p x X E
=
= , ako je varijabla X diskretna
( ) ( )


= dx x xf X E , ako je varijabla X kontinuirana

Varijanca sluajne varijable X, ija je oekivana vrijednost
( )
= X E , dana je izrazom:

( ) ( ) ( ) ( )

1
2 2 2
k
i
i i
x p x X E X V
=
= = = , ako je varijabla X diskretna
( ) ( ) ( ) ( )dx x f x X E X V
i


= = =
2 2 2
, ako je varijabla X kontinuirana
33
7.2. Teorijske distribucije diskretne sluajne varijable


a) Binomna distribucija

Definira se u svezi s Bernoullijevim pokusima. Bernoullijev pokus ima sljedea obiljeja:
(1) pokus ima dva ishoda (uspjeh, neuspjeh), (2) u svakom ponavljanju pokusa vjerojatnost
ishoda uspjeh jednaka je p i ne mijenja se od pokusa do pokusa. Vjerojatnost ishoda
neuspjeh jednaka je q = 1 p , (3) pokusi su neovisni.

Ako je n broj ponavljanja Bernoullijeva pokusa, p vjerojatnost ishoda uspjeh, a X
(sluajni) broj ishoda uspjeh, varijabla X je binomna sluajna varijabla. Sluajna varijabla
X ravna se prema binomnoj distribuciji ako je njezina distribucija vjerojatnosti dana
izrazom:
( )
x n x
q p
x
n
x p
-
|
|

\
|
= , x = 0, 1, 2, , n
odnosno
( )
( )
n-x x
q p
! x n x!
n!
x p

= , x = 0, 1, 2, , n

skraeno B(n; p). Oekivana vrijednost distribucije je
( )
np X E = = , a varijanca je
npq =
2
. Distribucija je simetrina (za p 0,5). S porastom n-a, binomna distribucija
se pribliava normalnoj distribuciji.


Primjer 7.1

Varijabla X ravna se po binomnoj distribuciji B(5; 0,4).
a) Kako glasi funkcija vjerojatnosti i funkcija distribucije?
b) Kolika je vjerojatnost da sluajna varijabla distribuirana prema funkciji pod (a) poprimi
vrijednosti: x = 0; x 2; ; x 5, x > 3; 3 x 5; 3< x 5?

a) Binomna distribucija, n = 5, p =0,4. Ona glasi: ( )
x x
x
x p
- 5
6 , 0 4 , 0
5
|
|

\
|
= , x = 0, 1, 2, , 5.

x
i
0 1 2 3 4 5
p(x
i
) 0,0778 0,2592 0,3456 0,2304 0,0768 0,0102
F(x
i
) 0,0778 0,3370 0,6826 0,9130 0,9898 1,0000

b) p(0) = 0,0778 p(x 2) = p(0) + p(1) + p(2) = 0,6826

p(x 5) = 1 p(x > 3) = 1 p(x 3) = 1 0,913 = 0,087
34
p(3 x 5) = p(3) + p(4) + p(5) = 0,3174 p(3< x 5) = p(4) + p(5) = 0,087


b) Poissonova distribucija

Ako je p vrlo maleno, tj ako je p < 0,1 a n 50 tada se binomne vjerojatnosti mogu
izraunati aproksimativno pomou funkcije

( )
!
-
x
e
x p
x

= , > 0, x = 0, 1, 2,

gdje je np: p(x) = 1, e = baza prirodnih logaritama 2,71828

Ta teorijska distribucija zove se Poissonova distribucija. Poissonova distribucija je
granini sluaj binomne distribucije.

Oekivana vrijednost Poissonove distribucije je
( )
= = x E , a varijanca je =
2
.
Standardna devijacija je = = .



7.3. Teorijske distribucije kontinuirane sluajne varijable


a) Normalna (Gaussova) distribucija

Normalna distribucija najvanija je statistika distribucija. Ima oblik zvona, unimodalna
je, protee se od - < x < + , simetrina je pa je 0 =
3
, oekivana vrijednost
(aritmetika sredina) jednaka je medijanu i modu, mjera je zaobljenosti 3 =
4
.

Funkcija vjerojatnosti normalne distribucije je

( )
2
2
1
2
1
|

\
|


x
e x f

gdje je: = standardna devijacija
= konstanta 3,14159
e = baza prirodnih logaritama 2,71828
= oekivana vrijednost

S obzirom da oekivana vrijednost i standardna devijacija ovise o mjernim jedinicama
varijable X, uvodi se standardizirana (jedinina) normalna distribucija. Ako je sluajna
35







varijabla normalno distribuirana sa sredinom i standardnom devijacijom , tada je
varijabla


=
X
Z distribuirana po standardiziranoj normalnoj distribuciji:
( )
2
2
1
2
1
z
e z f

=

, - < Z < + ,

Normalna distribucija oznaava se s N (,
2
), a standardizirana (jedinina) normalna
distribucija s N (0, 1).

Jedinina normalna distribucija je tabelirana. U tablici distribucije vjerojatnosti
navedene su povrine koje predouju vjerojatnost da sluajna varijabla poprimi
vrijednost iz intervala z Z 0 . Normalna distribucija je simetrina, pa su tabline
vrijednosti dane samo za pozitivne vrijednosti varijable Z .


Primjer 7.2

Sluajna varijabla X distribuirana je po normalnoj distribuciji N (0; 1). Odredite vjerojatnost da
varijabla poprimi vrijednost iz intervala
a) 1,774 < Z < 0
b) 2,118 < Z < 1,88
c) Z > 1,668
d) Z > 1,683
e) Z < 2,445
f) Z < 2,039
g) 1,121 < Z < 2,975



a) P(1,774<Z<0) = P(0<Z<1,774) = 0,4619





b) P(2,118<Z<1,88) = P (2,188<Z<0) + P(0<Z<1,88)
= 0,4829 + 0,4699 = 0,9528




c) P(Z > 1,668) = P(1,668<Z<0) + P(Z>0)
= 0,4523 + 0,5 = 0,9523

36















d) P(Z>1,683) = P(Z>0) P(0<Z<1,683)
= 0,5 0,4538 = 0,0462





e) P(Z < 2.445) = P(Z<0) + P(0<Z<2,445)
= 0,5 + 0,4928 = 0,9928




f) P(Z<2,039) = P(Z<0) P(2,039<Z<0)
= 0,5 0,4792 = 0,0208





g) P(1,121<Z<2,975) = P (0<Z<2,975) P(0<Z<1,121)
= 0,4985 0,3688 = 0,1297



Primjer 7.3

Varijabla X ravna se po normalnoj distribuciji N (33; 8
2
). Kolika je vjerojatnost da sluajna
varijabla poprimi vrijednost manju od 20.


625 1
8
33 20
,

X
z =

=

( ) ( ) 625 1 20 , Z P X P < = <
= P(Z<0) P(1,625<Z<0)
= 0,5 0,4479 = 0,0521 P(X < 20) = 5,21%


U programskoj potpori EXCEL-a binomna distribucija i pripadajua funkcija
distribucije odreuju se na temelju opcija Insert f
x
function Statistical BINOMDIST, i to
za danu vrijednost varijable x i za parametre n i p. Ako se ne utvruje vrijednost kumulativne
frekvencije , u odgovarajue polje upie se false.
37
Vjebe


1. Neka je X varijabla ije vrijednosti predouju broj ishoda glava pri jednom bacanju triju
pravilnih novia

a) Prikaite tabelarno distribuciju vrijednosti sluajne varijable X te pripadajuu funkciju
distribucije
b) Kolika je oekivana vrijednost sluajne varijable te varijanca, standardna devijacija i
koeficijent varijacije?


2. Zadana je binomna distribucija B(7; 0,5). Prikaite tabelarno njezine vrijednosti i
pripadajue vrijednosti funkcije distribucije. Odredite oekivanu vrijednost, varijancu,
standardnu devijaciju, koeficijent asimetrije i koeficijent zaobljenosti distribucije.


3. Sluajna varijabla pripada normalnoj distribuciji sa sredinom 100 i standardnom
devijacijom 20.

a) Izraunajte standardizirane vrijednosti z za ove vrijednosti varijable X: 90, 80, 40, 120,
140, 160, 125, 170.
b) Odredite vjerojatnosti: P(80<X<120), P(60<X<140), P(40<X<160), P(40<X<125),
P(X<170).


4. Na burzi sadanja cijena dionice tvrtke Marina iznosi 720 kuna. Prema predvianjima
brokera tijekom godine cijena dionice biti e normalno distribuirana varijabla sa sredinom =
700 kuna i standardnom devijacijom = 20 kuna. Pod pretpostavkom da je predvianje tono,
izraunajte vjerojatnost da za godinu dana cijena te dionice nee biti nia od sadanje.


5. Distribucija proizvoda prema teini normalna je oblika.15,87% proizvoda ima teinu
manju od 27 grama, a 2,28 % proizvoda ima teinu veu od 36 grama.

a) Kolika je aritmetika sredina distribucije, standardna devijacija i koeficijent varijacije?
b) Kolika je vjerojatnost da je sluajno izabrani proizvod teak izmeu 25,5 i 31,5 grama?







38
8. METODA UZORAKA



Statistiko istraivanje konanih skupova s vrlo velikim brojem jedinica i beskonanih
skupova provodi se pomou metode uzoraka. Pojava koja se eli ispitati tom metodom
zove se populacija ili osnovni skup, a njezin dio koji se u tu svrhu ispituje zove se uzorak.
Da bi zakljuci na osnovi uzorka bili to toniji, uzorak mora biti reprezentativan.

Osnovne zadae metode uzoraka su:
procjenjivanje nepoznatih parametara
ispitivanje pretpostavki o parametrima, osobitostima jedne ili vie populacija

Parametar je brojana karakteristika populacije. On je funkcija svih njezinih
vrijednosti. Procjenjuje li se parametar na temelju uzorka, funkcija vrijednosti uzorka
naziva se procjeniteljem. Pomou procjenitelja i vrijednosti iz uzorka parametar se
procjenjuje brojem ili intervalom. Dobivene vrijednosti nazivaju se procjenama.

S obzirom na nain izbora jedinica u uzorak, razlikuje se namjerni uzorak od sluajnog
uzorka. U namjerni uzorak izabiru se jedinice prema odluci istraivaa (anketara). Meu
namjerne uzorke spadaju prigodni uzorak i kvotni uzorak. Sluajni uzorak izabire se tako
da svaki lan populacije ima vjerojatnost izbora u uzorak veu od nule. Sluajni uzorci iz
konanih skupova mogu biti: jednostavni sluajni uzorak, stratificirani uzorak i uzorak
skupina.

Kad se iz populacije od N elemenata izabire uzorak od n elemenata (n < N) tako da svaki
element ima jednaku vjerojatnost izbora, takav uzorak zove se jednostavni sluajni
uzorak. Izbor jedinica u uzorak iz konanog stvarnog skupa provodi se pomou tablica
sluajnih brojeva ili pomou odgovarajueg raunalnog programa koji generira sluajne
brojeve. Ponekad se primjenjuje sistemski izbor jedinica u uzorak. U tom sluaju
izraunava se korak izbora: N / n, a zatim odreuje sluajni poetak.

Kada u statistikim skupovima postoji znatan stupanj varijabilnosti obiljeja jedinica
tada se umjesto jednostavnog sluajnog uzorka primjenjuje stratificirani uzorak.
Postupku izbora uzorka prethodi razvrstavanje elemenata osnovnog skupa u podskupove
(stratume) koji se meusobno ne preklapaju. Dobiveni stratumi imaju manji stupanj
varijabilnosti nego osnovni skup. Stratificirani uzorak nastaje sluajnim izborom
elemenata osnovnog skupa iz stratuma.

Kod istraivanja beskonanih skupova za primjenu metode uzoraka u njihovu ispitivanju
potrebno je poznavati oblik i svojstva distribucije populacije.
39
Sampling-distribucija je teorijska distribucija vjerojatnosti procjenitelja parametra.
Svaka sampling-distribucija izvire iz koncepta ponovljenih izbora sluajnih uzoraka iz
danog osnovnog skupa. Kako je procjenitelj parametra funkcija uzorka, razliiti uzorci
dovode do razliitih vrijednosti procjena. Prema tome, procjenitelj je varijabla koja se
naziva sampling-varijablom zato to se mijenja od uzorka do uzorka. Sampling-varijabla
je sluajna varijabla jer se uzorci izabiru tako da svaka jedinica, odnosno uzorak ima
odreenu vjerojatnost izbora. Za sampling-distribuciju je vano kakva je oblika i koja su
joj statistika svojstva (oekivana vrijednost, standardna devijacija i sl.)


a) Sampling-distribucija aritmetikih sredina

Ako je sluajni uzorak veliine n izabran iz normalno distribuiranog osnovnog skupa
sa sredinom i standardnom devijacijom , aritmetika sredina uzorka X sluajna je
varijabla koja se ravna po normalnoj distribuciji s oekivanom vrijednosti i
standardnom devijacijom
X
. Standardna devijacija sampling-distribucije sredina
X

jo se naziva standardnom grekom sredine.

Ako je sluajan uzorak veliine n > 30 izabran iz normalno distribuiranog osnovnog
skupa sa sredinom i standardnom devijacijom , aritmetika sredina uzorka X
sluajna je varijabla koja se priblino ravna po normalnoj distribuciji
( )
x
, X N
Standardizirana varijabla
X

X
Z

= je sluajna varijabla rasporeena po jedininoj
normalnoj distribuciji.

Ako je sluajni uzorak veliine n 30 izabran iz normalno distribuiranog osnovnog
skupa a sredinom i standardnom devijacijom , varijabla
X

X
t

= sluajna je
varijabla koja pripada Studentovoj (t) distribuciji s (n 1) stupnjem slobode


U tablici t-distribucije u predstupcu je naveden broj stupnjeva slobode od 1 do 29. Broj
stupnjeva slobode (, df, ss) jednog pokazatelja definira se kao broj neovisnih opaanja n
umanjen za broj k parametara potrebnih da bi se odredio dani pokazatelj, tj. k - n df = = .
U zaglavlju tablice oznaene su vjerojatnosti 0,1; 0,05; 0,025; 0,01 i 0,005. U brojanom
dijelu tablice nalaze se kritine vrijednosti koje e t premaiti za broj stupnjeva slobode koji se
oitava u istom retku s vjerojatnou oznaenom u zaglavlju za isti stupac. Primjerice, za 10
stupnjeva slobode postoji vjerojatnost 0,1 da e t premaiti 1,372. Budui da je Studentova
distribucija simetrina to je ista vjerojatnost, tj. 0,1 da e t biti manje od 1,372, ili
vjerojatnost je 0,8 da e se t nalaziti izmeu 1,372 i +1,372. Isto tako za 20 stupnjeva
slobode vjerojatnost je 0,95 da e se t nalaziti izmeu 2,086.
40
b) Sampling-distribucija proporcija

Sampling-distribucija proporcija p za dovoljno velik uzorak priblino je normalna oblika,
s oekivanom vrijednosti p i standardnom devijacijom (standardnom grekom procjene)
p
. Procjenitelj proporcije osnovnog skupa je n / m p = . Uzorak je velik ako ispunjava
ove uvjete: 5 np ili 5 nq .


c) Sampling-distribucija varijanci

Ako sluajni uzorak potjee iz normalno distribuiranog osnovnog skupa, sampling-
distribucija varijanci
2
ima oblik
2
- distribucije s (n 1) stupnjem slobode.
Procjenitelj varijance osnovnog skupa je ( )

1
2 2

1
1
n
i
i
x X
n

=
Oekivana vrijednost navedenog procjenitelja jednaka je varijanci osnovnog skupa.


U tablici
2
distribucije (hi-kvadrat) u predstupcu je naveden broj stupnjeva slobode od
1 do 30. U zaglavlju su oznaene vjerojatnosti od 0,995 do 0,005. U brojanom dijelu tablice
nalaze se kritine vrijednosti koje e hi-kvadrat premaiti za broj stupnjeva slobode koji se
oitava u istom retku s vjerojatnou oznaenom u zaglavlju za isti stupac. Primjerice, za 10
stupnjeva slobode postoji vjerojatnost 0,1 da e hi-kvadrat premaiti 15,9871.


Primjer 8.1

Numerika varijabla X broj je jednakih proizvoda koje je nabavilo etvero potroaa. Njezine
su vrijednosti 2, 4, 5, 9 i one ine osnovni skup. Svaki element skupa, odnosno svaki uzorak
veliine n = 2, ima jednaku vjerojatnost izbora.
a) Izraunajte aritmetiku sredinu i standardnu devijaciju osnovnog skupa.
b) Navedite sve mogue uzorke veliine 2 iz navedenog skupa. Pretpostavite da se izbor
provodi s ponavljanjem. Za svaki uzorak izraunajte aritmetiku sredinu. Uredite vrijednosti
aritmetikih sredina uzoraka, tj. formirajte sampling-distribuciju uzoraka.
c) Za dobivenu sampling-distribuciju odredite oekivanu vrijednost i standardnu devijaciju
d) emu je jednaka oekivana vrijednost sampling-distribucije sredina?


Provodi li se izbor uzoraka s ponavljanjem, standardna devijacija sampling-distribucije
sredina dana je izrazom
n
x

= . Koristei se ovim izrazom provjerite tonost izraunane


standardne devijacije sampling distribucije sredina.

41

Aritmetike sredine uzoraka
i
x
( )
i
x p
2 0,0625
3 0,1250
3,5 0,1250
4 0,0625
4,5 0,1250
5 0,0625
5,5 0,1250
6,5 0,1250
7 0,1250
9 0,0625

Vrijednosti varijable
elemenata u uzorku
Aritmetike sredine
uzoraka i x
2 , 2 2
2 , 4 3
4 , 2 3
2 , 5 3,5
5 , 2 3,5
2 , 9 5,5
9 , 2 5,5
4 , 4 4
4 , 5 4,5
5 , 4 4,5
4 , 9 6,5
9 , 4 6,5
5 , 5 5
5 , 9 7
9 , 5 7
9 , 9 9


a)
( )
5 = 9 + 5 + 4 + 2
4
1
=
1
=
1 =
N
i
i
x
N

( ) 5 6
4
26 1

1
2 2
, x
N
N
i
i
= = =
=
= 5 6 = , 2,54951

b) mogui uzorci veliine n = 2 s ponavljanjem i njihove pripadajue sredine:




















Broj moguih uzoraka s ponavljanjem je 16. Budui da je vjerojatnost izbora svakoga
sluajnog uzorka veliine n = 2 jednaka, iznosi 1/16 (= 0,0625)

Sampling distribucija uzoraka je:













42

i
x
( )
i
x p
( )
i i
x p x
( ) ( )
2
-
i i
x x p
2 0,0625 0,1250 0,5625
3 0,1250 0,3750 0,5000
3,5 0,1250 0,4375 0,2813
4 0,0625 0,2500 0,0625
4,5 0,1250 0,5625 0,0313
5 0,0625 0,3125 0,0000
5,5 0,1250 0,6875 0,0313
6,5 0,1250 0,8125 0,2813
7 0,1250 0,8750 0,5000
9 0,0625 0,5625 1,0000
Ukupno 1,0000 5,0000 3,2500

c)














Oekivana vrijednost sampling distribucije je:

( ) ( ) = = =

=
5
10
1
i
i
i
x p x X E

Varijanca i standardna devijacija sampling-distribucije sredina jesu:

( ) [ ] ( ) ( ) = = =
=

10
1
2
2
2
i
i i
x
x x p X E 3,25 = 25 3 = ,
x
1,80278

d) Standardna devijacija osnovnog skupa je = 2,54951

Standardna devijacija sampling distribucije sredina je: =
2
54951 2
= =
,
n
x

1,80278
to je u skladu s rezultatom dobivenim pomou sampling-distribucije.

Standardna devijacija sampling distribucije predouje mjeru disperzije aritmetikih
sredina uzoraka u odnosu prema aritmetikoj sredini populacije i naziva se standardnom
grekom aritmetike sredine. Standardna devijacija sampling-distribucije sredina uzoraka
izabranih bez ponavljanja, dana je izrazom

1

=
N
n N
n
x



Faktor
1

N
n N
u izrazu za standardnu greku procjene naziva se faktorom korekcije za
konane osnovne skupove. Jednak je jedan za beskonane skupove, aproksimativno je
jedan kad je f < 0,05 . Veliina f naziva se frakcijom izbora
N
n
f = .
43
Primjer 8.2

Populacija ima aritmetiku sredinu 200 i standardnu devijaciju 25. Kolika je vjerojatnost da se
aritmetika sredina sluajnog uzorka od 100 elemenata nae izmeu:
a) 195 i 205 b) 197,5 i 202,5?


a) n = 100, Sampling-distribucija aritmetikih sredina uzoraka je priblino normalna sa
sredinom = 200 i standardnom grekom 5 2 =
100
25
= = ,
n
x


( ) ( ) 9544 , 0 2 2
205 195
205 195 = < < =
|
|

\
|

<

<

= < < Z P


P X P
x x x

b) ( ) ( ) 6826 , 0 1 1
5 , 202 5 , 197
5 , 202 5 , 197 = < < =
|
|

\
|

<

<

= < < Z P


P X P
x x x



Vjebe

1. Osnovni skup sastoji se od podataka o radnom stau devetoro zaposlenih. Njihov je rani
sta izraen u godinama:

Zaposleni: A B C D E F G H I
Radni sta: 10 8 7 6 5 4 4 2 2

a) Izraunajte aritmetiku sredinu i standardnu devijaciju osnovnog skupa.
b) Izaberite iz osnovnog skupa bez ponavljanja sve uzorke veliine n = 2. Formirajte
sampling-distribuciju aritmetikih sredina. Odredite oekivanu vrijednost i standardnu
devijaciju (standardnu greku) distribucije. Standardnu greku izraunajte izravno,
primjenom odgovarajue formule.
c) Ponovite postupak (b) za n = 3 i n = 4.
d) Dobivene sampling-distribucije (b) i (c) usporedite linijskim grafikonom.

2. Osnovni skup sastoji se od ovih est vrijednosti x
i
: 3, 4, 5, 6, 9, 12
a) Izraunajte varijancu osnovnog skupa
b) Formirajte mogue uzorke bez ponavljanja n = 3. Za svaku uzorak odredite vrijednost
varijance
c) Kako glasi sampling-distribucija varijanci (svaki uzorak ima jednaku vjerojatnost izbora)
d) Odredite oekivanu vrijednost sampling distribucije varijanci. Usporedite tu veliinu s
varijancom osnovnog skupa utvrenom pod (a)
e) Korigirajte varijance uzoraka faktorom
N
N
n
n 1
1

, a zatim izraunajte oekivanu


vrijednost sampling-distribucije varijanci.
44
9. PROCJENA PARAMATARA



Procjenjivanje nepoznatih parametara temelji se na podacima koji tvore sluajni uzorak i
na uporabi odgovarajueg procjenitelja (estimator). Parametar se procjenjuje brojem i
intervalom. Primjena procjenitelja na podacima iz uzorka dovodi do procjene (statistic,
estimate). Procjenjivanje intervalom sastoji se u odreivanju granica raspona varijacije u
kojemu se prema nekom kriteriju oekuje da e se nai nepoznati parametar.



9.1. Procjena aritmetike sredine


Podloga za procjenjivanje aritmetike sredine osnovnog skupa ( ) je sluajni uzorak
veliine n lanova te odgovarajua funkcija vrijednosti iz uzorka (procjenitelj).

Ako je (x
1
, x
2
, , x
n
) sluajni uzorak, procjenitelj aritmetike sredine osnovnog skupa
brojem je aritmetika sredina uzorka, tj.

x = ,

=
=
n
i
i
x
n
x
1
1


Kad je uzorak izabran iz normalno distribuiranog osnovnog skupa s nepoznatom sredinom
i nepoznatom standardnom devijacijom, sampling-distribucija sredina uzoraka ravna se po
normalnoj distribuciji, tj. ( )
2
~
x
, N x . Ako je uzorak dovoljno velik (n > 30) sampling-
distribucija sredina priblino je normalna oblika. Iz svojstva normalne distribucije
slijedi:

( ) ( ) = + < < 1
2 2
x
/
x
/
z x z x P

gdje je P oznaka za vjerojatnost, x je aritmetika sredina uzorka,
2 /
z

je koeficijent
pouzdanosti i ovisi o razini pouzdanosti.
x
je standardna greka procjene sredine
(standardna devijacija sampling distribucije).
x
/
z x L
2 1
= je donja granica intervala
pouzdanosti (povjerenja), a
x
/
x L
2 2
z + = gornja granica intervala pouzdanosti procjene
aritmetike sredine.

Interval se tumai: s vjerojatnou 100 (1) % oekuje se da e se izmeu navedenih
granica nai nepoznata aritmetika sredina osnovnog skupa.

45



/2 = 0,025
0,475 0,475
Z0,025=1,96
/2 = 0,025
Z0,025=-1,96 0
Procjenjuje li se aritmetika sredina samo brojem, nije mogue donijeti sud o preciznosti
procjene niti zakljuivati o razini pouzdanosti s kojom se ona moe upotrijebiti.
Preciznost procjene uoava se samo ako se primjenjuje intervalni procjenitelj. Ona se
oituje, za danu razinu pouzdanosti, na udaljenosti granica (tj. na irini intervala). to je
interval procjene ui to je preciznost procjene vea.

Ako je x aritmetika sredina malog sluajnog uzorka (n 30) uzorka izabranog iz
normalno distribuiranog osnovnog skupa
( )
2
, N s nepoznatom standardnom devijacijom
i nepoznatom aritmetikom sredinom, interval pouzdanosti za aritmetiku sredinu
osnovnog skupa na odabranoj razini pouzdanosti je:

( ) ( ) = + < < 1
2 2
x
/
x
/
t x t x P

Interval izvire iz oblika sampling-distribucije sredina malih uzoraka koja ima oblik
Studentove distribucije. Koeficijent pouzdanosti t odreuje se pomou Studentove
distribucije prema broju stupnjeva slobode (n 1) i za vjerojatnost 2 / .


Primjer 9.1

Intervalni je procjenitelj aritmetike sredine osnovnog skupa velikim sluajnim uzorkom
( ) ( ) = + < < 1
2 2
x
/
x
/
z x z x P .
a) Koliki je koeficijent pouzdanosti
2 /
z

ako ( ) 1 iznosi 0,95. Skicirajte postupak


odreivanja koeficijenta.
b) Uz koju se razinu pouzdanosti provodi postupak intervalne procjene aritmetike sredine
osnovnog skupa pomou velikog uzorka, ako je koeficijent pouzdanosti 2,17.


a) Procjena je na razini 95%. Koeficijent pouzdanosti
je ( ) 1 = 0,95 ; = 0,05; /2 = 0,025
025 0 2
=
, /
z z

.
Povrina izmeu 0 i z jest: 0,5 0,025 = 0,4750
U tablici toj povrini pripada vrijednost varijable
z = 1,96 pa je 96 1 =
025 0
, z
,
.

b) 17 2 =
2
, z
/
. Pripadajua je povrina 0,4850. Razina pouzdanosti je:
/2 = 0,5 0,4850 = 0,0150; = 0,03; ( ) 1 = 0,97 ili 97%.


Primjer 9.2

Odredite vrijednosti standardne greke procjene aritmetike sredine osnovnog skupa:
46
a) procjenjuje se sredina konanog skupa od 125.768 lanova pomou sluajnog izbora
veliine 1.250 lanova. Standardna devijacija skupa iznosi 64.
b) Procjenjuje se sredina konanog skupa pomou sluajnog uzorka veliine 600 formiranog
izborom svakog 10. lana skupa. Varijanca skupa iznosi 100.


a) N = 125768; n = 1250; 0099 0 =
125768
1250
= = ,
N
n
f
= 64; f < 0,05
81019 1 =
1250
64
= = ,
n
x



b) n = 600; 10 =
600
=
N
n
N
; N = 6000; 1 0 = = ,
N
n
f ; f > 0,05
100 =
2
; 10 = .
38733 0
1 6000
600 6000
600
10
1
,
N
n N
n
x
=

=




Primjer 9.3

Ispituje se prosjeno trajanje pozivnih telefonskih razgovora preko telefonske centrale jednog
poduzea. Trajanje (u minutama) 10 sluajno odabranih razgovora iz evidencije od 8967
razgovora bilo je sljedee:

x
i
: 2 1 1 2 3 4 2 1 1 3

Pretpostavlja se da je trajanje pozivnih razgovora na centrali normalno distribuirano s
nepoznatom aritmetikom sredinom i nepoznatom standardnom devijacijom. Odredite granice
u kojima se moe oekivati da obuhvaaju prosjeno trajanje razgovora za osnovni skup.
Pouzdanost je procjene: 95% i 90%.


N = 8967; n =10;
8967
10
= =
N
n
f = 0,0011 f < 0,05

Aritmetika sredina uzorka: 2
10
20 1
1 1
= = =

=
n
i
x
n
x minute

Procjenitelj varijance i standardne devijacije osnovnog skupa:
( )
9
10
1

1
2
2
=

=
=
n
x x

n
i
i
,
3
10
=
9
10
=
47
Standardna greka procjene aritmetike sredine osnovnog skupa:
3
1
=
10
3
10
= =
n


Za uzorak n 30 izabran iz normalno distribuiranog osnovnog skupa interval procjene s
pouzdanosti 100(1-) u opem obliku je:

( ) ( ) = + < < 1
2 2
x
/
x
/
t x t x P

Koeficijent pouzdanosti t odreuje se pomou tablica t distribucije. Za pouzdanost procjene
95%:

(1-) = 0,95; = 0,05; /2 = 0,025; n =10; df = 9;
( )
262 2 = 9
025 0
, t
,


95%-tni interval pouzdanosti procjene prosjenog trajanja razgovora osnovnog skupa iznosi:

95 , 0
3
1
262 , 2 2
3
1
262 , 2 2 = |

\
|
+ < < P
( ) 95 0 754 2 246 1 , , , P = < <

Za pouzdanost procjene 90% koeficijent pouzdanosti je
( )
833 1 = 9
05 0
, t
,
pa je interval procjene:

90 , 0
3
1
833 , 1 2
3
1
833 , 1 2 = |

\
|
+ < < P
( )
90 0 = 611 2 < < 389 1 , , , P


U programskoj potpori EXCEL-a (Tools Data Analysis Descriptive Statistics) dio
ispisa je:
Trajanje pozivnih razgovora
Mean 2
Standard Error 0,333333333
Standard Deviation 1,054092553
Sample Variance 1,111111111
Confidence Level (95,0%) 0,754052386

[Napomena: U navedenom ispisu Standard Error jest standardna greka, Standard Deviation je
procjena standardne devijacije, Sample Variance je procjena varijance populacije, Confidence
Level (95%) je greka procjene na razini 95% pouzdanosti (umnoak koeficijenta pouzdanosti i
standardne greke procjene)]


Odreivanje veliine uzorka

Kod sampling-distribucije sredina ( )
2
~
x
, N x , planirana veliina greke koja se tolerira
pri procjeni je: d =[
x
/
z
2
+ ] ,
x
/
z d
2
=
48
Ako se uzorak izabire iz beskonanog osnovnog skupa na razini pouzdanosti 100 (1-)% i
utvrena je greka procjene d, tada je izraz za odreivanje veliine uzorka:

n
z d
/

2
= ,
2
2 /
(

=
d
z
n



Ako se sluajni uzorak izabire iz konanog osnovnog skupa i frakciji izbora je manja od
5% za izraun veliine uzorka koristi se gornji izraz. Ako je frakcija zbora vea od 5%
koristi se faktor korekcije, pa je veliina uzorka izraunana gornjim izrazom tek
prethodni rezultat koji se oznaava sa:
2
2 /
0
(

=
d
z
n


Konana veliina uzorka dobiva se izrazom:
N
n
n
n
0
0
1+
= ,


9.2. Procjena totala osnovnog skupa


Total T je zbroj vrijednosti numerike varijable konanog osnovnog skupa. Taj
parametar povezan je s aritmetikom sredinom osnovnog skupa, . Ako konani skup ima
N lanova, tada je N T = .

Procjenitelj totala osnovnog skupa pomou sluajnog uzorka brojem je: x N T

= .

Standardna greka procjene totala osnovnog skupa je:
x T

N =

Intervalna procjena totala konanog osnovnog skupa na odabranoj razini pouzdanosti je:

( ) ( ) = + < < 1
2 2
T
/
T
/
z T

T z T

P ,
x T

N =



9.3. Procjena proporcije osnovnog skupa


Proporcija konanog osnovnog skupa je parametar koji predouje omjer lanova skupa s
odreenim oblikom obiljeja M i opsega skupa N, odnosno N / M p = .

Procjenitelj proporcije osnovnog skupa brojem je: n / m p =
49
gdje je m broj lanova uzorka s odreenim oblikom obiljeja, a n veliina uzorka.

Ako sluajni uzorak veliine n potjee iz beskonanog skupa, sampling-distribucija je
oblika binomne distribucije s ovim svojstvima:

E [ p ] = p,
n
pq
p
=
1
=
n
q p
p


Sampling-distribucija proporcija svih uzoraka veliine n priblino ima oblik normalne
distribucije ako je n > 30. Oekivana vrijednost te sampling-distribucije je proporcija
osnovnog skupa p, a standardna greka procjene
p
.

Intervalna procjena proporcije osnovnog skupa na odabranoj razini pouzdanosti je:

( ) ( ) = + < < 1
2 2 p / p /
z p p z p P

gdje je p procjena proporcije brojem (odnosno proporcija uzorka),
2 /
z

je koeficijent
pouzdanosti procjene,
p
je standardna greka procjene proporcije.

Interval se tumai: s vjerojatnou 100 (1-) % oekuje se da e se proporcija osnovnog
skupa nai izmeu izraunanih granica.

Granice intervala procjene proporcije osnovnog skupa pomou dovoljno velikog uzorka
izabranog iz konanog skupa bez ponavljanja izraunavaju se na isti nain kao kod
procjene pomou uzorka iz beskonanog osnovnog skupa. Razlika se pojavljuje pri
raunanju standardne greke procjene proporcije. Za veliki uzorak izabran iz konanog
osnovnog skupa uz f >0,05 standardna greka procjene proporcije je: |

\
|

=
1 1 N
n N
n
q p
p


Primjer 9.4

Ispituje se raspoloenje biraa prema kandidatu stranke. U birakom popisu navedeno je 6000
graana. Iz popisa je sluajnim izborom izabrano 196 biraa, od kojih je njih 138 izjavilo da
e glasovati za kandidata stranke na predstojeim izborima.
a) Procijenite proporciju osnovnog skupa brojem
b) Izraunajte granice u kojima se moe oekivati proporcija svih biraa kandidata stranke na
predstojeim izborima.razina pouzdanosti je 90%.


a) n =196, m =138 70408 0 =
196
138
= = ,
n
m
p
Procjena proporcije biraa u osnovnom skupu za kandidata stranke iznosi 0,70408, tj. 70,4%.
50
b) Interval pouzdanosti procjene proporcije osnovnog skupa:

( ) ( ) = + < < 1
2 2 p / p /
z p p z p P
Osnovni skup je konaan (N = 6000), frakcija odabira je 03267 0 =
6000
196
= = ,
N
n
f < 0,05
Razina pouzdanosti je 90%, koeficijent pouzdanosti 64 1 =
05 0
, z
,
i standardna greka procjene
proporcije je 03269 0
1 196
29592 0 70408 0
1
,
, ,
n
q p
p
=

=

Interval procjene je: ( ) 90 0 03269 0 64 1 70408 0 03269 0 ,64 1 ,70408 0 , , , , p , P = + < <

( )
90 0 = 75769 0 < < 65047 0 , , p , P

Zakljuak: na razini pouzdanosti od 90% moe se oekivati da e za navedenog kandidata
glasovati izmeu 65,05% i 75,77% birakog tijela.


Odreivanje veliine uzorka

Kod sampling-distribucije proporcija
( )
2
p
, N ~ p , planirana veliina greke koja se
tolerira pri procjeni je: d = [
p /
z p
2
+ ] p ,
p /
z d
2
=

Ako se uzorak izabire iz beskonanog osnovnog skupa na razini pouzdanosti 100 (1-)% i
utvrena je greka procjene d, tada je izraz za odreivanje veliine uzorka:
n
pq
z d
/ 2
=

,
2
2 /
(
(

=
d
pq z
n



Ako se sluajni uzorak izabire iz konanog osnovnog skupa i frakciji izbora je manja od
5% za izraun veliine uzorka koristi se gornji izraz. Ako je frakcija zbora vea od 5%
koristi se faktor korekcije, pa je veliina uzorka izraunana gornjim izrazom tek
prethodni rezultat
0
n . Konana veliina uzorka dobiva se izrazom:
N
n
n
n
0
0
1+
=



9.4. Procjena varijance (standardne devijacije) osnovnog skupa


Varijanca, odnosno standardna devijacija najvanija je mjera disperzije. Ona upuuje na
stupanj varijabilnosti numerike varijable. Ako su na raspolaganju vrijednosti numerike
varijable iz uzorka, varijanca osnovnog skupa procjenjuje se brojem ili intervalom.
51
Nepristrani procjenitelj varijance osnovnog skupa brojem pomou vrijednosti iz
sluajnog uzorka dan je izrazom:
( )
1
1
2
2

=
n
x x

n
i
i


Ako su podaci iz uzorka grupirani, vrijednosti x
i
ponderiraju se frekvencijama f
i
.
Procjenitelj standardne devijacije brojem je:
2
=

Sampling-distribucija varijanci ima oblik
2
-distribucije. Intervalna procjena varijance
osnovnog skupa na odabranoj razini pouzdanosti :

( ) ( )
( )
( )


=
|
|

\
|

< <


1
1 1
2
1 ; 2 / 1
2
2
2
1 ; 2 /
2
n n
n n
P

a intervalna procjena standardne devijacije:

( ) ( )
( )
( )


=
|
|
|

\
|

< <


1
1 1
2
1 ; 2 / 1
2
1 ; 2 / n n
n n
P

Kod velikih uzoraka gdje je n 100, sampling distribucija varijanci priblino je normalna
oblika, pa se granice intervala mogu definirati pomou te distribucije.



Vjebe


1. Odredite vrijednost koeficijenta pouzdanosti za intervalnu procjenu aritmetike sredine
osnovnog skupa pomou velikog uzorka i ove razine pouzdanosti:

(1-) 0,80 0,90 0,94 0,96 0,98 0,99


2. Izraunajte vrijednost standardne greke procjene aritmetike sredine osnovnog skupa
ako su zadani ovi uvjeti:
a) Uzorak 64 lana bira se iz konanog osnovnog skupa od 1000 lanova sa standardnom
devijacijom 9.
b) Standardna devijacija osnovnog skupa iznosi 10, izabire se uzorak 20 lanova uz interval
izbora 250.
c) Uzorak veliine n = 100 izabire se iz normalno distribuiranog beskonanog osnovnog
skupa
( )
2
10 , N .
52
3. Brodarska tvrtka ispituje uestalost otkaza rezervacija na cruiser-ima. Na sluajan nain
izabrano je 36 dana jednog razdoblja: Na temelju informacija u raunalnom sustavu tvrtke
utvren je broj otkaza rezervacija u danima izabranim u uzorak. Podaci iz uzorka su sljedei:

Broj otkaza, x
i
0 1 2 3 4 5 6
Broj dana, f
i
6 11 7 5 3 2 2

a) Procijenite brojem prosjean broj otkaza rezervacija na cruiser-ima
b) Odredite granice 95%-tnog intervala procjene aritmetike sredine.


4. Ispituje se prosjena vrijednost mjesenih rauna korisnika kartice lanca supermarketa.
Pomou odgovarajueg programa za raunalo izabran je sluajni uzorak rauna ispostavljenih
za listopad 2011. Na temelju podataka iz uzorka formirana je ova distribucija frekvencija:

Vrijednost (u kn) 100-150 150-200 200-250 250-500 500-1000
Broj rauna 69 37 40 32 18

a) Izraunajte aritmetiku sredinu uzorka.
b) Odredite granice 95%-tnog intervala procjene aritmetike sredine skupa.


5. Kolika je procjena proporcije osnovnog skupa brojem i koje su granice intervala
procjene proporcije osnovnog skupa ako su zadane ove veliine:
a) n = 2500; p = 0,4; (1) = 0,94; osnovni skup beskonaan
b) n = 1341; p = 0,65; (1) = 0,94; N = 16431
c) n = 864; p = 0,4; (1) = 0,95; f < 0,05


6. U sluajnom uzorku 300 vozaa na cesti prvog reda izmeu dva grada ustanovljeno je da
njih 175 neispravno upotrebljava svjetla u tijeku none vonje.
a) Kolika je procjena proporcije vozaa koji se neispravno koriste svjetlima u tijeku none
vonje izmeu dva grada?
b) Odredite granice pripadajueg intervala procjene proporcije osnovnog skupa. Razina je
pouzdanosti 90%.


7. Kolika je vrijednost procjene standardne devijacije i koje su granice intervala procjene
standardne devijacije osnovnog skupa za ove sluajeve:
a) n = 29; (1) = 0,95; = 35,75
b) n = 20; (1) = 0,99; = 260,6


8. U sluajni uzorak izabrana su 64 studenta. Izmjerena je njihova visina. Prosjeno
odstupanje od prosjene visine studenata u uzorku iznosi 2,5 cm. Odredite granice 95%-tnog
intervala procjene standardne devijacije osnovnog skupa. Koje bi granice bile kad bi uzorak
bio veliine 25?
53
10. TESTIRANJE HIPOTEZA O PARAMATARU



Statistika hipoteza je tvrdnja o veliini parametra ija se vjerodostojnost ispituje
pomou sluajnog uzorka. Postupak kojim se donosi odluka o prihvaanju ili neprihvaanju
tvrdnje naziva se testiranjem statistikih hipoteza.

Svaki postupak testiranja polazi od nulte hipoteze i alternativne hipoteze. Sadraj
alternativne hipoteze uvijek proturjei sadraju nulte hipoteze. Odluka o prihvaanju ili
neprihvaanju nulte hipoteze donosi se na temelju vrijednosti iz sluajnog uzorka pa sud
koji proizlazi iz nje nije kategorian. U postupku odluivanja mogu se pojaviti: greka
tipa I (kada se odbaci istinita nulta hipoteza) i greka tipa II (kada se prihvati lana
nulta hipoteza).



Nulta hipoteza je
Odluka
istinita

lana
Prihvatiti nultu hipotezu

odluka ispravna

greka tipa II
Odbaciti nultu hipotezu

greka tipa I

odluka ispravna

Vjerojatnost odbacivanja istinite nulte hipoteze (greka tipa I) oznaava se s i naziva
se razinom signifikantnosti (znaajnosti). Vjerojatnost prihvaanja lana nulte hipoteze
(greka tipa II) oznaava se s . Vjerojatnost odbacivanja lane nulte hipoteze (1 )
naziva se snagom statistikog testa.



10.1. Testiranje hipoteze o aritmetikoj sredini osnovnog skupa


Testiranje hipoteze o pretpostavljenoj vrijednosti aritmetike sredine osnovnog skupa
provodi se pomou sluajnog uzorka veliine n lanova. Ako je uzorak velik (n > 30) test
je pomou velikog uzorka (ztest). Kad je uzorak malen (n 30) test je pomou malog
uzorka (t-test). Postupak testiranja je :

odreivanje sadraja nulte i alternativne hipoteze
identificiranje izraza za testnu veliinu i izraunavanje njezine vrijednosti
odabir razine signifikantnosti i odreivanje kritinih granica (granice) koje dijele
podruje prihvaanja nulte hipoteze od podruja njezina odbacivanja
donoenje zakljuka o ishodu testa.
54
Test o aritmetikoj sredini osnovnog skupa moe biti dvosmjeran (na dvije granice) ili
jednosmjeran (na gornju ili na donju granicu). Temelj testa je sampling-distribucija
sredina. Ako je nulta hipoteza istinita i ako uzorak ima vie od 30 lanova, sampling-
distribucija sredina uzoraka priblino je oblika normalne distribucije, tj. ( )
2
~
x
, N x ,
bez obzira kako je rasporeen osnovni skup. Nepoznata je aritmetika sredina osnovnog
skupa , a njezina je pretpostavljena veliina
0
.



Vrsta testa
Nulta
hipoteza
Alternativna
hipoteza
Podruje prihvaanja
nulte hipoteze
Podruje odbacivanja
nulte hipoteze
dvosmjeran

0 0
= K H

0 1
K H

| z|
2
<
/
z



| z|
2
>
/
z


jednosmjeran, na
gornju granicu

0 0
K H

0 1
> K H

z z <

z z >
jednosmjeran, na
donju granicu

0 0
K H

0 1
< K H

z z >

z z <

Test-veliina je empirijski z-omjer:
x
x
z

=

gdje je x aritmetika sredina uzorka,
0
je pretpostavljena vrijednost aritmetike
sredine osnovnog skupa,
x
je standardna greka (tj. standardna devijacija sampling-
distribucije sredina).

Odluka o prihvaanju ili odbacivanju nulte hipoteze donosi se usporedbom test-veliine z
s teorijskom vrijednou koeficijenta signifikantnosti, koji ovisi o vjerojatnosti a
odreuje se pomou povrina ispod normalne krivulje.

Odluka se donosi alternativno pomou kritinih granica izraenih u mjernim jedinicama
varijable. Za dvosmjeran test kritine granice prihvaanja nulte hipoteze su:

x
/
z c
2 0 1
= ,
x
/
z c
2 0 2
+ =

Nae li se aritmetika sredina uzorka izmeu navedenih granica, prihvatit e se nulta
hipoteza. Ako je aritmetika sredina uzorka manja od donje ili vea od gornje kritine
granice, odbacuje se nulta hipoteza na razini signifikantnosti ..

Kod jednosmjernog testa na gornju granicu (test na desnoj strani) kritina granica je
x
z c

+ =
0 2
. Nulta hipoteza se prihvaa kao istinita ako je aritmetika sredina uzorka
manja od kritine vrijednosti, a odbacuje se ako je vea od te granice. Odluka o
jednosmjernom testu na donju granicu (test na lijevoj strani) donosi se pomou granice
x
z c

=
0 1
. Aritmetika sredina uzorka vea od donje granice upuuje na prihvaanje
55
nulte hipoteze, a vrijednost sredine manja od donje kritine granice na njezino
odbacivanje.

Kad se testiranje hipoteze o pretpostavljenoj aritmetikoj sredini osnovnog skupa
temelji na Studentovoj distribuciji kao sampling-distribuciji sredina, test veliina je
empirijski t-omjer:
x
x
t

=

Ako je nulta hipoteza istinita, test-veliina pripada Studentovoj (t) distribuciji s (n 1)
stupnjem slobode. Oblici hipoteza i nain odluivanja prikazani su u tabeli.


Vrsta testa
Nulta
hipoteza
Alternativna
hipoteza
Podruje prihvaanja
nulte hipoteze
Podruje odbacivanja
nulte hipoteze
dvosmjeran

0 0
= K H

0 1
K H

| t|
2
<
/
t



| t|
2
>
/
t


jednosmjeran, na
gornju granicu

0 0
K H

0 1
> K H

t t <

t t >
jednosmjeran, na
donju granicu

0 0
K H

0 1
< K H

t t >

t t <


Primjer 10.1

Odredite koeficijent signifikantnosti za test o pretpostavljenoj vrijednosti aritmetike sredine
osnovnog skupa pomou sluajnog uzorka ako je:
a) test dvosmjeran, n = 231, = 0,01; 0,05 i 0,10
b) test jednosmjeran, n = 852, = 0,05
c) test je dvosmjeran, uzorak 24 lana izabran je iz normalno distribuiranog osnovnog skupa
s nepoznatom standardnom devijacijom, razina signifikantnosti 5%. Kolika bi bila vrijednost
koeficijenta ako bi test bio jednosmjeran?


a) 30 > n = 0,01 58 , 2
005 , 0 2 /
= = z z


= 0,05 96 , 1
025 , 0 2 /
= = z z


= 0,10 65 , 1
05 , 0 2 /
= = z z



b) = 0,05 na desnom kraku: 65 1 = =
05 0
, z z
,
ili na lijevom kraku: 65 1
05 0
, z
,
=

c) = 0,05; 30 < n (t-distribucija) df = n 1 = 24 1 = 23 069 2 = =
025 0 2
, t t
, /

Za jednosmjeran test:
05 , 0
t t =

df = 23 714 , 1
05 , 0
= t 714 , 1
05 , 0
= t

Primjer 10.2

Zadani su ovi uvjeti za provoenje testova o pretpostavljenoj sredini osnovnog skupa:
56
a)
0 0
= K H ;
0 1
K H ; 500 =
0
; 49 = ; 441 = n ; osnovni skup beskonaan;
05 0 = ,
b)
0 0
K H ;
0 1
> K H ; 2000 =
0
; 196 = ; 784 = n ; 05 0 < , f ; 05 0 = ,
c)
0 0
K H ;
0 1
< K H ; 1500 =
0
; 164 = ; 820 = n ; 10 0 = , f ; 01 0 = ,
d)
0 0
K H ;
0 1
> K H ; 50 =
0
; 25
2
= ; 26 = n ; 05 0 < , f ; 05 0 = ,
Za svaki od navedenih sluajeva odredite (standardiziranu) kritinu vrijednost i vrijednosti
granica koje dijele podruje prihvaanja od podruja odbacivanja nulte hipoteze


a) dvosmjeran, 30 > n ; 96 1 = =
025 0 2
, z z
, /
;
42667 495
441
49
96 1 500
2 0 2 0 1
, ,
n
z z c
/
x
/
= = = =


57333 504
441
49
96 1 500
2 0 2 0 2
, ,
n
z z c
/
x
/
= + = + = + =



b) jednosmjeran, n > 30; 65 1 = =
05 0
, z z
,

55 2011 =
784
196
65 1 + 2000 = + = + =
0 0 2
, ,
n

z z c
x





c) jednosmjeran, n > 30; 33 2
01 0
, z z
,
= = ; 10 0 = = ,
N
n
f 8200 =
1 0
820
=
,
N
33980 1487
1 8200
820 8200
820
164
33 2 1500
1
0 0 1
, ,
N
n N
n
z z c

x

= =



d) jednosmjeran, n < 30; 708 1 = =
05 0
, t t
,
; df =25 5 = 25 = =
2

67483 , 51
26
5
708 1 50

0 0 2
= + = + = + = ,
n
t t c
x





Primjer 10.3

Prema standardu, prosjena trajnost arulja od 75 W iznosi 2000 sati s prosjenim
odstupanjem 250 sati. Iz serije arulja izabran je (f < 0,05) sluajni uzorak 64 arulje.
Ispitivanjem je ustanovljeno da je prosjena trajnost arulja u uzorku 1935 sati. Moe li se
prihvatiti pretpostavka da je uzorak izabran iz osnovnog skupa kojemu je aritmetika sredina
prema standardu? Testirajte na razini signifikantnosti 5%.


Hipoteze glase: 2000 =
0
K H ; 000 2
1
K H
Test veliina (empirijski z-omjer): 08 2
64
250
2000 1935
0 0
,
n
x x
z
x
=



57
Razina signifikantnosti: = 0,05.
Test je dvosmjeran, kritine su vrijednosti za prihvaanje nulte hipoteze:
2 2
< <
/ /
z z z -

,
96 1 = =
025 0 2
, z z
, /
96 1 96 1 , z , < <

Odluka: empirijski z omjer manji je od teorijske (kritine) vrijednosti, tj. 96 1 08 2 , , < pa se
na danoj razini signifikantnosti odbacuje
0
H . Prema tome, ne prihvaa se pretpostavka da je
uzorak izabran iz skupa arulja s prosjenom trajnou 2000 sati.

Oduka se alternativno donosi pomou kritinih granica:
75 1938
64
250
96 1 2000
2 0 2 0 1
, ,
n
z z c
/
x
/
= = = =

sati
25 2061
64
250
96 1 2000
2 0 2 0 2
, ,
n
z z c
/
x
/
= + = + = + =



sati

Kako je aritmetika sredina uzorka manja 1935 = x sati manja od donje kritine granice, ne
prihvaa se
0
H .
















Primjer 10.4

Radi poveanja proizvodnosti rada jedne vrste automatskih strojeva predloena je njihova
preinaka. Prema proraunima, preinaka je poslovno opravdana ako se postigne povean broj
operacija po satu i ako u prosjeku iznosi vie od 120. Na jednom stroju provedena je preinaka i
evidentiran je broj operacija po satu 144 mjerenja. Prosjean broj operacija po satu u
provedenom ispitivanju iznosio je 125. Zbroj kvadrata vrijednosti mjerenja iznosi 2307600.
Do kojeg se zakljuka dolazi na temelju provedenog ispitivanja. Vjerojatnost odbacivanja
istinite nulte hipoteze iznosi 5%.


n = 144 125 = x ,
58
( )
06981 20
143
125 144 2307600
1 1
2
1
2 2
1
2

,
n
x n x
n
x x

n
i
i
n
i
i
=

=

=
= =


67248 1 =
144
06981 20
= = ,
,
n



Hipoteze glase: 120
0
K H , 120 >
1
K H

Test veliina (empirijski z-omjer): 99 2
67248 1
120 125
0
,
,
x
z
x
=

=

Razina signifikantnosti: 05 0 = ,
Test je jednosmjeran, kritine su vrijednosti za prihvaanje nulte hipoteze:

z z <
65 1 =
05 0
, z
,
65 1 < , z

Odluka: empirijski z-omjer vei je od teorijske (kritine) vrijednosti, tj. 2,99>1,65. Odbacuje
se
0
H na danoj razini signifikantnosti.

Alternativno do zakljuka se dolazi pomou kritine granice:
76 122 = 67248 1 65 1 + 120 = + =
0 2
, , , z c
x




Aritmetika sredina uzorka je 125 i vea je od gornje granice, pa se ne prihvaa H
0
.
Odstupanje aritmetike sredine uzorka navie je znaajno pa se prihvaa pretpostavka da je
preinaka strojeva gospodarski opravdana.














Teorijska razina signifikantnosti predouje odabranu vjerojatnost odbacivanja istinite
nulte hipoteze. Empirijska razina signifikantnosti (pvrijednost) jest vjerojatnost
odbacivanja istinite nulte hipoteze izraunana pomou podataka iz uzorka. U postupku
donoenja odluke u testu p-vrijednost rabi se ovako:
ako je p-vrijednost vea od , prihvaa se nulta hipoteza
ako je p-vrijednost manja od , prihvaa se alternativna hipoteza.
59
10.2. Testiranje hipoteze o proporciji osnovnog skupa


Postupak testiranja hipoteze o pretpostavljenoj vrijednosti proporcije osnovnog skupa
pomou velikog uzorka provodi se u koracima koji su svojstveni svakom statistikom
testu.

Test o proporciji osnovnog skupa je dvosmjeran (na dvije granice) ili jednosmjeran (na
gornju, odnosno gornju granicu). Temelj testa je sampling-distribucija proporcija. Ako je
nulta hipoteza istinita i ako je uzorak dovoljno velik, sampling distribucija priblino je
oblika normalne distribucije, tj.
( )
2
0 p
, p N ~ p s
. Nepoznata je proporcija osnovnog skupa
p, a njena pretpostavljena veliina
0
p .



Vrsta testa
Nulta
hipoteza
Alternativna
hipoteza
Podruje prihvaanja
nulte hipoteze
Podruje odbacivanja
nulte hipoteze
dvosmjeran

0 0
= p p H K

0 1
p p H K

| z|
2
<
/
z



| z|
2
>
/
z


jednosmjeran, na
gornju granicu

0 0
p p H K

0 1
> p p H K

z z <

z z >
jednosmjeran, na
donju granicu

0 0
p p H K

0 1
< p p H K

z z >

z z <

Test-veliina je empirijski z-omjer:
p
p p
z

=

gdje je p proporcija uzorka,
0
p je pretpostavljena vrijednost proporcije osnovnog
skupa,
p
je standardna greka (standardna devijacija sampling-distribucije proporcija).
Standardna greka proporcije rauna se polazei od nulte hipoteze kao istinite.

Odluka o prihvaanju ili odbacivanju nulte hipoteze donosi se usporedbom test-veliine z
s teorijskom vrijednosti koeficijenta signifikantnosti, koji ovisi o vjerojatnosti a
odreuje se pomou povrina ispod normalne krivulje.

Odluka o testu donosi se alternativno pomou kritinih granica. Za dvosmjeran test
kritine granice prihvaanja nulte hipoteze su:

p /
z p c
s

2 0 1
= ,
p /
z p c
2 0 2
+ =

Test veliina je proporcija uzorka p . Nae li se proporcija uzorka izmeu navedenih
granica, prihvatit e se nulta hipoteza. Ako je proporcija uzorka manja od donje ili vea
od gornje kritine granice, odbacuje se nulta hipoteza na razini signifikantnosti .
60
Kod jednosmjernog testa na gornju granicu (test na desnoj strani) kritina granica je
p
z p c

+ =
0 2
. Nulta hipoteza se prihvaa kao istinita ako je proporcija uzorka manja
od kritine vrijednosti, a odbacuje se ako je vea od te granice. Odluka o jednosmjernom
testu na donju granicu (test na lijevoj strani) donosi se pomou granice
p
z p c

=
0 1
.
Proporcija uzorka vea od donje granice upuuje na prihvaanje nulte hipoteze, a
vrijednost proporcije manja od donje kritine granice na njezino odbacivanje.


Primjer 10.5

a) Proporcija sluajnog uzorka 400 lanova izabranoga iz beskonanog osnovnog skupa
iznosi 0,49215. Moe li se prihvatiti pretpostavka da uzorak potjee iz osnovnog skupa s
proporcijom 0,51? Testira se na razini signifikantnosti 5%.

b) Testira se nulta hipoteza da je proporcija osnovnog skupa jednaka 0,7 a pripadajua
alternativna hipoteza sadri tvrdnju da je proporcija vea od 0,7. Proporcija sluajnog uzorka
veliine 676 lanova jest 0,72. Uzorak je izabran iz osnovnog skupa opsega 11265 lanova.
Do koje se odluka dolazi provedbom testa? Razina signifikantnosti je 5%.



a) n = 400, 51 0 =
0
, p 49215 0 = , p

Hipoteze glase: 51 0 =
0
, p H K 51 0
1
, p H K

Test veliina (empirijski z-omjer):
p
p p
z

=
0 0
1 p q = ,
( )
02499 0
400
51 0 1 51 0
0 0
,
, ,
n
q p
p
=

= =
s


71 0
02499 0
51 0 49215 0
,
,
, ,
z =

=

Razina signifikantnosti: 05 0 = , .
Test je dvosmjeran, kritine vrijednosti za prihvaanje nulte hipoteze su:
2 2 / /
z z z

< < ,
96 1 = =
025 0 2
, z z
, /
96 1 96 1 , z , < <

Odluka: empirijski z-omjer vei je od donje, a manji od gornje teorijske (kritine) vrijednosti,
tj. 1,96 < 0,71< 1,96. Prihvaa se
0
H na danoj razini signifikantnosti. Prema tome prihvaa
se pretpostavka da je uzorak izabran iz skupa s proporcijom 0,51.

Odluka se alternativno donosi pomou ovih kritinih granica:
46101 0 02499 0 96 1 51 0
2 0 1
, , , , z p c
p /
= = =
55899 0 = 02499 0 96 1 + 51 0 = + =
2
0 2
, , , , z p c
p
/


61
Proporcija uzorka 49215 0 = , p nalazi se izmeu gornje i donje granice prihvaanja
0
H , pa se
prihvaa nulta hipoteza.

b) n = 676, N = 11265 f = n / N = 676/11265 = 0,06 f > 0,05
70 0 =
0
, p 72 0 = , p

Hipoteze glase: 70 0
0
, p H K , 70 0 >
1
, p H K

Test veliina (empirijski z-omjer):
p
p p
z

=
0 0
1 p q = , 01709 0
1 11265
676 11265
676
30 0 70 0
1
0 0
,
, ,
N
n N
n
q p
p
=

=
s


17 1
01709 0
70 0 72 0
,
,
, ,
z =

=

Razina signifikantnosti: 05 0 = , .
Test je jednosmjeran, kritino podruje za prihvaanje nulte hipoteze su:

z z < ,
65 1 = =
05 0
, z z
,
65 1 < , z

Odluka: empirijski z-omjer manji je od gornje teorijske (kritine) vrijednosti, tj. 1,17<1,65
pa se prihvaa
0
H na danoj razini signifikantnosti. Prema tome prihvaa se pretpostavka da je
uzorak izabran iz skupa s proporcijom 0,70.

Odluka se alternativno donosi pomou ovih kritinih granica:
72820 , 0 01709 , 0 65 , 1 70 , 0
2 / 0 2
= + = + =
p
z p c



Proporcija uzorka 72 0 = , p manja je od gornje granice prihvaanja nulte hipoteze, pa se
prihvaa nulta hipoteza.


Vjebe


1. Sluajan uzorak ima 27 jedinica i izabran je iz normalno distribuiranog osnovnog skupa
s pretpostavljenom sredinom 50 i nepoznatom standardnom devijacijom. Na temelju
vrijednosti iz uzorka dobivene su ove veliine: 1296 =
27
1 = i
i
x , 64808 =
27
1 =
2
i
i
x .
a) Kako glase hipoteze za dvosmjerni test o pretpostavljenoj sredini osnovnog skupa?
Provedite test na razini signifikantnosti 4%. Skicirajte postupak.
b) Kako glase hipoteze za jednosmjerni test o pretpostavljenoj sredini na donju granicu (na
lijevu stranu). Provedite test. Razina signifikantnosti je 4%. Skicirajte postupak.
62
Odluku donesite najprije na temelju standardizirane test veliine, a zatim koritenjem kritinih
granica.


2. U tijeku pokusne proizvodnje stroj proizvodi prosjeno 625 proizvoda po smjeni, s
prosjenim odstupanjem 30 proizvoda. Mjerenje rada stroja provedeno je za 45 smjena.
Potvruje li pokusna proizvodnja navod dobavljaa da stroj izrauje vie od 620 proizvoda po
smjeni? Testira se na razini signifikantnosti 5%.


3. Fast-food restorani oglaavaju dostavu gotove hrane. U oglasu se navodi da e se
naruena roba isporuiti za najvie 60 minuta od primitka narudbe. Na temelju sluajnog
uzorka 100 narudbenica izraunano je prosjeno vrijeme potrebno za dostavu koje iznosi 58
minuta, s prosjenim odstupanjem 5 minuta. Moe li se na temelju rezultata iz uzorka
zakljuiti da je vrijeme isporuke dulje od onoga oglaavanoga. Razina signifikantnosti je 5%.


4. Provedite dvosmjeran test o pretpostavljenoj proporciji osnovnog skupa 0,55 na temelju
sluajnog uzorka veliine 625 izabranoga iz beskonanog osnovnog skupa. Proporcija uzorka
je 0,53. razina signifikantnosti je 5%. Napiite kako glase hipoteze. Odluku donesite pomou
standardizirane test veliine i kritinih granica (proporcija). Skicirajte postupak testiranja.


5. Nulta hipoteza sadri tvrdnju da je proporcija osnovnog skupa jednaka 0,25 (ili vea), a
alternativna hipoteza suprotnu tvrdnju. Proporcija sluajnog uzorka (n = 1000) izabranog iz
konanog skupa s frakcijom izbora manjom od 5% iznosi 0,22. Do koje odluke se dolazi u
postupku testiranja ako je razina signifikantnosti 3%. Napiite kako glase hipoteze. Odluku
donesite pomou standardizirane test veliine i kritine granice (proporcije). Skicirajte
postupak testiranja.


6. U proizvodnji jedne vrste proizvoda tolerira se kart u omjeru 1:12. Kontrolom 300
sluajno odabranih proizvoda pronaeno ih je 39 neispravnih. Nalazi li se proporcija
neispravnih proizvoda utvrenih kontrolom u granicama tolerancije. 05 0 = , .


7. Financijska sluba poduzea analizira uzroke slabog toka gotovine. Pretpostavlja se da je
jedan od uzroka neredovitost plaanja po ispostavljenim fakturama. Sluba pretpostavlja da
vie od 75% komitenata plaa u roku duljem od 60 dana. Iz skupa od 64289 neplaenih
faktura izabran je uzorak veliine 238, meu kojima je s rokom prekoraenja duljim od 60
dana pronaeno njih 195. Do kojih se rezultata dolazi na temelju rezultata iz uzorka? Razina
signifikantnosti je 4%.

63
11. USPOREDBA PARAMETARA OSNOVNIH SKUPOVA



U sklopu inferencijalne statistike ispituju se parametri dvaju ili vie osnovnih skupova.
Postupci se temelje na sluajnim uzorcima izabranim iz tih skupova.

Uzorci su nezavisni ako se opaanja ili mjerenja odabranog obiljeja provode na
razliitim jedinicama izabranim u uzorak iz dvaju nepovezanih skupova ili iz dvaju
stratuma jednog skupa. Uzorci su zavisni ako se vrijednosti iz uzorka dobivaju
ponovljenim opaanjem ili mjerenjem odabrane varijable na istim jedinicama statistikog
skupa izabranim u uzorak u razliitim vremenskim trenucima.



11.1. Procjena razlike aritmetikih sredina dvaju osnovnih skupova


Neka vrijednosti
1 , 21 11
1
, , ,
n
x x x K ine uzorak iz osnovnog skupa
1
S , s aritmetikom
sredinom
1
i standardnom devijacijom
1
, a vrijednosti
2 , 22 12
2
, , ,
n
x x x K uzorak iz
osnovnog skupa
2
S , s aritmetikom sredinom
2
i standardnom devijacijom
2
. Postupak
procjene nepoznate razlike aritmetikih sredina dvaju skupova
2 1
D = pomou
velikih nezavisnih uzoraka temelji se na sampling-distribuciji procjenitelja razlike
sredina uzoraka 2 1 X X D

= . Ako nezavisni veliki uzorci potjeu iz osnovnih skupova s


nepoznatim sredinama i poznatim varijancama
2
1
i
2
2
, sampling-distribucija
procjenitelja razlike oblika je normalne distribucije ili priblino takva oblika. Ta
sampling-distribucija ima oekivanu vrijednost jednaku D i standardnu devijaciju
2 1
-x x
,
koja se naziva standardnom grekom razlike sredina, to jest:

[ ] D X X E = =
2 1
2 1 ;
2
2
2
1
2
1
-
2 1
n n
x x

+ =

Procjena razlike aritmetikih sredina intervalom na razini pouzdanosti 100 (1-) % :

( ) ( ) ( )

= + < <

1

2 1 2 1
2 / 2 1 2 /
x x x x
z D z D P

gdje je D

razlika sredina nezavisnih uzoraka,


2 /
z

je koeficijent pouzdanosti procjene,


koji ovisi o razini pouzdanosti i odreuje se pomou povrina normalne distribucije,
2 1
- x x
je standardna greka razlike sredina.
64
Kod velikih uzoraka ako varijance skupova nisu poznate, standardna greka razlike
utvruje se pomou procjena varijanci:

2
2
2
1
2
1
2 1
n

x - x

+ =

( )
1
1
1
2
1 1
2
1
1

=
n
x x

n
i
i
,
1
1
1
1
1
n
x
x
n
i
i
=
= ;
( )
1
2
1
2
2 2
2
2
2

=
n
x x

n
i
i
,
2
1
2
2
2
n
x
x
n
i
i
=
=

Procjenjuje li se razlika sredina pomou malih uzoraka izabranih iz normalno
distribuiranih osnovnih skupova s razliitim sredinama i jednakim varijancama,
procjenitelj razlike sredina brojem je 2 1 X X D

= . Distribucija procjenitelja razlike


sredina oblika je t- distribucije s ( ) 2
2 1
+ n n stupnja slobode, pa je interval procjene na
temelju uzorka:

( ) ( ) ( )

= + < <

1

2 1 2 1
2 / 2 1 2 /
x x x x
t D t D P

Ako su varijance osnovnih skupova meusobno jednake ( )
2 2
2
2
1
= = , standardna
greka razlike aritmetikih sredina je:

2 1
2 1
2 1
-
1 1
2 1
n n
n n
n n
x x
+
= + =

Ako su uzorci izabrani iz normalno distribuiranih skupova s jednakim nepoznatim
varijancama, zajednika se varijanca procjenjuje kombiniranjem podataka iz oba uzorka:

( ) ( )
2
2 1
1
2
2 2
1
2
1 1
2
2 1
+
+
=

= =
n n
x x x x

n
i
i
n
i
i


a standardna greka razlike sredina je:

( ) ( )
|
|

\
| +

+
+
=
2 1
2 1
2 1
2
2 2
2
1 1
2
1 1
2 1
n n
n n
n n
n n
x - x



Koeficijent pouzdanosti t vrijednost je Studentove distribucije za ( ) 2
2 1
+ n n stupnja
slobode i vjerojatnost 2 / .


65
Primjer 11.1

Aritmetika sredina uzorka veliine 100 elemenata iz osnovnog skupa A je 120, a aritmetika
sredina uzoraka veliine 64 iz skupa B iznosi 115. Uzorci su nezavisni i potjeu iz
beskonanih skupova. Varijanca skupa A iznosi 40, a varijanca skupa B 36.
a) Procijenite brojem razliku aritmetikih sredina skupova A i B
b) U kojim granicama se oekuje da e se nalaziti razlika aritmetikih sredina skupova.
Pouzdanost procjene je 95%.


a) 100
1
= n , 120
1
= x , 40
2
1
= ; 64
2
= n , 115
2
= x , 36
2
2
=
Procjena razlike sredina brojem: 5 115 120
2 1
= = = x x D



b) ( ) 1 = 0,95 = 0,05 /2 = 0,025
025 0 2
=
, /
z z

=1,96
( ) ( ) 95 0
2 1 2 1
025 0 2 1 025 0
, z D

z D

P
x - x
,
x - x
,
= + < <
Standardna greka razlike sredina: 98107 0
64
36
100
40
2
2
2
1
2
1
2 1
,
n n
x - x
= + = + =



Granice intervala procjene razlike aritmetikih sredina:

( ) ( )
( ) ( ) 95 0 92290 6 07710 3
95 0 98107 0 96 1 5 98107 0 96 1 5
2 1
2 1
, , , P
, , , , , P
= < <
= + < <



S vjerojatnosti 0,95 oekuje se da e razlika sredina skupova A i B biti izmeu 3,07710 i
6,92290.



11.2. Test hipoteza o razlici sredina dvaju osnovnih skupova


Testiranje hipoteza o razlici sredina dvaju osnovnih skupova pomou velikih i malih
nezavisnih uzoraka temelji se na sadraju nulte i alternativne hipoteze. Postupci
testiranja jednaki su onima pri testiranju hipoteze o jednom parametru osnovnog skupa.


Vrsta testa

Nulta hipoteza

Alternativna hipoteza
Podruje
prihvaanja
nulte hipoteze
Podruje
odbacivanja
nulte hipoteze
dvosmjeran

0 0 1 0
D H = K


0 2 1 1
D H K

| z|
2
<
/
z



| z|
2
>
/
z


jednosmjeran, na
gornju granicu

0 2 1 0
D H K


0 2 1 1
D H > K

z z <

z z >
jednosmjeran, na
donju granicu

0 2 1 0
D H K


0 2 1 1
D H < K

z z >

z z <
66
Test-veliina je empirijski z-omjer:

( )
2 1
0 2 1
x - x

D x x
z

=

gdje je
2 1
x x
standardna greka razlike (tj. standardna devijacija sampling-distribucije
razlika aritmetikih sredina uzoraka) a izraunava se na isti nain kao i za procjenu.

Odluka se donosi usporedbom empirijske testne veliine s teorijskom vrijednosti
standardizirane normalne distribucije.

Alternativno odluka za dvosmjeran test donosi se pomou kritinih granica:

2 1
-
2 0 1
x x
/
z D c

=
2 1
-
2 / 0 2
x x
z D c

+ =

Testna veliina je razlika aritmetikih sredina uzoraka
2 1
x x D

= Ako razlika
aritmetikih sredina uzoraka pada izmeu kritinih granica, kao istinita prihvatit e se
nulta hipoteza na razini signifikantnosti . U protivnome, nulta hipoteza se nee
prihvatiti.

Za jednosmjerne testove odreuje se kritina granica koja razdvaja podruje
prihvaanja od podruja odbacivanja nulte hipoteze. Kritina granica za test na donju
granicu je
2 1
0 1
x x
z D c

, a za test na donju granicu je


2 1
-
0 2
x x
z D c

+ = .

Hipoteze o razlici sredina dvaju osnovnih skupova testiraju se i pomou malih nezavisnih
uzoraka. Oblici hipoteza za test razlike sredina imaju isti, ve navedeni oblik. Ako je
nulta hipoteza istinita i ako su nepoznate varijance normalno distribuiranih osnovnih
skupova meusobno jednake, tada je test veliina empirijski t-omjer:

( )
2 1
0 2 1
x x
D x x
t

,
( ) ( )
|
|

\
| +

+
+
=
2 1
2 1
2 1
2
2
2
1 1
2
1 1
2 1
n n
n n
n n
n n
x - x



t-omjer pripada Studentovoj (t) distribuciji s ( ) 2
2 1
+ n n stupnjeva slobode. Odluka se
donosi usporedbom empirijskog t-omjera s teorijskom vrijednosti Studentove
distribucije.

Alternativno, odluka se donosi pomou kritinih granica. Za dvosmjeran test kritine
granice prihvaanja nulte hipoteze su:

2 1
-
2 0 1
x x
/
t D c

=
2 1
-
2 / 0 2
x x
t D c

+ =
67
Kritina je granica za test na donju granicu
2 1
0 1
x x
t D c

, a za test na gornju
granicu
2 1
-
0 2
x x
t D c

+ = .

Ako je 0 =
0
D , rije je o testu hipoteze da je razlika aritmetikih sredina dvaju
skupova jednaka nuli, odnosno da su aritmetike sredine skupova meusobno jednake.
Testna veliina u tom sluaju je:
2
1
-
2 1
x x
x x
z

=

Kad je rije o testu hipoteze o jednakosti sredina dvaju osnovnih skupova, kritine
granice za dvosmjeran test su:

2 1
-
2 1
x x
/
z c

=
2 1
-
2 2
x x
/
z c

+ = ,

a za jednosmjeran
2 1
-
1
x x
z c

= odnosno
2
1
-
2
x x
z c

+ = .

Odluka se donosi usporedbom testne veliine i vrijednosti kritine granice.


Primjer 11.2

Iz dvaju osnovnih skupova izabran je po jedan uzorak. Uzorci su nezavisni, prvi veliine 100,
a drugi 36 lanova. Aritmetika sredina uzorka izabranog iz prvog osnovnog skupa iznosi 40,
a aritmetika sredina uzorka iz drugog skupa 32. Prvi je osnovni skup rasporeen po
distribuciji s aritmetikom sredinom i varijancom oblika
( )
25
1
, N , a drugi
( )
16
1
, N . Moe li
se prihvatiti pretpostavka da je razlika aritmetikih sredina osnovnih skupova jednaka 10?
Testira se na razini signifikantnosti 5%.


100
1
= n , 40
1
= x , 25
2
1
= ; 36
2
= n , 32
2
= x , 16
2
2
= ; 10 =
0
D
Hipoteze glase: 10
0 1 0
= H K , 0 1
2 1 1
K H

Test veliina (empirijski z-omjer):
( )
2 1
0 2 1
x - x
D x x
z


=
83333 0
36
16
100
25
2
2
2
1
2
1
x - 2 1
,
n n
x
= + = + =


( )
40 2
83333 0
10 32 40
,
,
z =

=

Razina signifikantnosti: = 0,05.
68
# Metoda 1 Metoda 2 #
1 9 1 9 1
3 1,1,0 2 0,1,1,1,1,1,1,1,1,1 10
7 3,3,2,2,2,2,2 2 2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,3 19
12 5,5,5,5,5,5,4,4,4,4,4,4 2 4,4,4,4,5 5
10 7,7,7,7,7,6,6,6,6,6 2
2 9,8 2
Test je dvosmjeran, kritine su vrijednosti za prihvaanje nulte hipoteze:
2 2 / /
z z z

< < ,
96 1 = =
025 0 2
, z z
, /
96 1 96 1 , z , < <

Odluka: empirijski z omjer manji je od teorijske (kritine) vrijednosti, tj. 96 1 40 2 , , < pa
se na danoj razini signifikantnosti odbacuje
0
H . Prema tome, ne prihvaa se pretpostavka da
su uzorci izabrani iz skupova kojima je razlika aritmetikih sredina jednaka 10.

Oduka se alternativno donosi pomou kritinih granica:

8,36667 0,83333 1,96 10
2 1 -
2 0 1
= = =
x x
/
z D c


63333 11 = 83333 0 96 1 + 10 = + =
2 1
-
2 0 2
, , , z D c
x x
/



Kako je razlika aritmetikih sredina uzoraka manja 8 32 40
2 1 0
= = = x x D

manja od donje
kritine granice, ne prihvaa se
0
H .


Primjer 11.3

U sklopu studija rada ispituje se razlika proizvodnosti rada radnika koja se postie dvjema
obrazovnim metodama. 70 radnika podijeljeno je u dvije skupine. U prvoj skupini je 35
sluajno izabranih radnika od njih 70, a u drugoj preostalih 35. Poslije zavrenog obrazovanja
mjerena je proizvodnost radnika i to utrokom vremena za obavljanje iste radnje. Rezultati
mjerenja (u minutama) proizvodnosti radnika obrazovanih prvom i drugom metodom
prikazani su dvostrukim S-L dijagramom.









Moe li se prihvatiti pretpostavka da nema razlike u prosjenoj proizvodnosti radnika
obrazovanih navedenim metodama. Testira se na razini signifikantnosti 5%.


=
1
n 35
35
385
1
1
1
1
1
= =

=
n
x
x
n
i
i
=24,371429
( )
=

=
1 35
17143 188
1
1
1
2
1 1
2
1
1
,
n
x x

n
i
i
5,53445
=
2
n 35 = = =

=
35
779
2
1
2
2
2
n
x
x
n
i
i
22,25714
( )
=

=
1 35
68571 56
1
2
1
2
2 2
2
2
2
,
n
x x

n
i
i
1,66723
69
= + = + =
35
66723 1
35
53445 5
2
2
2
1
2
1
2 1
, ,
n

x - x

0,4536103

Hipoteze glase: =
0 1 0
H K 0
2 1 1
K H 0

Test veliina (empirijski z-omjer): =

=
4536103 0
25714 22 371429 24
2 1
2 1
,
, , x x
z
x - x

4,661018

Razina signifikantnosti: = 0,05.

Test je dvosmjeran, kritine su vrijednosti za prihvaanje nulte hipoteze:
2 2 / /
z z z

< < ,
96 1 = =
025 0 2
, z z
, /
96 1 96 1 , z , < <

Odluka: empirijski z omjer vei je od teorijske (kritine) vrijednosti, tj. 96 , 1 66102 , 4 > pa se
na danoj razini signifikantnosti odbacuje
0
H . Prema tome, ne prihvaa se pretpostavka da
nema razlike u prosjenoj proizvodnosti radnika obrazovanih navedenim metodama

Oduka se alternativno donosi pomou kritinih granica:

= =
2 1 -
2 1
x x
/
z c

0,889076
= + =
2 1 -
2 / 2
x x
z c

0,889076

Kako je razlika aritmetikih sredina uzoraka manja = =
2 1 0
x x D

2,11429 vea od gornje


kritine granice, ne prihvaa se
0
H .


U programskoj potpori EXCEL-a (Tools Data Analysis z-Test: Two Sample for
Means) dio ispisa je:

z-Test: Two Sample for Means

Metoda 1 Metoda 2
Mean 24,3714286 22,25714286
Variance 5,53445 1,66723
Observations 35 35
Hypothesized Mean Difference 0
z 4,66101808
P(Z<=z) one-tail 1,5732E-06
z Critical one-tail 1,64485363
P(Z<=z) two-tail 3,1465E-06
z Critical two-tail 1,95996398


70
11.3. Procjena razlike proporcija i test hipoteze o razlici proporcija


Neka su
1
n i
2
n dovoljno veliki nezavisni uzorci izabrani iz osnovnih skupova s
proporcijama
1
p i
2
p i neka su
1
p i
2
p proporcije uzoraka. Sampling-distribucija razlika
proporcija priblino je normalna oblika s oekivanom vrijednosti koja je jednaka razlici
proporcija osnovnih skupova. Standardna devijacija te distribucije jednaka je
standardnoj greki razlike
2 1
- p p
. Nepristrana procjena razlike proporcija osnovnih
skupova brojem jest razlika proporcija uzoraka, tj. ( )
2 1
p p . Kad je sampling
distribucija razlika priblino normalna oblika, intervalna procjena, uz pouzdanost
( ) 1 100 % je:

( ) ( ) ( ) [ ] ( )

= + < <

1
2 1 2 1
2 2 1 2 1 2 2 1 p p / p p
/
z p p p p z p p P

Standardna greka razlike proporcija je:

|
|

\
|
+ =
2 1
-
1 1

2 1
n n
q p
p p

2 1
2 2 1 1
2 1
2 1

n n
p n p n
n n
m m
p
+
+
=
+
+
= , p q = 1 ;
1
1
1

n
m
p = ,
2
2
2

n
m
p =


U praksi se najee testira hipoteza o jednakosti proporcija dvaju osnovnih skupova,
odnosno hipoteza da je razlika proporcija osnovnih skupova jednaka nuli. Hipoteze na
test i nain donoenja odluka navedeni su u tablici


Vrsta testa

Nulta hipoteza

Alternativna
hipoteza
Podruje
prihvaanja
nulte hipoteze
Podruje
odbacivanja
nulte hipoteze
dvosmjeran

0
2 1 0
= p p H K

0
2 1 1
p p H K

| z|
2
<
/
z



| z|
2
>
/
z


jednosmjeran, na
gornju granicu

0
2 1 0
p p H K

0
2 1 1
> p p H K

z z <

z z >
jednosmjeran, na
donju granicu

0
2 1 0
p p H K

0
2 1 1
< p p H K

z z >

z z <


Test-veliina je empirijski z-omjer:
( )
2 1
-
2 1
0
p p
p p
z


=

Odluka se donosi usporedbom empirijske testne veliine s teorijskom vrijednosti
standardizirane normalne distribucije na uobiajen nain.
71
Primjer 11.3

Iz dvaju osnovnih skupova izabrani su nezavisni uzorci veliine 100 =
1
n i 200 =
2
n . Broj
lanova s odreenim modalitetom obiljeje u prvom uzorku je 50 =
1
m , a u drugom 75 =
2
m .
a) Izraunajte vrijednost proporcija uzoraka
1
p i
2
p .
b) Procijenite brojem i 95%-tnim intervalom razliku proporcija osnovnih skupova
c) Testirajte hipotezu da je razlika proporcija osnovnih skupova jednaka 0,02. Razina
signifikantnosti 5%.

a) Proporcije uzoraka: 5 , 0
100
50

1
1
1
= = =
n
m
p 375 , 0
200
75

2
2
2
= = =
n
m
p

b) Procjena razlike proporcija brojem: 125 0 375 0 5 0
2 1
, , , p p = =

Procjena intervalom: ( ) ( ) ( ) [ ] ( )

= + < <

1
2 1 2 1
2 2 1 2 1 2 2 1 p p / p p /
z p p p p z p p P

Uz pouzdanost 95%, koeficijent pouzdanosti
025 0 2
=
, /
z z

=1,96
Standardna greka razlike proporcija:
|
|

\
|
+ =
2 1
-
1 1

2 1
n n
q p
p p

41667 , 0
200 100
75 50

2 1
2 1
=
+
+
=
+
+
=
n n
m m
p 58333 0 41667 0 1 1 , , p q = = =
06038 , 0
200
1
100
1
58333 , 0 41667 , 0
2 1
-
= |

\
|
+ =
p p


Interval procjene razlike proporcija:

( ) ( ) 95 0 06038 0 96 1 125 0 06038 0 96 1 125 0
2 1
, , , , p p , , , P = + < <
( ) ( ) 95 , 0 24334 , 0 00666 , 0
2 1
= < < p p P

c) Hipoteze glase: 02 0
2 1 0
, p p H = K , ,02 0
2 1 1
p p H K

Test veliina (empirijski z-omjer):
( ) ( )
74 1
06038 0
02 0 375 0 5 0
2 1
-
0 2 1
,
,
, , , D p p
z
p p
=

=

=


Razina signifikantnosti: = 0,05.

Test je dvosmjeran, kritine su vrijednosti za prihvaanje nulte hipoteze:
2 2 / /
z z z

< < ,
96 1 = =
025 0 2
, z z
, /
96 1 96 1 , z , < <

Odluka: empirijski z omjer pada u podruje prihvaanja nulte hipoteze, tj 96 1 74 1 96 1 , , , < <
pa se na danoj razini signifikantnosti prihvaa pretpostavka da su uzorci izabrani iz osnovnih
skupova kojima je razlika proporcija jednaka 0,02.
72
Vjebe


1. Sluba za prihvat prtljage zrane kompanije pomou uzorka procjenjuje razliku u teini
prtljage mukih i enskih putnika. U sluajnom uzorku 144 putnice izmjerena je prosjena
teina prtljage 21,5 kg, s prosjenim odstupanjem 2,5 kg. Prosjena teina prtljage putnika
izabranih u sluajni uzorak veliine 121 iznosila je 18 kg, s prosjenim odstupanjem 1,8 kg.
Procijenite brojem i 95%-tnim intervalom pouzdanosti razliku prosjenih teina prtljage
mukih i enskih putnika.


2. U tvornikom pogonu dva automatska stroja proizvode isti proizvod. Ispituje se njihova
proizvodnost mjerena brojem izraenih proizvoda pa radnom satu. Mjerenja u sluajno
izabranim razdobljima rada strojeva (broj proizvoda po satu) bila su sljedea:

Stroj I 55 47 50 44 52 55 57 49 60 52 58
Stroj II 43 47 51 49 48 53 46 47 55 47 50

a) Prikaite podatke o radu strojeva dvostrukim S-L dijagramom
b) Procijenite brojem i intervalom razliku u prosjenoj proizvodnosti rada strojeva. Razina
pouzdanosti intervalne procjene je 95%.


3. Proizvoa baterija tipa 3R12 tvrdi da se njihova kakvoa bitno ne mijenja ni nakon
estomjesenog skladitenja raunajui od dana proizvodnje. Da bi se testirala tvrdnja
proizvoaa, izabran je uzorak od 40 baterija neposredno nakon to su proizvedene. Prosjean
vijek trajanja tih baterija bio je 584 sata, s prosjenim odstupanjem 49 sati. Nakon est mjeseci
izabran je uzorak 35 uskladitenih baterija. njihova je prosjena trajnost bila 558 sati, s
prosjenim odstupanjem 57 sati. Moe li se prihvatiti tvrdnja proizvoaa? Razina
signifikantnosti je 3%.


4. U uzorku 1.000 gledatelja TV postaje Ch1 zabavni program redovito prati njih 410. U
uzorku 500 gledateljica 52% njih redovito prati taj zabavni program.
a) Moe li se prihvatiti pretpostavka da zabavni program prate u jednakoj proporciji
gledatelji i gledateljice? Vjerojatnost greke tipa I iznosi 0,05
b) Moe li se prihvatiti pretpostavka da je proporcija gledateljica vea od proporcije
gledatelja za vie od 15%? Testira se na razini signifikantnosti 5%:
c) U kojim se granicama moe oekivati da e se nai proporcija gledatelja (ena i
mukaraca) zabavnog programa? Pouzdanost procjene 96%.


5. Ispituje se proporcija tekuih rauna s negativnim saldom veim od doputenog u dvije
poslovnice Pomorske banke. Analitika sluba pretpostavlja da je proporcija takvih rauna u
drugoj poslovnici manja od proporcije u prvoj poslovnici. U uzorku 562 rauna prve
poslovnice 75 ih je s nedoputenim prekoraenjem, a u uzorku veliine 462 rauna druge
poslovnice 44 rauna su s nedoputenim prekoraenjem. to se moe zakljuiti o pretpostavci
analitike slube? Testira se na razini 10% signifikantnosti.
73
12. HI-KVADRAT TEST



Testiranje hipoteza o parametrima osnovnih skupova pomou uzorka temelji se na
odreenim teorijskim pretpostavkama. esto se, primjerice, pretpostavlja da sluajni
uzorak potjee iz normalne ili neke druge distribucije poznatih opih karakteristika.

Da bi se ispitala pretpostavka o obliku distribucije populacije iz koje potjee uzorak
rabi se
2
-test (hi-kvadrat test). Testira se hipoteza o distribuciji osnovnog skupa s
pretpostavljenim parametrima. Test veliina temelji se na empirijskom
2
koji ovisi o
razlikama meu oekivanim frekvencijama prema modelu navedenom u nultoj hipotezi i
empirijskim frekvencijama distribucije.

Provedba
2
-testa o obliku distribucije populacije poiva na sluajnom uzorku n lanova
koji predouju oblike kvantitativne ili kvalitativne varijable. Postupku testiranja prethodi
razvrstavanje n podataka iz uzorka prema naelu iscrpnosti i iskljuivosti u k grupa.,
ime se dolazi do empirijske distribucije, odnosno statistikog niza. Slijedi izbor modela
teorijske distribucije s kojom se usporeuje empirijska distribucija.. Ako parametri
teorijske distribucije nisu poznati, procjenjuju se uporabom podataka iz uzorka. Na
temelju pretpostavljene distribucije osnovnog skupa raunaju se oekivane frekvencije
koje se usporeuju s empirijskim frekvencijama.

Test polazi od ovih hipoteza:

K
0
H distribucija osnovnog skupa je specificiranog oblika
K
1
H distribucija osnovnog skupa nije specificiranog oblika

Test- veliina je empirijski
2
, koji je predoen izrazom:.

( ) ( ) ( ) ( )
k
k k
i
i i
e
e
e f
e
e f
e
e f
e
e f
2 2 2
2 2
1
2
1 1 2

+ +

+ +

= L L
( )

=
k
i i
i i
e
e f
1
2
2


gdje je: f
i
= apsolutne frekvencije,
e
i
= oekivane frekvencije prema distribuciji navedenoj u nultoj hipotezi.

Ako je nulta hipoteza istinita, test veliina izraunana pomou podataka iz dovoljno
velikog uzorka priblino distribuirana prema
2
- distribuciji s ( ) 1 g k stupnjeva
slobode, gdje je k broj grupa (lanova statistikog niza), g je broj procijenjenih
74
parametara distribucije osnovnog skupa. Kada su parametri predstavljene distribucije
poznati, 0 = g .

Odluka se donosi usporedbom test-veliine
2
s teorijskom vrijednosti ( ) 1
2
g k

,
gdje je odabrana razina signifikantnosti, a ( ) 1 g k broj stupnjeva slobode. Nulta se
hipoteza prihvaa ako je empirijski
2
jednak teorijskoj vrijednosti
2
-distribucije ili
manji od nje, a ne prihvaa kad je empirijski
2
vei od teorijske vrijednosti
2
-
distribucije.

Da bi primjena testa bila valjana, potrebno je da broj podataka bude dovoljno velik i
da oekivane frekvencije nisu suvie male. Kriterij je:

uzorak je dovoljno velik ako je 30 n
sve oekivane frekvencije (e
i
) jednake 2 i vee, te ako ih je najmanje 50% jednako 5 i
vee.

Nekad se primjenjuje sljedei kriterij:

sve oekivane frekvencije (e
i
) moraju biti vee od 5, ako je broj stupnjeva slobode
jednak 1.

Ako se u distribuciji oekivanih frekvencija nau manje od onih koje propisuje
primijenjeno pravilo, pristupa se spajanju susjednih grupa, ime se mijenja i broj
stupnjeva slobode.


Primjer 12.1

Ispituje se uestalost zastoja strojeva na jednoj proizvodnoj liniji po radnoj smjeni. Analizom
400 radnih smjena dobiveni su rezultati:

Broj zastoja 0 1 2 3 4 5 6
Broj smjena 35 115 130 75 30 10 5

Moe li se prihvatiti pretpostavka da se uestalost zastoja po smjeni ravna po binomnoj
distribuciji? Testira se na razini signifikantnosti 5%.


Binomna distribucija: ( )
x n x
q p
x
x p

|
|

\
|
=
6
, = x 0, 1, 2, , 6
Procjena parametra p: p n x = ,
n
x
p =
75
2
400
6 5 5 10 4 30 3 75 2 130 1 115 0 35
1
1
=
+ + + + + +
= =

=
=
k
i
i
k
i
i i
f
x f
x
33333 0
6
2
,
n
x
p = = = 66667 , 0 33333 , 0 1 1 = = = p q

Pretpostavljena binomna distribucija s procijenjenim parametrima:

( )
x x
x
x p


|
|

\
|
=
6
66667 , 0 33333 , 0
6
, = x 0, 1, 2, , 6

Oekivane frekvencije: ( )
i i
x p e 400 = .

Broj zastoja Broj smjena
x
i
f
i
p(x
i
) e
i
= np(x
i
) (f
i
- e
i
) (f
i
- e
i
)
2
(f
i
- e
i
)
2
/e
i

0 35 0,0878 35,118 0,118 0,0138 0,00039
1 115 0,2634 105,351 9,649 93,0960 0,88367
2 130 0,3292 131,687 1,687 2,8468 0,02162
3 75 0,2195 87,790 12,790 163,5887 1,86341
4 30 0,0823 32,921 2,921 8,5312 0,25914
5 10 0,0165 6,584+0,549 7,867 61,8939 8,67745
6 5 0,0014 * * * *
Ukupno 400 1,0000 392,8673 0,000 11,70569

* Oekivana frekvencija posljednje grupe (0,5487) manja je od 2, stoga je treba pribrojiti prethodnoj
oekivanoj frekvenciji (6,5841). Razlika 7,8673 dobivena je ovako: (10+5) (6,584+0,549)=7,867.

Test-veliina (empirijski hi-kvadrat) je: =
2
11,70569

Hipoteze glase:

K
0
H distribucija osnovnog skupa ravna se prema binomnoj distribuciji
K
1
H distribucija osnovnog skupa ne ravna se prema binomnoj distribuciji

Razina signifikantnosti: = 0,05. Broj stupnjeva slobode ( ) = = 1 g k df 6 1 1= 4 jer
je procijenjen jedan parametar, a dvije su posljednje numerike grupe spojene u jednu.

( ) ( ) = = 4
2
05 , 0
2

df 9,48773

Odluka: empirijski hi-kvadrat (11,70569) vei je od teorijske vrijednosti (9,48773) i pada u
podruje odbacivanja nulte hipoteze. Na danoj razini signifikantnosti ne prihvaa se
pretpostavka da uzorak potjee iz osnovnog skupa koji se ravna prema binomnoj distribuciji.


76
Primjer 12.2

Promatra se broj prometnih nezgoda pa danima u jednom gradu: rezultati promatranja
navedeni su u tabeli:

Broj nezgoda 0 1 2 3 4
Broj dana 44 37 15 3 1

Moe li se prihvatiti pretpostavka da je distribucija nezgoda po danima rasporeena po
Poissonovoj distribuciji s parametrom =0,9? Testira se na razini 1% signifikantnosti.


Poissonova distribucija:
!
9 , 0
) (
9 , 0
x
e
x p
x
= , = x 0, 1, 2,
Oekivane frekvencije: ( )
i i
x p e 100 =

Broj nezgoda Broj smjena
x
i
f
i
p(x
i
) e
i
= np(x
i
) (f
i
- e
i
) (f
i
- e
i
)
2
(f
i
- e
i
)
2
/e
i

0 44 0,40657 40,657 3,343 11,1759 0,27488
1 37 0,36591 36,591 0,409 0,1671 0,00457
2 15 0,16466 16,466 1,466 2,1494 0,13053
3 3 0,04940 4,940+1,346 2,286 5,2244 0,83116
4 1 0,01346 * * * *
Ukupno 100 1,00000 100 0,000 1,24114

* Oekivana frekvencija posljednje grupe (1,346) manja je od 2, stoga je treba pribrojiti prethodnoj
oekivanoj frekvenciji (4,940). Razlika 2,2857 dobivena je ovako: (3+1) (4,94+1,346)= 2,286

Test-veliina (empirijski hi-kvadrat) je: =
2
1,24114

Hipoteze glase:

K
0
H distribucija osnovnog skupa ravna se prema Poissonovoj distribuciji
K
1
H distribucija osnovnog skupa ne ravna se prema Poissonovoj distribuciji

Razina signifikantnosti: = 0,01. Broj stupnjeva slobode ( ) = = 1 g k df 4 0 1= 3 jer
je parametar pretpostavljene distribucije poznat, a dvije su posljednje numerike grupe spojene
u jednu.

( ) ( ) = = 3
2
01 , 0
2

df 11,34487

Odluka: empirijski hi-kvadrat (1,24114) manji je od teorijske vrijednosti (11,34487) i pada u
podruje prihvaanja nulte hipoteze. Na danoj razini signifikantnosti prihvaa se pretpostavka
da uzorak potjee iz osnovnog skupa koji se ravna prema Poissonovoj distribuciji.

77
Kod testiranja hipoteze o distribuciji kontinuirane varijable osnovnog skupa, preporuuje
se provesti postupak formiranja razreda distribucije frekvencija na temelju podataka iz
uzorka tako da svakom razredu pripadne priblino jednaka oekivana frekvencija.


Primjer 12.3

Mjerenjem brzine vozila na jednoj dionici prometnice dobiveni su sljedei podaci (u km/h):

Brzina vozila 50-60 60-70 70-80 80-90 90-100 100-110 110-120 120-130
Broj vozila 3 6 15 21 12 4 2 1

Moe li se prihvatiti pretpostavka da je distribucija brzine vozila oblika normalne distribucije?
Testira se na razini signifikantnosti 5%.


Normalna distribucija ( )
2
, N je distribucija kontinuirane sluajne varijable.
Aritmetika sredina uzorka: = = =
=
=
64
5380

8
1
8
1
i
i
i
i i
f
x f
x 84,0625
Varijanca uzorka:
( )
2817 202
63
75 12743
1
-

8
1
2
2
,
,
n
x x f

i
i i
= =

=
=

Neprostrana procjena standardne devijacije: 2226 , 14 2817 , 202 = =

Brzina vozila
(prave granice) f
i
p(x
i
) e
i
= np(x
i
) (f
i
- e
i
) (f
i
- e
i
)
2
(f
i
- e
i
)
2
/e
i

do 70 9 0,1612 10,3168 -1,3168 1,7340 0,1681
70-80 15 0,2263 14,4832 0,5168 0,2671 0,0184
80-90 21 0,2741 17,5424 3,4576 11,9550 0,6815
90-100 12 0,2255 14,432 -2,432 5,9146 0,4098
100 i vie 7 0,1129 7,2256 -0,2256 0,0509 0,0070
Ukupno 64 1,0000 64 1,2849

Vjerojatnost da normalno distribuirana sluajna varijabla poprimi vrijednost u granicama
prvog razreda: ( ) 1612 , 0 3388 , 0 5 , 0
2226 , 14
0625 , 84 70
70 = = |

\
|
< = < Z P X P
drugog razreda: ( ) ( ) 2263 , 0 1125 , 0 3388 , 0 286 , 0 989 , 0 80 70 = = < < = < < Z P X P

treeg razreda: ( ) 2741 , 0 1616 , 0 1125 , 0 ) 417 , 0 286 , 0 ( 90 80 = + = < < = < < Z P Z P
etvrtog razreda: ( ) 2255 , 0 1616 , 0 3871 , 0 ) 121 , 1 417 , 0 ( 100 90 = = < < = < < Z P Z P
petog razreda: ( ) 1129 , 0 3871 , 0 5 , 0 ) 121 , 1 ( 100 = = < = < Z P Z P
78
Test-veliina (empirijski hi-kvadrat) je: =
2
1,2849

Hipoteze glase:

K
0
H distribucija osnovnog skupa ravna se prema normalnoj distribuciji
K
1
H distribucija osnovnog skupa ne ravna se prema normalnoj distribuciji

Razina signifikantnosti: = 0,05. Broj stupnjeva slobode ( ) = = 1 g k df 5 2 1= 2 jer
distribucija ima 5 razreda, a 2 parametra pretpostavljene distribucije su procijenjena,

( ) ( ) = = 2
2
05 , 0
2

df 5,99146

Odluka: empirijski hi-kvadrat (1,2849) manji je od teorijske vrijednosti (5,99146) i pada u
podruje prihvaanja nulte hipoteze. Na danoj razini signifikantnosti prihvaa se pretpostavka
da uzorak potjee iz osnovnog skupa koji se ravna prema normalnoj distribuciji.


Vjebe


1. Kontrolor prilazi automatu u jednakim vremenskim razmacima i redovito pregledava
uzorak od 10 proizvoda, utvrujui broj loih proizvoda u uzorku. Nakon 60 obilazaka
kontrolor je dobio sljedee podatke:

Broj loih proizvoda 0 1 2 3 4 5
Broj obilazaka 5 15 18 16 4 2

Moe li se prihvatiti pretpostavka da je osnovni skup iz kojeg potjeu podaci oblika binomne
distribucije? Testira se na razini signifikantnosti 5%


2. U jednoj telefonskoj centrali biljee se pogreni spojevi po minutama. Motrenjem
tijekom 50 minuta dobiveni su sljedei podaci

Broj pogrenih spojeva 0 1 2 3 4 5 6
Broj minuta 7 15 12 9 4 2 1

Moe li se prihvatiti pretpostavka da navedeni podaci potjeu iz osnovnog skupa koji se
rasporeuje prema Poissonovoj distribuciji s parametrom 2 pogrena spoja u minuti. Testira se
na razini signifikantnosti 5%


3. Uzorak od 60 domainstava dao je ovu dnevnu potronju mesa u kg:

Dnevna potronja mesa 0-0,3 0,3-0,6 0,6-0,9 0,9-1,2 1,2-1,5 1,5-1,8
Broj domainstava 7 15 12 9 4 1

Moe li se prihvatiti pretpostavka da mjerenja dnevne potronje mesa u domainstvima
potjeu iz normalno distribuiranog osnovnog skupa Testira se na razini signifikantnosti 1%.
79
13. REGRESIJSKA ANALIZA



Regresijska analiza sastoji se u primjeni razliitih metoda ispitivanja ovisnosti jedne
varijable o drugoj varijabli ili vie njih. Osnova analize je regresijski model. Regresijski
model je algebarski model kojim se analitiki izraava statistiki odnos meu pojavama.



13.1. Model jednostavne linearne regresije


Model jednostavne regresije sadri zavisnu (regresand ili output) i jednu nezavisnu
(regresorsku ili input) varijablu. Prvi korak u analizi odnosa meu dvjema pojavama
sastoji se u crtanju dijagrama rasipanja. Prema rasporedu toaka donosi se prvi sud o
obliku, smjeru i jakosti veze meu varijablama.

























80
Opi oblik modela jednostavne linearne regresije je ( ) e X f Y + = . Funkcionalni dio
modela je ( ) X X f + = . Varijabla e izraava nesistemske utjecaje na zavisnu varijablu
i model ini statistikim. Regresijska analiza provodi se na temelju n parova vrijednosti
varijabli X i Y, pa se model predouje sustavom n jednadbi

i i i
e x y + + = , , n , , i K 2 1 =

Jednadba pravca (funkcionalni dio modela) odreen je ako su poznati parametri i .
Neka su a i b procjene parametara i procjene nepoznatih vrijednosti varijable e jednake
u
i
(rezidualna odstupanja). Model linearne regresije s procijenjenim parametrima je:

i i i
u y y + = , , n , , i K 2 1 =
odnosno
i i i
u bx a y + + = , n , , i K 2 1 =

Do procjena a i b dolazi se primjenom metode najmanjih kvadrata. Ona se sastoji u
traenju onih procjena parametara za koje rezidualni zbroj kvadrata postie minimum.
Primjenom postupka minimalizacije dolazi se do sustava normalnih jednadbi ije je
rjeenje :

=
=


=
n
i
i
n
i
i i
x n x
y x n y x
b
1
2 2
1
, x b y a =

gdje je
n
y
y
n
i
i
=
=
1
i
n
x
x
n
i
i
=
=
1


Model bx a y + = naziva se linearnom regresijskom jednadbom s procijenjenim
parametrima. Parametar a je konstantni lan (vrijednost regresijske funkcije ako je
vrijednost nezavisne varijable jednaka nuli). Parametar b je regresijski koeficijent
(predouje iznos linearne promjene regresijske vrijednosti za jedinino poveanje
vrijednosti varijable X).

Regresijske vrijednosti
i i
bx a y + = , , n , , i K 2 1 =

predouju procjene vrijednosti zavisne varijable za dane stvarne vrijednosti nezavisne
varijable. Razlike vrijednosti zavisne varijable Y i regresijskih vrijednosti ( y ) ine
rezidualna odstupanja (
i i i
y y u = ).
81
Kupaci i tjedna prodaja
40
50
60
70
80
90
100
110
120
130
400 500 600 700 800 900 1000 1100
Broj kupaca (x
i
)
T
j
e
d
n
a

p
r
o
d
a
j
a

(
0
0
0

k
n
)
Primjer 13.1

Uprava lanca prodavaonica eli da razvije model za predvianje tjedne prodaje. Razmotreno je
vie regresorskih varijabli i odlueno da se koristi samo jedna (broj kupaca) za predvianje
zavisne varijable (tjedna prodaja). U 20 prodavaonica prikupljeni su sljedei podaci:

Prodavaonica

Broj kupaca

Tjedna prodaja
(u tisuama kuna)
Prodavaonica

Broj kupaca

Tjedna prodaja
(u tisuama kuna)
1 907 112 11 679 76,3
2 926 110,5 12 872 94,3
3 506 68,4 13 924 94,6
4 741 92,1 14 607 76,4
5 789 94,2 15 452 69,2
6 889 100,8 16 729 89,5
7 874 94,5 17 794 93,3
8 510 67,3 18 844 102,3
9 529 72,4 19 1010 117,7
10 420 61,2 20 621 74,1

a) Konstruirajte dijagram rasipanja
b) Procijenite vrijednosti parametara regresijskog modela pretpostavivi da meu varijablama
postoji linearna statistika veza. Regresijsku funkciju prikaite u dijagramu rasipanja.
c) Izraunajte regresijske vrijednosti i vrijednosti rezidualnih odstupanja.


a)
















b) n =20, 15 , 731
20
14623
1
= = =

=
n
x
x
n
i
i
055 , 88
20
1 , 1761
1
= = =

=
n
y
y
n
i
i

82
Kupaci i tjedna prodaja s regresijskim
pravcem
40
50
60
70
80
90
100
110
120
130
400 500 600 700 800 900 1000 1100
Broj kupaca (x
i
)
T
j
e
d
n
a

p
r
o
d
a
j
a

(
0
0
0

k
n
)
Prodavaonica Broj kupaca Tjedna prodaja (000 kn)
x
i
y
i
x
i
2
x
i
y
i

1 907 112,0 822649 101584
2 926 110,5 857476 102323
3 506 68,4 256036 34610,4
4 741 92,1 549081 68246,1
5 789 94,2 622521 74323,8
6 889 100,8 790321 89611,2
7 874 94,5 763876 82593
8 510 67,3 260100 34323
9 529 72,4 279841 38299,6
10 420 61,2 176400 25704
11 679 76,3 461041 51807,7
12 872 94,3 760384 82229,6
13 924 94,6 853776 87410,4
14 607 76,4 368449 46374,8
15 452 69,2 204304 31278,4
16 729 89,5 531441 65245,5
17 794 93,3 630436 74080,2
18 844 102,3 712336 86341,2
19 1010 117,7 1020100 118877
20 621 74,1 385641 46016,1
Ukupno 14623 1761,1 11306209 1341279

2
1
2 2
1
731,15 20 11306209
88,055 731,15 20 1341279


=

=
=
n
i
i
n
i
i i
x n x
y x n y x
b = 0,0873

24,23 24,2256 731,15 0,0873 55 0 88 = = = , x b y a

Linearna regresijska jednadba:
i i
x , , y 0873 0 23 24 + = , i = 1, 2, 3, , 20
















83

Broj kupaca
Tjedna prodaja
(000 kn)
Regresijske
vrijednost
Rezidualna
odstupanja
Relativna rezidualna
odstupanja (u%)
i
x
i
y
i
y
i
u
rel , i
u
907 112,0 103,4111 8,5889 7,67
926 110,5 105,0698 5,4302 4,91
506 68,4 68,4038 -0,0038 -0,01
741 92,1 88,9193 3,1807 3,45
789 94,2 93,1097 1,0903 1,16
889 100,8 101,8397 -1,0397 -1,03
874 94,5 100,5302 -6,0302 -6,38
510 67,3 68,7530 -1,4530 -2,16
529 72,4 70,4117 1,9883 2,75
420 61,2 60,8960 0,3040 0,50
679 76,3 83,5067 -7,2067 -9,45
872 94,3 100,3556 -6,0556 -6,42
924 94,6 104,8952 -10,2952 -10,88
607 76,4 77,2211 -0,8211 -1,07
452 69,2 63,6896 5,5104 7,96
729 89,5 87,8717 1,6283 1,82
794 93,3 93,5462 -0,2462 -0,26
844 102,3 97,9112 4,3888 4,29
1010 117,7 112,4030 5,2970 4,50
621 74,1 78,4433 -4,3433 -5,86
14623 1761,1 1761,1879 -0,0879 -

Relativna rezidualna odstupanja: 100

=
i
i i
rel , i
y
y y
u , , n , , i K 2 1 =

Statistiko-analitike veliine za prosudbu reprezentativnosti regresije temelje se na
ralanjivanju zbroja kvadrata odstupanja vrijednosti zavisne varijable od njezina
prosjeka. Odstupanje zavisne varijable Y od njezine aritmetike sredine Y za pojedinu
toku (
i i
y , x ) moe se ralaniti: ( ) ( ) ( )
i i i i
y y y y y y + = .














c)
84
Navedenih ralambi ima koliko i parova vrijednosti, odnosno n. Kvadriranjem izraza i
zbrajanjem lanova dolazi se do jednadbe:

( ) ( ) ( )

= = =
+ =
n
i
n
i
i i i
n
i
i
y y y y y y
1 1
2 2
1
2


Zbroj kvadrata empirijskih vrijednosti zavisne varijable od njezine aritmetike sredine
(ukupni zbroj kvadrata, ST) rastavlja se na dvije komponente. Prva komponenta je zbroj
kvadrata odstupanja regresijskih vrijednosti od aritmetike sredine zavisne varijable
(zbroj kvadrata protumaen modelom, SP). Druga komponenta je neprotumaeni dio
zbroja kvadrata ili zbroj kvadrata rezidualnih odstupanja (SR).

Varijanca regresije je aritmetika sredina kvadrata rezidualnih odstupanja:

( )
n
y y
n
i
i i
y

=
1
2
2


Standardna devijacija je:
2
y y
= . Koeficijent varijacije je: 100 =
y
V
y
y

.

Specifian pokazatelj reprezentativnosti regresije je koeficijent determinacije
regresije:
( )
( )

=
=

=
n
i
i
n
i
i
y y
y y
r
1
2
1
2
2


Koeficijent determinacije je proporcija modelom protumaenoga dijela zbroja kvadrata
u ukupnom zbroju kvadrata. On se kree u granicama izmeu nule i jedan. Model je
reprezentativniji to je koeficijent determinacije blii jedinici.


Analiza modela jednostavne regresije u sklopu deskriptivne statistike svodi se na
odreivanje analitikog izraza i prosudbi njegove kakvoe, pri emu se odstupanja od
funkcionalnog dijela ne specificiraju. Primjena naela inferencijalne statistike u svezi je
s regresijskim modelom u kojemu je varijabla e sluajna varijabla odreenih svojstava.
Varijabla e je u kombinaciji s funkcionalnim dijelom modela, pa je i zavisna varijabla
takoer sluajna varijabla. Za fiksne vrijednosti nezavisnih varijabli u (teorijski)
ponovljenim realizacijama zbog prisutnosti sluajne varijable e generiraju se razliite
vrijednosti zavisne varijable. Stoga se empirijske vrijednosti zavisne varijable smatraju
uzorkom iz (zamiljenog, beskonanog) osnovnog skupa, a sam polazni model modelom
osnovnog skupa.
85
Polazni model osnovnog skupa (populacije) je:

i i i
e x y + + = , , n , , i K 2 1 =


Teorijske pretpostavke za analizu modela su:

Svojstva zavisne varijable Y Svojstva sluajne varijable e

(1)

[ ]
i i i
x x y E + =

[ ] 0 =
i
e E , i
(2)
( )
2
=
i i
x y var ( )
2
=
i
e var

(3)
( ) , y , y cov
j i
0 = j i ( ) 0 =
j i
e , e cov

(4)
i
y ( )
2
, x N
i
+
i
e ( )
2
0 , N


Sluajna varijabla e zove se greka relacije, jer bi model bio deterministiki kad bi
svaka njezina vrijednost bila jednaka nuli. Njezina prisutnost izraava efekte
nepredvidivih utjecaja na zavisnu varijablu i efekte izostavljenih varijabli iz modela.

Neka n vrijednosti zavisne varijable Y ine uzorak iz beskonano velikog osnovnog skupa,
i neka su i

procjene nepoznatih parametara, a


i
e procjene nepoznatih vrijednosti
varijable e . Model uzorka je:

i i i
e x

y + + = , , n , , i K 2 1 =

odnosno,
i i i
e y y + = ,
i i
x

y + = , , n , , i K 2 1 =

Procjene greaka relacije
i
e zovu se rezidualna odstupanja.

Izrazi za procjenu nepoznatih parametara brojem su:

=
=

=
n
i
i
n
i
i i
x n x
y x n y x

1
2 2
1
, x

y = .

Procjena

zove se regresijski koeficijent, a procjena konstantni lan.



Izrazi za procjenu varijance osnovnog skupa, standardne devijacije i koeficijenta
varijacije su:
( )
2
1
2
2

=
n
y y

n
i
i i
,
2
= , 100
y


=
86
Ako su ispunjene polazne pretpostavke u analizi modela, sampling-distribucija
procjenitelja parametara poznatog je oblika. Dani oblik sampling-distribucije omoguuje
da se formiraju intervalne procjene parametara i donese sud o preciznosti procjena i
njihovoj pouzdanosti.

Kad je varijanca normalno distribuiranog osnovnog skupa poznata, intervalna procjena
parametra je:



z

+ < <

Kad varijanca normalno distribuiranog osnovnog skupa nije poznata, sampling-distribucija
procjenitelja parametra oblika je Studentove distribucije s (n 2) stupnja slobode, pa
je intervalna procjena parametra :




t

+ < <

Standardna greka procjene (standardna devijacija sampling-distribucije regresijskih
koeficijenata) je

=
n
i
i

x n x

1
2 2
2

,
( )
2
1
2
2

=
n
y y

n
i
i i


Intervalna procjena parametra (varijanca normalno distribuiranog skupa je poznata):




z z + < <

odnosno (varijanca normalno distribuiranog skupa nije poznata):




t t + < <

Standardna greka procjene je:
|

\
|

=


=
=
n
i
i
n
i
i

x n x n
x
1
2 2
1
2 2



Regresijski model s procijenjenim parametrima rabi se za predvianje (prognozu) razine
zavisne varijable. Predvianje se provodi brojem i intervalom. Prognostika vrijednost
izraunava se uvrtenjem pretpostavljene vrijednosti nezavisne varijable u regresijsku
jednadbu
f f
x

y + =

Sampling-distribucija procjenitelja zavisne varijable oblika je Studentove distribucije s
87
(n 2) stupnja slobode, pa je prognostiki interval zavisne varijable za pretpostavljenu
vrijednost nezavisne varijable
f
x oblika:

f f
y f f y f
t y Y t y + < <

Standardna greka procjene je:
( )

+ + =
n
i
i
f
y
x n x
x x
n

f
1
2 2
2
1
1

Analiza varijance za model jednostavne regresije oslanja se na ralambu zbroja
kvadrata odstupanja empirijskih vrijednosti zavisne varijable od njezine aritmetike
sredine. S formalnog stajalita jednaka je dekompoziciji predoenoj za model
jednostavne regresije u sklopu deskriptivne statistike.

( ) ( ) ( )

= = =
+ =
n
i
n
i
i i i
n
i
i
y y y y y y
1 1
2 2
1
2


U razvijenom obliku zbrojevi kvadrata dani su jednadbama:

2
1
2 2
y n y ) y y ( ST
n
i
i i
n
i i
= =

= =

2
1 1
2
y n y x

y ) y y ( SP
i
n
i
i
n
i
i i
n
i i
+ = =

= = =

( )
i
n
i
i
n
i
i
n
i
n
i
i i i
y x

y y y y SR

= = = =
= =
1 1 1 1
2 2


Procjene varijance i komponenti (sredine kvadrata, mean squares) odreuju se tako da se
pojedini zbrojevi kvadrata podijele pripadajuim stupnjevima slobode. Veliine za analizu
varijance predoeni su u tabeli analize varijance (ANOVA, Analysis of Variance).



Izvor varijacija

Stupnjevi slobode

Zbroj kvadrata

Sredina kvadrata

Protumaen
modelom


1


2
) y y ( SP
i
n
i i
=

=


SP / 1


Rezidualna
odstupanja


n2


( )

=
=
n
i
i i
y y SR
1
2


SR/ (n2)


Ukupno


n1


2
) y y ( ST
i
n
i i
=

=


--

88
Veliine u tabeli analize varijance primjenjuju se u razliitim postupcima. Primjerice,
rezidualna sredina kvadrata procjena je varijance osnovnog skupa, omjer protumaenog i
ukupnog zbroja kvadrata je koeficijent determinacije, F-omjer je test veliina u
postupku testiranja hipoteza o znaajnosti regresije, itd.

U praksi se testira hipoteza o znaajnosti parametra uz nezavisnu varijablu. Nulta
hipoteza sadri tvrdnju da je parametar osnovnog skupa 0 = , a alternativna hipoteza
da je parametar osnovnog skupa 0 . Ako je nulta hipoteza istinita i ako su ispunjene
pretpostavke o modelu, test veliina
( )
( )
2
1
2
1
2
1

/ y y
n / SR
/ SP
F
n
i
i
=

=

pripada F-distribuciji sa [ ] 2 1 n , stupnjeva slobode. Odluka se donosi usporedbom
empirijskog F-omjera s teorijskom vrijednosti F-distribucije za razinu signifikantnosti
i broj stupnjeva slobode [ ] 2 1 n , . Nulta hipoteza se prihvaa ako je empirijski F-
omjer manji od teorijske vrijednosti F-distribucije, u protivnom se ona ne prihvaa.
Odluka se ekvivalentno donosi na temelju p-vrijednosti (nulta hipoteza se prihvaa ako je
p-vrijednost vea od )



13.2. Jednostavna krivolinijska regresija


Odnosi meu dvjema pojavama mogu biti nelinearni. Model kojim se izraavaju ti odnosi
naziva se modelom jednostavne krivolinijske regresije. Neki od njih lineariziraju se
prikladnom transformacijom varijabli, te se analiziraju na isti nain kao i model
jednostavne linearne regresije. Najee se provodi logaritamska transformacija
nezavisne i zavisne varijable ili obiju varijabli, zatim reciprona transformacija nezavisne
ili zavisne varijable, i tome slino. Pregled odabranih transformacija koje se odnose na
funkcionalni dio modela prikazan je u tabeli.

Oblik modela Transformacije varijabli Linearizirani oblik modela
x
e y

=

y ln

x ln y ln + =

x y =

x log , y log

x log log y log + =
x
y =


y log


log x log y log + =

x log y + =

x log

x log y + =
x
y
+
=
1

y
1
x
y
+ =
1

89
Proizvodnja i prosjeni trokovi
0
200
400
600
800
1000
1200
1400
1600
1800
0 10 20 30 40 50 60 70
proizvodnja (u tisuama komada)
p
r
o
s
j
e

n
i

t
r
o

k
o
v
i
Proizvodnja i prosjeni trokovi (logaritamske vrijednosti)
2,7
2,75
2,8
2,85
2,9
2,95
3
3,05
3,1
3,15
3,2
1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8
log (proizvodnja)
l
o
g

(
t
r
o

k
o
v
i
)
Primjer 13.2

Proizvodnja proizvoda u tisuama komada (varijabla X) i prosjeni trokovi proizvodnje
(varijabla Y) iznose:

i
y
550 580 620 700 750 815 895 997 1195 1541
i
x
60 54 50 45 36 32 25 23 18 10

a) Konstruirajte dijagram rasipanja s aritmetikim mjerilima na osima, te s logaritamskim
transformiranim vrijednostima varijabli.
b) Procijenite parametre regresijskog modela:
i i i
x y

= , , n , , i K 2 1 = . Kako glasi
jednadba s procijenjenim parametrima? Izraunajte regresijske vrijednosti.
c) Odredite sve elemente u tabeli ANOVA
d) Izraunajte ove veliine: .

, r , r ,
2 2

e) Odredite granice 95%-tnog intervala procjene parametra .


a)












b) Logaritamski oblik modela osnovnog skupa:
i i i
log x log log y log + + =
Model uzorka:
i i i
log x log

log y log + + =

x
i
y
i
log x
i
log y
i
log x
i
log y
i
log
2
x
i
i
y log
i
y
60 550 1,77815 2,74036 4,87278 3,16182 2,74872 560,68289
54 580 1,73239 2,76343 4,78735 3,00119 2,77538 596,17838
50 620 1,69897 2,79239 4,74419 2,88650 2,79485 623,51849
45 700 1,65321 2,84510 4,70355 2,73311 2,82151 662,99195
36 750 1,55630 2,87506 4,47447 2,42208 2,87797 755,03885
32 815 1,50515 2,91116 4,38173 2,26548 2,90777 808,67018
25 895 1,39794 2,95182 4,12647 1,95424 2,97023 933,75591
23 997 1,36173 2,99870 4,08341 1,85430 2,99133 980,23691
18 1195 1,25527 3,07737 3,86294 1,57571 3,05335 1130,71545
10 1541 1,00000 3,18780 3,18780 1,00000 3,20208 1592,49632
353 8643 14,93912 29,14319 43,22468 22,85442 29,14319 8644,28533
90

Izvor varijacije Stupnjevi slobode Suma kvadrata Sredina kvadrata
Protumaen regresijom
Rezidualna odstupanja
1
8
0,1822
0,001969
0,1822
0,00024651
Ukupno 9 0,1841 -


Procjena varijance regresije 0,0002461
Procjena standardne devijacije regresije 0,01569
Koeficijent determinacija 0,9893
Korigirani koeficijent determinacije 0,9880



= =
= = =
|

\
|

\
|
|

\
|

=
n
i
n
i
i i
n
i
n
i
i
n
i
i i i
x log
n
x log
y log x log
n
y log x log

1
2
1
2
1 1 1
1
1
=
10
93912 14
85442 22
10
14319 29 93912 14
22468 43
2
,
,
, ,
,

= 0,58261

|

\
|
=

=
=
n
i
i
n
i
i
x log
n

n
y log
log
1
1
1
= ( )
10
93912 14
58261 0
10
14319 29 ,
,
,
=3,78469

Jednadba s procijenjenim parametrima: x log , , y log 58261 0 78469 3 =

Jednadba u nelogaritamskom obliku:
58261 0
01964 6091
,
x , y

=

c)




d)





Korigirani koeficijent determinacije,
2
r rauna se pomou koeficijenta determinacije, a
u njegovom raunanju uzima se u obzir i broj stupnjeva slobode odnosno veliina uzorka:

( )
2 2
1
2
1
1 r
n
n
r

=

e) Granice intervala procjene parametra: ( ) 95 0, t

P

= + < <


( ) 95 0 02141 0 306 2 58261 0 02141 0 306 2 58261 0 , , , , , , , P = + < <
( ) 95 0 53323 0 63198 0 , , , P = < <

U sklopu potpore EXCEL-a nalazi se program za regresijsku analizu (Tools Data
Analysis regression izbor zavisne i nezavisne varijable lokacija podataka izbor
mjesta ispisa ...) Ako je rije o regresijskim modelima koji se lineariziraju, potrebno je
provesti transformaciju varijabli. U tu svrhu se rabe odgovarajue funkcije (Insert f
x
Function Math&Trig ..lnlog10) Primjenom EXCEL-a dobivaju se ovi rezultati:

91
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,994640116
R Square 0,98930896
Adjusted R Square 0,98797258
Standard Error 0,015687055
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 0,182173334 0,182173334 740,29018 3,5876E-09
Residual 8 0,001968669 0,000246084
Total 9 0,184142003
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 3,784691563 0,032371617 116,9138856 3,202E-14 3,71004248 3,859340647
log x -0,58261313 0,021413086 -27,20827412 3,588E-09 -0,631991792 -0,53323446


RESIDUAL OUTPUT
Observation Predicted log y Residuals Standard Residuals
1 2,748717305 -0,008354615 -0,56488665
2 2,775376219 -0,011948226 -0,807864039
3 2,794849338 -0,002457649 -0,166170773
4 2,821508253 0,023589787 1,594993353
5 2,877969298 -0,002908035 -0,196623072
6 2,907771429 0,003386179 0,228952196
7 2,970233365 -0,01841033 -1,244790934
8 2,991331052 0,007364106 0,497914644
9 3,053353325 0,02401458 1,623715177
10 3,202078437 -0,014275799 -0,965239902




Vjebe

1. Procjenjuju se parametri modela
i i i
e x y + + = , i = 1, 2,, n. Postupak se provodi
na temelju 12 parova vrijednosti varijable X (prodajna cijena u eurima po kg) i potronja
proizvoda po stanovniku (zavisna varijabla, u kg). Potronja i cijene za 12 podruja jednog
trita dane su u tabeli:

Potronja 63,9 63,4 56,1 62,1 77,6 80,1 82,0 85,4 84,6 80,5 81,4 85,2
Cijena 67,2 73,3 79,5 76,3 60,4 59,7 59,0 56,8 58,7 65,6 66,4 63,8

a) Napravite dijagram rasipanja. to se zakljuuje na temelju tog prikaza?
b) Kako glasi linearna regresijska jednadba s procijenjenim parametrima?
c) Izraunajte regresijske vrijednosti, rezidualna odstupanja i relativna rezidualna odstupanja.
d) Odredite sve elemente u tabeli ANOVA
e) Kolika je procjena varijance, standardne devijacije, koeficijenta varijacije, koeficijenta
determinacije i korigiranog koeficijenta determinacije?
92
f) Odredite granice intervala procjene (pouzdanost 95%) parametra , parametra ,
oekivane vrijednosti varijable Y za vrijednost nezavisne varijable =
0
x 59,0.

2. Zaduenja poslovnih banaka kod Centralne banke (zavisna varijabla, u mlrd. eura) i
prosjena eskontna stopa (nezavisna varijabla, u %) bili su:

Godina 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001 2002.
Zaduenje 353 380 448 521 601 624 705 790 840
Eskontna stopa 3,11 3,29 3,90 4,37 4,52 4,34 5,00 5,25 6,01

a) Konstruirajte dijagram rasipanja.
b) Odnos zaduenja i eskontne stope predouje se modelom jednostavne linearne jednadbe,
kako glasi model osnovnog skupa?
c) Izraunajte ove vrijednosti:
2 2
r , r , V

, , ,

, ,

.
d) Odredite granice 95%-tnog intervala procjene parametara uz regresorsku varijablu.
e) Procijenite brojem i 95%-tnim intervalom opseg zaduenja poslovnih banaka kod
Centralne banke ako je eskontna stopa 7%.
f) Napravite tabelu ANOVA i interpretirajte rezultate regresijske analize.


3. Ulaganja u reklamu u tisuama eura (varijabla X) i ostvarena prodaja u tisuama komada
(varijabla Y) iznose:

x
i
370 200 350 150 230 100 400 266 340 280
y
i
71,0 30,0 87,7 25,0 38,0 23,8 89,0 50,0 65,0 61,0

a) Konstruirajte dijagram rasipanja s originalnim vrijednostima varijabli, a zatim s
logaritamskim vrijednostima varijable Y i originalnim vrijednostima varijable X.
b) Procijenite parametre regresijskog modela:
i
x
i
i
e y

= , i = 1, 2,, n.
c) Izraunajte ove vrijednosti:
2 2
r , r , V

, , ,

, ,

.
d) Napravite tabelu ANOVA i interpretirajte rezultate regresijske analize.
e) Procijenite brojem i 95%-tnim intervalom prodaju ako ulaganja u reklamu iznose 90 tisua
komada.

4. Na temelju 18 parova vrijednosti varijabli osobna potronja (zavisna varijabla) i
raspoloivi dohodak (nezavisna varijabla) procijenjeni su parametri linearnog regresijskog
modela. Regresijski koeficijent je 0,80348, a njegova standardna greka 0,07253. Vrijednost je
konstantnog lana 439,213.

a) Kako glasi model osnovnog skupa, a kako linearna regresijska jednadba s procijenjenim
parametrima?
b) Moe li se prihvatiti pretpostavka da varijabla raspoloivi dohodak u modelu nije
signifikantna? Testirajte na razini 5% signifikantnosti. Primijenite t-test. Pokaite da se do
istog zakljuka dolazi uporabom F-testa.

93
14. LINEARNA KORELACIJA



Korelacijska analiza sastoji se u primjeni postupaka kojima se utvruju pokazatelji
jakosti statistike veze meu pojavama. Ako je povezanost po obliku linearna, govori se o
linearnoj korelaciji.

Polazna veliina za mjerenje jakosti i smjera povezanosti dviju pojava je kovarijanca. Po
definiciji, kovarijanca je prvi mjeoviti moment numerikih varijabli X i Y. Ako se
raspolae parovima njihovih vrijednosti (x
i
, y
i
), i = 1, 2, , n, kovarijanca je:

( ) ( )( ) y y x x
n
Y , X cov
i
n
i
i ,
= =

=1
1 1
1


ili u razvijenom obliku:

y x y x
n
n
i
i i ,
=

=1
1 1
1
,

=
=
n
i
i
x
n
x
1
1
,

=
=
n
i
i
y
n
y
1
1



Ako parovi vrijednosti (x
i
, y
i
), i = 1, 2,, n ine uzorak, procjenitelj kovarijance osnovnog
skupa je:

( )( ) y y x x
n

i
n
i
i ,

=

=1
1 1
1
1


odnosno, ( )

=
n
i
i i ,
y x n y x
n

1
1 1
1
1


Kovarijanca je jednaka nuli ako su sve vrijednosti barem jedne varijable meusobno
jednake, pa je i varijanca (standardna devijacija) te varijable jednaka je nuli. Kovarijanca
je vea od nule (pozitivna) ako postoji tendencija da iznadprosjene vrijednosti jedne
varijable dolaze s iznadprosjenim vrijednostima druge varijable, i obrnuto. Postoji li
tendencija da iznadprosjene vrijednosti jedne varijable prate ispodprosjene
vrijednosti druge varijable, kovarijanca je manja od nule (negativna). Budui da je
kovarijanca simetrina s obzirom na oznake varijabli, svejedno je koja e se varijabla
oznaiti s X a koja s Y.

Kovarijanca ovisi o mjernim jedinicama varijabli X i Y pa se njome prosuuje postojanje
kovarijacija meu pojavama. Za mjerenje stupnja povezanosti pojava koristi se
94
kovarijanca standardiziranih vrijednosti varijabli X i Y, to jest Pearsonov koeficijent
korelacije ili produkt moment formula:

y x
r

11
= , 1 1 r

Ovaj izraz moe se razviti na vie naina, a jedan od njih je:

|

\
|
|

\
|


=

= =
=
n
i
i
n
i
i
n
i
i i
y n y x n x
y x n y x
r
1
2 2
1
2 2
1


Koeficijent poprima vrijednosti iz zatvorenog intervala od minus do plus jedan. Prve
ocjene o stupnju i smjeru povezanosti varijabli mogu se donijeti na temelju dijagrama
rasipanja.




























95
Vrijeme za reklame i prodaja
100
150
200
250
300
350
300 400 500 600 700 800 900
Vrijeme za reklame (minuta)
P
r
o
d
a
j
a

(
t
i
s
u

a

k
o
m
a
d
a
)
Vrijednost koeficijenta jednaka nuli govori da ne postoji linearna korelacija meu
pojavama, vrijednost plus jedan da je potpuna i pozitivna smjera, a vrijednost minus
jedan da je potpuna i negativnog smjera. to je koeficijent po apsolutnoj vrijednosti blii
jedinici, veza je ua. Vrlo mala vrijednost koeficijenta ne mora nuno znaiti da je slaba
veza meu pojavama, povezanost moe biti uska ali krivolinijska.


Primjer 14.1

Prikupljeni su sljedei mjeseni podaci:

x
i
352 373 411 441 462 490 529 577 641 692 743 801
y
i
166 153 177 201 216 208 227 238 268 268 274 302

Varijabla X predouje ukupno vrijeme za reklame na nacionalnoj televiziji u minutama, a
varijabla Y prodaju proizvoda u tisuama komada.

a) Konstruirajte dijagram rasipanja
b) Izraunajte vrijednost kovarijance kao deskriptivno-statistike veliine. Odredite
vrijednost procijenjene kovarijance osnovnog skupa.
c) Izraunajte vrijednost Pearsonova koeficijenta korelacije. to zakljuujete ne temelju
dobivenog rezultata.


a)


















b) 542,66667
12
6512
1
= = =

=
n
x
x
n
i
i
224,83333
12
2698
1
= = =

=
n
y
y
n
i
i

96
i
x
i
y x x
i
y y
i
( )( ) y y x x
i i
( )
2
x x
i
( )
2
y y
i

352 166 -190,66667 -58,83333 11217,55556 36353,77778 3461,36111
373 153 -169,66667 -71,83333 12187,72222 28786,77778 5160,02778
411 177 -131,66667 -47,83333 6298,05556 17336,11111 2288,02778
441 201 -101,66667 -23,83333 2423,05556 10336,11111 568,02778
462 216 -80,66667 -8,83333 712,55556 6507,11111 78,02778
490 208 -52,66667 -16,83333 886,55556 2773,77778 283,36111
529 227 -13,66667 2,16667 -29,61111 186,77778 4,69444
577 238 34,33333 13,16667 452,05556 1178,77778 173,36111
641 268 98,33333 43,16667 4244,72222 9669,44444 1863,36111
692 268 149,33333 43,16667 6446,22222 22300,44444 1863,36111
743 274 200,33333 49,16667 9849,72222 40133,44444 2417,36111
801 302 258,33333 77,16667 19934,72222 66736,11111 5954,69444
6512 2698 0,00000 0,00000 74623,33333 242298,66667 24115,66667

Kovarijanca: ( )( ) 33333 74623
12
1 1
1
1 1
, y y x x
n
i
n
i
i ,
= =

=
= 6218,61111

Procjena kovarijance osnovnog skupa:
( )( ) y y x x
n

i
n
i
i ,

=

=1
1 1
1
1
= =
11
33333 7462,
6783,93939

c) Pearsonov koeficijent korelacije:
y x
r

11
=
( )
= =

=
12
67 242298,666
2
n
x x
i
x
142,09699
( )
= =

=
12
7 24115,6666
2
n
y y
i
y
44,829; =

=
44,829 142,09699
6218,61111
r 0,97622

Izmeu opsega prodaje i reklamnog vremena postoji pozitivna uska korelacija


Koeficijent linearne korelacije takoer je jednak drugom korijenu koeficijenta
determinacije, a predznak koeficijenta korelacije uvijek je jednak predznaku
regresijskog koeficijenta, tj.

( )
( )

=
=

=
n
i
i
n
i
i
y y
y y
r
1
2
1
2
,

sign sign y =

Vrijede jednakosti:
x
y

= ,
y
x

= .
97
Coefficients Standard Error
Intercept 57,70243 12,13095
X Variable 1 0,30798 0,02163
Regression Statistics
Multiple R 0,97622
R Square 0,95301
Adjusted R Square 0,94831
Standard Error 10,64478
Observations 12
Primjer 14.2

Na osnovi podataka iz Primjera 14.1 odredite linearnu regresijsku jednadbu s procijenjenim
parametrima i standardne pokazatelje.



Regresijska jednadba s procijenjenim parametrima: x , , y 30798 0 70243 57 + =

64478 10, =
95301 0
2
, r =
94831 0
2
, r =
97622 0, r =
13095 12,


02163 0,






Koeficijent korelacije osnovnog skupa oznaava se s . Koeficijent linearne korelacije r
procjenitelj je koeficijenta korelacije osnovnog skupa brojem. Za procjenu koeficijenta
korelacije osnovnog skupa pomou uzoraka koristi se isti izraz kao za izraun
koeficijenta linearne korelacije r u sklopu deskriptivne statistike.

Sampling-distribucija procjenitelja ovisi o veliini uzorka n i parametru . Za izraun
granica ( ) - 1 100 % -tnog intervala pouzdanosti rabi se transformacijski izraz (Fisherov):

( )

=
|
|

\
|

+
< <

+
1
3
1
1
2
1
3
1
1
2
1
2 2
n
z
r
r
ln Z
n
z
r
r
ln P
/ /


gdje je: r = koeficijent korelacije uzorka,
2 /
z

= koeficijent pouzdanosti, a odreuje se


na uobiajen nain pomou povrina ispod jedinine normalne distribucije. Vrijednosti su
navedenih granica tabelirane, a do granica procjene koeficijenta korelacije osnovnog
skupa dolazi se inverznom interpolacijom, emu slue posebne tablice.

U programskoj potpori EXCEL-a Fisherove transformacije odreuju se na temelju opcija
Insert f
x
function Statistical FISHER, i to za danu vrijednost r. Do granica procjene
koeficijenta korelacije osnovnog skupa dolazi se opcijom FISHERINV.


Testiranje hipoteze o koeficijentu korelacije osnovnog skupa temelji se na
odgovarajuoj sampling-distribuciji. Ako uzorak potjee iz osnovnog skupa koji se ravna
prema normalnoj distribuciji s koeficijentom korelacije 0 = , test veliina je:
98
2
1
2
r
n r
t

=

i pripada Studentovoj distribuciji s (n 2) stupnja slobode. Odluka se donosi kao u
svakom t-testu, usporedbom izraunane i kritine (teorijske) vrijednosti Studentove
distribucije. Test moe biti dvosmjeran i jednosmjeran.

Ako je parametar bilo koji broj iz intervala njegove varijacije, test hipoteze o
pretpostavljenoj vrijednosti provodi se pomou jedinine normalne distribucije.
Sampling-distribucija Z veliine (Fisherove transformacije)
r
r
ln Z

+
=
1
1
2
1
aproksimativno
je oblika normalne distribucije sa sredinom

+
=
1
1
2
1
ln
Z
i standardnom devijacijom
3
1

=
n
Z
. Test veliina, pisana u razvijenom obliku, za sluaj kada je pretpostavljena
vrijednost koeficijenta korelacije osnovnog skupa
0
jest

( )
(

|
|

\
|

+
|

\
|

+
=
0
0
1
1
2
1
1
1
2
1
3

ln
r
r
ln n z

Odluka se donosi usporedbom test-veliine s odgovarajuom vrijednosti jedinine
normalne distribucije.


Primjer 14.3

Analizom opsega prodaje jednog proizvoda (varijabla Y, u tisuama komada) 2011. godine i
prosjenog broja stanovnika te godine (varijabla X, u tisuama) na 17 segmenata trita
dobivena je regresijska jednadba x , y 625 0 250 + = . Koeficijent determinacije je 0,8464.
Zbroj kvadrata odstupanja zavisne varijable od njezine aritmetike sredine iznosi 9765,625.
Zbroj kvadrata odstupanja vrijednosti nezavisne varijable od njezine aritmetike sredine iznosi
21160.
a) Koliki je koeficijent linearne korelacije?
b) Odredite granice 95%-tnog intervala procjene koeficijenta linearne korelacije osnovnog
skupa.
c) Testirajte hipotezu da je koeficijent linearne korelacije osnovnog skupa jednak nuli.
Alternativnom hipotezom pretpostavite da je koeficijent korelacije osnovnog skupa vei od
nule. Razina signifikantnosti je 5%
d) Odredite sve elemente u tabeli ANOVA
e) Odredite granice 95%-tnog intervala procjene parametra .
f) Ako se pretpostavi da e na jednom segmentu trita broj stanovnika biti 500 tisua, kolika
je prognostika vrijednost prodaje?


99
a) =
2
r 0,8464
Koeficijent linearne korelacije: 8464 0
2
, r r = = = 0,92

b) Granice 95%-tnog intervala procjene koeficijenta korelacije osnovnog skupa:
( )

=
|
|

\
|

+
< <

+
1
3
1
1
2
1
3
1
1
2
1
2 2
n
z
r
r
ln Z
n
z
r
r
ln P
/ /


n = 17, ( ) 95 0 1 , = 05 0, = 96 1
025 0
, z
,
= r = 0,92

95 0
3 17
92 0 1
92 0 1
2
1
3 17
92 0 1
92 0 1
2
1
025 0 025 0
,
z
,
.
ln Z
z
,
,
ln P
, ,
=
|
|

\
|

+
< <

+

( ) 95 0 1128 2 0652 1 , , Z , P = < <
( ) 9712 0 7877 0 , , P < <

c) Hipoteze glase: 0
0
K H , 0
1
> K H

Test veliina (empirijski t-omjer): 09155 9
92 0 1
2 17 92 0
1
2
2 2
,
,
,
r
n r
t =

=
Razina signifikantnosti: 05 0 = ,
Test je jednosmjeran, kritine su vrijednosti za prihvaanje nulte hipoteze:

t t < ,
df = 15, 753 1
05 0
, t
,
= 753 1, t >
Odluka: empirijski t-omjer vei je od teorijske (kritine) vrijednosti, tj. 9,09155 >1,753.
Ne prihvaa se
0
H na danoj razini signifikantnosti.

d)
Izvor varijacije Stupnjevi slobode Zbroj kvadrata Sredina kvadrata
protumaen modelom
rezidualna odstupanja
1
15
8265,625
1500,000
8265,625
100,000
ukupno 16 9765,625 -

( ) 625 9765
1
2
, y y ST
n
i
= =

=
8464 0
2
,
ST
SP
r = = SP=8265,625 SR = ST SP = 1500
e)
( )
=

=
2 2
1
2
2
n
SR
n
y y

n
i
i i
100 06875 0
21160
100
1
2 2
2
,
x n x

n
i
i

= =


x , y 625 0 250 + = ( ) 95 0, t

P

= + < <


025 0,
t (15) =2,131
( ) 95 0 06875 0 131 2 625 0 06875 0 131 2 625 0 , , , , , , , P = + < <
( ) 95 0 77151 0 47849 0 , , , P = < <

f) x = 500 5 562 500 625 0 250 , , y = + = tisua komada.
100
Vjebe

1. Dane su ove vrijednosti varijabli:

x
i
14 6 8 2 12 2 9 11
y
i
6 4 5 1 5 3 4 6

a) Konstruirajte dijagram rasipanja.
b) Izraunajte vrijednost kovarijance kao deskriptivno-statistike veliine.
c) Izraunajte vrijednost Pearsonova koeficijenta korelacije.
d) Kako glasi linearne regresijska jednadba s procijenjenim parametrima?
e) Pokaite da je koeficijent linearne korelacije jednak umnoku regresijskog koeficijenta i
omjera odgovarajuih standardnih devijacija varijabli.

2. Analizira se odnos dviju pojava modelom jednostavne regresije. Toke u dijagramu
rasipanja proteu se od donjeg lijevog kuta prvog kvadranta koordinatnog sustava prema
gornjem desnom kutu sustava. Zbroj opaenih vrijednosti varijable X (nezavisne varijable)
iznosi 520, a njezina aritmetika sredina 52. Zbroj opaanja vrijednosti Y (zavisne varijable)
iznosi 430. Omjer standardnih devijacija varijabli X i Y jednak je jedan. Zbroj kvadrata
odstupanja opaenih vrijednosti zavisne varijable od regresorskih vrijednosti te varijable
jednak je 408, a zbroj kvadrata odstupanja regresijskih vrijednosti od aritmetike sredine
zavisne varijable jednak je 392.
a) Koliki je koeficijent linearne korelacije?
b) Odredite granice 95%-tnog intervala procjene koeficijenta korelacije osnovnog skupa
c) Odredite sve elemente u tabeli ANOVA
d) Testirajte hipotezu da je koeficijent korelacije osnovnog skupa jednak nuli.
e) Kako glasi model regresije s procijenjenim parametrima?
f) Kolika je procjena standardne devijacije regresije?

4. Trgovako poduzee ima 136 prodavaonica na malo. Ukupan promet svih prodavaonica
tijekom godine bio je 527,2 milijuna eura. Za ostvarenje tog prometa utroeno je 24819 tisua
sati.
i
i
i
y x

=
136
1
=105474,8;

=
136
1
2
i
i
x =2335,97;

=
136
1
2
i
i
y =4836570.

a) Procijenite vrijednost koeficijenta linearne korelacije brojem i 95%-tnim intervalom.
b) Kako glasi jednadba linearne regresije s procijenjenim parametrima? Zavisna varijabla
promet, nezavisna radni sati.
c) Izraunajte vrijednost standardne greke konstantnog lana i regresijskog koeficijenta.
d) Koliki je koeficijent determinacije i korigirani koeficijent determinacije, te procjena
standardne devijacije osnovnog skupa i koeficijenta varijacije?
e) Napiite regresijsku jednadbu s procijenjenim parametrima i standardne pokazatelje.
f) Procijenite brojem i 90%-tnim intervalom pouzdanosti vrijednost zavisne varijable
osnovnog skupa ako je empirijska vrijednost nezavisne varijable 143 tisue radnih sati.

101
15. MODELI VREMENSKIH SERIJA



Vremenska serija predstavlja niz kvantitativnih podataka koji su prikupljani u pravilnim
vremenskim intervalima. Razlikuju se intervalni niz od trenutanog vremenskog niza.
Intervalni niz nastaje zbrajanjem vrijednosti pojave po intervalima vremena i ima
svojstvo kumulativnosti. Trenutani niz sastoji se od kronoloki ureenih vrijednosti
koje su u svezi s odabranim vremenskim tokama.

Modelima se opisuje razvoj pojava u vremenu. U modeliranju polazi se od ralambe
serije na komponente koje oituju tipine oblike kovarijacije pojave s vremenom. Te
komponente su: trend, ciklina, sezonska i sluajna (rezidualna) komponenta.

Komponenta trenda pokazuje dugoronu (sekularnu) tendenciju kretanja pojave u
vremenu. Izraava se nekom funkcijom vremena. Prema obliku te funkcije trend je
linearni, parabolini, eksponencijalni, itd.

Ciklina komponenta predstavlja periodine varijacije pojave u trajanju od 2 ili vie
godina (ciklusi). Na relativno kratkom vremenskom intervalu ona se teko identificira pa
se kod kratkih vremenskih serija ne razdvaja od komponente trenda.

Sezonska komponenta moe se uoiti u serijama mjesenih ili kvartalnih podataka.
Predstavlja periodine oscilacije pojave u razdoblju od jedne godine. Za mnoge pojave
sezonska kretanja su u pravilu lako uoljiva.

Trend, ciklina i sezonska komponenta deterministike su komponente i daju se izraziti
nekom funkcijom vremena. Meutim, na razvoj vremenske pojave utjeu i nesistemski
faktori. Javljaju se sluajne varijacije ("noise") ili povremeno neki poseban dogaaj
uzrokuje ekstremne vrijednosti pojave ("outlier"). Takve iregularne promjene, koje ne
oituju neku pravilnost, predstavljaju sluajnu (stohastiku) komponentu.

Svaka vremenska serija ne mora sadravati sve navedena komponente. Uostalom,
stacionarne vremenske serije ne sadre trend, njihova razina pojave ne mijenja se s
vremenom, nemaju prisutne striktno periodine varijacije i njihove varijance ne ovise o
vremenu.

Model temeljen na standardnoj dekompoziciji moe biti aditivan, multiplikativan ili
mjeovit. Opi oblik aditivnog modela je:

e S C T Y + + + =

102
gdje Y predouje empirijsku seriju, T vrijednost trenda, C vrijednost cikline
komponente, a S i e vrijednosti sezonske i sluajne komponente. U ovom modelu sve
komponente se zbrajaju i izraene su u istim mjernim jedinicama kao i vrijednosti serije.
Kako se trend i ciklina komponenta esto ne razdvajaju model se moe predoiti
izrazom: e S T Y + + = .

Opi oblik multiplikativnog modela je:

I I T Y
S
=

U ovom modelu trend-ciklus komponenta izraena je u mjernim jedinicama pojave, a sve
ostale komponente dane su u relativnom iznosu (indeksi nepomnoeni sa sto).
Multiplikativni model se logaritamskom transformacijom svodi se na aditivni, tj.

I log I log T log Y log


S
+ + =

Ako serija sadri negativne vrijednosti ili nulu, ovaj model se ne moe primijeniti pa se
rabi mjeoviti (pseudoaditivni) model

( ) 1 + + =

I I T T Y
S


gdje su vrijednosti varijable Y vrijednosti serije, T je trend-ciklus komponenta izraena
u mjernim jedinicama vrijednosti serije, a sezonska i iregularna komponenta (

I , I
S
) u
relativnom iznosu.



13.1. Modeli trenda


Modelima trenda statistiki se opisuje dugorona kovarijacija pojave s vremenom. Ako
se pretpostavi da serija ne sadri periodine komponente model trenda u opem obliku je

e T Y + = ili

I T Y = ili T Y =

gdje je T komponenta trenda predoena nepoznatom funkcijom vremena f(X), a e i su
nepoznata odstupanja od trenda s obiljejima sluajnih varijabli.

Statistika analiza modela trenda provodi se metodama regresijske analize. Pri tome je
pristup sa stajalita deskriptivne ili inferencijalne statistike.

Oblici modela koji se relativno esto pojavljuju dani su u tabeli. U navedenim izrazima
t
y
su vrijednosti vremenske serije,
t
x je varijabla vrijeme koja dogovorno poprima
103
vrijednosti prvih n prirodnih brojeva ( = = t x
t
1, 2, , n),
t
su vrijednosti sluajne
varijable,
2 1
, , , , su parametri.



Naziv modela


Oblik modela

Linearni trend
(trend polinom prvog stupnja)


t t t
x y + + =

Parabolini trend drugog stupnja


t t t t
x x y + + + =
2
2 1



Eksponencijalni trend (jednostavni)


t
x
t
t
y = ,
t t t
ln ln x ln y ln + + =
t t
x
t
e y
+ +
= ,
t i t
x y ln + + =


Eksponencijalni trend (sloeni),
logaritamska parabola


t
x x
t
t t
y
2
2 1
= ,
t t t t
ln ln x ln x ln y ln + + + =
2
2
1

t t t
x x
t
e y
+ + +
=
2
2 1
,
t t t t
x x y ln + + + =
2
2 1




Numerika analiza modela trenda obuhvaa procjenu nepoznatih parametara, odreivanje
pokazatelja reprezentativnosti i ispitivanje kakvoe modela. Uz pretpostavku da e trend
biti postojan i u prognostikom horizontu, model s procijenjenim parametrima moe se
koristiti i u prognostike svrhe.


Model linearnog trenda identian je modelu jednostavne linearne regresije u kojemu je
vrijeme nezavisna varijabla. Oblika je
t t t
u bx a y + + = , = = t x
t
1, 2, , n, gdje su
t
y
vrijednosti lanova vremenske serije, a i b procjene nepoznatih parametara,
t
u
rezidualna odstupanja, a n broj lanova niza. Jednadba se uobiajeno predouje u
obliku

b x a y + = , , n , , i K 2 1 =

gdje je y vrijednost trenda. Uz jednadbu se navode i oznake (razdoblje za koje je
x =1; jedinica mjere vremena, jedinica mjere vrijednosti lanova niza za koje se rauna
trend).

Primijeni li se metoda najmanjih kvadrata, procjene parametara dobivaju se izrazima:

=
=

=
n
t
t
n
t
t t
x n x
y x n y x
b
1
2 2
1
, x b y a = , gdje je
n
y
y
n
t
t
=
=
1
,
n
x
x
n
t
t
=
=
1

104
Prodaja kompanije Eastman Kodak
0,0
2,0
4,0
6,0
8,0
10,0
12,0
14,0
16,0
18,0
20,0
1969 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991
u

m
i
l
i
j
a
r
d
a
m
a

d
o
l
a
r
a
Rezidualna odstupanja (razlike vrijednosti vremenskog niza i trenda) upuuju na
disperziju oko trenda kao srednje vrijednosti i podloga su za odreivanje varijance,
standardne devijacije i koeficijenta varijacije
( )
n
y y
n
i
i i
y

=
1
2
2
,
2
y y
= , 100 =
y
V
y
y

.


Primjer 15.1

Podaci o prodaji (u milijardama $) koju je ostvarila kompanija Eastman Kodak u razdoblju
1970-1989. dani su u tabeli.

Godina

Prodaja

Godina

Prodaja

1970. 2,8 1980. 9,7
1971. 3,0 1981. 10,3
1972. 3,5 1982. 10,8
1973. 4,0 1983. 10,2
1974. 4,6 1984. 10,6
1975. 5,0 1985. 10,6
1976. 5,4 1986. 11,5
1977. 6,0 1987. 13,3
1978. 7,0 1988. 17,0
1979. 8,0 1989. 18,4

a) Navedeni niz prikaite grafiki.
b) Analizirajte model linearnog trenda sa stajalita deskriptivne statistike. Odredite trend
vrijednosti i rezidualna odstupanja. Kolika je standardna devijacija i koeficijent varijacije
trenda? Liniju trenda ucrtajte u grafikon.


a)














105
b)
Godina Prodaja Vrijeme Trend Rezidualna odstupanja
t
y
t
x
t t
y x
2
t
x
2
t
y
t
y
t t
y y
1970. 2,8 1 2,8 1 7,8 1,7 1,1
1971. 3,0 2 6,0 4 9,0 2,4 0,6
1972. 3,5 3 10,5 9 12,3 3,1 0,4
1973. 4,0 4 16,0 16 16,0 3,9 0,1
1974. 4,6 5 23,0 25 21,2 4,6 0,0
1975. 5,0 6 30,0 36 25,0 5,3 -0,3
1976. 5,4 7 37,8 49 29,2 6,0 -0,6
1977. 6,0 8 48,0 64 36,0 6,8 -0,8
1978. 7,0 9 63,0 81 49,0 7,5 -0,5
1979. 8,0 10 80,0 100 64,0 8,2 -0,2
1980. 9,7 11 106,7 121 94,1 8,9 0,8
1981. 10,3 12 123,6 144 106,1 9,7 0,6
1982. 10,8 13 140,4 169 116,6 10,4 0,4
1983. 10,2 14 142,8 196 104,0 11,1 -0,9
1984. 10,6 15 159,0 225 112,4 11,8 -1,2
1985. 10,6 16 169,6 256 112,4 12,6 -2,0
1986. 11,5 17 195,5 289 132,3 13,3 -1,8
1987. 13,3 18 239,4 324 176,9 14,0 -0,7
1988. 17,0 19 323,0 361 289,0 14,7 2,3
1989. 18,4 20 368,0 400 338,6 15,5 2,9
Ukupno 171,7 210 2285,1 2870 1851,7 171,7 0,0

n = 20, 5 10
20
210
1
,
n
x
x
n
t
t
= = =

=
585 8
20
7 171
1
,
,
n
y
y
n
t
t
=
=
= =

=

=

=
=
n
t
t
n
t
t t
x n x
y x n y x
b
1
2 2
1
= =


2
5 10 20 2870
585 8 5 10 20 1 2285
,
, , ,
0,725188


970526 0 5 0 1 725188 0 588 8 , , , , x b y a = = =

Model linearnog trenda s procijenjenim parametrima:

t t
x , , y 725188 0 970526 0 + =
x = 1, 1970. godine
Jedinica za x je jedna godina
Jedinica za y je milijarda dolara

Koeficijent b pokazuje da se vrijednost prodaje kompanije linearno poveavala u prosjeku
0,725 milijardi $ godinje. Konstantni lan a ( 0,97) predstavlja vrijednost trenda za godinu
koja prethodi prvoj godini u nizu, tj. za 1969. godinu (x = 0).
106
Prodaja kompanije Eastman Kodak
0,0
2,0
4,0
6,0
8,0
10,0
12,0
14,0
16,0
18,0
20,0
1969 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991
u

m
i
l
i
j
a
r
d
a
m
a

d
o
l
a
r
a
y = 0,7252x + 0,9705
R
2
= 0,9261
( )
n
y y
n
i
i i
y

=
1
2
2

20
92360 27,
= =1,39618
2
y y
= =1,18160
100 =
y
V
y
y

= = 100
5 10
18160 1
,
,
11,25334


















Model linearnog trenda u sklopu inferencijalne statistike jednak je modelu linearne
regresije. Model osnovnog skupa oblika je
t t t
e x y + + = .

U modelu su
t
y vrijednosti serije, i nepoznati parametri,
t
e nepoznate vrijednosti
sluajne varijable e za koju se pretpostavlja da su joj vrijednosti meusobno
nekorelirane sluajne veliine s konstantnom varijancom te da su identino rasporeene
po normalnoj distribuciji, s oekivanjem 0 i varijancom
2
.

lanovi vremenskog niza tvore uzorak. Primjenom procjenitelja pomou uzorka se
procjenjuju parametri i druge statistiko-analitike veliine. Izrazi za procjene
parametara jednaki su onima iz deskriptivne statistike, tj. a = , b

= . Model uzorka s
procijenjenim parametrima je:

t t t
e x

y + + = ,
t t
x

y + =

Osim parametara procjenjuju se standardna devijacija, koeficijent varijacije,
standardne greka procjene i druge veliine. Dio ovih veliina temelji se na analizi
varijance, koja je za linearni trend jednaka analizi varijance modela jednostavne linearne
regresije.
107
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,96231943
R Square 0,92605869
Adjusted R Square 0,92195084
Standard Error 1,24551644
Observations 20
ANOVA
df SS MS F
Regression 1 349,7218985 349,7219 225,4363
Residual 18 27,9236015 1,5513112
Total 19 377,6455
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 0,97052632 0,578581564 1,6774235 0,110739 -0,24502844 2,1860811
X Variable 1 0,72518797 0,048299056 15,014537 1,27E-11 0,62371542 0,8266605
Primjer 15.2

Na temelju podataka iz Primjera 15.1 analizirajte model linearnog trenda sa stajalita
inferencijalne statistike.


Model s procijenjenim parametrima:
t t
x , , y 725188 0 970526 0 + =

















Standardna greka procjene trenda pokazuje da je prosjeno odstupanje stvarnih vrijednosti
prodaje od trend-vrijednosti iznosi 1,246 milijardi $. Modelom linearnog trenda protumaeno
je 92,6% odstupanja.


Model jednostavnog eksponencijalnog trenda je
t
x
t
t
y = , a u logaritamskom obliku
t t t
ln ln x ln y ln + + = . Logaritamskom transformacijom model eksponencijalnog
trenda svodi se na model linearnog trenda. U lineariziranom modelu umjesto originalnih
vrijednosti rabe se njihovi logaritmi. Parametri su procijenjeni metodom najmanjih
kvadrata, a druge statistiko-analitike veliine dobiju se na nain kao kod linearnog
trenda. Pri tome se uvijek polazi od rezultata dobivenih na temelju logaritamskog oblika
modela.


Primjer 15.3

Podatke iz Primjera 15.1 prikaite grafiki tako da na osi apscisa naznaite aritmetiko
mjerilo za varijablu vrijeme, a na osi ordinata aritmetiko mjerilo za logaritme vrijednosti
lanova niza.
a) Predoene varijacije prodaje modelom jednostavnog eksponencijalnog trenda i izraunajte
uobiajene statistiko analitike veliine
b) Kolika se prodaja (prema trendu) moe oekivati u 1991. godini?
108
Prodaja kompanije Eastman Kodak
0,00
0,50
1,00
1,50
2,00
2,50
3,00
3,50
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990
l
n

y
t

a)















Godina Prihod Vrijeme
Trend
vrijednosti
Prodaja prema
trendu
y
t
x
t
ln y
t
x
t
ln y
t
x
t
2
(ln y
t
)
2
ln
t

t

1970 2,8 1 1,02962 1,02962 1 1,06012 1,13 3,09
1971 3 2 1,09861 2,19722 4 1,20695 1,22 3,39
1972 3,5 3 1,25276 3,75829 9 1,56942 1,31 3,72
1973 4 4 1,38629 5,54518 16 1,92181 1,41 4,08
1974 4,6 5 1,52606 7,63028 25 2,32885 1,50 4,48
1975 5 6 1,60944 9,65663 36 2,59029 1,59 4,91
1976 5,4 7 1,68640 11,80479 49 2,84394 1,68 5,39
1977 6 8 1,79176 14,33408 64 3,21040 1,78 5,92
1978 7 9 1,94591 17,51319 81 3,78657 1,87 6,49
1979 8 10 2,07944 20,79442 100 4,32408 1,96 7,13
1980 9,7 11 2,27213 24,99338 121 5,16256 2,06 7,82
1981 10,3 12 2,33214 27,98573 144 5,43890 2,15 8,58
1982 10,8 13 2,37955 30,93410 169 5,66224 2,24 9,42
1983 10,2 14 2,32239 32,51343 196 5,39348 2,34 10,34
1984 10,6 15 2,36085 35,41281 225 5,57363 2,43 11,35
1985 10,6 16 2,36085 37,77366 256 5,57363 2,52 12,45
1986 11,5 17 2,44235 41,51990 289 5,96506 2,62 13,67
1987 13,3 18 2,58776 46,57975 324 6,69652 2,71 15,00
1988 17 19 2,83321 53,83105 361 8,02710 2,80 16,46
1989 18,4 20 2,91235 58,24701 400 8,48179 2,89 18,07
Ukupno 171,7 210 40,20988 484,05453 2870 86,81732

=


=
= =
n
t
t
n
t
n
t
t t t
x n x
y ln x y ln x
b
1
2 2
1 1
=


2
5 10 20 2870
20988 40 5 10 05453 484
,
, , ,
0,0930087 5 10, x =
109
= =

=
x b y ln
n
a ln
n
t
t
1
1
= 5 10 0930087 0 20988 40
20
1
, , , 1,0339026

Model eksponencijalnog trenda s procijenjenim parametrima:
t t
x , , y ln 0930087 0 0339026 1 + =
a u nelogaritamskom obliku:
t
x ,
t
e , y
0930087 0
8120186 2 =

Elementi u tabeli ANOVA izraunavaju se izrazima predoenim u analizi modela jednostavne
linearne regresije, s tim to se umjesto originalnih vrijednosti varijable rabe njihovi logaritmi.
Primjenom programa za regresijsku analizu u EXCEL-u dobiveni su ovi rezultati:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,9811686
R Square 0,9626919
Adjusted R Square 0,9606192
Standard Error 0,11129
Observations 20


ANOVA
df SS MS F Significance F
Regression 1 5,7526613 5,75266126 464,4691 2,64192E-14
Residual 18 0,2229382 0,01238545
Total 19 5,9755994
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 1,0339026 0,0516977 19,9990124 9,64E-14 0,9252898 1,14251545
X Variable 1 0,0930087 0,0043156 21,5515461 2,64E-14 0,0839419 0,10207552


b) U 1991. godini (x= 22) oekuje se prodaja u vrijednosti od 21,76 milijardi dolara.



15.2. Pomini prosjeci


Pomini prosjeci su aritmetike sredine M uzastopnih vrijednosti lanova vremenskog
niza. Niz pominih prosjeka ini izvedeni niz koji ima manji stupanj varijabilnosti u
usporedbi s izvornim nizom. Njima se izglauje vremenska serija pa se mogu shvatiti kao
lokalni model trenda.

Ako je broj lanova pominog prosjeka neparan (M = 2m + 1), raunaju se pomou izraza:

, y
M
y
m
m s
s t
*
t
=
+
=
1
m n , , m , m t + + = K 2 1

110
Prodaja korporacije General Motors
4
5
6
7
8
9
10
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990
P
r
o
d
a
j
a

(
m
i
l
i
j
u
n
i

j
e
d
i
n
i
c
a
)
Prodaja yt Pomini prosjeci M=5 Pomini prosjeci M=7
gdje su
*
t
y vrijednosti pominih prosjeka, a
t
y vrijednosti lanova niza. Vrijednost
prosjeka pridruuje se razdoblju sredinjeg lana pominog prosjeka.

Kada je broj lanova pominog prosjeka M paran broj, tj. M = 2m , provodi se postupak
centriranja. Centrirani pomini prosjeci raunaju se u obliku dvostrukih pominih
prosjeka, tj. odreivanjem jednostavnih pominih prosjeka od prethodnih pominih
prosjeka od po dva lana.


Primjer 15.4

Prodaja korporacije General Motors u razdoblju 1970-1989. (u milijunima jedinica)

Godina Prodaja Godina Prodaja Godina Prodaja Godina Prodaja
1970 5,3 1975 6,6 1980 7,1 1985 9,3
1971 7,8 1976 8,6 1981 6,8 1986 8,6
1972 7,8 1977 9,1 1982 6,2 1987 7,8
1973 8,7 1978 9,5 1983 7,8 1988 8,1
1974 6,7 1979 9 1984 8,3 1989 7,9

a) Izraunajte petogodinje i sedmogodinje pomine prosjeke
b) Usporedite originalni niz i nizove izraunanih pominih prosjeka na jednom grafikonu.

a)
Godina Prodaja M =5 M =7
t
y ( ) 5
*
t
y ( ) 7
*
t
y
1970. 5,3
1971. 7,8
1972. 7,8 7,3
1973. 8,7 7,5 7,4
1974. 6,7 7,7 7,9
1975. 6,6 7,9 8,1
1976. 8,6 8,1 8,3
1977. 9,1 8,6 8,1
1978. 9,5 8,7 8,1
1979. 9 8,3 8,0
1980. 7,1 7,7 7,9
1981. 6,8 7,4 7,8
1982. 6,2 7,2 7,8
1983. 7,8 7,7 7,7
1984. 8,3 8,0 7,8
1985. 9,3 8,4 8,0
1986. 8,6 8,4 8,3
1987. 7,8 8,3
1988. 8,1
1989. 7,9


b)
111
Primjer 15.5

Mjeseni podaci o prodaji jeans-a u Velikoj Britaniji (u tisuama)

1980. 1981. 1982. 1983. 1984. 1985.
Sijeanj 1998 1924 1969 2149 2319 2137
Veljaa 1968 1959 2044 2200 2352 2130
Oujak 1937 1889 2100 2294 2476 2154
Travanj 1827 1819 2103 2146 2296 1831
Svibanj 2027 1824 2110 2241 2400 1899
Lipanj 2286 1979 2375 2369 3126 2117
Srpanj 2484 1919 2030 2251 2304 2266
Kolovoz 2266 1845 1744 2126 2190 2176
Rujan 2107 1801 1699 2000 2121 2089
Listopad 1690 1799 1591 1759 2032 1817
Studeni 1808 1952 1770 1947 2161 2162
Prosinac 1927 1956 1950 2135 2289 2267

a) Izraunajte dvanaestomjesene pomine prosjeke. Niz prikaite linijskim grafikonom
b) Prikaite na istom grafikonu prikaite originalni seriju i izraunane prosjeke.

a)























U sklopu potpore EXCEL-a koristi se program (Tools Data Analysis Moving
Average) i Trendline rutina.
=AVERAGE(B4:B15)
=AVERAGE(C9:C10)
112
Prodaja jeans-a u Velikoj Britaniji
1500
1700
1900
2100
2300
2500
2700
2900
3100
3300
p
r
o
-
7
9
o

u
-
8
0
l
i
p
-
8
0
l
i
s
-
8
0
s
i
j
-
8
1
t
r
a
-
8
1
k
o
l
-
8
1
s
t
u
-
8
1
v
l
j
-
8
2
s
v
i
-
8
2
r
u
j
-
8
2
p
r
o
-
8
2
o

u
-
8
3
s
r
p
-
8
3
l
i
s
-
8
3
s
i
j
-
8
4
t
r
a
-
8
4
k
o
l
-
8
4
s
t
u
-
8
4
v
l
j
-
8
5
l
i
p
-
8
5
r
u
j
-
8
5
p
r
o
-
8
5
u

t
i
s
u

a
m
a

Prodaja Pomini prosjeci, M=12
Godina 1982. 1983. 1984. 1985. 1986. 1987. 1988. 1989. 1990. 1991. 1992. 1993 1994.
Izvoz 1739 1696 1799 1833 2010 2366 2399 2922 3334 3436 3691 3702 4201






















Vjebe

1. Prijevoz robe u pomorskom prometu Republike Hrvatske (u milijunima tona)

Godina 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000.
Promet 13,2 14,6 14,9 14 15,5 15,7 16,3 16,9

a) Navedeni niz prikaite linijskim grafikonom.
b) Procijenite parametre odgovarajueg modela trend polinoma.
c) Odredite sve elemente u tabeli ANOVA. Kolika je procjena standardne devijacije i
koeficijenta varijacije.

2. Svjetski izvoz (u milijunima US $)





a) Prikaite niz linijskim grafikonom.
b) Odredite procjene parametara i druge statistiko-analitike veliine modela trend polinoma
treeg stupnja.
c) Trend polinom prikaite na grafikonu pod (a)
d) Komentirajte dobivene rezultate.

113
10 16 20 23 25 26 30 36 48 62 78 94 107 118 127
Godina 1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001. 2002.
Dobit 201 250 313 403 525 706 900 1153 1490 1859
Godina, mjesec Prodaja Godina, mjesec Prodaja
2001, I 25 2002, I 24
II 21 II 22
III 24 III 22
IV 29 IV 27
V 45 V 48
VI 91 VI 94
VII 208 VII 239
VIII 210 VIII 229
IX 80 IX 90
X 36 X 37
XI 22 XI 21
XII 21 XII 22
3. Proizvodnja artikla (u tisuama komada) po godinama razdoblja 1988-2002. bila je




Analizirajte sljedee modele: model linearnog trenda, model parabolinog trenda drugog
stupnja, model trend polinoma treeg stupnja. Koji je od navedenih modela najprikladniji, sa
stajalita statistike analize?

4. Dobit tvrtke nakon oporezivanja (u tisuama eura) je:





a) Niz prikaite linijskim grafikonom, a zatim polulogaritamskim grafikonom.
b) Procijenite parametre eksponencijalnog trenda.
c) Izraunajte elemente analize varijance i druge statistiko-analitike veliine.
d) Jednadbu trenda napiite u nelogaritamskom obliku i uz nju navedite sve potrebne
elemente.

5. Jedinini trokovi izrade proizvoda uvedenoga u proizvodnju u razdoblju 2000-2002.
godine opisuju se jednadbom trenda:

2
98 0 01 1 53 120
x x
, , , y =
x = 1, prosinac 2000.
Jedinica za x je jedan mjesec
Jedinica za y je jedna kuna

Izraunajte vrijednosti trenda i prikaite ih polulogaritamskim mjerilom

6. Prodaja sezonskog proizvoda dana je u tabeli (u tisuama komada):





















a) Navedeni niz prikaite linijskim grafikonom
b) Izraunajte tromjesene pomine prosjeke
c) Izraunajte dvanaestomjesene centrirane pomine prosjeke
d) Nizove pominih prosjeka prikaite na grafikonu pod (a). Komentirajte prikaz i rezultate.

Tablica 1



0 z

Povrine ispod normalne krivulje

You might also like