You are on page 1of 14

cieki dostpu do STATISTICA

Spis treci
Sprawdzanie zgodnoci z rozkadem normalnym test Shapiro-Wilka: ............................................................................. 2
Test t-Studenta w modelu zmiennych niezalenych:........................................................................................................ 3
Test t-Studenta w modelu zmiennych powizanych ........................................................................................................ 4
Test Manna-Whitneya : .................................................................................................................................................... 5
Test Wilcoxona ................................................................................................................................................................. 5
Tabele kontyngencji skala nominalna ............................................................................................................................ 6
Badanie zalenoci ............................................................................................................................................................ 8
ANOVA w modelu zmiennych niezalenych.................................................................................................................... 10
ANOVA w modelu zmiennych zalenych......................................................................................................................... 11
Test Kruskala-Wallisa test nieparametryczny (ANOVA rang Kruskala-Wallisa) ........................................................... 12
Test Friedmana test nieparametryczny (ANOVA rang Friedmana).............................................................................. 12
Regresja Wielokrotna...................................................................................................................................................... 13

Sprawdzanie zgodnoci z rozkadem normalnym test Shapiro-Wilka:


H0 : RDane = RNor
H1 : RDane RNor

Grupa pe =k
p=0,8206 H0
Grupa pe =m
p=0,8077 H0

Test t-Studenta w modelu zmiennych niezalenych:


Skala interwaowa, model zmiennych niepowizanych, zgodno z rozkadem normalnym w kadej z grup, liczba grup
k=2
H0 : 1 = 2
H1 : 1 2

Jednorodno wariancji test Levena


H0 : SD21 = SD22
H1 : SD21 SD22

p testu Levena p=0,4991 H0 patrzymy na warto p testu t-Studenta p=0,3353

p testu Levena p=0,0235 H1 patrzymy na warto p testu t z oddz. est. war. p=0,0042 H1 (test Welcha)

Test t-Studenta w modelu zmiennych powizanych


Skala interwaowa, model zmiennych powizanych, zgodno z rozkadem normalnym, liczba grup k=2
H0 : przed = po
H1 : przed po

Warto p testu p=0,0195 H1

Test Manna-Whitneya :
Gdy brak zgodnoci z rozkadem normalnym skala interwaowa, lub skala porzdkowa w modelu zmiennych
niepowizanych, liczba grup k=2
H0 : 1 = 2
H1 : 1 2

Patrzymy na drugie p za Z popraw. (poprawka na rangi wizane) p=0,5312 H0

Test Wilcoxona
Gdy brak zgodnoci z rozkadem normalnym skala interwaowa, lub skala porzdkowa w modelu zmiennych
powizanych, liczba grup k=2
H0 : przed = po
H1 : przed po

Warto p testu p=0,0005 H1

Tabele kontyngencji skala nominalna


Test Chi2 , Test Chi2 z poprawk Yatesa, test dokadny Fishera
H0 : 1 = 2

H0 : brak zalenoci midzy badanymi parametrami

H1 : 1 2

H1 : jest zaleno midzy badanymi parametrami

1. Sposb

menopauza

POST
MEN
Og

Podsumowujca tabela dwudzielcza:


czstoci obserwowane (Rak piersi- 2
grupy)
Typ hist.
Typ hist.
Wiersz
1
2
Razem
24
10
34
6
4
10
30
14
44

Podsumowujca tabela Wyliczanie


licznoci (Rak piersi- 2 grupy)
Typ hist.
Typ hist.
Wiersz
1
2
Razem
POST
23,18182
10,81818
34,00000
MEN
6,81818
3,18182
10,00000
Og
30,00000
14,00000
44,00000
Liczebno oczekiwana <5 test dokadny Fishera dwustronny
menopauza

statystyka
Chi^2 Pearsona
Chi^2 NW
Chi^2 Yatesa
dok. Fishera, 1-stronny
2-stronny
Chi^2 McNemara (A/D)
(B/C)
p=0,7014

Statystyka: menopauza(2) x Typ


hist.(2) (Rak piersi- 2 grupy)
Chi-kwadr.
df
p
,3993277
df=1
p=,52744
,3887764
df=1
p=,53294
,0603922
df=1
p=,80588
p=,39386
p=,70135
12,89286
df=1
p=,00033
,5625000
df=1
p=,45325

H0

2 Sposb - tylko dla tabel 2x2

Tabela 2x2 (Rak piersi- 2 grupy)


Kolumna1
Kolumna2
Licznoci, wiersz
Procent caoci
Licznoci, wiersz
Procent caoci
Razem w kol.
Procent caoci
Chi-kwadrat (df=1)
V-kwadrat (df=1)
Chi-kwadrat skoryg. Yatesa
Fi-kwadrat
dok. p Fishera, jednostr.
dwustr.
Chi-kwadrat McNemary A/D
Chi-kwadrat McNemary B/C

p< 0,0001 H1

78
34,667%
19
8,444%
97
43,111%
73,81
73,48
71,51
,32803

2,26
1,69

29
12,889%
99
44,000%
128
56,889%
p= ,0000
p= ,0000
p= ,0000
p= ,0000
p= ,0000
p= ,1328
p= ,1939

Wiersz
Razem
107
47,556%
118
52,444%
225

Badanie zalenoci
Wspczynnik korelacji Pearsona oba parametry na skali interwaowej i oba zgodne z rozkadem normalnym, bada
zaleno liniow
H0 : RP = 0

brak zalenoci linowej midzy badanymi parametrami

H1 : RP 0

jest zaleno linowa midzy badanymi parametrami

Gdy potwierdzona zgodno z rozkadem normalnym

Zmn. X &
Zmn. Y

Korelacje (Zadania_3)
Oznaczone wsp. korelacji s istotne z p < ,05000
(Braki danych usuwano przypadkami)
rednia Odch.st.
r(X,Y)
r2
t

Poziom estriolu
[mg/24h]
Masa urodzeniowa
[g/100]

30,36000 3,510461 0,455274 0,207275 2,452312 0,022203

p=0,0222 H1
Wykr. rozrzutu: Masa urodzeniowa [g/100] vs. Poziom estriolu [mg/24h] (BD usuwano przypadk.)
Poziom estriolu [mg/24h] = -2,092 + ,60252 * Masa urodzeniowa [g/100]
Korelacja: r =

,45527

28
26

Poziom estriolu [mg/24h]

24
22
20
18
16
14
12
10
8
24

26

Wanych

Staa
zal: Y

Nachyle
zal: Y

Staa
zal: X

Nachyle
zal: X

16,20000 4,645787

Wsp. korelacji Pearsona; wsp. determinacji

6
22

28

30

Masa urodzeniowa [g/100]

32

34

36

0,95 Prz.Ufn.

25 24,78695 0,344015

y=a+bx

- 0,602516
2,09237

Wspczynnik korelacji nieparametrycznej Spearmana oba parametry na skali interwaowej ale brak zgodnoci z
rozkadem normalnym, jeden lub oba parametry na skali porzdkowej
H0 : RS = 0

brak zalenoci monotonicznej midzy badanymi parametrami

H1 : RS 0

jest zaleno monotoniczna midzy badanymi parametrami

Para zmiennych

Apgar - 5 & pH pp.

Korelacja porzdku rang Spearmana (Zad1)


BD usuwane parami
Oznaczone wsp. korelacji s istotne z p <,05000
N
R
t(N-2)
p
Wanych
Spearman
0,623545
105
8,094646
0,000000

Wsp. korelacji Spearmana


p< 0,0001 H1
Korelacje (Zad1 10v*105c)
pH pp.

Apgar - 5

ANOVA w modelu zmiennych niezalenych


Skala interwaowa, liczba grup >2, zgodno z rozkadem normalnym w kadej z grup, jednorodno wariancji
H0 : 1 = 2=.=k
H1 : i j

i=1k; j=1.k; ij

Mona wyznaczy statystyki opisowe w kadej z grup, nastpnie zakadka Testy ANOVA

Sprawdzamy na wykresie czy rednie i odchylenia standardowe s skorelowane


Test Levene'a jednorodnoci wariancji (ANOVA1)Zaznaczone efekty s istotne z p < ,05000
SS
df
MS
SS
df
MS
F
p
Efekt
Efekt
Efekt
Bd
Bd
Bd
zmiana cinienia
1,315070
3
0,438357
14,16468
36
0,393463
1,114098
0,356127
Jednorodno wariancji potwierdzona
Zmienna

Zmienna
zmiana cinienia

Analiza wariancji (ANOVA1) Zaznaczone efekty s istotne z p < ,05000


SS
df
MS
SS
df
MS
Efekt
Efekt
Efekt
Bd
Bd
Bd
58,39500
3
19,46500
50,63600
36
1,406556

13,83877

0,000004

p< 0,0001 H1 testujemy ktre pary rednich si rni testami post-hoc


Test Scheffe; Zmienna: (ANOVA1)
Zaznaczone rnice s istotne z p < ,05000
1
2
3
M=,37000
M=1,7300
M=2,4500
0,105887
0,004688
0,105887
0,610212
0,004688
0,610212
0,000006
0,007601
0,150215

Metoda

m1
m2
m3
m4

1
2
3
4

Wy k res rednic h i prz edz . ufno c i (95,00%)


z miana c i nienia
5

War toci

Test Scheffe najbardziej konserwatywny, test NIR


najmniej konserwatywny

-1
m1

m2

m3
Metoda

m4
z miana c i nienia

4
M=3,7100
0,000006
0,007601
0,150215

ANOVA w modelu zmiennych zalenych


Skala interwaowa, liczba grup >2, zgodno z rozkadem normalnym w kadej z grup, zaoenie sferycznoci (test
Mauchleya) i symetrii poczonej
H0 : 1 = 2=.=k
H1 : i j

Efekt

R1

i=1k; j=1.k; ij

Test sferycznoci Mauchleya (ANOVA)


Parametryzacja z sigma-ograniczeniami
Dekompozycja efektywnych hipotez
W
Chi-kw.
df
p
0,943258
1,635645
2
0,441392

Efekt

Wyraz wolny
Bd
R1
Bd

Analiza wariancji dla powtarzanych pomiarw (ANOVA)


Parametryzacja z sigma-ograniczeniami
Dekompozycja efektywnych hipotez
SS
Stopnie
MS
F
swobody
725224,9
1
725224,9
1799,191
11689,4
29
403,1
447,8
2
223,9
2,079
6244,9
58
107,7

p
0,000000
0,134213

p= 0,1342 H0 brak statystycznie istotnych rnic (rednie w trzech czasach nie rni si)
R1; Oczekiwane rednie brzegowe
Biecy efekt: F(2, 58)=2,0795, p=,13421
Dekompozycja efektywnych hipotez
Pionowe supki oznaczaj 0,95 przedziay ufnoci
100
98
96
94

DV_1

92
90
88
86
84
82
80
78
MAP 36g

MAP 48g
R1

MAP 60g

Test Kruskala-Wallisa test nieparametryczny (ANOVA rang Kruskala-Wallisa)


Model niezaleny, liczba grup >2, skala interwaowa ale nie spenione zaoenia ANOVA (brak normalnoci w
jakiej z grup lub wariancje niejednorodne lub skorelowanie rednich z odchyleniami standardowymi), skala
porzdkowa
H0 : 1 = 2=.=k
H1 : i j
i=1k; j=1.k; ij

Zalena:
SCORAD

CH-AD
CH-ADe
CH-ADi

Warto p dla porwna wielokrotnych (dwustronych);


SCORAD (Rosiska 02062011)
Zmienna niezalena (grupujca): Group
Test Kruskala-Wallisa: H ( 2, N= 154) =21,14553 p =,0000
CH-AD
CH-ADe
CH-ADi
R:77,500
R:94,186
R:44,769
0,114717
0,003644
0,114717
0,000013
0,003644
0,000013

p testu Kruskala-wallisa p< 0,0001 H1 testujemy ktre rozkady si rni testem Dunna

Test Friedmana test nieparametryczny (ANOVA rang Friedmana)


Model zaleny, liczba grup >2, skala interwaowa ale nie spenione zaoenia ANOVA, skala porzdkowa
H0 : 1 = 2=.=k
H1 : i j
i=1k; j=1.k; ij

Zmienna

TNF 0g
TNF 12g
TNF 24g
TNF 36g
TNF 48g
TNF 60g
TNF 5d

ANOVA Friedmana i wspczynnik zgodnoci Kendalla (ANOVA)


Chi kwad. ANOVA (N = 30 , df 6 ) =17,00240 p ,00928
Wspczynnik zgodnoci= ,09446 r red. rang = ,06323
rednia
Suma
rednia
Odch.std
Ranga
Rang
5,066667
152,0000
23,26800
3,900000
117,0000
16,57667
4,533333
136,0000
16,36600
4,266667
128,0000
15,54200
3,350000
100,5000
14,32033
3,250000
97,5000
14,03867
3,633333
109,0000
14,39967

17,46910
7,54539
7,21716
5,84767
5,03198
4,26091
4,46019

p testu Friedmana p< 0,0001 H1 testujemy ktre rozkady si rni testem Dunna (Zestaw medyczny lub
makro Post Hoc for Friedman)

Regresja Wielokrotna
1 . Regresja z jednym predykatorem y= b0 (wyraz wolny) + b1*x + e (bd estymacji)

statystyka

R wielorakie
Wielorakie R2
Skorygowane R2
F(1,14)
p
Bd std. estymacji

N=16

W. wolny
WIEK

Stat.podsum.; Zmn.
zal.:WZROST
(Korelacje)
Warto
0,786658889
0,618832207
0,591605936
22,7292312
0,000300369924
12,7245012

Podsumowanie regresji zmiennej zalenej: WZROST (Korelacje)


R= ,78665889 R^2= ,61883221 Skoryg. R2= ,59160594
F(1,14)=22,729 p<,00030 Bd std. estymacji: 12,725
b*
B. std.
b
B. std.
t(14)
z b*
zb
87,72349
12,01024
7,304059
0,786659
0,165004
4,14753
0,86996
4,767518

WZROST = 4.15*WIEK + 87.72 12.725


(0,87)
(12,01)

p
0,000004
0,000300

Brak zgodnoci z rozkadem normalnym reszt naley sprawdzi dlaczego

2. Regresja z wieloma predykatorami y= b0 + b1*x1 + b2 *x2 + + bk*xk + e


Wykresy ramkowe dla zmiennych cigych
1.
2.
3.
4.
5.

Badanie zaoenia liniowoci zwizku seria wykresw rozrzutu midzy zmienn zalen a poszczeglnymi zmiennymi niezalenymi
Badanie warunku wystarczajcej liczebnoci (n>>k+1 k- liczba predyktorw)
Tablice korelacji liniowych wybieramy takie predykatory, ktre s silnie skorelowane ze zmienn zalen ale sabo midzy sob
Wspczynnik korelacji czstkowej miara korelacji ze zmienn zalen z wyczeniem oddziaywania na ten zwizek innych
predyktorw( czysty wkad predykatora do wyjanienia zmiennoci zmiennej opisywanej)( 1/(1+4))
Wspczynnik korelacji semiczstkowej korelacja predyktora (uwzgldniajca jego powizania ze wszystkimi pozostaymi
predyktorami ) a zmienn zalen (bez uwzgldnienia jej korelacji z innymi predyktorami ( 1/(1+2+3+4))

Predyktor 1

Predyktor 2
[3]

[1]

[2]
[4]
Zm.zalena

6.

Tolerancja (obliczana jako 1 R-kwadrat korelacji wielorakiej) miara okrelajca ile procent wariancji predyktora nie jest
wyjaniony przez pozostae zmienne niezalene (predyktory) im warto nisza (blisza zero) tym bardziej jest w modelu zbdna
7. Czynnik inflacji wariancji CIW = 1/Tolerancja (jeli brak wspliniowoci CIW=1. Im CIW wiksze jeden, tym zmienna jest bardziej
2
nadmiarowa). Zakcajca model wspliniowo, gdy CIW>10 (R > 0.9)
8. Analiza reszt 1. - ocena normalnoci histogramu rozkadu reszt ( mona uy w razie wtpliwoci testu Shapiro- Wilksa)
9. Analiza reszt 2 - badanie autokorelacji reszt _ test Durbina Watsona ( powinien by koo wartoci 2, warto 0 silne skorelowanie
dodatnie, warto 4 silne skorelowanie ujemne)
10. Analiza reszt 3 ocena homoscedastycznoci ( wykres rozrzutu reszt i kwadratw reszt wzgldem wartoci przewidywanych)
11. Analiza reszt 4 ocena rozrzutu reszt wzgldem poszczeglnych predykatorw

statystyka
R wielorakie
Wielorakie R2
Skorygowane R2
F(2,9)
p
Bd std. estymacji

N=12

W. wolny
wiek
wzrost

Stat.podsum.;
Zmn. zal.:masa
(Korelacje)
Warto
0,883168187
0,779986047
0,731094058
15,9532483
0,0010990717
1,62162604

Podsumowanie regresji zmiennej zalenej: masa (Korelacje)


R= ,88316819 R^2= ,77998605 Skoryg. R2= ,73109406
F(2,9)=15,953 p<,00110 Bd std. estymacji: 1,6216
b*
B. std.
b
B. std.
t(9)
z b*
zb
2,280461
3,808800
0,598735
0,433237
0,198057
0,713444
0,326155
2,187442
0,548319
0,198057
9,892489
3,573235
2,768497

p
0,564113
0,056485
0,021807

You might also like