Professional Documents
Culture Documents
hipotezy proste
hipotezy zoone
hipotezy parametryczne
hipotezy nieparametryczne
sd
o
populacji
generalnej wydany na podstawie bada czciowych,
dajcy si zweryfikowa metodami statystycznymi,
czyli na podstawie wynikw bada prby.
Hipoteza parametryczna:
hipoteza
dotyczca
parametrw rozkadu statystycznego.
Hipotezy
weryfikujemy
za
pomoc
testw
statystycznych.
Test statystyczny:
metoda postpowania, ktra
kadej prbce x1, x2, ...,xn przyporzdkowuje z
ustalonym
prawdopodobiestwem
decyzje
odrzucenia lub przyjcia sprawdzanej hipotezy.
1.
2.
3.
4.
5.
f(x)
f ( x)dx
a
f(x)
krzywa Gaussa
1
f x
e
2
Parametry:
warto oczekiwana
odchylenie standardowe
x 2
2 2
0.1
0.2
30 st. swob.
3 st. swob.
1 st. swob
normalny
0.0
f(t)
0.3
0.4
Rozklad t-Studenta
-4
-2
0
t
0.4
Rozklad chi-kwadrat
0.2
0.1
0.0
f(chi^2)
0.3
10 st. swob.
3 st. swob.
1 st. swob
normalny
10
chi^2
15
20
0.15
0.00
0.05
f(x)
0.10
eksponencjalny
log-normalny
logistyczny
normalny
10
x
15
20
Estymacj
oraz
Weryfikacj
hipotez
statystycznych.
Decyzja
Przyj H0
Odrzuci H0
H0 jest
prawdziwa
Decyzja
poprawna
H0 jest
faszywa
Decyzja
bdna (bd II
rodzaju)
Decyzja
bdna (bd I
rodzaju)
Decyzja
poprawna
Przez
pojcie
mocy
testu
rozumie
si
prawdopodobiestwo odrzucenia hipotezy zerowej
kiedy jest ona faszywa.
Innymi sowy moc testu = 1 (1-prawdop.bdu II
rodzaju) .
Test statystyczny moe by mocny gdy w wikszoci
przypadkw jest w stanie odrzuci faszyw H0.
Test statystyczny moe by saby gdy istnieje due
prawdopodobiestwo przyjcia H0 pomimo jej
faszywoci.
W badaniach klinicznych, badaniach nad nowymi
lekami, etc. minimalna moc testu powinna wynosi
0,8.
Wrd
licznych
rozkadw
cigych
najwiksze znaczenie w statystyce posiada
rozkad normalny. W przyrodzie bowiem
istnieje silna tendencja rozkadania zbiorw
wok rednich w pewien charakterystyczny
sposb,
zwany
rozkadem
normalnym
(Gaussa).
Ksztat krzywej rozkadu normalnego (krzywa
o
ksztacie
dzwonu,
biegnca
do
nieskoczonoci w obu kierunkach) zaley od
2 parametrw: oraz .
to
odchylenie
standardowe
stanowice miar rozrzutu, zmienno wok
redniej . Najczciej nie znamy prawdziwej
wartoci , lecz oceniamy (szacujemy j) na
podstawie redniej obliczonej z prby x
Podobnie jeli nie znamy , estymujemy
odchylenie populacji na podstawie odchylenia w
prbie (s).
W rozkadzie normalnym: rednia, mediana i
moda s sobie rwne.
1
f ( xi )
e
2
1 x 2
( i
)
2
f(xi)- gsto
=3.14159 (stosunek obwodu koa do rednicy
e=2,71828
xi - wartoci z przedziau (- ,+)
1
P( x1 X x2 )
e
2 x1
( x ) 2
dx
2
2
f(x)
f ( x)dx
a
Wynik z przedziau x 1s i x 2s
x 1s
x 2s
Oraz
i
nazywamy w
medycynie
wynikiem
klinicznodiagnostycznie ostrzegawczym.
Wynik pomidzy x 2s i x 3s jest diagnostycznie
wtpliwy. Wynik powyej wartoci x 3s lub
poniej x 3s wskazuje na stan patologiczny.
Zmiana
wartoci
redniej
powoduje
przesunicie krzywej rozkadu w lewo lub w
prawo, podczas gdy zmiana odchylenia std.
Zmienia wysoko lub szeroko krzywej, a
wic wpywa na ksztat rozkadu.
Parametrami ksztatu rozkadu s: skono i
kurtoza
( K3 )
3
(
x
)
i
K3
A normalny
B dwumodalny
C prawoskony
D - lewoskony
4
(
x
)
i
K4
Po standaryzacji:
Kurtoza mierzy spiczasto rozkadu.
Jeeli
kurtoza
jest
wyranie < 0, wwczas
rozkad jest albo bardziej
spaszczony
od
normalnego albo bardziej
wysmuky.
Dla rozkadu normalnego
kurtoza wynosi dokadnie
0.
Wartoci
2>
0
charakteryzuj
rozkad
leptokurtyczny
(wysmuky).
Wartoci
2<
0
charakteryzuj
rozkad
platykurtyczny
(spaszczony).
a)
b)
c)
d)
1.
2.
Prby
niezalene
obserwacje
w
poszczeglnych grupach dokonywane s na
rnych obiektach.
Prby zalene - obserwacje dokonywane s
dwukrotnie na tych samych obiektach.
T(x)) }.
Testy
najmocniejsze
testy
minimalizujce
prawdopodobiestwo popenienia bdu II rodzaju
przy
ustalonym z gry poziomie prawdopodobiestwa popenienia
bdu I rodzaju .
M w PWn w / H1
w 1 M w
1.
2.
1.
2.
test
test
test
test
zgodnoci chi-kwadrat
zgodnoci Komogorowa
normalnoci Shapiro-Wilka
serii
Dwa pierwsze testy zgodnoci oceniaj
zgodno rozkadu empirycznego z
teoretycznym, natomiast test serii
(losowoci) weryfikuje hipotez o
losowym
pochodzeniu
obserwacji
badanej cechy w prbie.
test
test
test
test
test
Komogorowa-Smirnowa
jednorodnoci chi-kwadrat
mediany
serii
znakw
prbach
1.
2.
W oglnoci zachodzi:
gdzie:
Oi - warto mierzona,
Ei - odpowiadajca warto teoretyczna (oczekiwana), wynikajca z
hipotezy
i - odchylenie standardowe,
n - liczba pomiarw.
Zliczenia
W szczeglnoci gdy wartociami s zliczenia wtedy ich odchylenie
standardowe wynosi i rwnanie przechodzi na:
Uwagi:
przyjmuje si e warto Ei powinna by wiksza lub rwna 5 (spotyka
si te 10 - nie ma cisego wyprowadzenia, minimalnej wielkoci).
Znane odchylenie
Jeeli populacja ma rozkad normalny N(,) o nieznanej redniej
i znanym odchyleniu standardowym , natomiast liczebno
prby n jest dowolna, wtedy statystyka ma posta:
gdzie: m - rednia z prby
Jeeli H0 jest prawdziwa, to statystyka testowa Z ma rozkad
asymptotycznie normalny.
Warto statystyki, ktr obliczymy korzystajc z powyszego
wzoru, oznaczamy jako z. Nastpnie porwnujemy j z wartoci
krytyczn testu z , ktr moemy odczyta z tablic
standaryzowanego rozkadu normalnego, uwzgldniajc poziom
istotnoci . Decyzj o odrzuceniu H0 podejmujemy, jeeli
warto statystyki znajduje si w obszarze krytycznym. Jeeli
natomiast warto ta znajdzie si poza obszarem krytycznym,
nie ma wtedy podstaw do odrzucenia H0.
jest
rwna
1.
2.
3.
4.
5.
6.
Test chi-kwadrat
Test Komogorowa - Smirnowa dla jednej prbki
Test Kuipera (opracowana przez Kuipera jest modyfikacj testu
Komogorowa Smirnowa poprawiajc jego waciwoci w
kracowych obszarach rozkadu)
Test Cramera-von Misesa - Statystyka Cramera-von Misesa
porwnuje obserwacje w prbce (traktowane jako prba losowa) z
prb losow pobran z hipotetycznego rozkadu.
Test Watsona - Jest to kolejna modyfikowana statystyka
Cramera-von Misesa.
Test Andersona-Darlinga - Ocena stopnia dopasowania
dystrybuanty testowanego rozkadu z obliczon na podstawie
prby dystrybuant empiryczn. Test ten moe by stosowany
tylko dla kompletnych danych (bez w jakikolwiek sposb
brakujcych obserwacji).
1.
2.
1.
2.
3.
4.
5.
Do
najczciej
stosowanych
testw
statystycznych operujcych na jednym zbiorze
danych nale:
test t-Studenta dla jednej redniej (sprawdzajcy,
czy wyniki pochodz z populacji o danej
redniej),
test
Shapiro-Wilka
na
rozkad
normalny
(sprawdzajcy, czy prba pochodzi z populacji o
rozkadzie normalnym) oraz test z (sprawdzajcy,
czy prba pochodzi z populacji o rozkadzie
normalnym, gdy znane jest _ tej populacji).
Przy wnioskowaniu dla jednej redniej, w razie
stwierdzenia rozkadu innego ni normalny,
zamiast testu t stosuje sie test rang Wilcoxona.
Rozwamy
np. wyniki
np. 6
analiz
chemicznych test posuy do sprawdzenia,
czy mog pochodzi z populacji o redniej
rwnej 100:
96.19
98.07
103.53
99.81
101.60
103.44
> ci = qnorm(1-0.05/2)
> ci
[1] 1.959964
> s = 3/sqrt(length(dane))
>s
[1] 1.224745
> mean(dane) + c(-s*ci,s*ci)
[1] 98.03954 102.84046
Do poprzedniego zbioru
danych dodamy drugi zbir
dane2 i przeprowadzimy te
testy:
wyniki metoda
1 96.19 1
2 98.07 1
3 103.53 1
4 99.81 1
5 101.60 1
6 103.44 1
7 99.70 2
8 99.79 2
9 101.14 2
10 99.32 2
11 99.27 2
12 101.29 2
13 91.50 3
14 96.74 3
15 108.17 3
16 94.22 3
17 99.18 3
18 105.48 3
> dane
wynik probka metoda
1 46.37278 1 1
2 48.49733 1 2
3 46.30928 1 3
4 43.56900 1 4
5 46.57548 2 1
6 42.92014 2 2
7 47.22845 2 3
8 42.46036 2 4
9 43.71306 3 1
10 47.35283 3 2
11 44.87579 3 3
12 46.06378 3 4
13 47.29096 4 1
14 44.50382 4 2
15 44.26496 4 3
16 45.35748 4 4
> prop.test(30,300,p=0.07)
1-sample proportions test with continuity correction
data: 30 out of 300, null probability 0.07
X-squared = 3.6994, df = 1, p-value = 0.05443
alternative hypothesis: true p is not equal to 0.07
95 percent confidence interval:
0.0695477 0.1410547
sample estimates:
p
0.1
Jak wida, przedzia ufnoci zawiera sie w granicy 6.9 14.1%, zatem
7% zawiera sie w nim (p nieznacznie wiksze ni 0.05).
Innym przykadem jest porwnanie kilku takich wynikw. Zamy, ze w
innej 200-osobowej grupie odpowiedz pada u 25 osb, a w trzeciej,
500-osobowej, u 40 osb. Czy prby te pochodz z tej samej populacji?
> prop.test(c(30,25,40),c(300,200,500))
3-sample test for equality of proportions without continuity
correction
data: c(30, 25, 40) out of c(300, 200, 500)
X-squared = 3.4894, df = 2, p-value = 0.1747
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3
0.100 0.125 0.080
Jak wida, test nie wykaza istotnych rnic. Jeli chcielibymy wprowadzi do testu poprawk
Yatesa, dodajemy parametr cont=TRUE.
> kostka=c(6,12,9,11,15,7)
> pr=rep(1/6,6) # prawdopodobiestwo kadego rzutu wynosi 1/6
> pr
[1] 0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 0.1666667
> chisq.test(kostka,p=pr)
Chi-squared test for given probabilities
data: kostka
X-squared = 5.6, df = 5, p-value = 0.3471
> lek=c(19,41,60)
> ctl=c(46,19,15)
> chisq.test(cbind(lek,ctl)) # cbind tworzy ramke !
Pearsons Chi-squared test
data: cbind(lek, ctl)
X-squared = 39.8771, df = 2, p-value = 2.192e-09
> rnorm(30,50,5)
[1] 53.43194 58.74333 53.27320 46.42251 53.93869 44.80035 55.57112
43.65090
[9] 46.78265 55.88207 49.68947 52.65945 55.72740 48.75954 48.16239
50.89369
[17] 51.23270 47.14778 57.83292 45.67989 45.98016 50.45368 44.41436
44.24023
[25] 50.98059 48.69967 53.32837 48.09720 52.57135 49.64967
rozstp zmiennej
http://www.mini.pw.edu.pl/~mwojtys/
sar/dane/coagulation.txt
Szukamy:
- obserwacji odstajcych,
- skonoci rozkadw (niesymetryczne
skrzynki)
- nierwnoci wariancji (nierwne wielkoci
skrzynek)
Dla zbioru coagulation nieregularnoci na
wykresie skrzynkowym wynikaj raczej z
malej liczby obserwacji.