You are on page 1of 14

Tres tipos de pruebas

1.- Independencia de dos variables categricas 2.Homogeneidad de vectores de probabilidades 2.- Bondad de ajuste a proporciones o probabilidades especificas.

Prueba de independencia
Ho: Pij = Pi Pj para toda celda ij
Con datos de un proceso que se consideran representativos de una poblacin iid, la prueba de independencia de criterios de clasificacin es:
2 c

Oi .O. j Eij ! O..

G cal !
i !1 j !1

ij

 Eij Eij

Prueba de homogeneidad
Con muestras que se suponen representativas de c poblaciones que se muestrean independientemente. La prueba de homogeneidad de proporciones. Se efecta igual que antes.

P 11 P 12 Pj 1 Ph 1
=

P21 P22 = P2 j P2 h

Pi1 Pi 2 Pij Pih

Pc1
=

Pc 2 Pcj Pch

Bondad de Ajuste
Se tiene una sola poblacin con una variable categrica con K categoras

Vector de probablidades o proporciones poblacionales

P 1 P2 Pj PK

P 1
Hiptesis de ajuste H:

P 10 P20 = Pj 0 PK 0
4

P2 Pj PK

Caso de muestras aleatorias con reemplazo. Cuando se tiene una muestra representativa y los datos son independientes, es el caso de variables aleatorias idnticas e independientemente distribuidas (iid). Esto se consigue con un muestreo de probabilidades iguales y con reemplazo o bien, se tiene una muestra disponible en la que se supone que se tiene una muestra aleatoria independiente, por ejemplo los pacientes de un servicio de un hospital, los alumnos de una escuela o las ratas de un laboratorio, en los que se supone que los elementos de que se dispone son una muestra aleatoria, es decir representativa e independiente de una poblacin de elementos semejantes a los que se tiene en el estudio. Considere que el tamao de muestra es n, y que se tienen K categoras de una variable categrica o tambin pueden ser K categoras de que resultan del cruce de dos o ms variables categricas. Se considera que en la poblacin se tienen las proporciones Pj desconocidas.
5

Sean Ok=nk los casos observados, en muestra en categora k , con k= 1, .., K. As, las proporciones muestrales

Ok nk pk ! ! n n
son estimadores insesgados y consistentes de las proporciones poblacionales Pk. En estos casos las pruebas de bondad de ajuste, de homogeneidad o de independencia se efectan con el mismo tipo de estadstica de prueba, que puede ser la Ji cuadrada de Pearson o la de Razn de Verosimilitud, ambas tiene un comportamiento muy semejante. Se plantea la hiptesis sobre las Pk desconocidas y se estiman las proporciones que cumplen con la hiptesis PEk y con ellas las frecuencias esperadas Ek=n PEk, en una muestra de n, si la hiptesis es cierta
6

GP !
k !1

Ok  Ek
Ek
K

! n
k !1

pk  p E k
pE k

G RV

K Ok pk ! 2 Ok log ! 2n pk log Ek pE k k !1 k !1

Estas estadsticas, si la hiptesis es cierta, se distribuyen como un Ji cuadrada con K-s grados de libertad (gl), donde s es el nmero de restricciones que se plantean en las proporciones que cumplen con la hiptesis. Si la hiptesis no es cierta se distribuyen como una Ji cuadrada no central, donde el alejamiento de la central es funcin del alejamiento de las proporciones verdaderas de las hipotticas, en este caso los valores de la estadstica tendern a ser mas grandes que las de la Ji cuadrada central, de manera que se rechaza la hiptesis si la estadstica de prueba es mayor que el cuantil 1- de la Ji cuadrada central con K-s gl.
7

Aun que la estadstica de prueba tiene la misma forma, la manera de obtener las proporciones estimadas que cumplen con la hiptesis PEk, , los esperados Ek=nPEk y los gl, cambian segn el tipo de hiptesis. Estudio descriptivo. Se muestrea una sola poblacin. Si es una prueba de bondad de ajuste de que las proporciones poblacionales son valores fijos desconocidos, Ho: Pk= Pko , entonces PEk=Pko y las frecuencias esperadas son Ek=nPko. Slo hay una restriccin,
K

Po
k !1

!1

por lo que s = 1. Y los gl son K-1.


8

Estudio Descriptivo. Se muestrea una sola poblacin. Si


es una prueba de bondad de ajuste, en el que las categoras son nmeros enteros de la variable, por ejemplo casos de cncer en un da dado en los hospitales de un tipo, y se quiere saber si se puede considerar que las proporciones poblacionales se ajustan a una distribucin de Poison

Py P (Y ! y ) ! e P y! Entonces se estima el parmetro y con l las probabilidades de cada celda, en este caso el valor de Y o grupos de valores P de Y. En los grados de libertad, ahora s =2 , ya que adems de sumar uno, las proporciones estimadas cumplen con el estimador del parmetro.
9

Estudio Comparativo. Se tienen r poblaciones o dominios


k=1,...r, con muestra nk adecuada para dar buena precisin en las celdas de una variable categrica con c categoras, j=1,...c, en cada una de ellas. Este diseo es llamado muestreo producto de multinomiales. La hiptesis de homogeneidad establece que Pj1 =Pj2 =..= Pjk=..=Pjr y esto para las c categoras, para j=1, .., c. En este caso se tiene una tabla de contingencia con r renglones y c columnas, con rxc celdas o categoras. Pero la suma de las proporciones estimadas y esperadas por rengln es uno. En cada poblacin o rengln se estiman las proporciones poblacionales Pkj con pkj = Okj/nk, y para obtener los esperados se obtiene un promedio ponderado de las proporciones en las poblaciones renglones, para cada categora c.
r

pj !
k !1

nk p kj n.
10

Entonces el valor esperado en cada celda es .

E kj ! nk p j
Con estos valores como observados y esperados se obtiene las estadsticas de prueba. En este caso los grados de libertad son rc-r-c+1=(r-1)(c-1)

11

Estudio descriptivo. Si se toma una muestra de tamao


n, de una sla poblacin y en cada elemento se miden dos variables categricas, una con c categoras y la otra con r, este es el llamado muestreo multimomial. La hiptesis de inters es la de independencia, que establece que las dos variables categricas son independientes, es decir el estar en una categora de la primera variable no modifica las probabilidades de ocurrencia de las categoras de la otra variable. Si en la poblacin la proporcin de casos en una celda es Pkj, sta se estima con Okj /n.

12

Es decir

p kj !

nkj n

Okj n

La independencia implica que Pkj=PkPj , donde Pk y Pj son las probabilidades o proporciones marginales es decir Pk es la proporcin de un elemento en categora k de la primer variable, ignorando a la otra y Pj la proporcin de casos en la categora j de la segunda variable, ignorando a la primera; entonces las proporciones estimadas que cumplen con la hiptesis se obtienen estimando las proporciones marginales.
c

n
pk !
j !1

kj

nk . ! n

n
pj !
k !1

kj

n. j ! n
13

Entonces la proporcin de la celda hj estimada que cumple con la Hiptesis es

p Ekj ! p k p j
y los esperados son

n. j nk . n. j nk . ! Ekj ! np j pk ! n n n n
con estos valores substituidos en la estadstica de prueba, se realiza la evaluacin de la Ji cuadrada. En este caso los grados de libertad tambin son (r-1)(c-1)
14

You might also like