Professional Documents
Culture Documents
1.- Independencia de dos variables categricas 2.Homogeneidad de vectores de probabilidades 2.- Bondad de ajuste a proporciones o probabilidades especificas.
Prueba de independencia
Ho: Pij = Pi Pj para toda celda ij
Con datos de un proceso que se consideran representativos de una poblacin iid, la prueba de independencia de criterios de clasificacin es:
2 c
G cal !
i !1 j !1
ij
Eij Eij
Prueba de homogeneidad
Con muestras que se suponen representativas de c poblaciones que se muestrean independientemente. La prueba de homogeneidad de proporciones. Se efecta igual que antes.
P 11 P 12 Pj 1 Ph 1
=
P21 P22 = P2 j P2 h
Pc1
=
Pc 2 Pcj Pch
Bondad de Ajuste
Se tiene una sola poblacin con una variable categrica con K categoras
P 1 P2 Pj PK
P 1
Hiptesis de ajuste H:
P 10 P20 = Pj 0 PK 0
4
P2 Pj PK
Caso de muestras aleatorias con reemplazo. Cuando se tiene una muestra representativa y los datos son independientes, es el caso de variables aleatorias idnticas e independientemente distribuidas (iid). Esto se consigue con un muestreo de probabilidades iguales y con reemplazo o bien, se tiene una muestra disponible en la que se supone que se tiene una muestra aleatoria independiente, por ejemplo los pacientes de un servicio de un hospital, los alumnos de una escuela o las ratas de un laboratorio, en los que se supone que los elementos de que se dispone son una muestra aleatoria, es decir representativa e independiente de una poblacin de elementos semejantes a los que se tiene en el estudio. Considere que el tamao de muestra es n, y que se tienen K categoras de una variable categrica o tambin pueden ser K categoras de que resultan del cruce de dos o ms variables categricas. Se considera que en la poblacin se tienen las proporciones Pj desconocidas.
5
Sean Ok=nk los casos observados, en muestra en categora k , con k= 1, .., K. As, las proporciones muestrales
Ok nk pk ! ! n n
son estimadores insesgados y consistentes de las proporciones poblacionales Pk. En estos casos las pruebas de bondad de ajuste, de homogeneidad o de independencia se efectan con el mismo tipo de estadstica de prueba, que puede ser la Ji cuadrada de Pearson o la de Razn de Verosimilitud, ambas tiene un comportamiento muy semejante. Se plantea la hiptesis sobre las Pk desconocidas y se estiman las proporciones que cumplen con la hiptesis PEk y con ellas las frecuencias esperadas Ek=n PEk, en una muestra de n, si la hiptesis es cierta
6
GP !
k !1
Ok Ek
Ek
K
! n
k !1
pk p E k
pE k
G RV
K Ok pk ! 2 Ok log ! 2n pk log Ek pE k k !1 k !1
Estas estadsticas, si la hiptesis es cierta, se distribuyen como un Ji cuadrada con K-s grados de libertad (gl), donde s es el nmero de restricciones que se plantean en las proporciones que cumplen con la hiptesis. Si la hiptesis no es cierta se distribuyen como una Ji cuadrada no central, donde el alejamiento de la central es funcin del alejamiento de las proporciones verdaderas de las hipotticas, en este caso los valores de la estadstica tendern a ser mas grandes que las de la Ji cuadrada central, de manera que se rechaza la hiptesis si la estadstica de prueba es mayor que el cuantil 1- de la Ji cuadrada central con K-s gl.
7
Aun que la estadstica de prueba tiene la misma forma, la manera de obtener las proporciones estimadas que cumplen con la hiptesis PEk, , los esperados Ek=nPEk y los gl, cambian segn el tipo de hiptesis. Estudio descriptivo. Se muestrea una sola poblacin. Si es una prueba de bondad de ajuste de que las proporciones poblacionales son valores fijos desconocidos, Ho: Pk= Pko , entonces PEk=Pko y las frecuencias esperadas son Ek=nPko. Slo hay una restriccin,
K
Po
k !1
!1
Py P (Y ! y ) ! e P y! Entonces se estima el parmetro y con l las probabilidades de cada celda, en este caso el valor de Y o grupos de valores P de Y. En los grados de libertad, ahora s =2 , ya que adems de sumar uno, las proporciones estimadas cumplen con el estimador del parmetro.
9
pj !
k !1
nk p kj n.
10
E kj ! nk p j
Con estos valores como observados y esperados se obtiene las estadsticas de prueba. En este caso los grados de libertad son rc-r-c+1=(r-1)(c-1)
11
12
Es decir
p kj !
nkj n
Okj n
La independencia implica que Pkj=PkPj , donde Pk y Pj son las probabilidades o proporciones marginales es decir Pk es la proporcin de un elemento en categora k de la primer variable, ignorando a la otra y Pj la proporcin de casos en la categora j de la segunda variable, ignorando a la primera; entonces las proporciones estimadas que cumplen con la hiptesis se obtienen estimando las proporciones marginales.
c
n
pk !
j !1
kj
nk . ! n
n
pj !
k !1
kj
n. j ! n
13
p Ekj ! p k p j
y los esperados son
n. j nk . n. j nk . ! Ekj ! np j pk ! n n n n
con estos valores substituidos en la estadstica de prueba, se realiza la evaluacin de la Ji cuadrada. En este caso los grados de libertad tambin son (r-1)(c-1)
14