You are on page 1of 27

INTRODUCCION

Partiendo de la base de que algunos contrastes de hiptesis dependen del supuesto de normalidad, muchos de estos contrastes siguen siendo aproximadamente vlidos cuando se aplican a muestras muy grandes, incluso si la distribucin de la poblacin no es normal. Sin embargo, muchas veces se da tambin el caso de que, en aplicaciones prcticas, dicho supuesto de normalidad no sea sostenible. Lo deseable entonces ser buscar la inferencia en contrastes que sean vlidos bajo un amplio rango de distribuciones de la poblacin. Tales contrastes se denominan no paramtricos. La estadstica no paramtrica es una rama de la estadstica que estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definida a priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin conocida, cuando el nivel de medida empleado no sea, como mnimo, de intervalo. La mayor parte de las tcnicas estudiadas hacen suposiciones sobre la composicin de los datos de la poblacin. Las suposiciones comunes son que la poblacin sigue una distribucin normal, que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razn. Este tema presentar un grupo de tcnicas llamadas no paramtricas que son tiles cuando estas suposiciones no se cumplen.

Estadstica para toma de decisiones

Pruebas no paramtricas PRUEBAS ESTADSTICAS NO PARAMTRICAS 1. Concepto Las pruebas estadsticas no paramtricas Son procedimientos estadsticos para prueba de hiptesis que no requieren de la suposicin de la normalidad de la poblacin de la cual fue extrada la muestra y se pueden aplicar a datos de tipo cuantitativo y cualitativo. 2. Ventajas De Las Pruebas Estadsticas No Paramtricas Las pruebas estadsticas no paramtricas tienen ciertas ventajas claras sobre las pruebas paramtricas: No requieren la suposicin de que una poblacin est distribuida en forma de curva normal u otra forma especfica. Generalmente, es ms sencillo realizarlas y entenderlas. La mayor parte de las pruebas no paramtricas no exigen el tipo de clculos laboriosos a menudo necesarios, por ejemplo, para calcular una desviacin estndar. Algunas veces ni siquiera se requiere un ordenamiento o clasificacin formal. Muchas veces, lo nico que podemos hacer es describir un resultado como mejor que otro. Menos susceptibles a la contravencin de los supuestos. Ya que los supuestos son escasos y menos complicados. Tipo de medicin requerida. Se pueden utilizar con datos ordinales o nominales. Tamao de la muestra. Cuando la muestra es < 10 son sencillas, rpidas y slo un poco menos eficaces. Conforme aumenta el tamao de la muestra se hacen ms laboriosas y tardadas, y menos efectivas. Efectividad estadstica. Cuando se satisfacen los supuestos de la prueba no paramtrica son igual de efectivas. Si se satisfacen los supuestos de una prueba paramtrica con muestras pequeas son un poco menos efectivas y se vuelven menos eficaces a medida que aumenta el tamao de muestra.

3. Desventajas De Las Pruebas Estadsticas No Paramtricas Si se puede utilizar una prueba paramtrica y se usa una no paramtrica hay una prdida de informacin. En muestras grandes las pruebas no paramtricas son muy laboriosas. A menudo no son tan eficientes o claras como las pruebas paramtricas.

Estadstica para toma de decisiones

Pruebas no paramtricas

4. Mtodos de Pruebas Estadsticas No Paramtricas Existen una gran variedad de mtodos de paramtricas como:

pruebas estadsticas no

Prueba de Pearson Prueba binomial Prueba de Anderson-Darling Prueba de Cochran Prueba de Cohen kappa Prueba de Fisher Prueba de Friedman Prueba de Kendall Prueba de Kolmogrov-Smirnov Prueba de Kruskal-Wallis Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon Prueba de McNemar Prueba de la mediana Prueba de Siegel-Tukey Prueba de los signos Coeficiente de correlacin de Spearman Tablas de contingencia Prueba de Wald-Wolfowitz Prueba de los rangos con signo de Wilcoxon

Entre stos numerosos mtodos no paramtricos sobresalen: Prueba chi o Ji cuadrado. Prueba de Kolmogorov-Smirnov Prueba de Friedman Prueba del signo, donde slo se toman los signos positivos y negativos de las diferencias en las observaciones apareadas. Mtodo de Spearman o Correlacin por Rangos, cuando los datos o informacin obtenida mediante muestras, se clasifican de acuerdo al rango obtenido. Prueba T de Wilcoxon, requieren que los datos estn dados a escala ordinal y que las dos muestras se relacionen por pares o parejas. Prueba U de Mann Whitney, usada para determinar si dos muestras han sido extraidas de una misma poblacin, utilizando la suma de rangos. Prueba H de Prueba de Kruskal Wallis, utilizada para probar si tres o ms muestras independientes han sido extradas de poblaciones con la misma distribucin.

Estadstica para toma de decisiones

Pruebas no paramtricas

4.1. PRUEBA DE KOLMOGOROV-SMIRNOV Esta prueba se utiliza para contrastar la hiptesis nula de que dos muestras independientes de tamaos n1 y n2 proceden de la misma poblacin. El contraste se basa en las diferencias entre las frecuencias relativas acumuladas hasta los mismos puntos de corte correspondientes a las dos muestras. Si H0 es cierta es de esperar que dichas diferencias sean pequeas. Cuando la hiptesis alternativa no es direccional el contraste es sensible a cualquier diferencia existente entre las dos poblaciones, no slo en cuanto a tendencia central, sino tambin en cuanto a forma, asimetra, etc. El estadstico de prueba es:

Siendo Fn(x) la funcin de distribucin muestral y Fo(x) la funcin terica o correspondiente a la poblacin normal especificada en la hiptesis nula. Cuando esta diferencia es significativamente grande se rechaza la hiptesis de que las muestras proceden de la misma poblacin y la decisin se basa en el valor tipificado del estadstico de prueba, Z, que tiene distribucin normal tipificada.

TABLA DE KOLMOGOROV-SMIRNOV: La siguiente tabla expone los valores que debes buscar de acuerdo al procedimiento anterior para determinar si se rechaza o no la hiptesis formulada:

Estadstica para toma de decisiones

Pruebas no paramtricas

Ejemplo: En una investigacin, consistente en medir la talla de 100 nios de 5 aos de edad, se desea saber si las observaciones provienen de una poblacin normal. Tabla de 100 nios. Los valores + y

Estadstica para toma de decisiones

Pruebas no paramtricas

Solucin: 1) . Los valores observados de las frecuencias para cada clase son diferentes de las frecuencias tericas de una distribucin normal. . Los valores observados de las frecuencias para cada clase no son diferentes de las frecuencias tericas de una distribucin normal. 2) = 0.05 3) estadstico de prueba Prueba de Kolmogorov Primero se elaboran los clculos de los valores tericos esperados para la distribucin normal. Inicialmente se determina el valor Z de los lmites de cada clase en la serie, por ejemplo: en la primera clase se determinan el lmite inferior y el superior (90 y 93), y en las subsecuentes slo los lmites superiores (97, 101, 105 y 109). Para cada valor de Z, se localiza el rea bajo la curva normal tipificada. (Vase: tabla de reas bajo la curva normal tipificada de 0 a 2). Los clculos de valores Z, son de la forma siguiente:

Y as sucesivamente. Para cada valor Z, se localiza el rea de la curva tipificada de la tabla de nmeros aleatorios. A partir de estos valores, se obtiene la diferencia entre los lmites de clases entre el superior y el inferior, por ejemplo: 0.4997 - 0.4793 = 0.020, 0.4793 - 0.2357 = 0.2436, 0.2357 - (-0.2794) = 0.5151, 0.2794 - (-0.4854) = 0.206 y -0.4854 - (-0.4994) = 0.014. Estos resultados de diferencias se multiplican por el tamao de la muestra (100 nios), luego se obtienen las frecuencias tericas y despus se arreglan en frecuencias acumuladas. Clculos de los valores tericos.

Estadstica para toma de decisiones

Pruebas no paramtricas Las frecuencias acumuladas tericas y las observadas se arreglan en los rangos correspondientes, como se muestra en la siguiente tabla, y posteriormente se aplica la frmula de KolmogorovSmirnov. Clculo estadstico D de Kolmogorov-Smirnov.

D = ft - fobs = - 0.036 La diferencia mxima D es igual a -0.049, valor que se compara con los valores crticos de D en la prueba muestral de Kolmogorov-Smirnov y se obtiene la probabilidad de la existencia de esa magnitud de acuerdo con la prueba de KolmogorovSmirnov. El valor N es 100 y el mayor nmero de N en la tabla es 35, por lo cual se aplica la frmula al pie de la tabla:

Para la probabilidad de Lo anterior quiere decir que para todo valor menor que el crtico para una probabilidad de 0.05, la probabilidad correspondiente es mayor que 0.05, y todo valor mayor que D al calculado tinen una probabilidad menor que 0.05, o sea, es inversamente proporcional al crtico determinado o localizado en la tabla. 4) Zona de rechazo: Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. 5) Decisin e Interpretacin. En virtud de lo anterior, el estadstico de Kolmogorov-Smirnov obtendo es menor que el crtico y su probabilidad mayor que 0.05, por lo tanto, se acepta Ho y se rechaza Ha. Las frecuencias observadas y las tericas calculadas no difieren significativamente. Por lo tanto, las observaciones tienen una distribucin normal.

4.2.PRUEBA DE FRIEDMAN La prueba de Friedman permite contrastar si existen diferencias entre las poblaciones de las que fueron extradas k muestras, cuando stas corresponden a datos relacionados. stos han de estar medidos al menos en una escala ordinal. 1. Hiptesis: Hiptesis nula: No existen diferencias entre los grupos. Estadstica para toma de decisiones

Pruebas no paramtricas Hiptesis alternativa: Hay diferencias entre los grupos. 2. Estadstico de contraste El estadstico de contraste utilizado es r2, que se determina a partir de los siguientes pasos: a) En una tabla; se colocan todas las puntuaciones de forma que las filas son los sujetos y las columnas son las muestras. b) Se ordenan los sujetos en cada fila. c) Se calculan las sumas de rangos Rj correspondientes a cada columna. d) Se obtiene el estadstico de Friedman.

Dnde: N= nmero de bloques K= nmero de tratamientos R= suma de rangos para i- ensimo. ( ) Regin de rechazo

Ejemplo: La asociacin de padres de un centro convoca sucesivamente tres reuniones dirigidas a los padres de alumnos de un mismo grupo o clase, en las que se abordaron respectivamente temas relacionados con el apoyo de la familia al estudio (Tema A), el juego y el tiempo libre de los nios (Tema B), y la participacin de los padres en el centro (Tema C). Si contamos los datos de asistencia a cada una de las tres reuniones para los padres de alumnos de 6 clases, podemos afirmar que los tres temas atrajeron de modo distinto a los convocados? ( = 0.05) Tema A 3 3 3 2 3 3 Tema B 2 2 1 3 2 2 Tema C 1 1 2 1 1 1

Estadstica para toma de decisiones

Pruebas no paramtricas Solucin: Dado que el nmero de sujetos es pequeo, deberemos utilizar una prueba no paramtrica, y puesto que los casos se hayan relacionados, la prueba ms idnea es el anlisis de la varianza de dos clasificaciones por rangos de Friedman. En primer lugar, plantearemos las hiptesis: H0: No existen diferencias entre en la atraccin a los tres temas. H1: Existen diferencias significativas entre en la atraccin a los tres temas. El estadstico de contraste que emplearemos ser:

Por lo tanto, calcularemos la suma de rangos para cada columna: Tema A 3 3 3 2 3 3 Tema B 2 2 1 3 2 2 Tema C 1 1 2 1 1 1

RA = 17, RB = 12 y RC = 7. Sustituyendo:

Comparamos el valor observado con el que nos ofrece la tabla, teniendo en cuenta que X2 sigue una distribucin de chi cuadrado con k-1 grados de libertad. Por tanto, el valor crtico ser 0.9522 = 5.991 Puesto que el valor observado es mayor que el crtico, aqul entra en la regin de rechazo, por lo que podemos rechazar con una confianza del 95% que existen diferencias significativas en cuanto a la atraccin a los distintos temas. 4.3. PRUEBA DE CHI O JI CUADRADO. Se define como la suma de las fracciones que tienen por numerador el cuadrado de las diferencias entre las frecuencias reales u observadas y las frecuencias esperadas o tericas y por denominador la frecuencia esperada. Su estadstico de prueba se da por la siguiente frmula: Estadstica para toma de decisiones

Pruebas no paramtricas

Dnde:
Fo, frecuencia real u observada. Fe, frecuencia terica o esperada.

10

Ejemplo: Una asociacin de profesores universitarios quiere determinar si la satisfaccin en el trabajo es independiente del rango acadmico. Para ello realiz un estudio nacional entre los acadmicos universitarios y encontr los resultados mostrados son la tabla siguiente. Con =0.05, haga una prueba para saber si son dependientes la satisfaccin en el trabajo y el rango. Rango Instructor Profesor asistente Mucha 40 60 Regul 78 87 ar Poca 57 63 Satisfaccin en el trabajo Profesor Profesor asociado 52 63 82 88 66 64

Solucin: 1) Ho; La satisfaccin en el trabajo y el rango son independientes. H1; La satisfaccin en el trabajo y el rango son dependientes. 2) Nivel de significancia = 0,05. 3) Estadstico de prueba: Chi cuadrado: ( ) Se proceder a calcular los valores esperados de cada celda. Como los grados de libertad son 6, esto quiere decir que necesitamos calcular nicamente 6 frecuencias esperadas, y las faltantes se encuentran por diferencia. Se calcularn los valores esperados E11, E12, E13, E21, E22 y E23. Como se necesitan los totales de rengln y columna se mostrarn en la tabla: Rango Instructor Profesor Profesor asistente asociado Mucha 40 60 52 Regular 78 87 82 Poca 57 63 66 Total 175 210 200 Satisfacci n en el trabajo

Profesor Total 63 88 64 215 215 335 250 800

Estadstica para toma de decisiones

Pruebas no paramtricas

11

Satisfaccin Instructor Profesor asistente Mucha 40 60 (47.03) (56.44) Regular 78 87 (73.28) (87.94) Poca 57 63 (54.69) (65.62) Total 175 210

Profesor asociado 52 (53.75) 82 (83.75) 66 (62.50) 200

Profesor Total 63 (57.78) 88 (90.03) 64 (67.19) 215 215 335 250 800

Los valores entre parntesis son los esperados, los que no se calcularon por frmula se obtuvieron por diferencia con respecto a los totales.

4) Regin crtica y regin de aceptacin Grados de libertad: (r-1)(c-1) = (3-1)(4-1)=(2)(3) = 6

Regla de decisin: Si X2R 12.592 se rechaza Ho. 5) Decisin y justificacin:

12.592 no se rechaza Ho. Si X2R >

Como el valor de 2.75 es menor que el de tabla 12.592, por lo tanto no se rechaza Ho y se concluye con un =0.05 que la satisfaccin en el trabajo y el rango son independientes.

Estadstica para toma de decisiones

Pruebas no paramtricas 4.4. PRUEBA DE SIGNO La prueba de los signos es quiz la prueba no paramtrica ms antigua y ms sencilla, que se emplea de preferencia, para contrastar hiptesis sobre el parmetro de centralizacin y es usado fundamentalmente en el anlisis de comparacin de datos pareados. Consideremos una muestra aleatoria de tamao n tal que sus observaciones estn o puedan estar clasificadas en dos categoras: 0 y 1, + y -, ... etc. Su estadstico de prueba est dado por :

12

Dnde: p=0.5, probabilidad de presentacin del signo positivo. q=0.5, probabilidad de presentacin del signo negativo. n: suma del nmero de positivos ms los negativos, excluyendo los ceros. x: el nmero de signos positivos (puede ser considerado el nmero de signos negativos). Valor de la variable (nmero de positivos o negativos) = media de la distribucin binomial. = desviacin tpica en la distribucin binomial.

Ejemplo: Una compaa de taxis trata de decidir si el uso de llantas radiales en lugar de llantas regulares con cinturn mejora la economa de combustible. Se equipan 16 automviles con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se equipan los mismos autos con llantas regulares con cinturn y se manejan una vez ms por el recorrido de prueba. Se registra el consumo de gasolina, en kilmetros por litro, de la siguiente manera: Automvil Llantas radiales 1 2 3 4 5 6 7 4.2 4.7 6.6 7.0 6.7 4.5 5.7 Llantas cinturn 4.1 4.9 6.2 6.9 6.8 4.4 5.7 con

Estadstica para toma de decisiones

Pruebas no paramtricas 8 9 10 11 12 13 14 15 16 6.0 7.4 4.9 6.1 5.2 5.7 6.9 6.8 4.9 5.8 6.9 4.9 6.0 4.9 5.3 6.5 7.1 4.8

13

Se puede concluir en el nivel de significancia de 0.05 que los autos equipados con llantas radiales obtienen mejores economas de combustible que los equipados con llantas regulares con cinturn? Solucin: 1)

2) Nivel de significancia: =0.05 3) Estadstico de prueba: Prueba de signo Se procede a realizar las diferencias entre de los kilmetros por litro entre llantas radiales y con cinturn: Automvil Llantas radiales X1 4.2 4.7 6.6 7.0 6.7 4.5 5.7 6.0 7.4 4.9 6.1 5.2 5.7 6.9 6.8 4.9 Llantas cinturn Y1 4.1 4.9 6.2 6.9 6.8 4.4 5.7 5.8 6.9 4.9 6.0 4.9 5.3 6.5 7.1 4.8 con D1= Y1) (X1

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

+ + + + 0 + + 0 + + + + +

Estadstica para toma de decisiones

Pruebas no paramtricas Al observar las diferencias se ve que slo existe una n=14, ya que 14 se descartan los valores de cero. Se tiene: X = 11, p= , q= , ( ) ( ) = 0.9354 ( )

4) Regin critica y regin de aceptacin

Regla de decisin: Si zR se rechaza Ho. 5) Decisin y conclusin:

1.64 no se rechaza Ho. Si zR> 1.645

Como 4.28 es mayor a 1.64 se rechaza H0 y se concluye con un = 0.05 que las llantas radiales mejoran la economa de combustible. 4.5. MTODO DE SPEARMAN En estadstica, el coeficiente de correlacin de Spearman, (ro) es una medida de la correlacin (la asociacin o interdependencia) entre dos variables aleatorias continuas. Para calcular , los datos son ordenados y reemplazados por su respectivo orden. El estadstico viene dado por la expresin:

Dnde: D es la diferencia entre los correspondientes estadsticos de orden de x - y. N es el nmero de parejas. Estadstica para toma de decisiones

Pruebas no paramtricas

Se tiene que considerar la existencia de datos idnticos a la hora 15 de ordenarlos, aunque si stos son pocos, se puede ignorar tal circunstancia Para muestras; (10< n < 25) observaciones, podemos utilizar la siguiente aproximacin a la distribucin t de Student

La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlacin pero no independencia. Ejemplo: Supongamos que se tienen los siguientes 16 pares de observaciones, a 16 trabajadores que fueron evaluados con dos instrumentos, en la siguiente tabla se detalla el rango, la diferencia y la diferencia al cuadrado.

variables

rangos

diferencia

Diferencia al cuadrado 4 56.25 0 36 1 12.25 4 1 1 9 0 36 6.25 0 100 90.25 357

X 85 78 75 65 80 83 76 65 83 76 83 65 90 80 84 76

Y 50 38 30 25 38 42 35 25 45 35 42 25 55 40 48 35

RX 2 9.5 6 4 9.5 8 12 14 15 16 2 12 6 6 12 2

RY 4 2 6 10 8.5 11.5 14 15 16 13 2 6 8.5 6 2 11.5

-2 7.5 0 -6 1 -3.5 -2 -1 -1 3 0 6 -2.5 0 10 -9.5

Al nivel del 5% el coeficiente de correlacin es significativo. Se puede concluir que estas dos variables estn asociadas en la Estadstica para toma de decisiones

Pruebas no paramtricas poblacin de donde se seleccion la muestra. Solucin: = 0 no es significativo, no hay correlacin. 0 es significativo, hay correlacin. 2) Nivel de significancia: =0.05 3) Estadstico de prueba: Coeficiente de correlacin de Spearman 1)

16

4) Regin crtica y regin de aceptacin

0.05

0.05

= -2.145

= 2.145

Estadstica para toma de decisiones

Pruebas no paramtricas 5) Decisin y conclusin: Dado que E a la regin de aceptacin se rechaza la y se acepta . Se concluye que al nivel de 5%, hay correlacin, es decir, que la correlacin obtenida no es significativa. Tambin se puede decir que estas dos variables no estn asociadas en la poblacin de donde se extrajo la muestra.

17

4.6. PRUEBA T DE WILCOXON La prueba de los rangos con signo de Wilcoxon es una prueba no paramtrica para comparar la media de dos muestras relacionadas y determinar si existen diferencias entre ellas. Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras. Debe su nombre a Frank Wilcoxon, que la public en 1945.1 Se utiliza cuando la variable subyacente es continua pero no se presupone ningn tipo de distribucin particular. Sea: la diferencia entre las puntuaciones de la pareja i-sima; si alguna de estas diferencias es nula la pareja correspondiente se elimina del anlisis, de forma que el tamao de la muestra es n, el nmero de diferencias no nulas. A continuacin se asignan rangos desde 1 hasta n atendiendo nicamente al valor absoluto de las di y se suman los rangos correspondientes a las diferencias positivas y a las diferencias negativas por separado. Si la hiptesis nula es cierta, X e Y tienen el mismo valor central y es de esperar que los rangos se distribuyan aleatoriamente entre las diferencias positivas y negativas y, por tanto, que ambas sumas de rangos sean aproximadamente iguales. El estadstico de prueba, T, es la menor de las dos sumas de rangos. Cuando n > 15 la distribucin muestral de T bajo el supuesto de que H0 es cierta se aproxima a una normal de parmetros, la media y la varianza se determina de la siguiente manera:

El estadstico de prueba es el valor Z:

que se distribuye segn una normal tipificada.

Estadstica para toma de decisiones

Pruebas no paramtricas Ejemplo: Los datos que se dan a continuacin corresponden al nmero de piezas defectuosas producidas por 2 mquinas durante el mes de setiembre del 2006. Probar al nivel del 5%, que no hay una diferencia significativa entre los dos procesos
Numero defectuoso Das 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 8 5 10 7 9 11 3 6 6 8 5 6 9 3 7 10 9 13 8 4 2 8 8 6 5 10 9 4 A 9 4 12 9 10 11 6 7 8 10 6 9 11 6 7 8 12 13 9 6 3 9 10 9 7 11 9 6 B -1 1 -2 -2 -1 0 -3 -1 -2 -2 -1 -3 -2 -3 0 2 -3 0 -1 -2 -1 -1 -2 -3 -2 -1 0 -2 -16.0 Nota: eliminamos las diferencias iguales a -5.5 -16.0 -5.5 -5.5 -16.0 -24.0 -16.0 -5.5 16.0 -24.0 -24.0 -5.5 -16.0 -16.0 -5.5 -24.0 -16.0 -24.0 5.5 -16.0 -16.0 5.5 + Rangos -5.5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Nro. 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 Orden rango 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 16.0 16.0 16.0 16.0 16.0 16.0 16.0 16.0 16.0 16.0 16.0 24.0 24.0 24.0 24.0 24.0

18

Estadstica para toma de decisiones

Pruebas no paramtricas
29 30 7 3 6 5 1 -2 T= 27 5.5 -16.0 cero, siendo n= 26

19

Solucin: 1) la diferencia no es significativa. La diferencia es significativa. 2) Nivel de significancia: =0.05 3) Estadstico de prueba: Prueba T De Wilcoxon
( )( ( ) )

= -3.85 4) Regin crtica y regin de aceptacin

0.05

0.05

= -1,96

= 1.96

5) Decisin y conclusin Dado que E a la regin critica se rechaza la y se acepta . Se concluye que al nivel de 5%, la diferencia entre los dos procesos se considera significativa.

Estadstica para toma de decisiones

Pruebas no paramtricas 4.7. PRUEBA DE U DE MANN-WHITNEY En estadstica la prueba U de Mann-Whitney, es una prueba no paramtrica aplicada a dos muestras independientes. Es, de hecho, la versin no paramtrica de la habitual prueba t de Student. Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaos y extendido a muestras de tamao arbitrario como en otros sentidos por Henry B. Mann y D. R. Whitney en 1947. Para calcular el estadstico U se asigna a cada uno de los valores de las dos muestras su rango para construir

20

Dnde: n1 y n2 son los tamaos respectivos de cada muestra; R1 y R2 es la suma de los rangos de las observaciones de las muestras 1 y 2 respectivamente. El estadstico U se define como el mnimo de U1 y U2. Los clculos tienen que tener en cuenta la presencia de observaciones idnticas a la hora de ordenarlas. No obstante, si su nmero es pequeo, se puede ignorar esa circunstancia. La prueba calcula el llamado estadstico U, cuya distribucin para muestras con ms de 20 observaciones se aproxima bastante bien a la distribucin normal. En cambio cuando la muestra es pequea se utiliza la tabla de valores crticos de De Mann-Whitney. La aproximacin a la normal, z, cuando tenemos muestras lo suficientemente grandes viene dada por la expresin:

Donde mU y U son la media y la desviacin estndar de U si la hiptesis nula es cierta, y vienen dadas por las siguientes frmulas:

Estadstica para toma de decisiones

Pruebas no paramtricas Ejemplo: Consideremos dos muestras pequeas donde , para observar las aplicaciones de la prueba U de Mann Wihtney, para muestras pequeas, a fin de probar que ambas muestras proceden de la misma poblacin, a nivel del 5%. Nr o. 1 2 3 4 5 6 7 8 9 10 11 Pruebas I 18 24 22 23 17 16 14 20 II 28 32 28 32 16 18 17 13 23 28 32 Rango Rango I 7.5 13.0 9.5 11.5 5.5 3.5 2.0 9.5 II 15.0 18.0 15.0 18.0 3.5 7.5 5.5 1.0 11.5 15.0 18.0 Nro. 1 2 3 4 5 6 7 8 9 10 Orden 13 14 16 16 17 17 18 18 22 22 Categorizacin Rango 1.0 2.0 3.5 3.5 0.5 0.5 7.5 7.5 9.5 9.5 Nro. 11 12 13 14 15 16 17 18 19 Orden 23 23 24 28 28 28 32 32 32 Rango 11.5 11.5 13.0 15.0 15.0 15.0 18.0 18.0 18.0

21

S o l solucin:

1)

Todas las observaciones provienen poblacin. Todas las observaciones provienen diferentes. 2) Nivel de significancia: =0.05 3) Estadstico de prueba: prueba U de Mann-Whitney

de la misma de poblaciones

) Estadstica para toma de decisiones

Pruebas no paramtricas Calculadas las dos U, una para cada R, se elige la menor, en nuestro caso ser U=22. Luego se utiliza la tabla de valores 22 crticos de De Mann-Whitney, localizando los valores para y , con un nivel de =0.05, para una prueba bilateral, obteniendo los valores crticos de U=19.

4) El valor ser significativo cuando el resultado aplicando la formula U, ser menor o igual al valor obtenido de la tabla, en caso contrario no ser significativo, como en este caso donde 22>19, por lo tanto, se acepta la hiptesis nula , es decir, aceptamos que estas muestras provienen de la misma poblacin, al nivel del 5%.

4.8. PRUEBA H DE KRUSKAL-WALLIS En estadstica, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un mtodo no paramtrico para probar si las medias poblacionales de un grupo de datos proviene de la misma poblacin con muestras independientes. Actualmente se conoce tambin como: prueba H o anlisis de varianza por rangos. El estadstico est dado por:

Dnde: Estadstica para toma de decisiones

Pruebas no paramtricas
o o

es el nmero de observaciones en el grupo. R es el rango (entre todas las observaciones) de la observacin 23 en el grupo .

El procedimiento a seguir para el clculo del valor de H, debe : Ser requisitos indispensable que las poblaciones sean independientes. Combinar todos los valores de las muestras, como si fuera una sola. Ordenar de menor a mayor, es decir, categorizamos. Establecer los rangos, tal como se ha venido haciendo en las pruebas anteriores. Sumar los rangos para cada muestra. Aplicar la frmula para el clculo de H.

Ejemplo: Supongamos que el presidente de una corporacin financiera esta interesado en estudiar la rapidez de operacin que se presenta, desde el momento en que se deposita y se retira el dinero de las cuentas. Para ello elabora un ndice de permanencia del dinero, estableciendo un ndice del 350 para una cuenta considera extremadamente activa en el semestre; pero si solo se hacen 10 retiros en el mismo periodo, el ndice es de 80. De acuerdo a la anterior escala (de 80 a 3509 los ndices obtenidos del cuatro (4) muestra, en igual nmero de sucursales fueron: sucursal Caracas Chapinero Centro Niza ndices 305 206 305 310 300 310 120

120 206 100 206

116 180 80 150

80 300 206 210

206 180 305 206

180

150

116

120

340

Utilizando un nivel de 5%, aplicar la prueba de Kruskal wallis, a fin de probar si hay una diferencia significativa en cuanto a los ndices de movimientos de ahorros personales, entre las cuatro (4) sucursales de esta corporacin financiera. Solucin: 1) No hay una diferencia significativa en cuanto a los de movimiento de cuentas de ahorro, entre las sucursales. Si hay una diferencia significativa en cuanto a los de movimiento de cuentas de ahorro, entre las sucursales. ndices cuatro ndices cuatro

Estadstica para toma de decisiones

Pruebas no paramtricas

2) Nivel de significancia: =0.05 3) Estadstico de prueba: prueba de Kruskal-Wallis

24

Lo primero que se realizara es categorizar las observaciones como si fuera una sola muestra, obteniendo el rango para cada uno de ellos, as: Nro. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 ndice 80 80 100 116 116 120 120 120 150 150 180 180 180 180 206 206 206 206 206 206 300 300 305 305 305 310 310 340 Rango 1.5 1.5 3.0 4.5 4.5 7.0 7.0 7.0 9.5 9.5 12.5 12.5 12.5 12.5 17.5 17.5 17.5 17.5 17.5 17.5 21.5 21.5 24 24 24 26.5 26.5 28

Luego se procede en cada muestra, a colocar el rango en cada observacin, de esta manera se puede establecer la sumatoria de lor rangos, en la respectiva muestra:

Estadstica para toma de decisiones

Pruebas no paramtricas

Caracas ndice Rango 120 7.5 116 4.5 80 1.5 206 17.5 305 24.0 206 17.5 180 12.5 150 9.5 = 94.0

Chapinero ndice Rango 206 17.5 180 12.5 300 21.5 180 12.5 305 24.0 = 88.0

25

Niza Centro ndice Rango 100 7.5 80 1.5 206 17.5 305 24.0 310 17.5 300 12.5 = 94.0 ndice 206 150 180 206 310 120 116 120 340 = 130 Rango 17.5 8.5 12.5 17.5 26.5 7.0 4.5 7.0 28.0

Luego reemplazamos los resultados en la frmula para calcular el valor de H:

( [

Determinamos los grados de libertad: = K-1= 4-1=3, recordemos que K corresponde al nmero de muestras, en este caso son 4. 4) Regin crtica y regin de aceptacin

Estadstica para toma de decisiones

Pruebas no paramtricas

26

=0.05

5) Decisin y conclusin: Dado que H=1.73 E a la regin de aceptacin, se acepta y rechaza . Concluyndose que a nivel de significancia de 5%, No hay una diferencia significativa en cuanto a los ndices de movimiento de cuentas de ahorro, entre las cuatro sucursales.

Estadstica para toma de decisiones

Pruebas no paramtricas BIBLIOGRAFA:

27

Estadstica y muestreo. CiroMtinez Bencardino Estadstica para administracin y economa By RICHARD I AUTOR LEVIN, DAVID S AUTOR RUBIN Estadistica Matematica con Aplicaciones By Dennis D Wackerly, William Mendenhall, Richard L Scheaffer Estadstica Multivariante y No Paramtrica con SPSS: .By Rafael lvarez Cceres INTERNET:

http://ocwus.us.es/metodos-de-investigacion-y-diagnostico-eneducacion/analisis-de-datos-en-la-investigacioneducativa/Bloque_II/page_95.htm/ es.wikipedia.org/wiki/Estadstica_no_paramtrica www.slideshare.net/.../unidad-v-estadstica-no-paramtrica books.google.com.pe/books?isbn=8479781807

Estadstica para toma de decisiones

You might also like