You are on page 1of 2

INVESTIGACIÓN DEL TEST DE

INDEPENDENCIA DE FISHER
Arias Gálvez Vicente Orlando
Universidad Técnica Estatal de Quevedo
vicente.arias2013@uteq.edu.ec
 También parece ser que aunque el test deja de ser exacto no
Resumen—En este informe se da a conocer sobre el test de significa que no se pueda aplicar. [1]
Independencia de Fisher que es utilizado para estudiar si existe Condiciones del test
asociación entre dos variables cualitativas, es decir, si las Independencia: las observaciones de la muestra deben ser
proporciones de una variable son diferentes dependiendo del valor independientes unas de otras.
que adquiera la otra variable. Muestreo aleatorio.
Tamaño de la muestra < 10% población.
Palabras clave. – Test de independencia fisher
Cada observación contribuye únicamente a uno de los niveles.
Las frecuencias marginales de columnas y filas tienen que
ser fijas. Si esta condición no se cumple, el test de Fisher deja
I. INTRODUCCIÓN
de ser exacto. [1]
En este trabajo investigativo se describen breves definiciones Cálculo del p-value
sobre el test de independencia de Fisher como también se da a El test exacto de Fisher se basa en la distribución
conocer mediante dos ejemplos los comandos a utilizar para la hipergeométrica, que permite calcular la probabilidad exacta de
realización de este test en el programa R. obtener una determinada distribución de eventos dentro de una
tabla. Supóngase la siguiente tabla de contingencia:

II. MARCO CONCEPTUAL .. nivel-A1 nivel-A2 total


Test exacto de Fisher nivel-B1 a b a+b
La prueba de Fisher es el test exacto utilizado cuando se quiere nivel-B2 c d c+d
estudiar si existe asociación entre dos variables cualitativas, es total a+c b+d n= a+b+c+d
decir, si las proporciones de una variable son diferentes
dependiendo del valor que adquiera la otra variable. En la gran
Si las frecuencias marginales son fijas (conocidas), sabiendo el
mayoría de casos, el test de Fisher se aplica para comparar dos
valor de una celda se puede calcular el valor de las demás. La
variables categóricas con dos niveles cada una (tabla 2x2). Es
probabilidad de que a adquiera un determinado valor (dentro de
posible utilizarlo con tablas 2xK niveles pero los
las limitaciones impuestas por las frecuencias marginales) se
requerimientos de cálculo son altos. [1]
corresponde con la fórmula de la distribución hipergeométrica:
El test de Fisher es más preciso que sus equivalentes
aproximados (test chi-square de independencia o G–test de
independencia) cuando el número de eventos esperado por nivel
es pequeño. Se recomienda utilizarlo siempre que sea posible
(tiempo de computación) aunque para observaciones totales El test de Fisher calcula las probabilidades de todas las posibles
>1000 los resultados de los test aproximados son muy tablas y suma las de aquellas tablas que tengan probabilidades
parecidos. [1] menores o iguales que la tabla observada, generando así el p-
Es importante tener en cuenta que el test de Fisher está diseñado value de dos colas. [1]
para situaciones en las que las frecuencias marginales de filas y Fuerza de asociación (tamaño del efecto)
columnas (los totales de cada fila y columna) son fijas, se Dado que el test de Fisher contrasta si las variables están
conocen de antemano. Esta condición es relevante en los relacionadas, al tamaño del efecto se le conoce como fuerza de
experimentos biológicos ya que no es común poder cumplirla. asociación. Existen múltiples medidas de asociación, entre las
Si esta condición no se satisface el test de Fisher deja de ser que destacan phi o Cramer’s V. Los límites empleados para su
exacto, por lo general pasando a ser más conservativo. En varios clasificación son:
artículos se menciona que el test de Barnard es más potente que pequeño: 0.1
el de Fisher cuando las frecuencias marginales no son fijas. mediano: 0.3
grande: 0.5
En R se pueden calcular mediante la función assocstats() del CANNABIS ALGÚN NINGUNO TOTAL
paquete vcd. [2] SÍNTOMA
NUNCA 23 13 36
III. DESARROLLO ALGUNA VEZ 20 28 48
#Creación de la tabla de contingencia
EJEMPLOS DE APLICACIÓN DEL TEST FISHER cannabis<-c(rep("Nunca",36),rep("Alguna vez",48))
EJEMPLO # 1 sintomas_psicotico<-
Supongamos que se quiere estudiar la posible asociación entre c(rep("No",23),rep("Si",13),rep("No",20),rep("Si",28))
el hecho de que una gestante fume durante el embarazo y que tabla<-table(cannabis, sintomas_psicotico)
el niño presente bajo peso al nacer. Por lo tanto, se trata de ver tabla
si la probabilidad de tener bajo peso es diferente en gestantes
que fumen o en gestantes que no fumen durante la gestación.
Para responder a esta pregunta se realiza un estudio de
seguimiento sobre una cohorte de 2000 gestantes, a las que se
interroga sobre su habito durante la gestación y se determina
además el peso del recién nacido. Los resultados de este estudio
se muestran a continuación: [3] #Test Exacto de Fisher
Cuadro. 1. Tabla de contingencia para estudiar la asociación fisher.test(tabla)
entre fumar durante la gestación y el bajo peso del niño al nacer.
Estudio de seguimiento de 2000 gestantes

#Formación de la tabla de contingencia a estudiar


Si<-c(43,105) El p.value es mayor a 0,05 por lo tanto no se puede rechazar
No<-c(207,1645) que haya diferencias entre el porcentaje de cannabis y el estado
tabla<-data.frame(Si,No) psicótico un con nivel de confianza del 95%.
rownames(tabla)<-c("Fumadores","No fumadores")
tabla
IV. CONCLUSIONES
 Mediante la revisión bibliográfica se dio a conocer el test
de independencia de Fisher, como también se determinó la
función para realizar esta prueba en el programa R.
#Realización del test Fisher
fisher.test(tabla)  Se comprobó la prueba de Fisher en dos ejemplos donde se
rechazaba y aceptaba la hipótesis de independencia con
éxito.

V. REFERENCIA BIBLIOGRÁFICA

[1] J. A. Rodrigo, «Test estadísticos para variables


cualitativas. Test exacto de Fisher,» de Estadistica con R,
Creative Commons, 2016.
Conclusión: Si hay asociación entre las variables, es decir, el [2] A. Gómez, Estadistica Básica R y R–Commander, España:
bajo peso y el fumar durante la gestación están asociados de Segunda Edición, 2013.
manera significativa (p-value <0.05) [3] O. Ramirez, «Clase II_Maestria,» España, 2015.

EJEMPLO # 2
Se realiza un estudio para investigar la relación entre la
exposición a cannabis y el riesgo de desarrollar síntomas
psicóticos cuatro años más tarde en individuos que se
expusieron al uso de cannabis durante su adolescencia.

You might also like