You are on page 1of 40

Anlisis Estadstico

Fallas mas comunes.

http://www.socialresearchmethods.net/kb/yinyangmap.php

BASES DE DATOS.
Elementos y variables. Transcripcin Verificacin ANALISIS DESCRIPTIVO INICIAL

Univariado
Multivariado ( 2,3 o 4 variables simultaneamente)
6

PROPUESTAS DE MODELOS Objetivo. Diseo. Como se colectaron los elementos y se hicieron las mediciones? Escalas de Medicin Papel de las variables en la teora e hiptesis: independientes (causales) dependientes (efectos) factores de confusin Intervinientes Supuestos del modelo a la luz de la teora y el diseo
7

PRUEBAS DE MODELOS
corridas, ajustes resultados plausibles? Diagnostico de los modelos. transformaciones

MODELOS ADECUADOS
Objetivos , teora, supuestos, datos

INTERPRETACION
8

10

NIVEL DE SIGNIFICANCIA Usar el 5 o el 1 % de significancia no es absolutamente indispensable. Puede haber resultados significativos al 7.2%. INFERENCIA SIMULTANEA Es muy grave efectuar muchas pruebas de significancia y reportar solo las significativas. Se aumenta mucho la probabilidad de error tipo I en alguna de ellas. RECOMENDACIN Reportar valores de P, usar intervalos de confianza, procedimientos para inferencia simultanea.

11

Con muestras grandes se tienen resultados significativos, aun con efectos muy pequeos.
RECOMENDACIN Reportar el tamao del efecto en prueba de t,
Error Estndar de = X1-X2

X1 X 2 S

n 2

Tamao Tamao del efecto de muestra

12

RECOMENDACIN Reportar el tamao del efecto en prueba de F,

SCHo glerror x Valor de F = SCError glHo


Tamao del efecto Tamao de muestra

SCEmr SCEmc glEmc x 13 SCEmc glEmr glE mc

Efecto observado

Error estndar

El efecto si es significativo. Efectos como ese o mayores no pueden ocurrir fcilmente slo por azar.
14

Efecto observado

Error estndar

El efecto no es significativo. Efectos como ese o mayores pueden ocurrir fcilmente slo por azar.
15

Ntese que un efecto observado de la misma magnitud puede ser considerado significativo o no, dependiendo del error estndar. Efecto

Y1 Y2 , b, r
Error estndar

El efecto es significativo. El efecto no es significativo.

El error estndar depende de: 1.- el tamao de muestra(s), 2.- El diseo de investigacin en particular tipo de elementos, mediciones, homogenizacin , control de variacin, bloques 16 covariables, etc.

RECOMENDACIN Considerar que tamao del efecto es de interes prctico. No es lo mismo significancia estadstica que significancia prctica.

Ausencia de evidencia no es evidencia de ausencia.


El no encontrar efectos significativos no implica que stos no existan
17

I. Good (1988) ha sugerido usar los valores de P, estandarizados a un tamao de muestra fijo, digamos 100. Entonces se reemplaza la P de la prueba por :

1 n min , P 100 2
Donde n es el tamao de muestra en la prueba de significancia

18

No existe el diseo o el modelo bueno. Es decir que sea el bueno en todo. Los diseos y modelos son buenos en algunos aspectos y malos en otros.
RECOMENDACIN

Valorar las fallas y las potencialidades de los diseos y los modelos que se consideran adecuados
19

La forma y tamao de la unidad de estudio puede variar. Con unidades mas grandes hay menos variabilidad, pero no interesa disminuir esa variabilidad, lo que interesa es disminuir errores estndar de los estimadores de inters. Vx V1 RECOMENDACIN Vx b x x Usar una unidad o elemento lo mas pequeo posible, que resulte prctico su uso, que represente el fenmeno en estudio (Validez externa), y considerar el nmero de repeticiones necesario para tener potencia aceptable de rechazar Ho, usando el tamao del efecto que es el considerado mnimo que vale la pena detectar. O bien que produzca intervalos de confianza pequeos.
20

El numero de repeticiones o tamao de muestra no puede ser el mismo para todas las investigaciones.
RECOMENDACIN En los estudios comparativos, el tamao de muestra se debe obtener para que se tenga una probabilidad de error tipo 2, dada (0.2) ciando el tamao del efecto es la que se desea detectar como mnimo.

En estudios descriptivos se fija la magnitud del error de estimacin, y se obtiene la n que lo produce.
Todo lo anterior se basa en la teora estadstica, pero tambin hay que considerar aspectos prcticos y econmicos. Con cierta subjetividad, conviene valorar varias estrategias y elegir alguna.

21

Por considerar el mtodo cientfico nico, infalible y ya establecido, es comn que no se tomen en cuenta las investigaciones previas con objetivos, diseos y anlisis semejantes. RECOMENDACIN

Reportar y discutir aspectos metodolgicos tales como tamao de error experimental, efectos de bloques o estratos, de variables auxiliares, magnitudes de R2, de varianzas, correlaciones y otros aspectos estadsticos; provenientes de estudios previos. Estas consideraciones son tiles en la planeacin de cada investigacin. Tambin la metodologa se va corrigiendo y aumentando a medida que conocemos mas sobre un 22 aspecto de la realidad.

RECOMENDACIN

Teora sustantiva Metodologa Teora estadstica Realidad

23

De manera falsa se plantean alternativas como:


Contrastes o prueba de Tukey?, Covariables o bloques?, Pruebas paramtricas o no paramtricas? Anlisis multivariado o varios univariados?, etc. RECOMENDACIONES Usar varias posibilidades de anlisis, cuidando la inferencia multivariada. Esta ayuda, no determina las conclusiones. No hay mtodo bueno; al usar varias tcnicas permite confirmar resultados bajo diferentes supuestos o bien valorar las diferencias.
24

Es comn hacer generalizaciones incorrectas. Esto ocurre al aplicar un nico criterio metodolgico a condiciones distintas a las que se generaron. As, se dice: CV de mas de 30% es malo, R2 de menos de 0.50 no sirve, correlaciones de menos de 0.30 no sirven, el numero de repeticiones es 4, los bloques en laboratorio o invernadero no sirven, tras muestras para una determinacin qumica, los valores normales para varias mediciones en humanos se aplican siempre, etc.

RECOMENDACIN
Valorar las condiciones en que se generaron esos criterios y las de la propia investigacin. Pueden cambiar los criterios segn objetivo, diseo 25 y supuestos.

Si bien el uso de bloques es excelente para controlar factores de confusin, acercar mas los errores a la normalidad, homogeneidad de varianzas y disminuir la variabilidad; no es el nico medios disponible, se pueden usar covariables. El supuesto de homogeneidad de unidades dentro del bloque debe revisarse. Adems el supuesto muy comn de no interaccin de bloques con tratamientos. Si no hay balance, los bloques no son ortogonales con los tratamientos, lo cual dificulta la interpretacin.
RECOMENDACIN Valorar en cada caso las ventajas de usar bloques y otros procedimientos. 26

Es comn que al obtener los elementos de la muestra se tengan grupos de unidades que tienen factores aleatorios comunes. Localidades, grupos, corrales, escuelas, hospitales, individuos, etc. No es lo mismo 10 gatos medidos 5 veces cada uno, que 50 gatos medidos una sla vez. Esto introduce correlacin entre elementos dentro de cada grupo.
RECOMENDACIN Considerar los grupos como una unidad de estudio mayor y adecuar los mtodos estadsticos. Usar la correlacin intraclase (en muestreo esto produce el el DEFF, efecto de diseo) y error de restriccin. Tambin se llama pseudorepeticiones. En caso de mediciones repetidas, hay que usar los mtodos 27 adecuados.

Se tiene excesiva confianza en los mtodos mas usados como prueba de t, F, Ji cuadrada, regresin, etc. As sus resultados se consideran inapelables. RECOMENDACIN En cada caso hay que valorar los supuestos del modelo usado, a la luz de la teora, diseo y los datos disponibles. A esto se le ha llamado diagnstico del modelo. Toda conclusin esta condicionada a la validez de los supuestos tericos y metodolgicos.
28

La correlacin no implica causalidad. No hay objetividad absoluta, ni un mtodo cientfico infalible y obligado. Un experimento no demuestra sin lugar a dudas la causalidad, una teora o la existencia de algo. Siempre hay explicaciones alternativas y subjetividad. Si hay significancia no se comprueba una hiptesis cientfica. RECOMENDACIN Conocer los alcances de las metodologas usadas, las bases tericas, las posibilidades de errores. Indagar las explicaciones alternativas. En particular tener una posicin filosfica que rechace todo tipo de dogmatismos, especialmente la fe en el mtodo 29 cientifico y la estadistica.

Es comn buscar en toda decisin en el proceso de investigacin un apoyo metodolgico, como una receta, una liberacin de responsabilidades y a la vez, garanta de validez. esto no es posible!!! RECOMENDACIN Tomar decisiones lo mas objetivamente que se pueda, fundadas en razonamientos lgicos y procedimientos establecidos como adecuados. Si esto no es posible, usar el sentido comn, con corazonadas e intuiciones, que mientras los que las hacen estn mas entrenados y adentrados en la teora, sern mas acertadas. Esto se aplica a la estadstica, al igual que al resto de los 30 elementos de la investigacin.

Frecuentemente se usan mediciones que pueden no relejar adecuadamente los conceptos que se pretenden medir. Por ejemplo escalas para el dolor o preferencias, morbimortalidad como medida de salud, nitrgeno como cantidad de protenas, etc.
RECOMENDACIN.-Ponderar la validez de constructo de las mediciones. Es decir el grado en que las definiciones operacionales, reflejan los conceptos. Validez de traslacin: validez de cara, de contenido. Validez relativa al constructo. Validez predictiva, Concurrente, Convergente y discriminante. La forma de medir un concepto puede variar segn los propsitos de la investigacin o la 31 teora postulada.

32

33

34

35

36

Si bien el principio de parsimonia se toma como bueno para la ciencia, como un supuesto filosfico, si se toma como obligado y estrecho, conduce al error. Por ejemplo solo estudiar relaciones bivariadas, modelos con slo efectos principales. Es error por que puede haber variables intervinientes, factores de confusin, interacciones. vg la Paradoja de Simpson. RECOMENDACIN.-Usar mas el anlisis multivariado. Explorar modelos con interacciones de dos y tres factores, con trminos cuadrticos. Solo cuando no hay interacciones de cierto orden interpretar las de orden menor. Usar modelos intermedios, ni muy simples ni muy complejos 37 (interacciones de 4 factores)

Es comn que se juzgue si un modelo es adecuado con una prueba global de ajuste, F, Ramsey, Hosmer-Lemeshow. Bondad de ajuste a la normal de los residuos. Pero con muestras grandes se tiende a rechazar cualquier hiptesis estadstica.

RECOMENDACIN
Valorar el modelo adems de su ajuste a los datos, en comparacin con otros modelos y su concordancia con los aspectos tericos. Si la muestra es grande se puede tener residuos que no se ajustan a la normal, gracias al teorema central de limite. 38 Robustez de la F, t, etc.

Es comn que un procedimiento estadstico sea considerado siempre con igual valor para el avance del conocimiento, independientemente del propsito de la investigacin, de la base terica y el diseo del estudio. Vg. una t significativa apoya una hiptesis de causalidad entre un factor posible causal dicotmico y un efecto posible medido en escala numrica.
RECOMENDACIN.- Debe valorarse todo en el contexto de la investigacin. Por ejemplo la t de Student puede usarse en un experimento con buen control de factores de confusion, o en un estudio observacional comparativo, o incluso en un estudio descriptivo para ver slo la asociacion de la 39 variable dicotmica con la numrica.

RECOMENDACIN.- Un anlisis discriminante se puede usar cuando menos para : a).- Clasificar un futuro elemento en uno de k grupos en base a p variables numricas. b).- Tipificar en forma multivariada a las k poblaciones. c).- Asociar p variables numricas con una categrica con k categoras. El anlisis de conglomerados es una solucin al problema de la multicolinealidad y para simplificar asociaciones mltiples. Buscar nuevas aplicaciones de tcnicas 40 conocidas con o sin modificacin de las mismas.

You might also like