You are on page 1of 14

TEMA 1 Definicin de modelo: Objeto, concepto o conjunto de relaciones que se utiliza ara representar y estudiar de forma simple y comprensible

e una porcin de realidad emprica (Ros, 1995). Desde el establecimiento de la psicologa como ciencia emprica, para la comprensin de procesos y conducta se ha hecho necesario el estudio de las causas de los fenmenos psicolgicos. Dependiendo del modelo, las variables, an siendo las mismas, pueden cobrar un valor o importancia diferente. Necesidad de convertir los modelos empricos en modelos matemticos para poder crear los parmetros de las variables y conocer sus proporciones. Caractersticas de los modelos parsimonia. Simplicidad, que facilite la segunda caracterstica. Los modelos complejos, difcilmente interpretables, resultan intiles (otra vez el enfoque pragmtico que existe en psicologa). Es preferible explicar menos causas y que estas exlicaciones sean aplicables a poblaciones grandes. Interpretabilidad. Las relaciones entre variables deben estar enmarcadas en un marco. (relacion esprea: variables que correlacionan debido a la influencia de otra variable sobre una de las dos primeras). Objetivos del quehacer cientfico actual: bsqueda gradual, establecimiento relaciones. Mejora tcnicas anlisis. Modelos: deterministas: aquellos que utilizan todas las variables que afectan al fenmeno estudiado. Estocsticos: modelos probabilsticos que no predicen exactamente la conducta, sino la probabilidad de ejecutarla. Es un modelo que siempre tiene la variable de error en l. conducta =intencin b+ b= peso de la conducta Generacin de modelos. *validez relacionado con la capacidad de demostrar las hiptesis del modelo. En el momento en el que un modelo se vuelve determinista no es necesario repetir los procesos de modelizacin.

Modelo lineal general: El valor de la VD es igual a la suma ponderada de los valores asociados con una o ms VI ms el error. No requiere un nmero determinado de VI. Requiere linealidad y aditividad. Problemas de obtener una relacin logartmica en muestras restringidas en rango. (ejemplo de incapacidad de obtener ms puntuacin).

TEMA 2.CONSTRUCCIN DE UN MODELO ESTOCSTICO. Concepto de linealidad. Covarianza y correlacin. La recta y el plano de regresin. Estimacin de los parmetros de la ecuacin descomposicin de la varianza del modelo.

Modelo lienal general (MLG). Varianza incapaz de controlar por el investigador: Error. (se mide con la letra epsiln) Y =b0 + X 1b 1+ ...+ Insertar funcin del modelo lienal. Que exista una relacin lineal entre dos variables X e Y quiere decir que Y aumenta (o disminuye) con X, y, adems, lo hace siempre de modo constante ante un mayor nmero de variables, menor cantidad de error. tipos de relacin lineal: directa: (+ +). (- -). inversa:(- +). (+ -). nula: no existe relacin lineal. El resultado en la grfica es que la recta de regresin es una lnea recta. Existe la posibilidad de que un coeficiente que de como resultado una relacin lineal que en realidad no existe, debido a que la muestra puede dividirse en varios grupos con puntuaciones totalmente distintas. En la grfica se veran varias nubes de puntos en las grficas. Falsa ausencia de linealidad. Ver grficas de los apuntes. Falsa presencia de linealidad. Outlier: valor extremo. Covarianza: La covarianza tiene como funcin la de definir la orientacin de la relacin lineal (si es positiva o negativa). No se puede interpretar la cifra porque no respresenta una cantidad igual para todas las variables. Insertar frmula. *la unidad de medida de la desviacin tpica es ella misma. Para transformar las puntuaciones de covarianza en interpretables y comparar las variables, se la divide por el producto de las desv. Tpicas de X e Y. Correlacin: S xy S xS y la correlacin (coeficiente de correlacin de Pearson) permite medir, adems de la valencia de la relacin, su magnitud, para as poder comparar variables. Propiedades entre -1 y 1

invariante frente a cualquier transformacin lineal de las variables. Interpretacin. Comparacin: coeficiente de determinacin (r cuadrado) Distorsin: muestra poco representativa. Varios subgrupos en VI. Importancia de observar los grficos para detectar falas presencias o asusencias de lienalidad. Tarea: crear rectas de regresin lineal. Realizar la regresin en Y3, X1. La recta y el plano de regresin. Tipos: recta creciente. Ej.: y=1+ 2x recta decreciente. Ej.: y=4 x El tipo de recta depender de la valencia del coeficiente (pendiente). El origen de la recta (el valor de y cuando x=0) valdr la cifra que aparece antes del coeficiente (en el ejemplo de la ecuacin de la recta creciente, sera 1). El origen de la recta es b0 . Estimacin de los parmetros de la ecuacin. Ecuacin de regresin. Partiendo de la base de que todos los sujetos tienen puntuaciones en X e Y, lo que se intenta averiguar es, en el caso de la recta de regresin de Y sobre X (Y a partir de X), es averiguar la puntuaciones que un sujeto obtiene en Y si este obtiene una cierta puntuacin en X. Para cuantificar los coeficientes que nos dan las puntuaciones, la estimacin se realiza con varios mtodos. El mtodo ms sencillo es el que hace mnimos los errores de prediccin. Regresin de estimacin de mnimos cuadrados ordinarios. Error de prediccin en la recta: distancia que hay entre la puntuacin del sujeto en la grfica y su puntuacin en la recta. Calcula las distancias mnimas elevadas al cuadrado. Consiste en:
proporcin de error eliminado por el modelo de regresin =

error eliminado por el modelo de regresin error de estimacin media

Importancia de aadir variables para eliminar el error en las estimaciones Ecuaciones que se derivan de la ecuacin de regresin: (aadir del libro)

Nota: puntuaciones diferenciales: x i= X i X xi X puntuaciones tpicas: Z = Sx 2 Ejercicio Nota: es B2 una vez conocidas las diferencias entre Y e Y, se deben elevar al cuadrado las puntuaciones obtenidas. varianza total =varianza evitada con la ecuacin de regresin + varianza de error varianza total =varianza explicada + varianza residual
2 2 2 (Y Y ) =(Y Y ) + (Y Y )

ejemplo: P=[ 2,3 ,4 ,10 ] se extraen muestras diferentes de esta poblacin. X P =4,75 4,75 = m1=2,3 m 2=2,4 m3=2,10 m 4 =3,4 m5=3,10 m6=4,10 X 1=2,5 X 2=3 X 3 =6 X 4=3,5 X 5=6,5 X 6=7 Importancia de escoger un modelo adecuado ya que la media mestral nunca ser igual a la poblacional. Si la muestra no es representativa el modelo tampoco. Conociendo una distribucin terica de la poblacin se podr comprobar la probabilidad de que el modelo obtenido coincida con la poblacin. valoracin del coeficiente de determinacin mltiple ratio de proporcin de varianza explicada y no explicada R2 . [1R2 ] Criterios de cohen (1988): 0,02 efecto pequeo ( R0,14 ) 0,15 efecto medio ( R0,36 ) 0,35 efecto grande ( R0,51 ) No son valores fijos, pero son tiles para adaptar la investigacin a la literatura. Inferencia del modelo a la poblacin. Significacin del coeficiente de determinacin. 2 H 0 : R =0 [ R2 /k ] 2 H 1 : R =0 F = (1 R2)/ (nk 1) conde K es el nmero de variables y n el n de sujetos muestrales. Coeficiente de determinacin ajustado
R2=1[( 1R2 ) n1 ] nk 1

esto es R cuadrado corregida.

El coeficiente determinacin ajustado debe usarse en el caso de que no se disponga de toda la poblacin, es decir, en casi todos los casos en psicologa. La hiptesis nula en este coeficiente es que R cuadrado de cero como resultado de que lo que yo he obtenido en la muestra es resultado del azar. La hipotesis alternativa (excluyente y nula) propone que el resultado corresponde a lo existente en la poblacin. Lo interesante en este coeficiente es que se rechaze la hiptesis nula. Se obtendrn el valor emprico basado en la muestra y un valor terico basado en distribucin terica de la poblacin, para as compararlos. En este caso, la muestra no se adaptar a la distribucin normal (campana) sino que a la

distribucin de Fisher-Snedecor (dibujar grfica de distribucin). En esta grfica la zona izquierda va 1-alfa y en la derecha va alfa. Izquierda: no falsa derecha: no cierta. R2 Ser la formula del valor emprico. F Ser la formula del valor terico. En la medida en que la muestra sea ms pequea, existiran mayores diferencias entre nuestro valor emprico y el valor terico. Cualquier valor de R corregido menor que cero se igualar a cero. Ejemplo: paso 1: R2=0,7287 R2=0,7171 2 2 paso 2: H 0 : R 0 H 1 : R 0 paso 3: F =59,57 paso 4: comprobar la tabla 4. =0,05 1 =0,95 coger la grfica F y dividir segn el putno anterior. Grados de libertad del numerador: filas. grados de libertad del divisor: columnas. Comprobar en la tabla los datos de nuestro valor y el valor terico. (y cmo coo se hace esto?). F kjnk1= F 2 ; 47 mirar en la tabla, en este caso, 2 en las columnas y 47 en las filas. Da 3,18. Nota: la zona de la derecha de la grfica F es la zona de rechazo de la hiptesis nula. Se da por significativa ya que el valor terico cae en 3,18 y nuestro resultado (F) nos da 59,57, es decir, en la zona de rechazo de la hiptesis nula. Otro ejemplo: R2=0,7003 R2=0,6875 F =51,72 F 0,95 ; 2 ;47 =3,18 significativo.

TEMA 4: MTODOS DE CONSTRUCCIN DEL MODELO Mtodo simultneo. Mediante este mtodo se construye la ecuacin de regresin con todas las variables a la vez. En otras palabras, se obtiene la mejor estimacin lineal de la VD a partir de la combinacin de las k variables predictoras. Es el mtodo seguido en el tema anterior con las dos Vis. Esta estrategia es la ms adecuada cuando no disponemos de base terica o lgica para considerar una variable mejor que la otra u otras. Es decir, se trata del mtodo ms utilizado en estudios de tipo exploratorio. Mtodo paso a paso. copiar Mtodo jerrquico. Es una mezcla conceptual de los dos anteriores. Coincide en el primero en que se deben coger todas las variables y en el segundo en que se debe seleccionar el orden de entrada de las variables. Es el investigador el que selecciona el orden de las variables teniendo en cuenta la importancia terica y no tanto el valor de la variable. Proceso: En cada paso slo se introduce aquella variable que el investigador considera ms relevante. En cada paso se valora la bondad de ajuste de los datos al modelo de regresin lineal y se calculan los parmetros del modelo verificado en dicho paso. Razones para la ordenacin: Prioridad causal. Entra primero la variable que es causa, no consecuencia. Ordenamiento cronolgico de las variables en el modelo. Relevancia para la investigacin. En caso de no disponer de prioridades causales o consecuencias, la relevancia que una variable pueda adquirir para la investigacin cobra mayor importancia. Esta razn es vital para toda investigacin. No es un mtodo que sirva para fases iniciales. El investigador debe tener un marco terico bastante fuerte, en donde el constructo est muy definido.

TEMA 5. SUPUESTOS DEL MODELO. Supuestos del modelo. Otras cuestiones a tener en cuenta. Linealidad y aditividad qu es? La relacin debe ser lineal. La relacin debe ser aditiva(B = camgio producido en Y cuando X se incrementa en 1 unidad, manteniendo constantes las dems VI). Qu produce: estimadores sesgados ( F ( x) del grado de no linealidad). Cmo se detecta: Grfico de dispersin. Cmo se soluciona: transformacin de las VI. Transformaciones numricas. Otro tipo de regresin. Nivel de medida de las variables. Qu es? Las Vis deben ser cuantitativas continuas. Si no, dicotmicas o dicotomizadas. La VD debe ser cuantitativa continua o discreta con amplio rango de valores. Cmo se soluciona: Si VI = cualitativa variable DUMMY. Consiste en una dicotomizacin de una variable cualitativa. Ej: estado civil: se crea un si o no de cada una de las opciones que tiene el estado civil (soltero/no soltero, casado/no casado, etc.) Si VD = dicotmica regresin logstica binomial. Si VD = cualitativa regresin logstica mutinomial. Ausencia de multicolinealidad. Qu es: el problema se da cuando la redundancia entre dos variables es muy extrema. Una VI es una combinacin lineal exacta de otras VI. CI =B 0+ edadB1+ ao de nacimientoB 2 PESO =B 0+ calorasB1+ ejercicioB2+ estilo de vidaB3 la variable calorias y ejercicio ya vienen determinadas en la variables estilo de vida. absentismo =B0 + edadB 1+ antigedad B 2+ salarioB3 cuanta ms edad, ms salario y ms antigdad, en la gran parte de los casos. Se da multicolinealidad. Qu produce: si es perfecta: un infinito nmero de rectas ajustan los datos. MCO falla al calcular los coeficientes beta.

Si no es perfecta: coeficientes sesgados (inflados). Aportan ms que en la realidad. Cmo se detecta: correlaciones muy altas (>0,7) multicolinealidad. Tolerancia. Consiste en convertir la variable predictora y convertirla en criterio y poner de predictoras las que ya haban. Es varianza no explicada que ayuda a averiguar la multicolinealidad. 1R 2 Si posee demasiada tolerancia no tendr mucha varianza exlicada por ella misma. Cuanta ms tolerancia se solapa menos. La variable debera de tener la mitad de su varianza libre. Estabilidad de los coeficientes entre muestras. Los resultados inflados nunca se inflarn de la misma manera. Cmo se soluciona: planificacin adecuada de la investigacin. Combinar variables multicolineales. Eliminar variables multicolineales. Regresin no basada en MCO (mnimos cuadrados ordinarios). Ej: tiempo reaparicin lcera peptica tiempo respuesta tratamiento. Para comprobarlo, se somete a tratamiento a un conjunto de pacientes con lcera peptica, siendo todos ellos fumadores, y peridicamente (cada semana) se comprueba si la sinotmatologa... tiempo de reaparicin =B0+ tiempo rr ttB1+ tabacoB2+ alcoholB 3+ cafetc antes de comenzar el tratamiento, algunos de los pacientes han decidido abandonar el hbito de fumar, por lo que se sospecha que este nuevo hbito puede influir en la reaparicin de los sntomas, as como otros, como el consumo de alcohol, caf, anticidos, etc.

EJEMPLO. EJERCICIO TEMA 8. disminucin aumento de error (disminucin alfa) implica el aumento de error en la otra hiptesis (aumento de beta. - alfa + beta. Estudiantes sin orientacin media de 190 con orientacin mayor puntuacin. H 0=190 H 1=> 190 para situar a nuestra muestra: n=65 X =198 65 es el nmero de sujetos. gl ( grados de libertad )=n1 =0,05 S x =24 tipificar las medias (t): X t= S / n1 =2,67 x t n1 t 64 1,67 Para este caso se usar la tabla de distribucin t-student. Con un gl (grado de libertad) de 65 miramos la tabla (entre 60 y 70) sera aprox. 1,67. 2,67 est por encima de 1,67, por lo que se rechaza la hiptesis nula. Esto es debido a que si lo vemos en un grfico el 2,67 no cae en 1-alfa. En spss no te dan los resultados que tu obtienes de la tabla t-student. Te dan la probabilidad asociada. Pero sabiendo la probabilidad asociada, se puede localizar en la grfica, puesto que si tiene una p=0,995, significa que detrs de si deja el 99,5% de la distribucin, y viceversa y si tuviera p=0,005. Para averiguar de forma inversa (averiguar la probabilidad a partir de t) se consigue buscando dentro de nuestros grados de libertad una cifra que se aproxime a nuestro resultado en t. miramos a que columna pertenece y el nmero de esa columna ser la probabilidad asociada de t.

Nota: Es bilateral cuando se quieres saber si simplemente son diferentes las hipotesis, si se quiere saber si mayor o menor se utiliza unilateral.

PRUEBA T DE STUDENT. Para comparar dos grupos de observaciones: si no tienen caractersticas en comn, INDEPENDIENTES. Si se da el contrario, MUESTRAS RELACIONADAS. Supuestos: normalidad. La distrivucin de la VD tiene que seguir la curva normal. Problema solventado con el teorema central del lmite. Independencia. Las puntuaciones deben ser independientes entre s. Esto solo se garantiza cuando el muestreo ha sido aleatorio. Resulta inconveniente y mucho el muestreo en bola de nieve. Homocedasticidad. Se debe cumplir que ambos grupos tengan la misma varianza. Las muestras relacionadas siempre son iguales. Y 1 Y 2 T= (n 11)S 2+ (n 21)S 2 1 1 Estadstico de contraste: 1 ( + ) n1+ n22 n1 n2 t n + n 2
1 2

Contraste de varianzas: F =

S2 mayor S2 menor

F n 1, n 1
1 2

Prueba para muestras independientes con S^2 distintas: Y 1Y 2 t= 2 2 S1 S 2 + n 1 n2 Ejercicio apuntes tema 8: 2 2 H 0= E = c H 1= F= 1,72 F_blablabla = 2,11. p=0,0472 se da por buena la diferencia de varianzas. T= 2,63 t 781,664 (mirando la tabla t-student). p=0,005 Nota: sabiendo que t es positivo, ya sabemos que el grupo 1 ha memorizado ms palabras que el grupo 2. En este caso, como queremos saber si con dibujos aprenden ms, no queremos saber si de forma diferente, utilizamos unilateral. En este caso si comparamos t y t_78, rechazamos la

hiptesis nula. Sin t_78, viendo de p= 0,005 es mucho ms mayor que la probabilidad establecida (0,05) rechazamos la hiptesis nula. Tamao del efecto. =delta de Cohen Y 1Y 2 = 2 2 ( n1)S 1+ (n 21) S n 1+ n 22
1 1 + =t n1 n 2 =

TEMA 9 ANLISIS DE VARIANZA DE UN FACTOR modelos de ANOVA. Modelo de un factor completamente aleatorizado. Estructura y notacin de los datos. Modelo lineal general. Estimacin de los trminos del modelo. Descomposicin de la varianza. La razn F. Supuestos del modelo. Tamao del efecto y potencia del contraste. Comparaciones mltiples.

You might also like