Professional Documents
Culture Documents
MODALIDAD SEMIPRESENCIAL
MATERIA: ESTADISTICA
DOCENTE: ING. VICTOR MEDINA
ALUMNO: BYRON PAREDES
NIVEL: CUARTO
2
CONTENIDO
PRUEBAS NO PARAMETRICAS ............................................................................. 4
CONCLUSIONES ....................................................................................................... 8
T – STUDENT ........................................................................................................... 17
¿Cuáles Son Los Escenarios O Casos Para La Utilización De Cada Uno De Las
Mismas? .......................................................................................................................... 27
T – STUDENT ....................................................................................................... 28
3
PRUEBAS NO PARAMETRICAS
CONCLUSIONES
Pruebas Paramétricas
Se conoce el modelo de distribución de la población objeto de estudio y se
desconoce un número finito de parámetros de dicha distribución que hay que
estimar con los datos de la muestra.
Requieren conocer la distribución de la muestra para poder realizar inferencias
sobre la población
Pruebas No Paramétricas
Son métodos de distribución libre. No requieren conocer la distribución de la
muestra.
Se utilizan estadísticos cuya distribución se determina con independencia de
cuál sea la distribución de la población.
Son una alternativa a las pruebas paramétricas cuando los datos no cumplen
los requisitos de las pruebas paramétricas.
9
Una variable categórica es aquella que clasifica o asigna categoría a cada individuo en
exactamente una de varias celdas o clases; estas celdas o clases incluyen todo y son
mutuamente exclusivas. El lado que queda hacia arriba en un dado que se lanza es una
variable categórica: la lista de resultados {1, 2, 3, 4, 5, 6} es un conjunto de categorías
que incluyen todo y son mutuamente exclusivas. (Johnson & Kuby, 2008)
f i. f. j
eij
n
11
Calculemos Chi-cuadrado:
( f ij eij ) 2
2
exp
i j eij
1. Hagamos otra tabla, donde restamos a las frecuencias absolutas las
frecuencias esperadas.
2. Este valor elevado al cuadrado.
3. Dividido por la frecuencia esperadas.
exp
2
3,1296 1,3413 2,5606 1,0974 8,13
Tenemos:
exp
2
8,13
Ahora calculemos el valor de la tabla Chi-cuadrado.
1. Grados de libertad, son:
K = (número de fila-1)(número de columnas-1)
K= (2-1)(2-1) = 1
2. El valor alfa 0,01
3. El valor que buscamos:
Tenemos:
exp
2
8,13 g2.l .; 12;0,01 6,63
Por tanto:
exp
2
12;0,01
SIGNIFICADO: Las variables no son independientes.
Gráfico. Dado que el estadístico ji cuadrado sólo toma valores positivos, la zona de
rechazo de la hipótesis nula siempre estará del lado derecho de la curva.
13
Analizar según la base de datos y demostrar las siguientes hipótesis, utilizando para
ello las siguientes dos variables que se encuentran en nuestra base de datos, estas son
“Tipo de vivienda” y “Estado civil”, lo cual nos permitirá el cálculo y prueba de la
hipótesis a continuación. Con un nivel de significación del 5%.
3º Análisis.
15
4º Tabla de contingencia.
Se rechaza Ho
17
T – STUDENT
La prueba t-Student fue desarrollada en 1899 por el químico inglés William Sealey
Gosset (1876-1937), mientras trabajaba en técnicas de control de calidad para las
destilerías Guiness en Dublín.
Ejemplo:
De un universo de 44,000 niños, a los que se les registró el peso, talla e índice de masa
corporal, se tomó una muestra de 56 adolescentes (21 niñas y 35 niños), del subgrupo de
niñas y niños de 14 años de edad, para comparar las medias tomando exclusivamente el
índice de masa corporal (IMC). IMC en niñas y niños de 14 años de edad
Paso 1: prueba de normalidad de cada una de las muestras.
18
Paso 2: en este caso se hace la prueba t-test aun sabiendo que una de las
muestras (los niños) no tiene normalidad.
Paso 3: prueba para la homogeneidad de varianzas; se pueden considerar que
son homogéneas debido a que la p = 0.570.
Paso 4: (i) diferencia de medias = 0.025, (ii) vc a las muestras.
Observa que los datos tipificados (expresados como puntuaciones z) en las dos
columnas de la derecha tienen los mismos valores en ambas variables, dado que las
posiciones relativas son las mismas en las variables X e Y.
Si obtenemos los productos de los valores tipificados para cada caso, el resultado es:
22
El cociente de dividir la suma de productos (5) por N (hay que tener en cuenta que N
es el número de casos, NO el número de datos) es igual a 1:
Y por tanto:
3º Ahora vamos a ver cuánto influye la talla en el peso de nuestra base de datos.
¿Cuáles Son Los Escenarios O Casos Para La Utilización De Cada Uno De Las
Mismas?
Para poder aplicar cada uno de estas pruebas, existen diversas hipótesis nulas y
condiciones que deben cumplir nuestros datos para que los resultados al aplicar el test
sean fiables. Es decir, no se puede aplicar todos los test y quedarse con el que mejor
convenga para la investigación sin verificar si se cumplen las hipótesis y condiciones, si
se violan, invalidan cualquier resultado posterior son una de las causas más frecuentes de
que un estudio sea estadísticamente incorrecto.
T – STUDENT
Se aplica cuando la población estudiada sigue una distribución normal pero el
tamaño muestral es demasiado pequeño como para que el estadístico en el que
está basada la inferencia esté normalmente distribuido, utilizándose una
estimación de la desviación típica en lugar del valor real.
Se utiliza para la comparación de dos medias de poblaciones independientes y
normales.
Se utiliza para determinar si hay una diferencia significativa entre las medias
de dos grupos.
La t-Student es una prueba poderosa, en la que, aunque una de las muestras no
tenga distribución normal pero la otra sí y la razón de la varianza más grande
a la más pequeña sea < 2, esta prueba resulta adecuada al comparar dos medias.
El procedimiento comparar medias nos permite la aplicación de distintos
estadísticos inferenciales apropiados para contrastar hipótesis relativas a la
diferencia existente entre dos o más medidas.
COEFICIENTE DE PEARSON
Se utiliza para estudiar la asociación entre un factor de estudio y una
variable de respuesta cuantitativa, mide el grado de asociación entre dos
variables tomando valores entre -1 y 1.
Este estadístico utilizado para medir la magnitud de la relación
(supuestamente lineal) entre dichas variables.
Permite predecir el valor de una variable dado un valor determinado de la
otra variable. Se trata de valorar la asociación entre dos variables
cuantitativas estudiando el método conocido como correlación.
Se para medir el coeficiente de correlación lineal entre las dos (2) dos
variables cuantitativas. El grado de relación existente entre las dos
variables. Su significancia.
29
Referencias Bibliográficas
A continuación, el link:
https://www.youtube.com/watch?v=-oyzdB-1LTY&feature=youtu.be