Professional Documents
Culture Documents
DEFINICIN
Ciencia que estudia los mtodos para recopilar,
organizar y analizar datos sobre hechos,
fenmenos o situaciones, con el objeto
caracterizarlos, interpretarlos y generar
informacin relevante para la toma decisiones.
ESTADSTICA PARAMTRICA
Teora y mtodos de anlisis de datos que presuponen
determinadas condiciones acerca de la distribucin de la variable
de estudio en la poblacin de la cual se ha obtenido la muestra
investigada, de manera que, la validez de los resultados dependen
del cumplimiento de esas suposiciones.
Algunas suposiciones pueden ser la distribucin normal de los
datos, homocedasticidad de varianzas y que las observaciones
analizadas han sido medidas en escala de intervalo por lo menos.
En las pruebas paramtricas se utiliza regularmente la media
aritmtica como medida de tendencia central y la varianza como
medida de dispersin. Algunas pruebas paramtricas son: prueba t
de Student, anlisis de regresin, anlisis de varianza (ANDEVA),
correlacin de Pearson, entre otros.
ESTADSTICA
ESTADSTICA NO PARAMTRICA
Teora y mtodos de anlisis de datos que requieren el
cumplimiento condiciones generales pero ninguna acerca de la
forma especfica de la distribucin de la cual fue obtenida la
muestra, por ello se conocen tambin como pruebas de distribucin
libre. Se utiliza la mediana como medida de tendencia central y
rango como medida de dispersin. Es til es casos donde la variable
de estudio ha sido medida en escala nominal u ordinal.
Algunas pruebas no paramtricas son: la prueba de los signos,
prueba de rangos Wilcoxon, el anlisis de varianza unifactorial de
Kruskal-Wallis, el anlisis de varianza bifactorial de Friedman y los
coeficientes de correlacin de Spearman y de Kendall, entre otros.
ALFABETO GRIEGO: SMBOLOS ESTADSTICOS
minscula mayscula equiv minscula mayscula equiv
alfa a nu n
beta b xi x
gamma g micron o
delta d pi , p
psilon e rho(ro) r
zeta z sigma , s
eta e tau t
theta , th / z psilon u, y
iota i phi ( fi ) , f
kappa c/k ji o chi j
lambda l psi s
mu m omega o
POBLACIN Y MUESTRA
Muestreo
Poblacin Muestra
media x
2 varianza s2
CENSO p proporcin p ENCUESTA
total
Coef . Correlacin r
Parmetros Estadisti cos
Inferencia
VARIABLES Y TIPOLOGA
VARIABLE DE ESTUDIO
Caracterstica, propiedad o construccin
conceptual que comparten un conjunto de entes
en el marco de una investigacin, que al ser
medida u observada en uno de los elementos y
luego en otro, su valor, grado o categora puede
mostrar un cambio cuantitativo o cualitativo.
En estudios de corte experimental se le llama VARIABLE DE
RESPUESTA. Las variables pueden ser cuantitativas o cualitativas. No
confundir variable de estudio con categora de anlisis o un
indicador.
VARIABLES Y TIPOLOGA
CATEGORA DE ANLISIS
Una categora de anlisis agrupa un conjunto de aspectos
o unidades de significado que resultan relevantes desde el
punto de vista investigativo, de los cuales se recoge
informacin y se presentan resultados. Se utilizan en el
marco de la investigacin cualitativa.
Las categoras se construyen creando un nombre, palabra
clave o concepto que recoge un subconjunto de ideas
sobre la base de un criterio unificador, logrando que al
final del proceso todas las ideas estn incluidas en alguna
de las categoras establecidas. Surgen a partir del marco
terico o de la informacin recolectada en el proceso
mismo de investigacin.
VARIABLES Y TIPOLOGA
INDICADOR
Es un dato que brinda informacin cualitativa o
cuantitativa, que sirve de referencia para monitorear
objetivamente el desenvolvimiento y evolucin de un
proceso o actividad; para valorar las caractersticas y la
intensidad de un hecho o proyectar una tendencia
futura; para medir o comparar los resultados
efectivamente obtenidos en la ejecucin de un proyecto
o programa. Un conjunto o sistema de indicadores debe
tener capacidad para reflejar la realidad. Se utilizan en
el contexto de programas y proyectos.
VARIABLES Y TIPOLOGA
EJEMPLOS
En un estudio donde se desea comparar dos
variedades de caa a partir de la recopilacin y anlisis
estadstico de datos registrados en el tiempo, al
rendimiento de azcar y a altura de planta, por
ejemplo, se le llaman variables de estudio.
VARIABLE CUANTITATIVA
Variable que puede medirse con un instrumento y lleva
asociada una unidad de medida. Las variables
cuantitativas se miden en escala de intervalo o de razn
y pueden ser discretas o continuas.
VARIABLES Y TIPOLOGA
VARIABLE DISCRETA
Solo adopta ciertos valores como resultado de
del conteo, regularmente son nmeros enteros
cuyas divisiones carecen de relevancia prctica
en sentido natural o por determinacin.
VARIABLE CONTINUA
Son las que pueden tomar cualquier valor entre
dos nmeros enteros y se obtienen como
resultado de la medicin.
NIVELES O ESCALAS DE MEDICIN
Los niveles de medicin se diferencian a partir de tres
aspectos: ORDEN, DISTANCIA Y ORIGEN, dando lugar a
cuatro tipos de escalas: nominal, ordinal, de intervalo y
de razn.
Diferenciar las escalas de medicin de las variables de
estudio es clave para el anlisis estadstico de los datos.
Los estadsticos que se pueden calcular a partir de
resultados de escala de intervalo o razn son distintos a
los que pueden realizar con resultados de escala nominal
u ordinal. Es decir, el tipo de anlisis de estadstico
depende del nivel de medicin de las variables. Por
ejemplo, el nivel de medicin de una variable es
importante cuando se crea un grfico.
NIVELES O ESCALAS DE MEDICIN
ESCALA NOMINAL
No posee origen, orden ni distancia y se utiliza para
variables cualitativas cuyas observaciones se
clasifican en categoras donde una no es mejor ni
mayor que las otra(s), es decir, no existe un orden
natural o jerrquico entre los resultados. Las distintas
categoras pueden distinguirse con letras o nmeros,
no obstante, el empleo de nmeros tiene tan solo
carcter simblico a efecto de trabajar con las
frecuencias de cada una.
Gnero: masculino y femenino
Estado civil: casado, soltero, unido
Nacionalidad: guatemalteco, hondureo
NIVELES O ESCALAS DE MEDICIN
ESCALA ORDINAL
Las observaciones se clasifican en categoras que
tienen un orden con origen indefinido, la
diferencia entre una categora y otra no es
cuantificable, solo puede decirse que una categora
es menor o mayor que otra.
Nivel acadmico: primaria, segundaria, superior.
Intensidad de dolor: leve, moderado, severo
Experiencia: Aprendiz o experto
Estado de salud: Sano o enfermo
Atencin al cliente: mala, regular, buena, muy buena.
El primer aspecto a tomar en cuenta (el que tiene prioridad) para identificar la escala en la que se ha
medido una variable es uso o no de categoras. Al utilizar categoras, la escala de medicin debe ser
nominal u ordinal.
NIVELES O ESCALAS DE MEDICIN
ESCALA ORDINAL
Un caso particular donde se utiliza la escala ordinal es en
la evaluacin sensorial, que se define como la
disciplina cientfica utilizada para evocar, medir, analizar
e interpretar caractersticas del objeto de estudio que
son percibidas por los sentidos de la vista, olfato, gusto,
tacto y odo. Se utiliza cuando se pretende analizar
niveles de preferencia, aceptabilidad, satisfaccin,
estados, entre otros. Cualquiera que sea el caso, es
necesario elaborar una escala hednica (placer,
satisfaccin aplicada en alimentos) ya sea verbal o
grfica. En evaluacin sensorial tambin puede utilizarse
la escala de Likert o una escala diagramtica.
NIVELES O ESCALAS DE MEDICIN
ESCALA ORDINAL
Escala hednica verbal de 7 puntos Escala de Likert de 5 puntos
Valor Grado de aceptabilidad Valor Nivel de satisfaccin
1 Me disgusta mucho Completamente de acuerdo
1
2 Me disgusta De acuerdo
2
3 Me disgusta poco Neutral
3
4 No me gusta ni me disgusta En desacuerdo
4
5 Me gusta poco Completamente en
5 desacuerdo
6 Me gusta
7 Me gusta mucho
VARIABLES
CUALITATIVA CUANTITATIVA
DE
NOMINAL ORDINAL DE RAZN
INTERVALO
EJEMPLOS
Clasifique las siguientes variables de estudio en cualitativa o cuantitativa,
discreta o continua e indique la escala de medicin.
DESCRIPCIN DE LA VARIABLE CLASIFICACIN
Edad exacta, en aos, de los alumnos de una Cuantitativa, continua, de razn
clase.
Barrio en que residen los pobladores de un Cualitativa, n/a, nominal
municipio.
Hora aproximada en que deben alimentarse
Cuantitativa, discreta, de intervalo
las especies de una familia de mariposas en
estado larvario.
Grado de quemadura de los afectados por Cualitativa, n/a, ordinal
un incendio fabril.
Ubicacin de hospitales estatales en
Cuantitativa, continua y de intervalo
Guatemala expresado en coordenadas
geogrficas.
Nmero de llamadas de emergencia que
Cuantitativa, discreta y de razn
recibe el cuerpo de bomberos los das
viernes
EJEMPLOS
Clasifique las siguientes variables de estudio en cualitativa o cuantitativa,
discreta o continua, dicotmica o politmica e indique la escala de
medicin.
x
i 1
i
x1 3, x2 4, x3 5, x4 6, x5 7
x
i 1
i 3 4 5 6 7 25
NOTACIN SUMATORIA
Por ejemplo, la sumatoria de los primeros 100
nmeros naturales:
100
x
i 1
i 1 2 3 ...50 51... 98 99 100
Observacin :
1 100 101, 2 99 101, 3 98 101, 50 51 101
Entonces :
100
x
i 1
i 50 101 5050 Carl Friedrich Gauss
2
n 2 2
n n 1 n n 1
x 3
13
2 3
33
...n 3
i 1
i
2 4
NOTACIN SUMATORIA
Dado el conjunto de nmeros, encontrar el resultado de las
siguientes expresiones con base a las propiedades de la
notacin sumatoria.
Xi 2 5 3 1
K=2
Yi 5 3 2 4
PROPIEDADES
n
01 k nk
i 1
n
02 x
i 1
i x1 x2 x3 ... xn Tomar en cuenta que :
2
n n
n
03 x 2
i x x x ... xn
2
1
2
2
2
3
i 1
x xi
2
i
i 1
i 1
n n
04 k x
i 1
i k xi
i 1
n
05 x y
i 1
i i x1 y1 x2 y2 x3 y3 ... xn yn
PROPIEDADES
n n n
06 x y x y
i 1
i i
i 1
i
i 1
i
n n n n
07 x k x k x nk
i 1
i
i 1
i
i 1 i 1
i
n
08 x k x k x k x3 k ... xn k
2 2 2 2 2
i 1 2
i 1
xi2 2 xi k k 2
n n
08 xi k
2
i 1 i 1
EJEMPLO
En la tabla siguiente se da rapidez en la impresin de texto en pginas por
minuto (ppm) y el precio de cada impresora. Calcular el resultado de:
xi yi n
n
y
a x y
V (ppm) Precio ($) 2 i
10 250
i i b i 1
i 1 n
20 740
25 890 n
12
16
360
450
c y x y x
i 1
i i i i
18 525
n xi yi xi yi
d
n xi 2 xi
2
Respuestas:
a) 1,214,390
n xi yi xi yi
2
b) 535.83
c) 1417.1
e
n x 2 x 2 n y 2 y 2
i i i i
d) 43.01
e) 0.958
SUMATORIAS DOBLES
NIVELES DEL NIVELES DEL FACTOR COLUMNA
TOTAL DE FILA
FACTOR FILA j=1 j=2 j=3
b
y
a a a
y y y
TOTAL DE y..
i1 y1 i2 y2 i3 y3 ij
COLUMNA i 1 i 1 i 1 i 1 j 1
i 1, 2, ... a j 1, 2,... b
Los datos dispuestos verticalmente (i=1,2a) son las observaciones en cada uno los
niveles del factor fila, para uno de los niveles de factor columna. Los datos dispuestos
horizontalmente (j=1,2b) son las observaciones en cada uno de los niveles del factor
columna, para uno de los niveles del factor fila.
SUMATORIAS DOBLES
NIVELES DEL NIVELES DEL FACTOR COLUMNA
TOTAL DE FILA
FACTOR FILA j=1 j=2 j=3
b
y
a a a
y y y
TOTAL DE y..
i1 y1 i2 y2 i3 y3 ij
COLUMNA i 1 i 1 i 1 i 1 j 1
yij = Observacin de la variable respuesta en el i-simo nivel del factor fila y en el j-simo nivel del factor columna
y.. = Total de observaciones yij de la variable respuesta
y1j = Observaciones de columna en la fila 1. a b a b
y1. = Total de las observaciones de columna en la fila 1. i 1
yi y j yij
j 1 i 1 j 1
yi. = Total de las observaciones de columna en la i-sima fila.
SUMATORIAS DOBLES
a Indica que deben sumarse las observaciones de fila en la
y
i 1
i1 columna 1, que equivale al total de la columna 1 (y1) observe
que el punto representa un total.
y
Indica que deben sumarse los totales de columnas, desde j=1
j hasta j=b, esto que equivale al gran total (y..). Observar que el
j 1 gran total es igual a la suma de todas las observacin yij
b a b
y
j 1
j
i 1
y
j 1
ij
Contestar las preguntas y realizar las operaciones indicadas, teniendo en cuenta que
yij es el valor de la resistencia observado en el operario i, empleando la mquina j:
a b a a b
a Cual es el resultado de yi 2 c Operar y , y , yij
2
j
2
i
R / 75 i 1 j 1 i 1 i 1 j 1
b
b Cul es el resultado de y3 j
R /16205 R / 21365 R / 253
R / 86 j 1
EJEMPLO
A manera de conclusin, con relacin al ejercicio anterior:
y 2j
Indica que deben sumarse los cuadrados de los totales de
j 1
cada mquina, desde j=1 hasta j=b
a
yi 1
2
i
Indica que deben sumarse los cuadrados de los totales de
cada operario, desde i=1 hasta i=a
a b
y
i 1 j 1
ij
Indica que deben sumarse todos los valores de resistencia
observados.
EJERCICIO
En la tabla cruzada (o de contingencia) siguiente, se presenta el nmero de
plantas de mana (Arachis hypogaea) que registran distintos grados de
severidad segn la prctica de manejo utilizada en el cultivo.
Severidad
Prctica de manejo
Baja Moderada Alta
Rotacin de cultivos 235 124 38
Control de malezas 169 84 18
Uso de fungicidas 452 67 27
x i
x1 x2 x3 ...xn
x i 1
PARA UNA MUESTRA
n n
N
xx1 x2 x3 ...xn
i
i 1 PARA UNA POBLACIN
N N
MEDIA ARITMTICA: Propiedades
La suma de las desviaciones de un conjunto de datos con relacin a su
media es siempre cero. n
n n n n n x i n n
x x x x x nx x n
i 1
i
i 1
i
i 1 i 1
i
i 1
i
i 1
n
xi xi 0
i 1 i 1
x i
x i 1
n
n
n x xi xi n x
i 1
MEDIA ARITMTICA
Se obtuvo una muestra de los salarios de siete trabajadores de una
institucin educativa. Calcular la media aritmtica.
Trabajador 1 2 3 4 5 6 7
Salario (Q) 3400 6100 6200 2800 6100 4400 6000
n
x i
3400 6100 6200 2800 6100 4400 6000 35000
x i 1
5000
n 7 7
El salario promedio de trabajadores es de Q5,000.00. El salario de los
trabajadores, asumiendo que es igual para todos, es de Q5,000.00
Gc
diferencia absoluta entre el valor
atpico (xi) y el promedio de la
s muestra, dividida por la desviacin
estndar de la muestra.
Me 10
6 9 10 13 15 n=5
10 11
Me 10.5
2
6 9 10 11 13 15 n=6
MODA (Mo)
La moda es el valor que se presenta con mayor frecuencia. Hay
situaciones en que dos o ms datos distintos se presentan en la serie
de datos se repiten con la misma frecuencia, o bien puede darse que
ningn dato se repita. De ah que la serie de datos pueda ser amodal,
bimodal o multimodal. Si contienen ms de dos modas, son
multimodales. Si todos los datos tienen la misma frecuencia, es
amodal. En los casos multimodales casi nunca se da la moda como
medida de tendencia central porque ofrecer tres o ms modas no
resulta de mucha ayuda para describir los datos.
Trabajador 1 2 3 4 5 6 7
Salario (Q) 3400 6100 6200 2800 6100 4400 6000
MEDIA PONDERADA
Se utiliza cuando en un conjunto de datos, cada uno tiene un factor de
importancia relativa, el cual puede expresarse como frecuencia o
porcentaje.
xp
xpi i
p i
En junio, una inversionista compr 300 acciones a Q200 cada una. En agosto
compr 400 acciones ms a Q250. En noviembre compr 450 acciones, pero el
precio baj a 230 cada ttulo. Cul es el precio promedio ponderado de cada
accin?
n
xg n
x i 1
i n x1 x2 x3 ...xn
Un vehculo recorre 280 km en cuatro tramos. Los primeros 70 km los recorre a 90 km/h, el siguiente
tramo a 40 k/h, el tercer tamo a 75 km/h y el ltimo tramo de 70 km a 60 km/h. Calcular la velocidad
promedio en el trayecto de los 280 kilmetros.
OTROS TIPOS DE MEDIAS
MEDIA CUADRTICA
La media cuadrtica o RMS (root mean square), es la raz cuadrada de la
media aritmtica de los cuadrados de los valores. Se puede utilizar
cuando en la serie de datos se tienen valores negativos cuyo efecto en el
resultado se considera irrelevante. No es afectada considerablemente
por valores extremos, por eso, tambin se utiliza para promediar
dimetros en plantaciones forestales donde la variabilidad de los
dimetros puede ser alta. La desviacin estndar es una media
cuadrtica.
n
i
x 2
x12 x22 x32 ... xn2
xc i 1
n n