You are on page 1of 61

ESTADSTICA

DEFINICIN
Ciencia que estudia los mtodos para recopilar,
organizar y analizar datos sobre hechos,
fenmenos o situaciones, con el objeto
caracterizarlos, interpretarlos y generar
informacin relevante para la toma decisiones.

La estadstica puede ser descriptiva e


inferencial. Tambin puede dividirse en
paramtrica y no paramtrica.

ESTADSTICA
ESTADSTICA DESCRIPTIVA
Parte de la estadstica que utiliza mtodos y
procedimientos de anlisis destinados a generar
informacin sobre las caractersticas de un
grupo de datos.
ESTADSTICA INFERENCIAL
Parte de la estadstica que comprende el uso de
mtodos y pruebas de anlisis de datos para
realizar generalizaciones, predicciones y
estimaciones sobre una poblacin a partir de
una muestra seleccionada aleatoriamente.

ESTADSTICA

ESTADSTICA PARAMTRICA
Teora y mtodos de anlisis de datos que presuponen
determinadas condiciones acerca de la distribucin de la variable
de estudio en la poblacin de la cual se ha obtenido la muestra
investigada, de manera que, la validez de los resultados dependen
del cumplimiento de esas suposiciones.
Algunas suposiciones pueden ser la distribucin normal de los
datos, homocedasticidad de varianzas y que las observaciones
analizadas han sido medidas en escala de intervalo por lo menos.
En las pruebas paramtricas se utiliza regularmente la media
aritmtica como medida de tendencia central y la varianza como
medida de dispersin. Algunas pruebas paramtricas son: prueba t
de Student, anlisis de regresin, anlisis de varianza (ANDEVA),
correlacin de Pearson, entre otros.

ESTADSTICA

ESTADSTICA NO PARAMTRICA
Teora y mtodos de anlisis de datos que requieren el
cumplimiento condiciones generales pero ninguna acerca de la
forma especfica de la distribucin de la cual fue obtenida la
muestra, por ello se conocen tambin como pruebas de distribucin
libre. Se utiliza la mediana como medida de tendencia central y
rango como medida de dispersin. Es til es casos donde la variable
de estudio ha sido medida en escala nominal u ordinal.
Algunas pruebas no paramtricas son: la prueba de los signos,
prueba de rangos Wilcoxon, el anlisis de varianza unifactorial de
Kruskal-Wallis, el anlisis de varianza bifactorial de Friedman y los
coeficientes de correlacin de Spearman y de Kendall, entre otros.

ALFABETO GRIEGO: SMBOLOS ESTADSTICOS
minscula mayscula equiv minscula mayscula equiv
alfa a nu n
beta b xi x
gamma g micron o
delta d pi , p
psilon e rho(ro) r
zeta z sigma , s
eta e tau t
theta , th / z psilon u, y
iota i phi ( fi ) , f
kappa c/k ji o chi j
lambda l psi s
mu m omega o

POBLACIN Y MUESTRA

POBLACIN estadstica se define como el conjunto de individuos


que tienen por lo menos una caracterstica en comn observable y
que resulta de inters desde el punto de vista investigativo. Al
estudio de la poblacin completa se le denomina CENSO. Al valor
de una caracterstica de la poblacin se le llama PARMETRO.
Una MUESTRA es el subconjunto de una poblacin, que manifiesta
las mismas caractersticas de la poblacin original de donde fue
extrada. Los requisitos deseables de una buena muestra son:
representatividad y confiabilidad. Lo primero se consigue a travs
de la seleccin del tipo de muestreo adecuado, en tanto que la
confiabilidad est referida al tamao de la muestra. Al estudio que
contempla la toma de una muestra se le denomina ENCUESTA. Al
valor de la caracterstica de una muestra se le llama ESTIMADOR,
estadstico o estadgrafo.

POBLACIN Y MUESTRA
Poblacin estadstica Muestra
Representativa y confiable
Unidad de Tipo de muestreo
muestreo Tamao de muestra

Muestreo

Poblacin Muestra

media x
2 varianza s2
CENSO p proporcin p ENCUESTA
total
Coef . Correlacin r
Parmetros Estadisti cos

Inferencia

VARIABLES Y TIPOLOGA

VARIABLE DE ESTUDIO
Caracterstica, propiedad o construccin
conceptual que comparten un conjunto de entes
en el marco de una investigacin, que al ser
medida u observada en uno de los elementos y
luego en otro, su valor, grado o categora puede
mostrar un cambio cuantitativo o cualitativo.
En estudios de corte experimental se le llama VARIABLE DE
RESPUESTA. Las variables pueden ser cuantitativas o cualitativas. No
confundir variable de estudio con categora de anlisis o un
indicador.

VARIABLES Y TIPOLOGA
CATEGORA DE ANLISIS
Una categora de anlisis agrupa un conjunto de aspectos
o unidades de significado que resultan relevantes desde el
punto de vista investigativo, de los cuales se recoge
informacin y se presentan resultados. Se utilizan en el
marco de la investigacin cualitativa.
Las categoras se construyen creando un nombre, palabra
clave o concepto que recoge un subconjunto de ideas
sobre la base de un criterio unificador, logrando que al
final del proceso todas las ideas estn incluidas en alguna
de las categoras establecidas. Surgen a partir del marco
terico o de la informacin recolectada en el proceso
mismo de investigacin.

VARIABLES Y TIPOLOGA
INDICADOR
Es un dato que brinda informacin cualitativa o
cuantitativa, que sirve de referencia para monitorear
objetivamente el desenvolvimiento y evolucin de un
proceso o actividad; para valorar las caractersticas y la
intensidad de un hecho o proyectar una tendencia
futura; para medir o comparar los resultados
efectivamente obtenidos en la ejecucin de un proyecto
o programa. Un conjunto o sistema de indicadores debe
tener capacidad para reflejar la realidad. Se utilizan en
el contexto de programas y proyectos.

VARIABLES Y TIPOLOGA
EJEMPLOS
En un estudio donde se desea comparar dos
variedades de caa a partir de la recopilacin y anlisis
estadstico de datos registrados en el tiempo, al
rendimiento de azcar y a altura de planta, por
ejemplo, se le llaman variables de estudio.

En un estudio sobre educacin agrcola y desarrollo


rural, al listado de temas diferenciados que son
comunes o recurrentes entre las entrevistas (sistemas
de produccin por ejemplo), y que constituyen las
dimensiones que se estudian, se les llama categoras
de anlisis.

VARIABLES Y TIPOLOGA
EJEMPLOS
En una investigacin, grupos homogneos de plantas
son tratadas con diferentes fungicidas para registrar el
efecto producido sobre la severidad de la enfermedad.
En este caso, severidad es la variable de respuesta.

Se evala el impacto econmico, social y ambiental del


establecido monocultivos extensivos. En este caso, al
ingreso percpita mensual de los pobladores
econmicamente activos en la zona de influencia se le
llama indicador econmico.

ESTADSTICA
DEFINICIN CONCEPTUAL Y OPERACIONAL DE
VARIABLES DE ESTUDIO

Dicha definicin debe contener la descripcin


contextualizada, breve y suficiente de la
esencia o naturaleza de la variable de estudio,
as como, especificar la actividad que deben
realizarse o el instrumento que debe utilizarse
para calificarla o medirla.

ESTADSTICA

POR QU ES NECESARIO DEFINIR LAS


VARIABLES DE ESTUDIO
Se realiza con el propsito de que cualquier
persona que lea el proyecto o informe de
investigacin conozca cul es el significado y
como se midieron y observaron las variables.
Para asegurar que las variables efectivamente
puedan ser medidas, observadas o evaluadas. Y
para permitir comparar los resultados con otras
investigaciones.

ESTADSTICA
EJEMPLO
Motivacin intrnseca en el trabajo. Estado cognitivo
que refleja el grado en que un trabajador atribuye la
fuerza de su comportamiento en el trabajo a
satisfacciones o beneficios derivados de sus tareas
laborales en s mismas. Se obtiene utilizando el
cuestionario denominado auto reporte de motivacin
intrnseca del Inventario de Caractersticas del Trabajo,
versin mexicana (Hernndez, et al. 2003).

ESTADSTICA
EJEMPLO
Eficiencia biolgica: Se refiere al grado de
bioconversin de energa a partir de la
biodegradacin del sustrato por parte del hongo,
expresado en porcentaje. Se obtiene a partir del
peso fresco de carpforos producidos hasta la
tercera oleada y el peso seco del sustrato
utilizado.

VARIABLES Y TIPOLOGA
VARIABLE CUALITATIVA
Variables cuyos datos se recogen por eleccin o asignacin y
pueden colocarse en un nmero determinado de categoras
(modalidades, clases, o grupos) que se distinguen por alguna
caracterstica no numrica (cualidad), las cuales constituyen los
posibles resultados de la variable. Por ello tambin reciben el
nombre de variables categricas. Se pueden utilizar letras,
palabras o cdigos numricos para representar cada categora. Se
llama variable dicotmica cuando presenta solo dos posibles
resultados y politmica cuando tiene tres o ms. Las variables
cualitativas se miden en escala nominal u ordinal.
El anlisis estadstico de variables cualitativas recae sobre las frecuencias
determinadas por conteo que han sido observadas en cada categora y no sobre
los datos individualmente considerados.

VARIABLES Y TIPOLOGA

VARIABLE CUANTITATIVA
Variable que puede medirse con un instrumento y lleva
asociada una unidad de medida. Las variables
cuantitativas se miden en escala de intervalo o de razn
y pueden ser discretas o continuas.

VARIABLES Y TIPOLOGA

VARIABLE DISCRETA
Solo adopta ciertos valores como resultado de
del conteo, regularmente son nmeros enteros
cuyas divisiones carecen de relevancia prctica
en sentido natural o por determinacin.

VARIABLE CONTINUA
Son las que pueden tomar cualquier valor entre
dos nmeros enteros y se obtienen como
resultado de la medicin.

NIVELES O ESCALAS DE MEDICIN
Los niveles de medicin se diferencian a partir de tres
aspectos: ORDEN, DISTANCIA Y ORIGEN, dando lugar a
cuatro tipos de escalas: nominal, ordinal, de intervalo y
de razn.
Diferenciar las escalas de medicin de las variables de
estudio es clave para el anlisis estadstico de los datos.
Los estadsticos que se pueden calcular a partir de
resultados de escala de intervalo o razn son distintos a
los que pueden realizar con resultados de escala nominal
u ordinal. Es decir, el tipo de anlisis de estadstico
depende del nivel de medicin de las variables. Por
ejemplo, el nivel de medicin de una variable es
importante cuando se crea un grfico.

NIVELES O ESCALAS DE MEDICIN
ESCALA NOMINAL
No posee origen, orden ni distancia y se utiliza para
variables cualitativas cuyas observaciones se
clasifican en categoras donde una no es mejor ni
mayor que las otra(s), es decir, no existe un orden
natural o jerrquico entre los resultados. Las distintas
categoras pueden distinguirse con letras o nmeros,
no obstante, el empleo de nmeros tiene tan solo
carcter simblico a efecto de trabajar con las
frecuencias de cada una.
Gnero: masculino y femenino
Estado civil: casado, soltero, unido
Nacionalidad: guatemalteco, hondureo

NIVELES O ESCALAS DE MEDICIN
ESCALA ORDINAL
Las observaciones se clasifican en categoras que
tienen un orden con origen indefinido, la
diferencia entre una categora y otra no es
cuantificable, solo puede decirse que una categora
es menor o mayor que otra.
Nivel acadmico: primaria, segundaria, superior.
Intensidad de dolor: leve, moderado, severo
Experiencia: Aprendiz o experto
Estado de salud: Sano o enfermo
Atencin al cliente: mala, regular, buena, muy buena.

El primer aspecto a tomar en cuenta (el que tiene prioridad) para identificar la escala en la que se ha
medido una variable es uso o no de categoras. Al utilizar categoras, la escala de medicin debe ser
nominal u ordinal.

NIVELES O ESCALAS DE MEDICIN
ESCALA ORDINAL
Un caso particular donde se utiliza la escala ordinal es en
la evaluacin sensorial, que se define como la
disciplina cientfica utilizada para evocar, medir, analizar
e interpretar caractersticas del objeto de estudio que
son percibidas por los sentidos de la vista, olfato, gusto,
tacto y odo. Se utiliza cuando se pretende analizar
niveles de preferencia, aceptabilidad, satisfaccin,
estados, entre otros. Cualquiera que sea el caso, es
necesario elaborar una escala hednica (placer,
satisfaccin aplicada en alimentos) ya sea verbal o
grfica. En evaluacin sensorial tambin puede utilizarse
la escala de Likert o una escala diagramtica.

NIVELES O ESCALAS DE MEDICIN
ESCALA ORDINAL
Escala hednica verbal de 7 puntos Escala de Likert de 5 puntos
Valor Grado de aceptabilidad Valor Nivel de satisfaccin
1 Me disgusta mucho Completamente de acuerdo
1
2 Me disgusta De acuerdo
2
3 Me disgusta poco Neutral
3
4 No me gusta ni me disgusta En desacuerdo
4
5 Me gusta poco Completamente en
5 desacuerdo
6 Me gusta

7 Me gusta mucho

Utilizar nmero impar de niveles con un punto neutral de ser necesario. No se


recomiendan escalas con ms de 9 puntos, porque se incrementa la subjetividad.

NIVELES O ESCALAS DE MEDICIN
ESCALA ORDINAL
Escala sensorial diagramtica de la maduracin del
fruto de banano

NIVELES O ESCALAS DE MEDICIN
ESCALA ORDINAL
Escala sensorial diagramtica de la severidad de la roya del
caf en hojas.

Sin sntomas De rea foliar


visibles afectada

NIVELES O ESCALAS DE MEDICIN
ESCALA DE INTERVALO
Tipo de escala donde magnitud entre dos resultados
subsiguientes cualesquiera es medible y constante,
tiene como origen el cero, pero no es real, es arbitrario
porque no indica ausencia absoluta de lo que se mide,
es decir, el valor cero es relativo y puede dar lugar a la
existencia de valores negativos que en algunos casos
tienen interpretacin prctica.
Temperatura ambiental: -5, 0, 3, 6,7 10C
Notas de un examen: 0, 20, 30, 50 100 puntos.
Horarios: de 7:00 h a 16:00 h, de 0:00 h a 5:30 h
Altitud de un lugar: 26 mbnm o 1200 msnm
Ubicacin geogrfica: 1420 23, -9015 05, 00423

NIVELES O ESCALAS DE MEDICIN
ESCALA DE RAZN
Posee un orden, la diferencia entre dos resultados
subsiguientes es medible y constante, el cero es
absoluto y representa ausencia de lo que se mide, por lo
que valores negativos existen pero regularmente no
tienen sentido prctico. El cero tiene significado real, no
obstante, algunas variables solo pueden registrar
valores mayores a cero, donde el cero, es tan solo el
punto de origen de la medicin.
Artculos vendidos: 0, 10, 40 o 120.
Altura de una persona: 1.60 m, 1.75 m, 1.90 m.
Aos de escolaridad: 4 aos, 8 aos, 10 aos.

TIPO DE VARIABLES Y ESCALAS DE MEDICIN

VARIABLES

CUALITATIVA CUANTITATIVA

Frecuencias DISCRETAS CONTINUAS

DE
NOMINAL ORDINAL DE RAZN
INTERVALO

EJEMPLOS
Clasifique las siguientes variables de estudio en cualitativa o cuantitativa,
discreta o continua e indique la escala de medicin.
DESCRIPCIN DE LA VARIABLE CLASIFICACIN
Edad exacta, en aos, de los alumnos de una Cuantitativa, continua, de razn
clase.
Barrio en que residen los pobladores de un Cualitativa, n/a, nominal
municipio.
Hora aproximada en que deben alimentarse
Cuantitativa, discreta, de intervalo
las especies de una familia de mariposas en
estado larvario.
Grado de quemadura de los afectados por Cualitativa, n/a, ordinal
un incendio fabril.
Ubicacin de hospitales estatales en
Cuantitativa, continua y de intervalo
Guatemala expresado en coordenadas
geogrficas.
Nmero de llamadas de emergencia que
Cuantitativa, discreta y de razn
recibe el cuerpo de bomberos los das
viernes

EJEMPLOS
Clasifique las siguientes variables de estudio en cualitativa o cuantitativa,
discreta o continua, dicotmica o politmica e indique la escala de
medicin.

DESCRIPCIN DE LA VARIABLE CLASIFICACIN


El pH de 10 muestras de suelo obtenidas de Cuantitativa, continua, de intervalo
un terreno para uso agrcola.
Calificacin asignada a cada una de las 20 Cualitativa, ordinal, dicotmica
preguntas de seleccin mltiple.
Edad aproximada, en aos, de los alumnos Cuantitativa, discreta, de razn
de una clase.
Las notas exactas de cero a 20, obtenidas Cuantitativa, continua, de intervalo
por los estudiantes en el curso estadstica
general
Color del fruto en variedades de manzana Cualitativa, nominal, politmica
cultivadas en Guatemala.
Nmero de fidos atrapados en trampas Cuantitativa, discreta y de razn
amarillas en el cultivo de tomate

NOTACIN SUMATORIA
La sumatoria, llamada tambin notacin sigma es
una operacin matemtica que se emplea para
indicar la suma de finito o infinito nmero de
sumandos. Se expresa con la letra griega sigma
mayscula.
n

x
i 1
i

Se lee la sumatoria de xi desde i igual a uno hasta n


xi es cada uno de valores que se suman
i es el valor inicial o lmite inferior
n es el valor final o lmite superior

NOTACIN SUMATORIA

Por ejemplo, la sumatoria de los nmeros


naturales del 3 al 7:

x1 3, x2 4, x3 5, x4 6, x5 7

x
i 1
i 3 4 5 6 7 25

NOTACIN SUMATORIA
Por ejemplo, la sumatoria de los primeros 100
nmeros naturales:
100

x
i 1
i 1 2 3 ...50 51... 98 99 100
Observacin :
1 100 101, 2 99 101, 3 98 101, 50 51 101
Entonces :
100

x
i 1
i 50 101 5050 Carl Friedrich Gauss

Por ello, la sumatoria de n nmeros naturales consecutivos es:


n
n n 1
xi 1 2 3 ...n
n
n 1
i 1 2 2

NOTACIN SUMATORIA
La frmula para la sumatoria del cuadrado de n
nmeros consecutivos es:
n
n n 1 2n 1

i 1
x 1 2 3 ...n
2
i
2 2 2 2

La frmula para la sumatoria del cubo de n


nmeros consecutivos es:


2

n 2 2


n n 1 n n 1
x 3
13
2 3
33
...n 3

i 1
i
2 4

NOTACIN SUMATORIA
Dado el conjunto de nmeros, encontrar el resultado de las
siguientes expresiones con base a las propiedades de la
notacin sumatoria.

Xi 2 5 3 1
K=2
Yi 5 3 2 4

PROPIEDADES
n
01 k nk
i 1

n
02 x
i 1
i x1 x2 x3 ... xn Tomar en cuenta que :
2
n n
n

03 x 2
i x x x ... xn
2
1
2
2
2
3
i 1
x xi
2
i
i 1
i 1

n n
04 k x
i 1
i k xi
i 1

n
05 x y
i 1
i i x1 y1 x2 y2 x3 y3 ... xn yn

PROPIEDADES
n n n
06 x y x y
i 1
i i
i 1
i
i 1
i

n n n n
07 x k x k x nk
i 1
i
i 1
i
i 1 i 1
i

n
08 x k x k x k x3 k ... xn k
2 2 2 2 2
i 1 2
i 1

xi2 2 xi k k 2
n n
08 xi k
2

i 1 i 1

EJEMPLO
En la tabla siguiente se da rapidez en la impresin de texto en pginas por
minuto (ppm) y el precio de cada impresora. Calcular el resultado de:

xi yi n
n
y
a x y
V (ppm) Precio ($) 2 i

10 250
i i b i 1
i 1 n
20 740
25 890 n
12
16
360
450
c y x y x
i 1
i i i i

18 525
n xi yi xi yi
d
n xi 2 xi
2

Respuestas:
a) 1,214,390
n xi yi xi yi
2
b) 535.83
c) 1417.1
e
n x 2 x 2 n y 2 y 2
i i i i
d) 43.01
e) 0.958

SUMATORIAS DOBLES
NIVELES DEL NIVELES DEL FACTOR COLUMNA
TOTAL DE FILA
FACTOR FILA j=1 j=2 j=3
b

i=1 y11 y12 y13 y j 1


1j y1
b
i=2 y21 y22 y23 y j 1
2j y2
b

i=3 y31 y32 y33 y


j 1
3j y3
a b

y
a a a

y y y
TOTAL DE y..
i1 y1 i2 y2 i3 y3 ij
COLUMNA i 1 i 1 i 1 i 1 j 1

i 1, 2, ... a j 1, 2,... b
Los datos dispuestos verticalmente (i=1,2a) son las observaciones en cada uno los
niveles del factor fila, para uno de los niveles de factor columna. Los datos dispuestos
horizontalmente (j=1,2b) son las observaciones en cada uno de los niveles del factor
columna, para uno de los niveles del factor fila.

SUMATORIAS DOBLES
NIVELES DEL NIVELES DEL FACTOR COLUMNA
TOTAL DE FILA
FACTOR FILA j=1 j=2 j=3
b

i=1 y11 y12 y13 y j 1


1j y1
b
i=2 y21 y22 y23 y j 1
2j y2
b

i=3 y31 y32 y33 y


j 1
3j y3
a b

y
a a a

y y y
TOTAL DE y..
i1 y1 i2 y2 i3 y3 ij
COLUMNA i 1 i 1 i 1 i 1 j 1

yij = Observacin de la variable respuesta en el i-simo nivel del factor fila y en el j-simo nivel del factor columna
y.. = Total de observaciones yij de la variable respuesta
y1j = Observaciones de columna en la fila 1. a b a b
y1. = Total de las observaciones de columna en la fila 1. i 1
yi y j yij
j 1 i 1 j 1
yi. = Total de las observaciones de columna en la i-sima fila.

SUMATORIAS DOBLES
a Indica que deben sumarse las observaciones de fila en la
y
i 1
i1 columna 1, que equivale al total de la columna 1 (y1) observe
que el punto representa un total.

y
Indica que deben sumarse los totales de columnas, desde j=1
j hasta j=b, esto que equivale al gran total (y..). Observar que el
j 1 gran total es igual a la suma de todas las observacin yij
b a b

y
j 1
j
i 1
y
j 1
ij

La eleccin de ij para denotar las filas y columnas es arbitraria, no


obstante, coherente con el estudio de matrices en lgebra lineal. Lo que
realmente es relevante, es la letra que se utiliza para indicar los distintos
niveles de la variable dispuesta horizontalmente y la que se utiliza para
los distintos niveles de la variable dispuestas verticalmente,
independientemente si es fila o columna.

EJEMPLO
Se estudian en el laboratorio los factores que pueden influir en la resistencia a la
abrasin (y) de un tipo particular de fibra. Se eligen al azar cuatro mquinas y tres
operarios y se realiza un experimento factorial usando fibras de un mismo lote de
produccin. Los resultados de la resistencia a la abrasin obtenidos, expresados en
kg/cm3 se muestran en el cuadro.
TIPO DE MQUINAS
OPERARIO A j 1 B j 2 C j 3 D j 4 TOTAL
1 i 1 18 25 19 18 80 i 1, 2, ... a
2 i 2 19 26 22 20 87 j 1, 2,... b
3 i 3 19 24 21 22 86
TOTAL 56 75 62 60

Contestar las preguntas y realizar las operaciones indicadas, teniendo en cuenta que
yij es el valor de la resistencia observado en el operario i, empleando la mquina j:
a b a a b
a Cual es el resultado de yi 2 c Operar y , y , yij
2
j
2
i
R / 75 i 1 j 1 i 1 i 1 j 1
b
b Cul es el resultado de y3 j
R /16205 R / 21365 R / 253

R / 86 j 1

EJEMPLO
A manera de conclusin, con relacin al ejercicio anterior:

a Indica que deben sumarse los valores de resistencia


y i 1
i2 observados en los distintos operarios (i=1,2a) cuando la
mquina es la nmero 2 (j=2)
b Indica que deben sumarse los valores de resistencia
y j 1
3j observados en las distintas mquinas (j=1,2b) cuando el
operario es el nmero 3 (i=3)
b

y 2j
Indica que deben sumarse los cuadrados de los totales de
j 1
cada mquina, desde j=1 hasta j=b
a

yi 1
2
i
Indica que deben sumarse los cuadrados de los totales de
cada operario, desde i=1 hasta i=a
a b

y
i 1 j 1
ij
Indica que deben sumarse todos los valores de resistencia
observados.

EJERCICIO
En la tabla cruzada (o de contingencia) siguiente, se presenta el nmero de
plantas de mana (Arachis hypogaea) que registran distintos grados de
severidad segn la prctica de manejo utilizada en el cultivo.

Severidad
Prctica de manejo
Baja Moderada Alta
Rotacin de cultivos 235 124 38
Control de malezas 169 84 18
Uso de fungicidas 452 67 27

Indicar o calcular el valor de las siguientes expresiones tomando en cuenta


que la notacin yij representa el nmero de plantas con grado de severidad i
utilizando la prctica de manejo j.
b a a
a ) y23 b) y 3 c) y d ) y1 j e) yi 2 f ) yi
j 1 i 1 i 1

ESTADSTICA DESCRIPTIVA

Datos sin ANLISIS DESCRIPTIVO Datos


agrupar DE DATOS agrupados

Medidas de Medidas de Medidas Medidas Anlisis Anlisis


tendencia
central dispersin de posicin forma grfico tabular

Rango Percentiles Sectores


Media Asimetra Lneas Tablas de
aritmtica Varianza Deciles Curtosis Barras frecuencias
Otros tipos de Desviacin Cuartiles Histograma
Tablas de
medias estndar contingencia
Coeficiente Cajas
Moda D. de Pareto
Mediana de variacin

CUANDO UTILIZAR UNA U OTRA MEDIDA
Entre las medidas de tendencia central, la media requiere variables cuantitativas. La
mediana es un estadstico tpicamente para variables con escala ordinal al menos. Al
contrario de lo que ocurre con la media, la mediana es insensible al efecto de valores
extremos y, por tanto, se debe utilizar cuando la distribucin es asimtrica. La moda
sirve para todo tipo de variables, pero es ms apropiada para caracterizar datos
categricos porque, regularmente, con variables continuas es de esperar que todos los
datos sean distintos.
En cuanto a las medidas de dispersin, la desviacin tpica, la varianza y el error tpico
de la media nicamente poseen significado con variables cuantitativas. La amplitud o
rango es apropiada para todo tipo de variables, excepto para las nominales, en las que
no tiene sentido hablar de dispersin.
En lo relativo a los ndices de asimetra y curtosis, de nuevo solo tiene sentido
calcularlos con variables cuantitativas. En cuanto a los percentiles, slo tienen sentido
calcularlos con variables al menos ordinales, carecen de significado con variables
nominales. Para analizar variables categricas con escala nominal u ordinal se
recomienda utilizar medidas de frecuencia (proporcin o porcentaje) tablas del
contingencia y de frecuencias, as como grficos de sectores y barras.

MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central son estadsticos o parmetros que se
utilizan para representar a un conjunto de datos a travs de un solo
valor que se considera tpico o representativo de la serie, y, entorno al
cual, se encuentran localizados el resto de valores del conjunto de
datos. Las medidas de tendencia central ms utilizadas son: media
aritmtica o promedio, mediana y moda. Tambin se pueden utilizar
otros tipos de medias, la media geomtrica, cuadrtica, ponderada y
armnica.

MEDIA ARITMTICA
Es el valor caracterstico de una serie de datos en el caso que todos
tuvieran la misma magnitud. La media aritmtica, promedio o
simplemente media, es sensible al efecto de valores extremos no
representativos del conjunto datos y puede darse que su valor tampoco lo
sea. Por ello, no es la medida de tendencia central ms adecuada para
describir un conjunto de dados cuando la distribucin es bimodal o
multimodal. Se obtiene dividiendo el total que resulta de sumar las todas
observaciones, por el nmero de datos de la muestra o poblacin.
n

x i
x1 x2 x3 ...xn
x i 1
PARA UNA MUESTRA
n n
N

xx1 x2 x3 ...xn
i
i 1 PARA UNA POBLACIN
N N

MEDIA ARITMTICA: Propiedades
La suma de las desviaciones de un conjunto de datos con relacin a su
media es siempre cero. n

n n n n n x i n n

x x x x x nx x n
i 1
i
i 1
i
i 1 i 1
i
i 1
i
i 1
n
xi xi 0
i 1 i 1

Cualquier dato de la serie debe ser menor al producto de su media por


el nmero de datos.
n

x i
x i 1
n
n
n x xi xi n x
i 1

MEDIA ARITMTICA
Se obtuvo una muestra de los salarios de siete trabajadores de una
institucin educativa. Calcular la media aritmtica.
Trabajador 1 2 3 4 5 6 7
Salario (Q) 3400 6100 6200 2800 6100 4400 6000
n

x i
3400 6100 6200 2800 6100 4400 6000 35000
x i 1
5000
n 7 7
El salario promedio de trabajadores es de Q5,000.00. El salario de los
trabajadores, asumiendo que es igual para todos, es de Q5,000.00

Trabajador Salario (Q) x-media


1 3400 -1600
2 6100 1100
3 6200 1200
4 2800 -2200
5 6100 1100
6 4400 -600
7 6000 1000
Suma de desviaciones 0

MEDIA ARITMTICA Y VALORES ATPICOS

un valor atpico (en ingls outlier) es una observacin que es


numricamente distante del resto de los datos. En presencia de valores
atpicos, la media aritmtica puede no ser representativa del conjunto de
datos. Los valores atpicos pueden ser indicativos de datos que pertenecen a
una poblacin diferente del resto de las muestras establecidas. En estos
casos se puede utilizar la mediana o la media recortada como medida de
tendencia central. Para determinar si un valor es atpico o no, se puede
utilizar la prueba de Dixon (1953) o la prueba de Grubbs (1950,1969).
El mtodo ms utilizado por su sencillez y resultados es el propuesto por
Tukey, que toma como referencia el rango intercuartl (RIQ). En un diagrama
de caja se considera un valor atpico el que se encuentra 1.5 veces esa
distancia de uno de esos cuartiles (atpico leve) o a 3 veces esa distancia
(atpico extremo).

MEDIA ARITMTICA Y VALORES ATPICOS

La prueba de Grubbs utiliza un

xi x estadstica de prueba, T, que es la

Gc
diferencia absoluta entre el valor
atpico (xi) y el promedio de la
s muestra, dividida por la desviacin
estndar de la muestra.

Ordenar los nmero de menor a


mayor e identificar valores atpicos
xi xi 1 potenciales. Se obtiene calculando la
Dc distancia entre el valor atpico (xi) y
xmax xmin su vecino ms prximo (xi1) dividido
por la diferencia entre los valores
mximo y mnimo.

En ambos casos se utilizan tablas para obtener el estadstico tabulado. Si el


estadstico calculado es mayor que el tabulado, el dato es atpico.

MEDIANA (Me)
La mediana es el valor que se ubica exactamente a la mitad de un serie de datos
ordenados de menor a mayor. Cuando la cantidad de observaciones de la serie es
par, no hay un nmero en el medio, en este caso, la mediana es el promedio de las
dos observaciones que dejan igual cantidad de datos tanto por izquierda como por
la derecha. Cuando los datos contengan valores extremos, es preferible usar a la
mediana como medida de tendencia central. Por ejemplo, en el caso del tiempo de
laborar en una empresa.

Me 10
6 9 10 13 15 n=5

El 50% de las personas tienen menos de 10 aos de laborar en la


empresa y el otro 50% tiene ms de 10 aos.

10 11
Me 10.5
2
6 9 10 11 13 15 n=6

MODA (Mo)
La moda es el valor que se presenta con mayor frecuencia. Hay
situaciones en que dos o ms datos distintos se presentan en la serie
de datos se repiten con la misma frecuencia, o bien puede darse que
ningn dato se repita. De ah que la serie de datos pueda ser amodal,
bimodal o multimodal. Si contienen ms de dos modas, son
multimodales. Si todos los datos tienen la misma frecuencia, es
amodal. En los casos multimodales casi nunca se da la moda como
medida de tendencia central porque ofrecer tres o ms modas no
resulta de mucha ayuda para describir los datos.
Trabajador 1 2 3 4 5 6 7
Salario (Q) 3400 6100 6200 2800 6100 4400 6000

El salario ms comn entre los trabajadores de la


empresa es de Q6100.00

OTROS TIPOS DE MEDIAS

MEDIA PONDERADA
Se utiliza cuando en un conjunto de datos, cada uno tiene un factor de
importancia relativa, el cual puede expresarse como frecuencia o
porcentaje.
xp
xpi i

p i

En junio, una inversionista compr 300 acciones a Q200 cada una. En agosto
compr 400 acciones ms a Q250. En noviembre compr 450 acciones, pero el
precio baj a 230 cada ttulo. Cul es el precio promedio ponderado de cada
accin?

Un estudiante obtuvo 80 y 50 puntos en dos exmenes con 20% de


ponderacin. Obtuvo 70 puntos en el laboratorio del curso que tiene 30% de
ponderacin Cul es la nota promedio ponderada?

OTROS TIPOS DE MEDIAS
MEDIA GEOMTRICA
La media geomtrica resulta til para promediar porcentajes, ndices, cifras
relativas y datos que cambian en el tiempo, de un periodo a otro, donde se
necesita conocer una tasa promedio de crecimiento o decrecimiento de una serie
temporal. La media geomtrica no se ve tan afectada por valores extremos. La
media geomtrica de un conjunto de n nmeros positivos se define como la raz
ensima del producto de n observaciones, as:

n
xg n
x i 1
i n x1 x2 x3 ...xn

Otro modelo de aplicacin de la media geomtrica se relaciona con la


determinacin de un cambio porcentual promedio durante cierto periodo. La
frmula es:
Valor final
xg n 1
Valor inicial
Nota: Los porcentajes se utilizan en forma decimal, a las tasas de incremento o
decrecimiento se les suma o resta al 100%, respectivamente.

OTROS TIPOS DE MEDIAS
MEDIA GEOMTRICA: EJEMPLOS
A continuacin se enlista el incremento porcentual de ventas de una
empresa durante los pasados 5 aos. Determine la media geomtrica
del incremento anual de ventas en ese periodo.

La informacin mostrada es el costo de un ao de estudios en


universidades pblicas y privadas en 1980-1981 y 2007-2008. Cul es
la media geomtrica del incremento anual en dicho periodo en los dos
tipos de institucin educativa? Compare las tasas de incremento.

OTROS TIPOS DE MEDIAS
MEDIA ARMNICA
La media armnica es el recproco, de la media aritmtica de los recprocos del
conjunto de datos. Se utiliza para promediar datos expresados como razn:
valores de rapidez, rendimientos o precios por artculo. Los datos de la serie
deben ser comparables en relacin algn aspecto. La media armnica resulta
poco influida por valores mucho ms grandes que el resto de datos, siendo en
cambio sensible a valores mucho ms pequeos. Para calcularla se divide el
nmero de valores n entre la suma de los recprocos de todos los valores, de la
siguiente forma:
1 n n
xa
1 n 1 n
1 1 1 1
n 1 ...
i 1 xi i 1 xi
x1 x2 x3 xn

Un comerciante compr un cargamento de 330 kilogramos de manzana a Q12.00/kg. Poco despus


compr otros 180 kg a Q22.00/kg y una tercera compra de 264 kg a Q15.00/kg. Cul es el precio
promedio al que compr las manzanas?

Un vehculo recorre 280 km en cuatro tramos. Los primeros 70 km los recorre a 90 km/h, el siguiente
tramo a 40 k/h, el tercer tamo a 75 km/h y el ltimo tramo de 70 km a 60 km/h. Calcular la velocidad
promedio en el trayecto de los 280 kilmetros.

OTROS TIPOS DE MEDIAS
MEDIA CUADRTICA
La media cuadrtica o RMS (root mean square), es la raz cuadrada de la
media aritmtica de los cuadrados de los valores. Se puede utilizar
cuando en la serie de datos se tienen valores negativos cuyo efecto en el
resultado se considera irrelevante. No es afectada considerablemente
por valores extremos, por eso, tambin se utiliza para promediar
dimetros en plantaciones forestales donde la variabilidad de los
dimetros puede ser alta. La desviacin estndar es una media
cuadrtica.
n

i
x 2
x12 x22 x32 ... xn2
xc i 1

n n

Relacin de orden entre los tipos de medias: xa xg x xc



OTROS TIPOS DE MEDIAS
MEDIA CUADRTICA: EJEMPLOS
Se tienen los datos de altura y dimetro de una muestra de 7 rboles
de pinus radiata. Calcular la media cuadrtica del dimetro y la altura.
Dimetro (cm) altura (m)
22.5 18.4
46.3 34.3
32.7 26.4
44.1 33.2
33.8 27.5
23.6 19.5
27.4 22.1

You might also like