Professional Documents
Culture Documents
TEXTO PARALELO
INTRODUCCIN
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
Distribucin normal.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas
de negocios o instituciones gubernamentales.
La estadstica se divide en dos grandes reas:
La estadstica descriptiva, que se dedica a los mtodos de recoleccin, descripcin,
visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos
pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros
estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son:
histograma, pirmide poblacional, clsters, entre otros.
La estadstica inferencial, que se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de
las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca
de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas si/no (prueba de hiptesis), estimaciones de caractersticas numricas
(estimacin), pronsticos de futuras observaciones, descripciones de asociacin
(correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras
tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos estadsticos
obtenidos en dos recuentos de la poblacin hebrea. El rey David por otra parte, orden a Joab,
general del ejrcito hacer un censo de Israel con la finalidad de conocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos
peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos
y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos para calcular
los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los
recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios
pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los
recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el
nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del
imperio.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico,
Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes
operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y
surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos
econmicos.
Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los recursos
nacionales, comprensiva de datos sobre organizacin poltica, instrucciones sociales, comercio y
podero militar. Durante el siglo XVII aport indicaciones ms concretas de mtodos de
observacin y anlisis cuantitativo y ampli los campos de la inferencia y la teora Estadstica.
Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica.
En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban
conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer empleo
de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de
Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso destruir
la antigua creencia popular de que en los aos terminados en siete mora ms gente que en los
restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus
de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms
personas que en los dems. Los procedimientos de Neumann fueron conocidos por el astrnomo
ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio de la vida
humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las
compaas de seguros.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora
de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de
promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la
ciencia.
Cada vez es mayor la proporcin de investigadores, en las ms diversas disciplinas cientficas, que
realizan anlisis estadsticos de datos como procedimiento formal para llegar a conclusiones o
apoyar procesos de decisin sobre las hiptesis de la investigacin.
Los recursos de la estadstica para la investigacin cientfica pueden considerarse como un
conjunto de herramientas conceptuales que poseen sus propias condiciones de aplicacin y pautas
de uso. Respetando ambos aspectos, las conclusiones que se realizan sobre las informaciones
tratadas convenientemente con herramientas estadsticas, tendrn una base slida. En caso
contrario, las conclusiones pueden ser errneas e, incluso, engaosas.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica
como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de
determinada poblacin; es decir, una funcin de valores de muestra.
"La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa
o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples
llamados individuales o particulares".
Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para recoger,
organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones
razonables basadas en tal anlisis.
"La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos
sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los
fenmenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la estadstica,
debido al gran campo de aplicacin que posee.
La investigacin en Psicologa, Sociologa y Educacin, al igual que ocurre en otras ciencias, en
buena medida se basa en el manejo de recursos estadsticos como elementos indispensables para
llegar a conclusiones aceptables por el resto de la comunidad cientfica. Dada la peculiaridad de
su objeto de estudio, inabordable en la mayora de los casos si no es a travs de perspectivas
complejas de relacin entre variables, la atencin de los investigadores en las ciencias humanas y
sociales se concentra cada vez ms en la llamada Estadstica Multivariante. Los diseos complejos
de investigacin y anlisis, las aportaciones ms recientes de la informtica para la aplicacin de
tcnicas avanzadas de manipulacin de datos y la discusin de estos aspectos desde perspectivas
tericas y aplicadas, preocupan y concentran a multitud de profesionales cuyo quehacer cotidiano
es el estudio de cmo se investiga, haciendo de ello su especialidad. Paralelamente, otras
especialidades dentro de estas ciencias utilizan el conocimiento ya elaborado y retransmitido,
preocupadas ms por los resultados y posibilidades que por las condiciones de aplicacin y los
fundamentos de uso, de tal forma que se ha propiciado la utilizacin de las tcnicas estadsticas,
sin considerar la adecuacin de stas a las condiciones en las que se aplican.
A su vez, las ciencias sociales se han visto apabulladas en los ltimos aos por avances
vertiginosos en informtica y aplicaciones estadsticas (Manheim, 1982; Rossi y otros, 1983), y
muy especialmente en la psicologa (Judd y otros, 1995), lo que favorece una absorcin de poca
calidad por parte de los especialistas en reas no metodolgicas. Por otro lado, la adopcin de
procedimientos informticos para realizar tareas metodolgicas no parece ser una solucin
inmediata, considerando la ansiedad que generan los ordenadores, fenmeno muy generalizado.
La fusin de esta creciente complicacin de las herramientas de anlisis, junto con la discrepancia
entre los objetivos de formacin y la necesidad de uso de los recursos estadsticos, consigue
finalmente que el especialista en reas aplicadas tienda a descuidar aspectos muy bsicos, previos
a la aplicacin de estos recursos estadsticos complejos. Por otro lado, en muchas ocasiones, la
aplicacin de herramientas estadsticas se deja arrastrar por hiptesis de comodidad, en el sentido
de aplicarse para permitir la ejecucin de una prueba o el ajuste de un modelo, no porque son las
estrategias ms adecuadas, sino porque son las ms cmodas.
ESTADISTICA DESCRIPTIVA
ESTADSTICA
ANALISIS ESTADSTICO
DATOS Y VARIABLES
CLASIFICACIN DE VARIABLES
Las variables pueden clasificarse en: categricas o cualitativas (atributos), no tienen ningn grado
de comparacin numrica, ejemplo: sexo, estado civil; y numricas o cuantitativas, son
caractersticas factibles de expresar por medio de nmeros, estas pueden ser Discretas, que solo
pueden tomar ciertos valores aislados en un intervalo, y Continuas, que pueden tomar cualquier
valor en un intervalo.
REPRESENTACIN DE DATOS
Los datos son colecciones de un nmero cualquiera de observaciones relacionadas entre si, para
que sean tiles se deben organizar de manera que faciliten su anlisis, se puedan seleccionar
tendencias, describir relaciones, determinar causas y efectos y permitan llegar a conclusiones
lgicas y tomar decisiones bien fundamentadas; por esa razn es necesario conocer lo mtodos de
Organizacin y Representacin, la finalidad de stos mtodos es permitir ver rpidamente todas
las caractersticas posibles de los datos que se han recolectado.
Representacin Tabular:
Presenta la variable y las frecuencias con que los valores de stas se encuentran
presentes en el estudio.
Representacin Grfica :
Se llaman grficas a las diferentes formas de expresar los datos utilizando los medios de
representacin que proporciona la geometra.
Diagrama de Puntos. Muestra la frecuencia con que aparece cada uno de los valores.
Diagrama de Tallo y Hoja. Es til para realizar una exploracin preliminar del conjunto,
genera una imagen adecuada de ellos sin perder informacin.
Distribucin de Frecuencias. Es una forma de sintetizar los datos y consiste en valerse de
una tabla para clasificar los datos segn su magnitud, en ella se seala el nmero de veces
que aparece cada uno de los valores. Cuando se dispone de un gran nmero de valores
discretos o cuando las variables son continuas, tiene sentido formar una tabla que presente
la distribucin de frecuencias de los datos agrupados en intervalos o clases, de igual tamao
si es posible, sin embargo una tabla de este tipo supone una concentracin de datos que
produce prdida de informacin.
DISTRIBUCIN DE FRECUENCIAS
DEFINICIONES
Clases o intervalos de clase: Grupo de valores que describen una caracterstica. Deben
incluir todas las observaciones y ser excluyentes. Los intervalos contienen los lmites de
clase que son los puntos extremos del intervalo. Se denominan intervalos cerrados, cuando
contienen ambos lmites e intervalos abiertos si incluyen solo un lmite.
Limites Reales: Sirven para mantener la continuidad de las clases
Anchura o tamao del intervalo: es la diferencia entre los lmites reales de una clase
Nmero de clases: es el nmero total de grupos en que se clasifica la informacin, se
recomienda que no sea menor que 5 ni mayor que 15
Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los
puntos medios coincidan con los datos observados para minimizar el error.
Frecuencia: es el nmero de veces que aparece un valor
Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba de un determinado
valor o lmite de clase.
Frecuencia Relativa: Indica la proporcin que representa la frecuencia de cada intervalo
de clase en relacin al total, es til para comparar varias distribuciones con parmetros de
referencia uniformes.
Frecuencia Acumulada Relativa: Indica la proporcin de datos que se encuentra por
arriba o debajo de cierto valor o lmite de clase.
Polgono de Frecuencias: Se puede obtener uniendo cada punto medio (marca de clase)
de los rectngulos del histograma con lneas rectas, teniendo cuidado de agregar al inicio
y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del reas.
Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin
porque el manejo de un menor nmero de datos provoca tambin menos errores en su
manipulacin. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente
estudiados.
El nmero de sujetos que componen la muestra suele ser inferior que el de la poblacin, pero
suficiente para que la estimacin de los parmetros determinados tenga un nivel de confianza
adecuado. Para que el tamao de la muestra sea idneo es preciso recurrir a su clculo.
DISTRIBUCION DE FRECUENCIAS
1) RANGO.
Es una medida de dispersin que se obtiene como la diferencia entre el nmero mayor y el nmero
menor de los datos.
R = N_max - N_min
Ejemplo. Dados los nmeros: 5, 10, 12, 8, 13, 9, 15 R= 15- 5
2) AMPLITUD TOTAL.
Simplemente se obtiene sumndole 1 al rango. AT = (R+1)
3) LAS CLASES.
Estn formadas por dos extremos. el menor se llama lmite inferior el mayor se llama lmite
superior. hay distintos tipos de clases.
Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99)
Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando.
Estas medidas permiten conocer diversas caractersticas de esta serie de datos. Las medidas de
posicin son de dos tipos:
a) Medidas de posicin central: informan sobre los valores medios de la serie de datos.
b) Medidas de posicin no centrales: informan de como se distribuye el resto de los valores de
la serie.
a) Medidas de posicin central
Las principales medidas de posicin central son las siguientes:
1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de
media, siendo las ms utilizadas:
a) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite.
La suma de todos estos productos se divide por el total de datos de la muestra:
Xm (X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn
= * nn)
---------------------------------------------------------------------------
------------
n
b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican
todo estos resultados y al producto fiinal se le calcula la raz "n" (siendo "n" el total de datos de la
muestra).
Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media
geomtrica.
La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin,
etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores. En
todo caso, la media aritmtica es la medida de posicin central ms utilizada.
Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo
que no se pierde ninguna informacin.
Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como
geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de
la serie. Estos valores anmalos podran condicionar en gran medida el valor de la media,
perdiendo sta representatividad.
2.- Mediana: es el valor de la serie de datos que se sita justamente en el centro de la muestra (un
50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en
su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces
que se ha repetido).
3.- Moda: es el valor que ms se repite en la muestra.
Ejemplo: vamos a utilizar la tabla de distribucin de frecuencias con los datos de la estatura de
los alumnos que vimos en la leccin 2.
Luego:
Xm = 1,253
Luego:
Xm = 1,253
En este ejemplo la media aritmtica y la media geomtrica coinciden, pero no tiene siempre por
qu ser as.
3.- Mediana:La mediana de esta muestra es 1,26 cm, ya que por debajo est el 50% de los valores
y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas
acumuladas.
En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se situara exactamente
entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la
divisin entre el 50% inferior y el 50% superior.
4.- Moda:
Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria
cuenta con 3 modas.
Existen diversas medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor
ms elevado y el valor ms bajo.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como
sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el nmero
de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamao de la
muestra.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados
estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza,
ms dispersos estn.
4.- Coeficiente de varizacin de Pearson: se calcula como cociente entre la desviacin tpica y
la media.
Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase (leccin 2)
y vamos a calcular sus medidas de dispersin.
1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego el
rango de esta muestra es 10 cm.
2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego, aplicamos la frmula:
Por lo tanto, la varianza es 0,0010
3.- Desviacin tpica: es la raz cuadrada de la varianza. Luego:
4.- Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacin tpica y la
media de la muestra.
Cv = 0,0320 / 1,253
Luego,
Cv = 0,0255
El inters del coeficiente de variacin es que al ser un porcentaje permite comparar el nivel de
dispersin de dos muestras. Esto no ocurre con la desvacin tpica, ya que viene expresada en las
mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersin de una serie de datos de la altura de los alumnos
de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones tpicas
(una viene vienes expresada en cm y la otra en kg). En cambio, sus coeficientes de variacin son
ambos porcentajes, por lo que s se pueden comparar.
[4.6]
[4.7]
[4.10]
[4.11]
[4.12]
Si una distribucin es simtrica con respecto a la media m y si el tercer momento central E[(X -
m )3] existe, entonces ste debe ser cero.
Cabe hacer notar que, si E[(X - m )3] = 0, no implica que la distribucin sea simtrica, pero si es
simtrica, entonces E[(X - m )3] = 0. Sin embargo es costumbre usar la expresin
En algunos casos se pueden calcular los momentos directamente usando la definicin, sin
embargo, habr ocasiones en que resulta ms sencillo si usamos una funcin auxiliar, y
calculamos su esperanza, esto es:
[4.13]
[4.14]
Cuando t = 1,
[4.15]
Las probabilidades son muy tiles, ya que pueden servir para desarrollar estrategias. Por ejemplo,
algunos automovilistas parecen mostrar una mayor tendencia a aumentar la velocidad si creen que
existe un riesgo pequeo de ser multados; los inversionistas estarn ms interesados en invertirse
dinerosi las posibilidades de ganar son buenas. El punto central en todos estos casos es la capacidad
de cuantificar cuan probable es determinado evento. En concreto decimos que las probabilidades
se utilizan para expresar cuan probable es un determinado evento.
2 La probabilidad clsica de un evento E, que denotaremos por P(E), se define como el nmero de
eventoselementales que componen al evento E, entre el nmero de eventos elementales que
componen el espacio maestral:
DISTRIBUCIN BINOMIAL
Esta distribucin corresponde a la realizacin de un experimento aleatorio que cumple con las
siguientes condiciones:
* Al realizar el experimento slo son posible dos resultados: el suceso A, llamado xito, o su
contrario A, llamado fracaso.
* La probabilidad del suceso A es constante, es decir, no vara de una prueba del experimento a
otra. Si llamamos p a la probabilidad de A, p(A) = P, entonces p(A) = 1 p = q
Como el clculo de estas probabilidades puede resultar algo tedioso se han construido tablas para
algunos valores de n y p que facilitan el trabajo.
b) Utilizacin de la frmula
Por ejemplo:
Cul es la probabilidad de obtener exactamente 2 caras al lanzar una misma moneda 6 veces ?
Donde:
q = 1 p (0.50)
X = ocurrencia del evento o xitos deseados = 2 (para efectos de la tabla binomial tmese como
r)
n = nmero de intentos
DISTRIBUCIN DE POISSON
La distribucin de POISSON es tambin un caso particular de probabilidad de variable
aleatoria discreta, el cual debe su nombre a Simon Denis Poisson (1781-1840), un francs
que la desarroll a partir de los estudios que realiz durante la ltima etapa de su vida.
Esta distribucin se utiliza para describir ciertos procesos.
Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad de rea,
tiempo, pieza, etc:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc.
- # de bacterias por c m2 de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo, rea, o
producto, la frmula a utilizar es:
donde:
p(X) = probabilidad de que ocurran x xitos, cuando el nmero promedio de ocurrencia de
ellos es l.
l = media o promedio de xitos por unidad de tiempo, rea o producto
e = 2.718 (base de logaritmo neperiano o natural)
X = variable que nos denota el nmero de xitos que se desea que ocurra
Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por unidad
de tiempo, rea o producto es totalmente al azar y que cada intervalo de tiempo es
independiente de otro intervalo dado, as como cada rea es independiente de otra rea
dada y cada producto es independiente de otro producto dado.
Clculo de la distribucin de probabilidad de Poisson por tres mtodos:
a) Utilizacin del Minitab 15.
b) Utilizacin de la frmula
c) Utilizacin de las tablas de Poisson
Por ejemplo:
Si un banco recibe en promedio (l=) 6 cheques sin fondo por da, cules son las
probabilidades de que reciba:
a) cuatro cheques sin fondo en un da dado (x),
b) 10 cheques sin fondos en cualquiera de dos das consecutivos?
(e= 2.718281828)
DISTRIBUCIN NORMAL
La distribucin normal es tambin un caso particular de probabilidad de variable aleatoria
contnua, fue reconocida por primera vez por el francs Abraham de Moivre (1667-
1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y
formul la ecuacin de la curva; de ah que tambin se le conozca, ms comnmente, como la
"campana de Gauss". La distribucin de una variable normal est completamente determinada
por dos parmetros, su media () y su desviacin estndar (). Con esta notacin, la densidad de
la normal viene dada por la ecuacin:
Existen dos razones bsicas por las cuales la distribucin normal ocupa un lugar tan prominente
en la estadstica:
Tiene algunas propiedades que la hacen aplicable a un gran nmero de situaciones en la que es
necesario hacer inferencias mediante la toma de muestras.
Propiedad:
No importa cules sean los valores de y para una distribucin de probabilidad normal, el rea
total bajo la curva siempre es 1, de manera que podemos pensar en reas bajo la curva como si
fueran probabilidades. Matemticamente es verdad que:
1. Aproximadamente el 68% de todos los valores de una poblacin normalmente distribuida se
encuentra dentro de 1 desviacin estndar de la media.
2. Aproximadamente el 95.5% de todos los valores de una poblacin normalmente distribuida
se encuentra dentro de 2 desviaciones estndar de la media.
3. Aproximadamente el 99.7% de todos los valores de una poblacin normalmente distribuida
se encuentra dentro de 3 desviaciones estndar de la media.
Relacin entre el rea bajo la curva de distribucin normal de probabilidad y la distancia a la media
medida en desviaciones estndar.
Estas grficas muestran tres formas diferentes de medir el rea bajo la curva normal. Sin embargo,
muy pocas de las aplicaciones de la distribucin normal de probabilidad implican intervalos de
exactamente (ms o menos) 1, 2 3 desviaciones estndar a partir de la media. Para estos casos
existen tablas estadsticas que indican porciones del rea bajo la curva normal que estn contenidas
dentro de cualquier nmero de desviaciones estndar (ms o menos) a partir de la media.
En la que:
Muestreo Aleatorio
Una muestra se dice que es extrada al azar cuando la manera de seleccin es tal, que cada elemento
de la poblacin tiene igual oportunidad de ser seleccionado. Una muestra aleatoria es tambin
llamada una muestra probabilstica son generalmente preferidas por los estadsticos porque la
seleccin de las muestras es objetiva y el error muestral puede ser medido en trminos de
probabilidad bajo la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo
aleatorio simple, muestreo sistemtico, muestreo estratificado y muestreo de conglomerados.
Error Estndar:
La desviacin estndar de una distribucin, en el muestreo de un estadstico, es frecuentemente
llamada el error estndar del estadstico. Por ejemplo, la desviacin estndar de las medias de todas
la muestras posibles del mismo tamao, extradas de una poblacin, es llamada el error estndar
de la media. De la misma manera, la desviacin estndar de las proporciones de todas las muestras
posibles del mismo tamao, extradas de una poblacin, es llamada el error estndar de la
proporcin. La diferencia entre los trminos "desviacin estndar" y "error de estndar" es que la
primera se refiere a los valoresoriginales, mientras que la ltima est relacionada con valores
calculados. Un estadstico es un valor calculado, obtenido con los elementos incluidos en una
muestra.
La teora de muestreo puede emplearse para obtener informacin acerca de muestras obtenidas
aleatoriamente de una poblacin conocida. Sin embargo, desde un punto de vista practico, suele
ser mas importante y ser capaz de inferir informacin acerca de una poblacin a partir de muestras
de ellas. Dichos problemas son tratados por la inferencia estadstica que utiliza principios de
muestreo. Un problema importante de la inferencia estadstica es la estimacin de parmetros
poblacionales o simplemente parmetros ( como la media y la varianza poblacionales ), a partir de
los estadsticos mustrales correspondientes o estadsticos ( como la media y la varianza muestral.
1.- La media de la distribucin muestral de las medias es x , la media poblacional. Por lo tanto, la
media muestral x es un estimado sin sesgo de la media poblacional .
s2 = ( N-1/ N ) 2
2 =( N/ N-1 )s2
Se encuentra que 2 = 2 , de modo que 2 es un estimado sin sesgo de 2 .Sin embargo es un estimado
de .En trminos de esperanza matemtica se poda decir que un estadstico no esta sesgado si su
esperanza es igual al parmetro poblacional correspondiente. Por lo tanto, x y 2 no estn sesgados
, porque E
Estimados Eficientes
Si las distribuciones mustrales de dos estadsticos tienen la misma media o esperanza matemtica
entonces el estadstico con la menor varianza se denomina estimador eficiente de la media ,
mientras que el otro estadstico se le llama estimador ineficiente. Los valores correspondientes de
los estadsticos se conocen, respectivamente , como estimadores eficientes. Si se consideran todos
los estadsticos posibles, cuyas distribuciones mustrales tienen la misma media, aquel con la
menor varianza suele denominarse el mejor o mas eficiente estimador de dicha media.
En un estudio de investigacin, el error de tipo I tambin mal llamado error de tipo alfa () ( es
la probabilidad de que ocurra este error), es el error que se comete cuando el investigador rechaza
la hiptesis nula (Ho) siendo sta verdadera en la poblacin. Es equivalente a encontrar un
resultado falso positivo, porque el investigador llega a la conclusin de que existe una diferencia
entre las hiptesis cuando en realidad no existe. es tambin conocido como nivel de significancia,
si el nivel de confianza es 95% el nivel de significancia vendra a ser 5%
En un estudio de investigacin, el error de tipo II, tambin llamado error de tipo beta () ( es la
probabilidad de que exista ste error), se comete cuando el investigador no rechaza la hiptesis
nula siendo sta falsa en la poblacin. Es equivalente a la probabilidad de un resultado falso
negativo, ya que el investigador llega a la conclusin de que ha sido incapaz de encontrar una
diferencia que existe en la realidad.
Se acepta en un estudio que el valor del error beta debe estar entre el 5 y el 20%..
Caracterizacin
Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con
media y varianza 2. Sea
Sin embargo, dado que la desviacin estndar no siempre es conocida de antemano, Gosset estudi
un cociente relacionado,
donde
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de
muestras de dos distribuciones normales se distribuye tambin normalmente, la distribucin t
puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.
LA PRUEBA JI CUADRADA
X20 =
Puede demostrar que X0 sigue aproximadamente la distribucin ji cuadrada con k-p-1 grados de
libertad, donde p representa el numero de parmetros de la distribucin hipottica estimada por el
medio de estadstica de muestra. Esta aproximacin se mejora cuando n aumenta. Rechazaramos
la hiptesis de que X se ajusta ala distribucin hipottica si X0>X k-p-1
Un punto que debe advertirse en la aplicacin de este procedimiento de prueba se refiere ala
magnitud de las frecuencias esperadas. Si estas frecuencias esperadas son demasiado pequeas,
entonces X0 no reflejan la desviacin de las observaciones respecto alas esperadas, si no solo las
mas pequeas de las frecuencias esperadas. No hay un acuerdo general en relacin con el valor
mnimo de las frecuencias esperadas, aunque los valores de 3,4 y 5 se utilizan ampliamente como
mnimos. Si la frecuencia esperada es demasiado pequea, puede combinarse con la frecuencia
esperada en un intervalo de clase adyacente. Las frecuencias observadas correspondientes se
combinaran tambin en ese caso, y k se reducir en 1. No se requiere que los intervalos de clase
sean de igual ancho.
Ejemplo
Una distribucin completamente especificada Un cientfico de computadoras ha desarrollado un
algoritmo para generar enteros pseudoaleatorios sobre el intervalo 0-9. Codifica el algoritmo y
genera 1000 dgitos pseudoaleatorios. Los datos se muestran en la tabla 11-3. Existe evidencia
de que el generador de nmeros aleatorios esta trabajando correctamente?
Si esta trabajando de manera correcta, entonces los valores 0-9 deben seguir la distribucin
uniforme discreta, la cual implica que cada uno de los enteros debe ocurrir exactamente 100 veces.
Esto es, las frecuencias esperadas E =100 para I=0,1,.,9 Puesto que estas frecuencias estimadas
pueden estimarse sin que sea necesario estimular ningn parmetro a partir de los datos de muestra,
la prueba resultante de bondad de ajuste de la ji cuadrada tendr k-p-1=10-0-1=9 grados de
libertad.
Total
0123456789
Frecuencia Observada O 94 93 112 101 104 95 100 99 108 94 1000
Frecuencias Esperada E 100 100 100 100 100 100 100 100 100 100 1000
El valor esperado de la estadstica de prueba es 2 2 2 2
X20 = =
Puesto que X =16.92 no somos capaces de rechazar la hiptesis de que los datos proviene de una
distribucin uniforme discreta. En consecuencia, el generador de nmeros aleatorios parece estar
trabajando en forma satisfactoria.
1. Test de Kolmogorov-Smirnov
Donde:
Fn (x): frecuencia observada acumulada.
n: N total de orden
N: N total de datos.
En el caso de la frecuencia terica acumulada, sta se determina a travs de la funcin de
Gumbel.
Una vez determinadas ambas frecuencias, se obtiene el supremo de las diferencias entre
ambas, en la i-sima posicin de orden, que se denomina D.
Representaciones de Spline
En la terminologa del dibujo mecnico, una spline es una banda flexible que se utiliza para
producir una curva suave a travs de un conjunto de puntos designados. Varios pesos pequeos se
distribuyen a lo largo de la banda para mantenerla en posicin sobre la mesa de dibujo mientras se
traza la curva. Es habitual describir la curva spline como una funcin
cbica polinmica cuyas primera y segunda derivada son continuas a travs de las distintas
secciones de la curva. Por otra parte, una superficie spline se puede describir como dos conjuntos
de curvas ortogonales de spline
Existe una gran variedad de curvas y superficies spline. Adems se les prefiere por la gran
diversidad de formas que pueden tomar, Fig 1 y Fig 2
Especificacin de spline
Existen tres mtodos equivalentes para especificar una representacin de spline particular:
1. Podemos establecer el conjunto de condiciones de frontera que se imponen en la spline
2. Podemos establecer la matriz que caracteriza la spline
3. podemos establecer un conjunto de funciones de combinacin que determinan la manera en que
se combinan las restricciones geomtricas en la curva para calcular posiciones a lo largo de la
trayectoria de la curva.
A fin de ilustrar estos procedimiento, suponga que tenemos la siguiente representacin polinmica
cbica paramtrica para la coordenada de x a lo largo de la trayectoria de una
seccin de la spline:
x(u ) = a x u 3 + bx u 2 + c x u + d x , 0 u 1
Por ejemplo, se podran establecer las condiciones de frontera para esta curva, en las coordenadas
de extremo x(0) y x(1) y en las primeras derivadas paramtricas en los extremos x(0) y x(1).
Estas cuatro condiciones de frontera son suficientes para determinar los valores de los cuatro
coeficientes.
A partir de las condiciones de frontera, obtenemos la matriz que caracteriza esta curva de
spline al volver a expresar de nuevo la ecuacin (1) como el producto
Dado un conjunto de puntos de control, las spline de interpolacin cbica se obtienen al ajustar
los puntos de entrada con una curva polinmica cbica alrededor de la curva que pasa por todos
los puntos de control (en este caso de interpolacin). Suponga que tenemos n+1 puntos de control
que se especifican con las coordenadas
p k = ( x k y k z k ), k = 0, 1, 2, , n
Podemos describir el polinomio cbico paramtrico que se debe ajustar entre cada par de
puntos de control con el siguiente conjunto de ecuaciones
x(u ) = a x u 3 + bx u 2 + c x u + d x ,
y (u ) = a y u 3 + b y u 2 + c y u + d y ,
z (u ) = a z u 3 + bz u 2 + c z u + d z , 0 u 1
Para obtener los coeficientes incgnitos, debemos establecer suficientes condiciones de frontera
en las uniones entre las secciones de la curva de manera que podamos obtener los valores
numricos para todos ellos.
Curvas de Bzier
Para cualquier n de puntos de control, el n de ptos de control que se debe aproximar y su
posicin relativa determinar el grado del polinomio de Bzier. Del mismo modo que con las spline
de interpolacin, se puede especificar una curva de Bzier con condiciones de frontera con una
matriz caracterstica o con funciones de combinacin. Usualmente se utiliza esta ltima tcnica.
El calculo recursivo de las funciones de combinacin de Bzier ,es dado por la expresin:
Bk ,n (u ) = (1 u )Bk ,n 1 (u ) + uBk 1,n 1 (u ), n > k 1
TEORA DE LA CORRELACIN
Correlacin Lineal
El propsito principal del anlisis de la correlacin lineal es medir la exactitud de una relacin
lineal entre dos variables. Al examinar un diagrama scatter nos percatamos de la relacin
entre la x e y.
Tipos de correlaciones
Correlacin no lineal
Regresin con Mnimos Cuadrados.
La manera de quitar esta subjetividad es considerar un criterio que cuantifique la suficiencia del
ajuste. Una forma de hacerlo es obtener una curva que minimice la diferencia entre los datos y
la curva y el mtodo para llevar a cabo este objetivo es al que se le llama regresin con mnimos
cuadrados.
Regresin Lineal
El ejemplo mas simple de una aproximacin por mnimos cuadrados es el ajuste de una lnea
recta a un conjunto de parejas de datos observadas: (x1,y1), (x2,y2), ...,(xn,yn). La expresin
matemtica de una lnea recta es:
en donde a0 y a1 son coeficientes que representan la interseccin con el eje de las abscisas y la
pendiente, respectivamente y E es el error o residuo entre el modelo y las observaciones, que se
puede representar reordenando la ecuacin (1) como:
Por lo tanto, el error o residuo es la diferencia entre el valor real de y y el valor aproximado,
a0+a1x, predicho por la ecuacin lineal.
Una estrategia que obtiene la mejor lnea a travs de los puntos debe minimizar la suma de los
errores residuales, como en:
Otro criterio seria minimizar la suma de los valores absolutos de las diferencias, esto es:Una
tercera estrategia en el ajuste de una lnea optima es el criterio de mnimas. En este mtodo, la
lnea se escoge de tal manera que minimice la distancia mxima a la que se encuentra un punto
de la lnea recta. Esta estrategia esta mal condicionada para regresin ya que influye de manera
indebida sobre un punto externo, aislado, cuyo error es muy grande. Se debe notar que el criterio
mnimas algunas veces esta bien condicionado para ajustar una funcin simple a una funcin
complicada.
Una estrategia que ignora las restricciones anteriores es la de minimizar la suma de los cuadrados
de los residuos, Sr, de la siguiente manera:
Este criterio tiene muchas ventajas, incluyendo el que ajusta una lnea nica a un conjunto dado
de datos. Antes de analizar estas propiedades, se muestra un mtodo que determina los valores
de a0 y a1 que minimizan la ecuacin.
Para determinar los valores de las constantes a0 y a1, se deriva la ecuacin (3) con respecto a
cada uno de los coeficientes:
Ntese que se han simplificado los smbolos de la sumatoria; a menos que otra cosa se indique,
todas las sumatorias van desde i=1 hasta n. Igualando estas derivadas a cero, se genera un
mnimo Sr. Si se hace as, las ecuaciones anteriores se expresaran como:
Este resultado se puede usar junto con la ecuacin para obtener: en donde son la media de y y
x, respectivamente, quedndonos entonces la siguiente ecuacin para a0:
Esta prueba estadstica en su modelo matemtico, significa conocer la correlacin entre tres o
ms variables, en las que dos de ellas se asocian y la tercera se muestra sin cambio. Por lo tanto,
cabe formular la pregunta clave: qu tan estrechamente dependen las variables a y b, cuando c
se mantiene sin cambios?. En este sentido, se establece la interpretacin del presente
procedimiento.
Matemticamente, la frmula siguiente se define como correlacin mltiple:
Pasos:
1. Elaborar una tabla en la que se ordenen las observaciones de las diferentes variables: x, y,
z, etc.
4. Calcular los coeficientes de correlacin parcial para cada variable estudiada, mediante las
6. Comparar los valores de coeficiente mltiple y parcial de correlacin con los valores crticos
Hiptesis.
Ha. Entre las variables cantidad de lectura, edad y dimetro de la cabeza existe correlacin
significativa, as como dependencia.
Ho. Entre las variables cantidad de lectura, edad y dimetro de la cabeza no existe correlacin
significativa, as como dependencia.
Hay significancia entre la edad de los nios y su cantidad de lectura, y no hay significancia entre
el radio de sus cerebros.
ANLISIS DE VARIANZA
Se suele representar por MST, se le denomina varianza total o cuadrados medios totales, es
tambin un cociente y al numerador se le llama suma de cuadrados total y se representa por SST,
y el denominador (kn -1) grados de libertad.
Los resultados de un anova se suelen representar en una tabla como la siguiente:
Fuente de variacin G.L. SS MS F
Entre grupos k-1 SSA SSA/(k-1) MSA/MSE
Tratamientos
Dentro Error (n-1)k SSE SSE/k(n-1)
Total kn-1 SST
Y el cociente F se usa para realizar el contraste de la hiptesis de medias iguales. La regin crtica
para dicho contraste es F > F(k-1,(n-1)k)a
Algunas propiedades
Es fcil ver en la tabla anterior que
GLerror+ GLtrata = (n - 1) k + k - 1 = nk - k + k - 1 = nk - 1 = GLtotal
No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad, llamada
identidado propiedad aditiva de la suma de cuadrados:
SST = SSA + SSE
El anlisisde la varianza se puede realizar con tamaos muestrales iguales o distintos, sin
embargo es recomendable iguales tamaos por dos motivos:
La F es insensible a pequeas variaciones en la asuncin de igual varianza, si el tamao es igual.
Igual tamao minimiza la probabilidad de error tipo II.
3. Modelos de anlisis de la varianza
El anova permite distinguir dos modelos para la hiptesis alternativa:
Modelo I o de efectos fijos en el que la H1 supone que las k muestras son muestras de k
poblaciones distintas y fijas.
Modelo II o de efectos aleatoriosen el que se supone que las k muestras, se han seleccionado
aleatoriamente de un conjunto de m>k poblaciones.
Un ejemplo de modeloI de anova es que se asume que existen cinco poblaciones (sin
tratamiento, con poca sal, sin sal, etc.) fijas, de las que se han extrado las muestras.
Un ejemplo de modelo II sera: un investigador est interesado en determinar el contenido, y sus
variaciones, de grasas en las clulas hepticas de cobayas; toma del animalario 5 cobayas al azar
y les realiza, a cada una, 3 biopsias hepticas.
La manera ms sencilla de distinguir entre ambos modelos es pensar que, si se repitiera el estudio
un tiempo despus, en un modelo I las muestras seran iguales (no los individuos que las forman)
es decir corresponderan a la misma situacin, mientras que en un modelo II las muestras seran
distintas.
Aunque las asunciones iniciales y los propsitos de ambos modelos son diferentes, los clculos y
las pruebas de significacin son los mismos y slo difieren en la interpretacin y en algunas
pruebas de hiptesis suplementarias.
Anlisis de la varianza de dos factores
Es un diseode anova que permite estudiar simultneamente los efectos de dos fuentes de
variacin.
En cualquier caso, el investigador puede estar interesado en estudiar si hay, o no, diferencia en
la evolucin segn el sexo. En un anova de dos vas se clasifica a los individuos de acuerdo a dos
factores (o vas) para estudiar simultneamente sus efectos. En este ejemplo se haran cinco
grupos de tratamiento para los hombres y otros cinco para las mujeres, en total diez grupos; en
general, si el primer factor tiene a niveles y el segundo tiene b, se tendrn ab muestras o unidades
experimentales, cada una con n individuos o repeticiones.
Una observacin individual se representa como:
El primer subndice indica el nivel del primer factor, el segundo el nivel del segundo factor y el
tercero la observacin dentro de la muestra. Los factores pueden ser ambos de efectos fijos (se
habla entonces de modelo I), de efectos aleatorios (modelo II) o uno de efectos fijos y el otro de
efectos aleatorios (modelo mixto). El modelo matemtico de este anlisis es:
i o Ai b el efecto del nivel i del 11 factor, j es la media global, Donde o Bj e el efecto del nivel
j del 2 factor y ijk las desviaciones aleatorias alrededor de las medias, que tambin se asume
que estn normalmente 2.distribuidas, son independientes y tienen media 0 y varianza
A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo aade la de
aditividad de los efectos de los factores.
B)ij, se les )ij, (AB)ij, ( A los trminos ( denomina interaccinentre ambos factores y
representan el hecho de que el efecto de un determinado nivel de un factor sea diferente para
cada nivel del otro factor.
Para entender mejor este concepto de interaccin veamos un ejemplo sencillo sobre un anova
de dos factores, cada uno con dos niveles: supngase un estudio para analizar el efecto de un
somnfero teniendo en cuenta el sexo de los sujetos. Se eligen al azar dos grupos de hombres y
otros dos de mujeres. A un grupo de hombres y otro de mujeres se les suministra un placebo y a
los otros grupos el somnfero. Se mide el efecto por el tiempo que los sujetos tardan en dormirse
desde el suministro de la pldora.
Se trata de un anova de dos factores (sexo y frmaco) fijos, cada uno con dos niveles (hombre y
mujer para el sexo y somnfero y placebo para el frmaco). Los dos tipos de resultados posibles
se esquematizan en la figura
En la figura A se observa que las mujeres tardan ms en dormirse, tanto en el grupo tratado como
en el grupo placebo (hay un efecto del sexo) y que los tratados con placebo tardan ms en
dormirse que los tratados con somnfero en ambos sexos (hay un efecto del tratamiento). Ambos
efectos son fcilmente observables.
Sin embargo en la figura B es difcil cuantificar el efecto del somnfero pues es distinto en ambos
sexos y, simtricamente, es difcil cuantificar el efecto del sexo pues es distinto en ambos grupos
de tratamiento. En este caso, se dice que existe interaccin.
Podra, incluso, darse el caso de que se invirtieran los efectos de un factor para los distintos
niveles del otro, es decir, que las mujeres se durmieran antes con el somnfero y los hombres
antes con el placebo.
La interaccin indica, por tanto, que los efectos de ambos factores no son aditivos: cuando se
dan juntos, su efecto no es la suma de los efectos que tienen cuando estn por separado, por lo
que, si en un determinado estudio se encuentra interaccin entre dos factores, no tiene sentido
estimar los efectos de los factores por separado. A la interaccin positiva, es decir, cuando el
efecto de los factores actuando juntos es mayor que la suma de efectos actuando por separado,
en Biologa se le denomina sinergiao potenciacin y a la interaccin negativa inhibicin. En el
ejemplo de la figura B, se dira que el ser mujer inhibe el efecto del somnfero, o que el ser
hombre lo potencia (segn el sexo que se tome como referencia).
4. Anlisis de Varianza a una va: Diseo completamente aleatorizado
Hay varias formas en las cuales puede disearse un experimento ANOVA. Quizs el ms comn
es el diseo completamente aleatorizado a una va. El trmino proviene del hecho que varios
sujetos o unidades experimentales se asignan aleatoriamente a diferentes niveles de un solo
factor. Por ejemplo: varios empleados (unidades experimentales) pueden seleccionarse
aleatoriamente para participar en diversos tipos (niveles diferentes) de un programa de
capacitacin (el factor).
El anlisis de varianza se basa en una comparacin de la cantidad de variacin en cada uno de los
tratamientos. Si de un tratamiento al otro la variacin es significativamente alta, puede
concluirse que los tratamientos tienen efectos diferentes en las poblaciones.
a. Esta variacin entre el nmero total de las 14 observaciones. Esto se llama variacin total.
b. Existe variacin entre los diferentes tratamientos (muestras). Esto se llama variacin entre
muestras.
c. Existe variacin dentro de un tratamiento dado (muestra). Esto se denomina variacin
dentro de la muestra.
BIBLIOGRAFIA
http://www.indec.mecon.ar/
http://www.isapre.cl/lado-graficos99.htm
Utilizamos esta pgina para extraer los grficos con los que apoyamos o contrariamos nuestra
hiptesis.
http://www.ing.unp.edu.ar/estadisitio/graficos.htm
http://www.ull.es/publicaciones/latina/z8/r4el.htm
http://www.monografias.com/trabajos15/estadistica/estadistica.shtml
http://es.wikipedia.org/wiki/Estad%C3%ADstica
http://www.hrc.es/bioest/estadis_1.html
http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-indice.html
http://es.wikipedia.org/wiki/Estad%C3%ADstica_inferencial
http://www.mitecnologico.com/iem/Main/EstadisticaInferencial
http://sitios.ingenieria-usac.edu.gt/estadistica/estadistica2/estadisticadescriptiva.html
http://www.ditutor.com/inferencia_estadistica/estadistica_inferencial.html
http://www.slideshare.net/freddygarcia/estadistica-inferencial-presentation
http://eilae12007.blogspot.com/