Texto Paralelo

UNIVERSIDAD RURAL DE GUATEMALA
Facultad de Ciencias Jurdicas y Sociales

4to. Semestre
Seccin B
ESTADISTICA
TEXTO PARALELO
INTRODUCCIN
Estadstica es el Conjunto de informes numricos derivados de los censos de poblacin, de datos

del registro del estado civil y de informes de apropiaciones.
Estadstica es la disciplina que estudia cuantitativamente los fenmenos de masa o colectivos, o
sea, aquellos fenmenos cuyo estudio solo puede efectuarse a travs de una coleccin de
observaciones
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
Conjunto de mtodos cientficos ligados a la toma, organizacin, recopilacin, presentacin y

anlisis de datos, tanto para la deduccin de conclusiones como para tomar decisiones razonables
de acuerdo con tales anlisis.
ESTADSTICA
La estadstica es una ciencia referente a la recoleccin, anlisis e interpretacin de datos, ya sea

para ayudar en la resolucin de la toma de decisiones o para explicar condiciones regulares o
irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional.
Sin embargo estadstica es mucho ms que eso, dado que en otras palabras es el vehculo que
permite llevar a cabo el proceso relacionado con la investigacin cientfica.
Tambin se denominan estadsticas (en plural) a los datos estadsticos.
Distribucin normal.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas
de negocios o instituciones gubernamentales.
La estadstica se divide en dos grandes reas:
La estadstica descriptiva, que se dedica a los mtodos de recoleccin, descripcin,
visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos
pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros
estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son:
histograma, pirmide poblacional, clsters, entre otros.
La estadstica inferencial, que se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de
las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca
de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas si/no (prueba de hiptesis), estimaciones de caractersticas numricas
(estimacin), pronsticos de futuras observaciones, descripciones de asociacin
(correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras
tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay

tambin una disciplina llamada estadstica matemtica, la cual se refiere a las
bases tericas de la materia. La palabra estadsticas tambin se refiere al
resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en
estadsticas econmicas, estadsticas criminales, entre otros
BREVE HISTORIA DE LA ESTADISTICA
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos estadsticos
obtenidos en dos recuentos de la poblacin hebrea. El rey David por otra parte, orden a Joab,
general del ejrcito hacer un censo de Israel con la finalidad de conocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos
peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos
y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos para calcular
los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los
recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios
pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los
recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el
nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del
imperio.
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir

la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico,
Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes
operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y
surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos
econmicos.
Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los recursos
nacionales, comprensiva de datos sobre organizacin poltica, instrucciones sociales, comercio y
podero militar. Durante el siglo XVII aport indicaciones ms concretas de mtodos de
observacin y anlisis cuantitativo y ampli los campos de la inferencia y la teora Estadstica.
Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica.
En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban
conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer empleo
de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de
Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso destruir
la antigua creencia popular de que en los aos terminados en siete mora ms gente que en los
restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus
de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms
personas que en los dems. Los procedimientos de Neumann fueron conocidos por el astrnomo
ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio de la vida
humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las
compaas de seguros.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora
de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de
promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la
ciencia.
Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos

fundamentales para la teora Estadstica; la teora de los errores de observacin, aportada por
Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace, Gauss y
Legendre. A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por Correlacin,
que tena por objeto medir la influencia relativa de los factores sobre las variables. De aqu parti
el desarrollo del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la
ciencia biomtrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios
estudios sobre la medida de las relaciones.
Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior desarrollo del

clculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad,
se ha demostrado que el determinismo fue reconocido en la Fsica como resultado de las
investigaciones atmicas y que este principio se juzga aplicable tanto a las ciencias sociales como
a las fsicas.
LA RELACION DE LA ESTADISTICA CON OTRAS CIENCIAS
La estadstica es una rama de la matemtica que se refiere a la recoleccin, estudio e interpretacin

de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la
fsica hasta las ciencias sociales, ciencias de la salud como la Psicologa y la Medicina, y usada en
la toma de decisiones en reas de negocios e instituciones gubernamentales.
Cada vez es mayor la proporcin de investigadores, en las ms diversas disciplinas cientficas, que
realizan anlisis estadsticos de datos como procedimiento formal para llegar a conclusiones o
apoyar procesos de decisin sobre las hiptesis de la investigacin.
Los recursos de la estadstica para la investigacin cientfica pueden considerarse como un
conjunto de herramientas conceptuales que poseen sus propias condiciones de aplicacin y pautas
de uso. Respetando ambos aspectos, las conclusiones que se realizan sobre las informaciones
tratadas convenientemente con herramientas estadsticas, tendrn una base slida. En caso
contrario, las conclusiones pueden ser errneas e, incluso, engaosas.
Estadstica: es comnmente considerada como una coleccin de hechos numricos expresados en

trminos de una relacin sumisa, y que han sido recopilados a partir de otros datos numricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica
como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de
determinada poblacin; es decir, una funcin de valores de muestra.
"La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa
o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples
llamados individuales o particulares".
Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para recoger,
organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones
razonables basadas en tal anlisis.
"La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos
sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los
fenmenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la estadstica,
debido al gran campo de aplicacin que posee.
La investigacin en Psicologa, Sociologa y Educacin, al igual que ocurre en otras ciencias, en
buena medida se basa en el manejo de recursos estadsticos como elementos indispensables para
llegar a conclusiones aceptables por el resto de la comunidad cientfica. Dada la peculiaridad de
su objeto de estudio, inabordable en la mayora de los casos si no es a travs de perspectivas
complejas de relacin entre variables, la atencin de los investigadores en las ciencias humanas y
sociales se concentra cada vez ms en la llamada Estadstica Multivariante. Los diseos complejos
de investigacin y anlisis, las aportaciones ms recientes de la informtica para la aplicacin de
tcnicas avanzadas de manipulacin de datos y la discusin de estos aspectos desde perspectivas
tericas y aplicadas, preocupan y concentran a multitud de profesionales cuyo quehacer cotidiano
es el estudio de cmo se investiga, haciendo de ello su especialidad. Paralelamente, otras
especialidades dentro de estas ciencias utilizan el conocimiento ya elaborado y retransmitido,
preocupadas ms por los resultados y posibilidades que por las condiciones de aplicacin y los
fundamentos de uso, de tal forma que se ha propiciado la utilizacin de las tcnicas estadsticas,
sin considerar la adecuacin de stas a las condiciones en las que se aplican.
A su vez, las ciencias sociales se han visto apabulladas en los ltimos aos por avances
vertiginosos en informtica y aplicaciones estadsticas (Manheim, 1982; Rossi y otros, 1983), y
muy especialmente en la psicologa (Judd y otros, 1995), lo que favorece una absorcin de poca
calidad por parte de los especialistas en reas no metodolgicas. Por otro lado, la adopcin de
procedimientos informticos para realizar tareas metodolgicas no parece ser una solucin
inmediata, considerando la ansiedad que generan los ordenadores, fenmeno muy generalizado.
La fusin de esta creciente complicacin de las herramientas de anlisis, junto con la discrepancia
entre los objetivos de formacin y la necesidad de uso de los recursos estadsticos, consigue
finalmente que el especialista en reas aplicadas tienda a descuidar aspectos muy bsicos, previos
a la aplicacin de estos recursos estadsticos complejos. Por otro lado, en muchas ocasiones, la
aplicacin de herramientas estadsticas se deja arrastrar por hiptesis de comodidad, en el sentido
de aplicarse para permitir la ejecucin de una prueba o el ajuste de un modelo, no porque son las
estrategias ms adecuadas, sino porque son las ms cmodas.
ESTADISTICA DESCRIPTIVA
ESTADSTICA
Es el conjunto de procedimientos y tcnicas empleadas para recolectar, organizar y analizar datos,

los cuales sirven de base para tomar decisiones en las situaciones de incertidumbre que plantean
las ciencias sociales o naturales.
ESTADSTICA INDUCTIVA Y DEDUCTIVA
Uno de los problemas fundamentales de la Estadstica es el estudio de la relacin existente entre

una poblacin y sus muestras. Segn la direccin de tal relacin la Estadstica puede ser:
Deductiva: cuando a partir del conocimiento de la poblacin se trata de caracterizar cada

muestra posible.
Inductiva: Cuando a partir del conocimiento derivado de una muestra se pretende

caracterizar la poblacin.
ESTADSTICA DESCRIPTIVA E INFERENCIAL

Estadstica Descriptiva: Se refiere a la recoleccin, presentacin, descripcin, anlisis e
interpretacin de una coleccin de datos, esencialmente consiste en resumir stos con uno
o dos elementos de informacin (medidas descriptivas) que caracterizan la totalidad de los
mismos. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos
conclusiones sobre s mismos y no sobrepasan el conocimiento proporcionado por stos.
Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una
poblacin o de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se
conocen los elementos de una muestra.
Estadstica Inferencial se refiere al proceso de lograr generalizaciones acerca de las
propiedades del todo, poblacin, partiendo de lo especfico, muestra. las cuales llevan
implcitos una serie de riesgos. Para que stas generalizaciones sean vlidas la muestra
deben ser representativa de la poblacin y la calidad de la informacin debe ser controlada,
adems puesto que las conclusiones as extradas estn sujetas a errores, se tendr que
especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La
estadstica inferencial es el conjunto de tcnicas que se utiliza para obtener conclusiones
que sobrepasan los lmites del conocimiento aportado por los datos, busca obtener
informacin de un colectivo mediante un metdico procedimiento del manejo de datos de
la muestra.
En sus particularidades la Inferencia distingue la Estimacin y la Contrastacin de Hiptesis. Es

estimacin cuando se usan las caractersticas de la muestra para hacer inferencias sobre las
caractersticas de la poblacin. Es contrastacin de hiptesis cuando se usa la informacin de la
muestra para responder a interrogantes sobre la poblacin.
ANALISIS ESTADSTICO
El anlisis estadstico es todo el proceso de organizacin, procesamiento, reduccin e

interpretacin de datos para realizar inferencias.
DATOS Y VARIABLES
Cuando se consideran los mtodos de organizacin, reduccin y anlisis de datos estadsticos, se

hace necesario aclarar los siguientes conceptos.
Variables: es toda caracterstica que vara de un elemento a otro de la poblacin.

Datos: son medidas o valores de las caractersticas susceptibles de observar y contar, se
originan por la observacin de una o ms variables de un grupo de elementos o unidades.
CLASIFICACIN DE VARIABLES
Las variables pueden clasificarse en: categricas o cualitativas (atributos), no tienen ningn grado
de comparacin numrica, ejemplo: sexo, estado civil; y numricas o cuantitativas, son
caractersticas factibles de expresar por medio de nmeros, estas pueden ser Discretas, que solo
pueden tomar ciertos valores aislados en un intervalo, y Continuas, que pueden tomar cualquier
valor en un intervalo.
REPRESENTACIN DE DATOS
Los datos son colecciones de un nmero cualquiera de observaciones relacionadas entre si, para
que sean tiles se deben organizar de manera que faciliten su anlisis, se puedan seleccionar
tendencias, describir relaciones, determinar causas y efectos y permitan llegar a conclusiones
lgicas y tomar decisiones bien fundamentadas; por esa razn es necesario conocer lo mtodos de
Organizacin y Representacin, la finalidad de stos mtodos es permitir ver rpidamente todas
las caractersticas posibles de los datos que se han recolectado.
Representacin Tabular:
Presenta la variable y las frecuencias con que los valores de stas se encuentran
presentes en el estudio.
Representacin Grfica :
Se llaman grficas a las diferentes formas de expresar los datos utilizando los medios de
representacin que proporciona la geometra.
METODOS DE REPRESENTACIN DE DATOS CUANTITATIVOS
Arreglo de Datos. Es una forma de presentar los datos en un arreglo ascendente o

descendente. Ofrece las ventajas siguientes: describe los valores mnimos y mximos, en
l se pueden dividir los datos fcilmente en secciones, permite darse cuenta de los valores
que aparecen ms de una vez, se puede observar la distancia entre valores consecutivos.
Diagrama de Puntos. Muestra la frecuencia con que aparece cada uno de los valores.
Diagrama de Tallo y Hoja. Es til para realizar una exploracin preliminar del conjunto,
genera una imagen adecuada de ellos sin perder informacin.
Distribucin de Frecuencias. Es una forma de sintetizar los datos y consiste en valerse de
una tabla para clasificar los datos segn su magnitud, en ella se seala el nmero de veces
que aparece cada uno de los valores. Cuando se dispone de un gran nmero de valores
discretos o cuando las variables son continuas, tiene sentido formar una tabla que presente
la distribucin de frecuencias de los datos agrupados en intervalos o clases, de igual tamao
si es posible, sin embargo una tabla de este tipo supone una concentracin de datos que
produce prdida de informacin.
DISTRIBUCIN DE FRECUENCIAS
Organizacin de datos agrupados
DEFINICIONES
Clases o intervalos de clase: Grupo de valores que describen una caracterstica. Deben
incluir todas las observaciones y ser excluyentes. Los intervalos contienen los lmites de
clase que son los puntos extremos del intervalo. Se denominan intervalos cerrados, cuando
contienen ambos lmites e intervalos abiertos si incluyen solo un lmite.
Limites Reales: Sirven para mantener la continuidad de las clases
Anchura o tamao del intervalo: es la diferencia entre los lmites reales de una clase
Nmero de clases: es el nmero total de grupos en que se clasifica la informacin, se
recomienda que no sea menor que 5 ni mayor que 15
Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los
puntos medios coincidan con los datos observados para minimizar el error.
Frecuencia: es el nmero de veces que aparece un valor
Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba de un determinado
valor o lmite de clase.
Frecuencia Relativa: Indica la proporcin que representa la frecuencia de cada intervalo
de clase en relacin al total, es til para comparar varias distribuciones con parmetros de
referencia uniformes.
Frecuencia Acumulada Relativa: Indica la proporcin de datos que se encuentra por
arriba o debajo de cierto valor o lmite de clase.
GRFICOS DE UNA DISTRIBUCIN DE FRECUENCIAS

Los grficos: son tiles porque ponen en relieve y aclaran las tendencias que no se captan
fcilmente en la tabla, ayudan a estimar valores con una simple ojeada y brinda una
verificacin grfica de la veracidad de las soluciones.
Histograma: Est formado por rectngulos cuya base es la amplitud del intervalo y tiene
la caracterstica que la superficie que corresponde a las barras es representativa de la
cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que
tienen el mismo tamao o diferente ( intervalo variable). La utilizacin de los intervalos de
amplitud variable se recomienda cuando en alguno de los intervalos , de amplitud
constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los
intervalos sea mucho mayor que la de los dems, logrando as que las observaciones se
hallen mejor repartidas dentro del intervalo.
Polgono de Frecuencias: Se puede obtener uniendo cada punto medio (marca de clase)
de los rectngulos del histograma con lneas rectas, teniendo cuidado de agregar al inicio
y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del reas.
Curvas de frecuencia: no es ms que la curva suavizada que se traza sobre el polgono y

representa la asimetra y la curtosis que tiene la distribucin, permite visualizar un esquema
ms claro del patrn de datos. Existen varios tipos de curva de frecuencia: Curvas J,
Simtricas o Asimtricas (sesgada a la derecha o a la izquierda), Unimodales, Bimodales
y Multimodales.
Ojivas: Cuando se trata de relacionar observaciones en un mismo aspecto para dos

colectivos diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia,
es necesario tener una base estndar, la frecuencia relativa. La ojiva representa
grficamente la forma en que se acumulan los datos y permiten ver cuantas observaciones
se hallan por arriba o debajo de ciertos valores. Es til para obtener una medida de los
cuartiles, deciles , percentiles.
POBLACION Y MUESTRA
Es un subconjunto de casos o individuos de una poblacin estadstica.
Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin,

para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica la inclusin de
sujetos en la muestra debe seguir una tcnica de muestreo. En tales casos, puede obtenerse una
informacin similar a la de un estudio exhaustivo con mayor rapidez y menor coste (vanse las
ventajas de la eleccin de una muestra, ms abajo).
Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin
porque el manejo de un menor nmero de datos provoca tambin menos errores en su
manipulacin. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente
estudiados.
El nmero de sujetos que componen la muestra suele ser inferior que el de la poblacin, pero
suficiente para que la estimacin de los parmetros determinados tenga un nivel de confianza
adecuado. Para que el tamao de la muestra sea idneo es preciso recurrir a su clculo.
DISTRIBUCION DE FRECUENCIAS
Agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de

observaciones en cada categora. Esto significa una de las cosas ms importantes de la matemtica,
su estadstica con la agrupacin de datos. La distribucin de frecuencias presenta las observaciones
clasificadas de modo que se pueda ver el nmero existente en cada clase.
Elementos fundamentales para elaborar una distribucin de frecuencia:
1) RANGO.
Es una medida de dispersin que se obtiene como la diferencia entre el nmero mayor y el nmero
menor de los datos.
R = N_max - N_min
Ejemplo. Dados los nmeros: 5, 10, 12, 8, 13, 9, 15 R= 15- 5
2) AMPLITUD TOTAL.
Simplemente se obtiene sumndole 1 al rango. AT = (R+1)
3) LAS CLASES.
Estn formadas por dos extremos. el menor se llama lmite inferior el mayor se llama lmite
superior. hay distintos tipos de clases.
Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99)
4)EL NUMERO DE CLASES.

Se determina a travs de la formula de Sturges, la cual es valida cuando el No de observaciones
sea menor o igual a 500. Formula.
Nc= 1 + 3.33log ( N )
Donde:
Nc es el nmero de clases. N es la cantidad de muestras tomadas.
5) VALOR DEL INTERVALO O AMPLITUD

Se Obtiene por medio de la ecuacin de dicta:
Vi = AT / Nc
Donde:
Vi es el valor de intervalo AT es la amplitud total Nc es el nmero de clase
MEDIDAS DE TENDENCIA CENTRAL MEDIA, MEDIANA Y MODA
Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando.
Estas medidas permiten conocer diversas caractersticas de esta serie de datos. Las medidas de
posicin son de dos tipos:
a) Medidas de posicin central: informan sobre los valores medios de la serie de datos.
b) Medidas de posicin no centrales: informan de como se distribuye el resto de los valores de
la serie.
a) Medidas de posicin central
Las principales medidas de posicin central son las siguientes:
1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de
media, siendo las ms utilizadas:
a) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite.
La suma de todos estos productos se divide por el total de datos de la muestra:
Xm (X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn
= * nn)
---------------------------------------------------------------------------
------------
n
b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican
todo estos resultados y al producto fiinal se le calcula la raz "n" (siendo "n" el total de datos de la
muestra).
Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media
geomtrica.
La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin,
etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores. En
todo caso, la media aritmtica es la medida de posicin central ms utilizada.
Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo
que no se pierde ninguna informacin.
Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como
geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de
la serie. Estos valores anmalos podran condicionar en gran medida el valor de la media,
perdiendo sta representatividad.
2.- Mediana: es el valor de la serie de datos que se sita justamente en el centro de la muestra (un
50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en
su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces
que se ha repetido).
3.- Moda: es el valor que ms se repite en la muestra.
Ejemplo: vamos a utilizar la tabla de distribucin de frecuencias con los datos de la estatura de
los alumnos que vimos en la leccin 2.
Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada
x x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Vamos a calcular los valores de las distintas posiciones centrales:
1.- Media aritmtica:

Xm (1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 *
= 3) + (1,30 * 3)
----------------------------------------------------------------------------
----------------------
30
Luego:
Xm = 1,253
Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm.
2.- Media geomtrica:
X = ((1,20^ 1) * (1,21^4) * (1,22^ 4) * .....* (1,29^3)* (1,30^3)) ^

(1/30)
Luego:
Xm = 1,253
En este ejemplo la media aritmtica y la media geomtrica coinciden, pero no tiene siempre por
qu ser as.
3.- Mediana:La mediana de esta muestra es 1,26 cm, ya que por debajo est el 50% de los valores
y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas
acumuladas.
En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se situara exactamente
entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la
divisin entre el 50% inferior y el 50% superior.
4.- Moda:
Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria
cuenta con 3 modas.
Medidas de Dispersin Desviacin Estndar, Varianza
Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos

concentrados, o ms o menos dispersos.
Existen diversas medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor
ms elevado y el valor ms bajo.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como
sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el nmero
de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamao de la
muestra.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados
estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza,
ms dispersos estn.
3.- Desviacin tpica: Se calcula como raz cuadrada de la varianza.
4.- Coeficiente de varizacin de Pearson: se calcula como cociente entre la desviacin tpica y
la media.
Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase (leccin 2)
y vamos a calcular sus medidas de dispersin.
Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada
x x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego el
rango de esta muestra es 10 cm.
2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego, aplicamos la frmula:
Por lo tanto, la varianza es 0,0010
3.- Desviacin tpica: es la raz cuadrada de la varianza. Luego:
4.- Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacin tpica y la
media de la muestra.
Cv = 0,0320 / 1,253
Luego,
Cv = 0,0255
El inters del coeficiente de variacin es que al ser un porcentaje permite comparar el nivel de
dispersin de dos muestras. Esto no ocurre con la desvacin tpica, ya que viene expresada en las
mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersin de una serie de datos de la altura de los alumnos
de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones tpicas
(una viene vienes expresada en cm y la otra en kg). En cambio, sus coeficientes de variacin son
ambos porcentajes, por lo que s se pueden comparar.
MOMENTOS, SESGO Y CURTOSIS

veremos que la media y la varianza son casos particulares de cantidades ms generales llamadas
momentos.
Consideremos la funcin g(X) = Xk, k =1, 2, A la esperanza matemtica de Xk se le denomina k-

simo momento de X.
[4.6]
Si k = 1 , se tiene que el primer momento de X es la media de X, es decir
[4.7]
E[X1] = m (compare con la definicin de la seccin 4.4). [4.8]
Si g(X) = (X-m )k,, obtenemos el k-simo momento central de X. Esto es:

[4.9]
Si el primer momento central existe, debe ser igual a cero.
El segundo momento central de X es la varianza (compare con la definicin de varianza de la

seccin 4.4). Por lo tanto la varianza de puede obtener como el segundo momento de X menos el
cuadrado de la media.
[4.10]
[4.11]
Obsrvese que de aqu se llega a
[4.12]
SESGO Y CURTOSIS DE UNA DISTRIBUCIN
Si una distribucin es simtrica con respecto a la media m y si el tercer momento central E[(X -
m )3] existe, entonces ste debe ser cero.
Cabe hacer notar que, si E[(X - m )3] = 0, no implica que la distribucin sea simtrica, pero si es
simtrica, entonces E[(X - m )3] = 0. Sin embargo es costumbre usar la expresin
como la medida de la simetra, ya que cuando una distribucin es simtrica,

g = 0 y toma un valor positivo (o negativo) para una distribucin que tiene una gran cola en el
lado derecho (izquierdo) y g es llamado sesgo de la distribucin.
Fig. 4. 10 Distribucin Distribucin con sesgo Distribucin con sesgo
simtrica positivo negativo
g=0 g>0 g<0
La cantidad se usa como la medida de la altura o curtosis de una

distribucin.
Fig. 4. 11 Distribucin Distribucin Distribucin leptocrtica

platocrtica mesocrtica
g * < 30 g*=3 g*>3
FUNCION GENERATRIZ DE MOMENTOS
En algunos casos se pueden calcular los momentos directamente usando la definicin, sin
embargo, habr ocasiones en que resulta ms sencillo si usamos una funcin auxiliar, y
calculamos su esperanza, esto es:
[4.13]
Derivando esta expresin

Derivando k veces, se tiene:
Cuando t = 0, la expresin del lado derecho es el k-simo momento de X
[4.14]
Cuando t = 1,
[4.15]
TEORA ELEMENTAL DE LA PROBABILIDAD
Las probabilidades son muy tiles, ya que pueden servir para desarrollar estrategias. Por ejemplo,
algunos automovilistas parecen mostrar una mayor tendencia a aumentar la velocidad si creen que
existe un riesgo pequeo de ser multados; los inversionistas estarn ms interesados en invertirse
dinerosi las posibilidades de ganar son buenas. El punto central en todos estos casos es la capacidad
de cuantificar cuan probable es determinado evento. En concreto decimos que las probabilidades
se utilizan para expresar cuan probable es un determinado evento.
2.1.1 Conceptoclsico y como frecuencia relativa. 1 Definicin Clsico. La probabilidad clsica:

el enfoque clsico o a priori de la probabilidad se basa en la consideracin de que los resultados
de un experimento son igualmente posibles. Empleando el punto de vista clsico, la probabilidad
de que suceda un evento se calcula dividiendo el nmero de resultados favorables, entre el nmero
de resultados posibles.
2 La probabilidad clsica de un evento E, que denotaremos por P(E), se define como el nmero de
eventoselementales que componen al evento E, entre el nmero de eventos elementales que
componen el espacio maestral:
Como frecuencia relativa 1 probabilstica: se basa en las frecuencias relativas. La probabilidad de

que un evento ocurra a largo plazo se determina observando en que fraccin de tiempo sucedieron
eventos semejantes en el pasado. La probabilidad de que un evento suceda se calcula por medio
de:
P (E) nmero de veces que el evento ocurri en el pasado
Numero total de observaciones
2 Definicin Frecuencia. La definicin frecuentita consiste en definir la probabilidad como el

lmite cuando n tiende a infinito de la proporcin o frecuencia relativa del suceso. Sea un
experimento aleatorio cuyo espacio maestral es E Sea A cualquier suceso perteneciente a E Si
repetimos n veces el experimento en las mismas Condiciones, la frecuencia relativa del suceso A
ser: Cuando el nmero n de repeticiones se hace muy grande la frecuencia relativa converge hacia
un valorque llamaremos probabilidad del suceso A. Es imposible llegar a este lmite, ya que no
podemos repetir el experimento un nmero infinito de veces, pero si podemos repetirlo muchas
veces y observar como las frecuencias relativas tienden a estabilizarse Esta definicin frecuentita
de la probabilidad se llama tambin probabilidad a posteriori ya que slo podemos dar la
probabilidad de un suceso despus de repetir y observar un gran nmero de veces el experimento
aleatorio correspondiente. Algunos autores las llaman probabilidades tericas.
2.1.2 interpretacin subjetiva de probabilidad
1 La probabilidad subjetiva de un evento: se la asigna la personaque hace el estudio, y depende

del conocimientoque esta persona tenga sobre el tema. Precisamente por su carcter de
subjetividad no se considera con validez cientfica, aunque en la vida diaria es de las ms comunes
que se utilizan al no apoyarse ms que en el sentido comn y los conocimientos previos, y no en
resultados estadsticos.
DISTRIBUCION BIMONIAL, NORMAL Y DE POISSON
DISTRIBUCIN BINOMIAL
La distribucin Binomial es un caso particular de probabilidadde variable aleatoria discreta, y por

sus aplicaciones, es posiblemente la ms importante.
Esta distribucin corresponde a la realizacin de un experimento aleatorio que cumple con las
siguientes condiciones:
* Al realizar el experimento slo son posible dos resultados: el suceso A, llamado xito, o su
contrario A, llamado fracaso.
* Al repetir el experimento, el resultado obtenido es independiente de los resultados obtenidos

anteriormente.
* La probabilidad del suceso A es constante, es decir, no vara de una prueba del experimento a
otra. Si llamamos p a la probabilidad de A, p(A) = P, entonces p(A) = 1 p = q
* En cada experimento se realizan n pruebas idnticas.

Todo experimento que tenga estas caractersticas se dice que sigue el modelo de la distribucin
Binomial o distribucin de Bernoulli.
En general, si se tienen n ensayos Bernoulli con probabilidad de xito p y de fracaso q, entonces

la distribucin de probabilidad que la modela es la distribucin de probabilidad binomialy su
regla de correspondencia es:
Como el clculo de estas probabilidades puede resultar algo tedioso se han construido tablas para
algunos valores de n y p que facilitan el trabajo.
Calculo de la distribucin de probabilidad binomial por tres mtodos:
a) Utilizacin del Minitab 15.
b) Utilizacin de la frmula
c) Utilizacin de las tablas binomiales
Por ejemplo:
Cul es la probabilidad de obtener exactamente 2 caras al lanzar una misma moneda 6 veces ?
Donde:
P(X) es la probabilidad de ocurrencia del evento
p es la probabilidad de xito del evento (en un intento) (0.5)

q es la probabilidad de fracaso del evento (en un intento) y se define como
q = 1 p (0.50)
X = ocurrencia del evento o xitos deseados = 2 (para efectos de la tabla binomial tmese como
r)
n = nmero de intentos
DISTRIBUCIN DE POISSON
La distribucin de POISSON es tambin un caso particular de probabilidad de variable
aleatoria discreta, el cual debe su nombre a Simon Denis Poisson (1781-1840), un francs
que la desarroll a partir de los estudios que realiz durante la ltima etapa de su vida.
Esta distribucin se utiliza para describir ciertos procesos.
Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad de rea,
tiempo, pieza, etc:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc.
- # de bacterias por c m2 de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo, rea, o
producto, la frmula a utilizar es:

donde:
p(X) = probabilidad de que ocurran x xitos, cuando el nmero promedio de ocurrencia de
ellos es l.
l = media o promedio de xitos por unidad de tiempo, rea o producto
e = 2.718 (base de logaritmo neperiano o natural)
X = variable que nos denota el nmero de xitos que se desea que ocurra
Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por unidad
de tiempo, rea o producto es totalmente al azar y que cada intervalo de tiempo es
independiente de otro intervalo dado, as como cada rea es independiente de otra rea
dada y cada producto es independiente de otro producto dado.
Clculo de la distribucin de probabilidad de Poisson por tres mtodos:
a) Utilizacin del Minitab 15.
b) Utilizacin de la frmula
c) Utilizacin de las tablas de Poisson

Por ejemplo:
Si un banco recibe en promedio (l=) 6 cheques sin fondo por da, cules son las
probabilidades de que reciba:
a) cuatro cheques sin fondo en un da dado (x),
b) 10 cheques sin fondos en cualquiera de dos das consecutivos?
(e= 2.718281828)
DISTRIBUCIN NORMAL
La distribucin normal es tambin un caso particular de probabilidad de variable aleatoria
contnua, fue reconocida por primera vez por el francs Abraham de Moivre (1667-
1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y
formul la ecuacin de la curva; de ah que tambin se le conozca, ms comnmente, como la
"campana de Gauss". La distribucin de una variable normal est completamente determinada
por dos parmetros, su media () y su desviacin estndar (). Con esta notacin, la densidad de
la normal viene dada por la ecuacin:
que determina la curva en forma de campana que tan bien conocemos
Existen dos razones bsicas por las cuales la distribucin normal ocupa un lugar tan prominente
en la estadstica:
Tiene algunas propiedades que la hacen aplicable a un gran nmero de situaciones en la que es
necesario hacer inferencias mediante la toma de muestras.
La distribucin normal casi se ajusta a las distribuciones de frecuencias reales observadas en

muchos fenmenos, incluyendo caractersticas humanas, resultados de procesos fsicos y
muchas otras medidas de inters para los administradores, tanto en el sector pblico como en
el privado.
Propiedad:
No importa cules sean los valores de y para una distribucin de probabilidad normal, el rea
total bajo la curva siempre es 1, de manera que podemos pensar en reas bajo la curva como si
fueran probabilidades. Matemticamente es verdad que:
1. Aproximadamente el 68% de todos los valores de una poblacin normalmente distribuida se
encuentra dentro de 1 desviacin estndar de la media.
2. Aproximadamente el 95.5% de todos los valores de una poblacin normalmente distribuida
se encuentra dentro de 2 desviaciones estndar de la media.
3. Aproximadamente el 99.7% de todos los valores de una poblacin normalmente distribuida
se encuentra dentro de 3 desviaciones estndar de la media.
Relacin entre el rea bajo la curva de distribucin normal de probabilidad y la distancia a la media
medida en desviaciones estndar.
Estas grficas muestran tres formas diferentes de medir el rea bajo la curva normal. Sin embargo,
muy pocas de las aplicaciones de la distribucin normal de probabilidad implican intervalos de
exactamente (ms o menos) 1, 2 3 desviaciones estndar a partir de la media. Para estos casos
existen tablas estadsticas que indican porciones del rea bajo la curva normal que estn contenidas
dentro de cualquier nmero de desviaciones estndar (ms o menos) a partir de la media.
Afortunadamente tambin se puede utilizar una distribucin de probabilidad normal estndar

para encontrar reas bajo cualquier curva normal. Con esta tabla se determina el rea o la
probabilidad de que la variable aleatoria distribuida normalmente est dentro de ciertas distancias
a partir de la media. Estas distancias estn definidas en trminos de desviaciones estndar.
Para cualquier distribucin normal de probabilidad, todos los intervalos que contienen el mismo
nmero de desviaciones estndar a partir de la media contendrn la misma fraccin del rea total
bajo la curva para cualquier distribucin de probabilidad normal. Esto hace que sea posible usar
solamente una tabla de la distribucin de probabilidad normal estndar.
El valor de z est derivado de la frmula:
En la que:
x = valor de la variable aleatoria de inters.

= media de la distribucin de la variable aleatoria.
= desviacin estndar de la distribucin.
z = nmero de desviaciones estndar que hay desde x a la media de la distribucin. (El uso de
z es solamente un cambio de escala de medicin del eje horizontal)
TEORA ELEMENTAL DEL MUESTREO
Muestreo Aleatorio
Una muestra se dice que es extrada al azar cuando la manera de seleccin es tal, que cada elemento
de la poblacin tiene igual oportunidad de ser seleccionado. Una muestra aleatoria es tambin
llamada una muestra probabilstica son generalmente preferidas por los estadsticos porque la
seleccin de las muestras es objetiva y el error muestral puede ser medido en trminos de
probabilidad bajo la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo
aleatorio simple, muestreo sistemtico, muestreo estratificado y muestreo de conglomerados.
Error Estndar:
La desviacin estndar de una distribucin, en el muestreo de un estadstico, es frecuentemente
llamada el error estndar del estadstico. Por ejemplo, la desviacin estndar de las medias de todas
la muestras posibles del mismo tamao, extradas de una poblacin, es llamada el error estndar
de la media. De la misma manera, la desviacin estndar de las proporciones de todas las muestras
posibles del mismo tamao, extradas de una poblacin, es llamada el error estndar de la
proporcin. La diferencia entre los trminos "desviacin estndar" y "error de estndar" es que la
primera se refiere a los valoresoriginales, mientras que la ltima est relacionada con valores
calculados. Un estadstico es un valor calculado, obtenido con los elementos incluidos en una
muestra.
TEORA DE LA ESTIMACIN ESTADSTICA

Estimacin de Parmetros
La teora de muestreo puede emplearse para obtener informacin acerca de muestras obtenidas
aleatoriamente de una poblacin conocida. Sin embargo, desde un punto de vista practico, suele
ser mas importante y ser capaz de inferir informacin acerca de una poblacin a partir de muestras
de ellas. Dichos problemas son tratados por la inferencia estadstica que utiliza principios de
muestreo. Un problema importante de la inferencia estadstica es la estimacin de parmetros
poblacionales o simplemente parmetros ( como la media y la varianza poblacionales ), a partir de
los estadsticos mustrales correspondientes o estadsticos ( como la media y la varianza muestral.
Estimados sin Sesgo
Si la media de la distribucin muestral de un estadstico es igual al parmetro poblacional

correspondiente, el estadstico se denomina estimador sin sesgo del parmetro; de otra manera, es
denominado estimador sesgado. Los valores correspondientes de dichos estadsticos se llaman
estimados sin sesgo o sesgados, respectivamente.
1.- La media de la distribucin muestral de las medias es x , la media poblacional. Por lo tanto, la
media muestral x es un estimado sin sesgo de la media poblacional .
2.- La media de la distribucin muestral de las varianzas es :
s2 = ( N-1/ N ) 2
donde 2 es la varianza poblacional y N es el tamao de la muestra .Entonces, la varianza muestral

s2 es un estimado sesgado de la varianza poblacional 2. Usando la varianza modificada.
2 =( N/ N-1 )s2
Se encuentra que 2 = 2 , de modo que 2 es un estimado sin sesgo de 2 .Sin embargo es un estimado
de .En trminos de esperanza matemtica se poda decir que un estadstico no esta sesgado si su
esperanza es igual al parmetro poblacional correspondiente. Por lo tanto, x y 2 no estn sesgados
, porque E
Estimados Eficientes
Si las distribuciones mustrales de dos estadsticos tienen la misma media o esperanza matemtica
entonces el estadstico con la menor varianza se denomina estimador eficiente de la media ,
mientras que el otro estadstico se le llama estimador ineficiente. Los valores correspondientes de
los estadsticos se conocen, respectivamente , como estimadores eficientes. Si se consideran todos
los estadsticos posibles, cuyas distribuciones mustrales tienen la misma media, aquel con la
menor varianza suele denominarse el mejor o mas eficiente estimador de dicha media.
La distribucin muestral de la media y la mediana tienen la misma media; a saber la media

poblacional. Sin embargo, la varianza de la distribucin muestral de las medias es mas pequea
que la varianza de la distribucin muestral de las medianas . por lo tanto, la media muestral ofrece
un estimado ineficiente de esta De todos los estadsticos que estiman la media poblacional, la
media muestral ofrece el mejor o mas eficiente estimado. En la practica , suelen usarse los
estimados ineficientes debido a la relativa facilidad con que se obtienen algunos de ellos.
TEORA ESTADSTICA DE LA DECISIN
Errores de tipo I y de tipo II
De Wikipedia, la enciclopedia libre

Saltar a navegacin, bsqueda
En un estudio de investigacin, el error de tipo I tambin mal llamado error de tipo alfa () ( es
la probabilidad de que ocurra este error), es el error que se comete cuando el investigador rechaza
la hiptesis nula (Ho) siendo sta verdadera en la poblacin. Es equivalente a encontrar un
resultado falso positivo, porque el investigador llega a la conclusin de que existe una diferencia
entre las hiptesis cuando en realidad no existe. es tambin conocido como nivel de significancia,
si el nivel de confianza es 95% el nivel de significancia vendra a ser 5%
En un estudio de investigacin, el error de tipo II, tambin llamado error de tipo beta () ( es la
probabilidad de que exista ste error), se comete cuando el investigador no rechaza la hiptesis
nula siendo sta falsa en la poblacin. Es equivalente a la probabilidad de un resultado falso
negativo, ya que el investigador llega a la conclusin de que ha sido incapaz de encontrar una
diferencia que existe en la realidad.
Se acepta en un estudio que el valor del error beta debe estar entre el 5 y el 20%..
El poder o potencia del estudio representa la probabilidad de observar en la muestra una

determinada diferencia o efecto, si existe en la poblacin. Es el complementario del error de tipo
II (1-).
TEORA DE LAS MUESTRAS PEQUEAS
En probabilidad y estadstica, la distribucin t (de t-Student) es una distribucin de probabilidad

que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el
tamao de la muestra es pequeo.
Aparece de manera natural al realizar la prueba t de Student para la determinacin de las

diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la
diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una
poblacin y sta debe ser estimada a partir de los datos de una muestra.
Caracterizacin
La distribucin t de Student es la distribucin de probabilidad del cociente

donde
Z tiene una distribucin normal de media nula y varianza 1

V tiene una distribucin chi-cuadrado con grados de libertad
Z y V son independientes
Si es una constante no nula, el cociente es una variable aleatoria que sigue la

distribucin t de Student no central con parmetro de no-centralidad .
[editar] Aparicin y especificaciones de la distribucin t de Student
Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con
media y varianza 2. Sea
la media muestral. Entonces
sigue una distribucin normal de media 0 y varianza 1.
Sin embargo, dado que la desviacin estndar no siempre es conocida de antemano, Gosset estudi
un cociente relacionado,
donde
es la varianza muestral y demostr que la funcin de densidad de T es

donde es igual a n 1.
La distribucin de T se llama ahora la distribucin-t de Student.
El parmetro representa el nmero de grados de libertad. La distribucin depende de ,
Intervalos de confianza derivados de la distribucin t de Student
El procedimiento para el clculo del intervalo de confianza basado en la t de Student consiste en

estimar la desviacin tpica de los datos S y calcular el error estndar de la media= S/(raz cuadrada
de n), siendo entonces el intervalo de confianza para la media = x media +- t (alfa/2) multiplicado
por (S/(raz cuadradada de n)).
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de
muestras de dos distribuciones normales se distribuye tambin normalmente, la distribucin t
puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.
para efectos prcticos el valor esperado y la varianza son :
E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3
LA PRUEBA JI CUADRADA
Prueba de bondad de ajuste de ji-cuadrada

El procedimiento de prueba requiere una muestra aleatoria de tamao n de la variable aleatoria X,
cuya funcin de densidad de probabilidad se desconoce. Estas n observaciones se arreglan en un
histograma de frecuencias, teniendo k intervalos de clase. Sea 01 la frecuencia observada en el
intervalo de la clase iesimo. De la distribucin de probabilidad hipottica, calculamos la frecuencia
esperada en el intervalo de clase iesimo, denotada E1. La estadstica de prueba es:
X20 =
Puede demostrar que X0 sigue aproximadamente la distribucin ji cuadrada con k-p-1 grados de
libertad, donde p representa el numero de parmetros de la distribucin hipottica estimada por el
medio de estadstica de muestra. Esta aproximacin se mejora cuando n aumenta. Rechazaramos
la hiptesis de que X se ajusta ala distribucin hipottica si X0>X k-p-1
Un punto que debe advertirse en la aplicacin de este procedimiento de prueba se refiere ala
magnitud de las frecuencias esperadas. Si estas frecuencias esperadas son demasiado pequeas,
entonces X0 no reflejan la desviacin de las observaciones respecto alas esperadas, si no solo las
mas pequeas de las frecuencias esperadas. No hay un acuerdo general en relacin con el valor
mnimo de las frecuencias esperadas, aunque los valores de 3,4 y 5 se utilizan ampliamente como
mnimos. Si la frecuencia esperada es demasiado pequea, puede combinarse con la frecuencia
esperada en un intervalo de clase adyacente. Las frecuencias observadas correspondientes se
combinaran tambin en ese caso, y k se reducir en 1. No se requiere que los intervalos de clase
sean de igual ancho.
Ejemplo
Una distribucin completamente especificada Un cientfico de computadoras ha desarrollado un
algoritmo para generar enteros pseudoaleatorios sobre el intervalo 0-9. Codifica el algoritmo y
genera 1000 dgitos pseudoaleatorios. Los datos se muestran en la tabla 11-3. Existe evidencia
de que el generador de nmeros aleatorios esta trabajando correctamente?
Si esta trabajando de manera correcta, entonces los valores 0-9 deben seguir la distribucin
uniforme discreta, la cual implica que cada uno de los enteros debe ocurrir exactamente 100 veces.
Esto es, las frecuencias esperadas E =100 para I=0,1,.,9 Puesto que estas frecuencias estimadas
pueden estimarse sin que sea necesario estimular ningn parmetro a partir de los datos de muestra,
la prueba resultante de bondad de ajuste de la ji cuadrada tendr k-p-1=10-0-1=9 grados de
libertad.
Total
0123456789
Frecuencia Observada O 94 93 112 101 104 95 100 99 108 94 1000
Frecuencias Esperada E 100 100 100 100 100 100 100 100 100 100 1000
El valor esperado de la estadstica de prueba es 2 2 2 2
X20 = =
Puesto que X =16.92 no somos capaces de rechazar la hiptesis de que los datos proviene de una
distribucin uniforme discreta. En consecuencia, el generador de nmeros aleatorios parece estar
trabajando en forma satisfactoria.
1. Test de Kolmogorov-Smirnov
Para la aplicacin del test sealado, es necesario determinar la Frecuencia observada

acumulada. Para la frecuencia observada en el caso especial de Gumbel, se ordena la
informacin de menor a mayor y se aplica:
Donde:
Fn (x): frecuencia observada acumulada.
n: N total de orden
N: N total de datos.
En el caso de la frecuencia terica acumulada, sta se determina a travs de la funcin de
Gumbel.
Una vez determinadas ambas frecuencias, se obtiene el supremo de las diferencias entre
ambas, en la i-sima posicin de orden, que se denomina D.
Luego, asumiendo un valor de significancia, se recurre a la tabla de valores crticos de D en

la prueba de bondad de ajuste de Kolmogorov-Smirnov, y considerando el tamao de la
muestra, se establece lo siguiente:
Si D < D tabla, se acepta que (el ajuste es adecuado, con el nivel de confiabilidad asumido.
AJUSTE DE CURVA Y MTODO DE MNIMOS CUADRADOS
Representaciones de Spline
En la terminologa del dibujo mecnico, una spline es una banda flexible que se utiliza para
producir una curva suave a travs de un conjunto de puntos designados. Varios pesos pequeos se
distribuyen a lo largo de la banda para mantenerla en posicin sobre la mesa de dibujo mientras se
traza la curva. Es habitual describir la curva spline como una funcin
cbica polinmica cuyas primera y segunda derivada son continuas a travs de las distintas
secciones de la curva. Por otra parte, una superficie spline se puede describir como dos conjuntos
de curvas ortogonales de spline
Existe una gran variedad de curvas y superficies spline. Adems se les prefiere por la gran
diversidad de formas que pueden tomar, Fig 1 y Fig 2
Especificacin de spline
Existen tres mtodos equivalentes para especificar una representacin de spline particular:
1. Podemos establecer el conjunto de condiciones de frontera que se imponen en la spline
2. Podemos establecer la matriz que caracteriza la spline
3. podemos establecer un conjunto de funciones de combinacin que determinan la manera en que
se combinan las restricciones geomtricas en la curva para calcular posiciones a lo largo de la
trayectoria de la curva.
A fin de ilustrar estos procedimiento, suponga que tenemos la siguiente representacin polinmica
cbica paramtrica para la coordenada de x a lo largo de la trayectoria de una
seccin de la spline:
x(u ) = a x u 3 + bx u 2 + c x u + d x , 0 u 1
Por ejemplo, se podran establecer las condiciones de frontera para esta curva, en las coordenadas
de extremo x(0) y x(1) y en las primeras derivadas paramtricas en los extremos x(0) y x(1).
Estas cuatro condiciones de frontera son suficientes para determinar los valores de los cuatro
coeficientes.
A partir de las condiciones de frontera, obtenemos la matriz que caracteriza esta curva de
spline al volver a expresar de nuevo la ecuacin (1) como el producto
Donde U es la matriz rengln de potencias del parmetro u y C es la matriz columna de

coeficientes. Al utiliza la ec. (2), es posible expresar las condiciones de frontera en forma de matriz
de coeficientes C como
C = M spline M geom
Donde M geom es una matriz de columnas de cuatro elementos que contiene los valores de
restricciones geomtricas (condiciones de frontera) en la spline y M spline es la matriz de 4x4 que
transforma loa valores de restriccin geomtrica a los coeficientes polinmicos y ofrece una
caracterizacin para la curva de spline. Por podemos construir
x (u ) = U M spline M geom
Por ltimo podemos ampliar la ec. (3), con el propsito de obtener una representacin polinmica
para la coordenada x en trminos de parmetros de restriccin geomtrica
x(u ) = g k BFk (u ) , k =0
donde gk son los parmetros de restriccin, como las coordenadas del punto de control y la
pendiente de la curva en los puntos de control , y BFk(u) son las funciones de combinacin
polinmica.
Mtodos de interpolacin de spline cbica
Esta clase de spline se utiliza con mayor frecuencia para establecer las trayectorias de los
movimientos de objetos o para ofrecer una representacin de un objeto o trazo existente. En
comparacin con los polinomios de orden superior, las spline cbicas requieren de menos clculos
y memoria computacional, a la vez que son ms estables. Las spline cbicas son ms flexibles para
el modelado de formas curvas arbitrarias.
Dado un conjunto de puntos de control, las spline de interpolacin cbica se obtienen al ajustar
los puntos de entrada con una curva polinmica cbica alrededor de la curva que pasa por todos
los puntos de control (en este caso de interpolacin). Suponga que tenemos n+1 puntos de control
que se especifican con las coordenadas
p k = ( x k y k z k ), k = 0, 1, 2, , n
Podemos describir el polinomio cbico paramtrico que se debe ajustar entre cada par de
puntos de control con el siguiente conjunto de ecuaciones
x(u ) = a x u 3 + bx u 2 + c x u + d x ,
y (u ) = a y u 3 + b y u 2 + c y u + d y ,
z (u ) = a z u 3 + bz u 2 + c z u + d z , 0 u 1
Para obtener los coeficientes incgnitos, debemos establecer suficientes condiciones de frontera
en las uniones entre las secciones de la curva de manera que podamos obtener los valores
numricos para todos ellos.
Curvas de Bzier
Para cualquier n de puntos de control, el n de ptos de control que se debe aproximar y su
posicin relativa determinar el grado del polinomio de Bzier. Del mismo modo que con las spline
de interpolacin, se puede especificar una curva de Bzier con condiciones de frontera con una
matriz caracterstica o con funciones de combinacin. Usualmente se utiliza esta ltima tcnica.
El calculo recursivo de las funciones de combinacin de Bzier ,es dado por la expresin:
Bk ,n (u ) = (1 u )Bk ,n 1 (u ) + uBk 1,n 1 (u ), n > k 1
TEORA DE LA CORRELACIN
Correlacin Lineal
El propsito principal del anlisis de la correlacin lineal es medir la exactitud de una relacin
lineal entre dos variables. Al examinar un diagrama scatter nos percatamos de la relacin
entre la x e y.
No hay correlacin cuando la configuracin de los puntos est esparcida.
No correlacin: A medida que aumenta x los valores de y se dispersan
Tipos de correlaciones
La correlacin puede ser positiva o negativa.

La positiva es cuando la variable y tiende a crecer y la negativa cuando la variable y tiende a
disminuir.
Correlacin Lineal Positiva: cuando la variable y (eje vertical) tiende a
crecer.
Correlacin Lineal Negativa: cuando la variable y (eje vertical) tiende a

disminuir. La relacin inferior es casi perfecta
Correlacin no lineal
Regresin con Mnimos Cuadrados.
Cuando se asocia un error sustancial a los datos, la interpolacin polinomial es inapropiada y

puede llevar a resultados no satisfactorios cuando se usa para predecir valores intermedios. Los
datos experimentales a menudo son de ese tipo. Una estrategia mas apropiada en estos casos es
la de obtener una funcin aproximada que ajuste adecuadamente el comportamiento o la
tendencia general de los datos, sin coincidir necesariamente con cada punto en particular. Una
lnea recta puede usarse en la caracterizacin de la tendencia de los datos sin pasar cobre ningn
punto en particular. Una manera de determinar la lnea, es inspeccionar de manera visual los
datos graficados y luego trazar la mejor lnea a travs de los puntos. Aunque este enfoque
recurre al sentido comn y es valido para clculos a simple vista es deficiente ya que es
arbitrario. Es decir, a menos que los puntos definan una lnea recta perfecta (en cuyo caso la
interpolacin seria apropiada), cada analista trazara rectas diferentes.
La manera de quitar esta subjetividad es considerar un criterio que cuantifique la suficiencia del
ajuste. Una forma de hacerlo es obtener una curva que minimice la diferencia entre los datos y
la curva y el mtodo para llevar a cabo este objetivo es al que se le llama regresin con mnimos
cuadrados.
Regresin Lineal
El ejemplo mas simple de una aproximacin por mnimos cuadrados es el ajuste de una lnea
recta a un conjunto de parejas de datos observadas: (x1,y1), (x2,y2), ...,(xn,yn). La expresin
matemtica de una lnea recta es:
en donde a0 y a1 son coeficientes que representan la interseccin con el eje de las abscisas y la
pendiente, respectivamente y E es el error o residuo entre el modelo y las observaciones, que se
puede representar reordenando la ecuacin (1) como:
Por lo tanto, el error o residuo es la diferencia entre el valor real de y y el valor aproximado,
a0+a1x, predicho por la ecuacin lineal.
Criterio para un mejor ajuste
Una estrategia que obtiene la mejor lnea a travs de los puntos debe minimizar la suma de los
errores residuales, como en:
Otro criterio seria minimizar la suma de los valores absolutos de las diferencias, esto es:Una
tercera estrategia en el ajuste de una lnea optima es el criterio de mnimas. En este mtodo, la
lnea se escoge de tal manera que minimice la distancia mxima a la que se encuentra un punto
de la lnea recta. Esta estrategia esta mal condicionada para regresin ya que influye de manera
indebida sobre un punto externo, aislado, cuyo error es muy grande. Se debe notar que el criterio
mnimas algunas veces esta bien condicionado para ajustar una funcin simple a una funcin
complicada.
Una estrategia que ignora las restricciones anteriores es la de minimizar la suma de los cuadrados
de los residuos, Sr, de la siguiente manera:
Este criterio tiene muchas ventajas, incluyendo el que ajusta una lnea nica a un conjunto dado
de datos. Antes de analizar estas propiedades, se muestra un mtodo que determina los valores
de a0 y a1 que minimizan la ecuacin.
Ajuste de una recta utilizando Mnimos Cuadrados.
Para determinar los valores de las constantes a0 y a1, se deriva la ecuacin (3) con respecto a
cada uno de los coeficientes:
Ntese que se han simplificado los smbolos de la sumatoria; a menos que otra cosa se indique,
todas las sumatorias van desde i=1 hasta n. Igualando estas derivadas a cero, se genera un
mnimo Sr. Si se hace as, las ecuaciones anteriores se expresaran como:
Ahora considerando que

= n, las ecuaciones se pueden expresar como un conjunto de dos ecuaciones lineales simultaneas
con dos incgnitas
A estas ecuaciones se les conoce como ecuaciones normales. Se pueden resolver

simultneamente y obtener:
Este resultado se puede usar junto con la ecuacin para obtener: en donde son la media de y y
x, respectivamente, quedndonos entonces la siguiente ecuacin para a0:
CORRELACIN MLTIPLE Y CORRELACIN PARCIAL
Esta prueba estadstica en su modelo matemtico, significa conocer la correlacin entre tres o
ms variables, en las que dos de ellas se asocian y la tercera se muestra sin cambio. Por lo tanto,
cabe formular la pregunta clave: qu tan estrechamente dependen las variables a y b, cuando c
se mantiene sin cambios?. En este sentido, se establece la interpretacin del presente
procedimiento.
Matemticamente, la frmula siguiente se define como correlacin mltiple:
Las frmulas para correlacin parcial se definen matemticamente como sigue:
Pasos:
1. Elaborar una tabla en la que se ordenen las observaciones de las diferentes variables: x, y,
z, etc.
2. De acuerdo con la frmula de coeficiente de correlacin simple de Pearson, calcular por
cada pareja de variables: XY, XZ, YZ, etc.
3. Calcular el coeficiente de correlacin mltiple en funcin de la variable independiente
considerada en la hiptesis alterna, mediante la frmula rx.zy.
4. Calcular los coeficientes de correlacin parcial para cada variable estudiada, mediante las
frmulas rxy.z, rxz.y y rzy.x.
5. Calcular los grados de libertad (gl). gl = N tamao de la muestra - K variables.
6. Comparar los valores de coeficiente mltiple y parcial de correlacin con los valores crticos
correspondientes, distribuidos en funcin de la probabilidad. Tabla de coeficientes de
correlacin en niveles de P 0.05 y 0.01.
7. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:
Objetivo: Conocer si la cantidad de lectura en nios de 12, 13 y 14 aos es una variable

dependiente de la edad o de la variable del dimetro de su cabeza.
Hiptesis.
Ha. Entre las variables cantidad de lectura, edad y dimetro de la cabeza existe correlacin
significativa, as como dependencia.
Ho. Entre las variables cantidad de lectura, edad y dimetro de la cabeza no existe correlacin
significativa, as como dependencia.
Aplicacin de la prueba estadstica.

gl = N - K = 15 - 3 = 12
Los valores de r calculados de la correlacin parcial se comparan en la distribucin de valores

crticos en funcin de la probabilidad y se observa que con 12 grados de libertad se ubican las
cifras de 0.532 y 0.661, para un nivel de significancia al 5 y 1%. Esto significa que los valores 0.97
y 0.99 tienen una probabilidad menor que 0.01.
Entonces las variables X y Y tienen una probabilidad que cae en el nivel de significancia, se acepta
Ha y se rechaza Ho. La variable Z se acepta Ho y se rechaza Ha.
Hay significancia entre la edad de los nios y su cantidad de lectura, y no hay significancia entre
el radio de sus cerebros.
ANLISIS DE VARIANZA
Se suele representar por MST, se le denomina varianza total o cuadrados medios totales, es
tambin un cociente y al numerador se le llama suma de cuadrados total y se representa por SST,
y el denominador (kn -1) grados de libertad.
Los resultados de un anova se suelen representar en una tabla como la siguiente:
Fuente de variacin G.L. SS MS F
Entre grupos k-1 SSA SSA/(k-1) MSA/MSE
Tratamientos
Dentro Error (n-1)k SSE SSE/k(n-1)
Total kn-1 SST
Y el cociente F se usa para realizar el contraste de la hiptesis de medias iguales. La regin crtica
para dicho contraste es F > F(k-1,(n-1)k)a
Algunas propiedades
Es fcil ver en la tabla anterior que
GLerror+ GLtrata = (n - 1) k + k - 1 = nk - k + k - 1 = nk - 1 = GLtotal
No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad, llamada
identidado propiedad aditiva de la suma de cuadrados:
SST = SSA + SSE
El anlisisde la varianza se puede realizar con tamaos muestrales iguales o distintos, sin
embargo es recomendable iguales tamaos por dos motivos:
La F es insensible a pequeas variaciones en la asuncin de igual varianza, si el tamao es igual.
Igual tamao minimiza la probabilidad de error tipo II.
3. Modelos de anlisis de la varianza
El anova permite distinguir dos modelos para la hiptesis alternativa:
Modelo I o de efectos fijos en el que la H1 supone que las k muestras son muestras de k
poblaciones distintas y fijas.
Modelo II o de efectos aleatoriosen el que se supone que las k muestras, se han seleccionado
aleatoriamente de un conjunto de m>k poblaciones.
Un ejemplo de modeloI de anova es que se asume que existen cinco poblaciones (sin
tratamiento, con poca sal, sin sal, etc.) fijas, de las que se han extrado las muestras.
Un ejemplo de modelo II sera: un investigador est interesado en determinar el contenido, y sus
variaciones, de grasas en las clulas hepticas de cobayas; toma del animalario 5 cobayas al azar
y les realiza, a cada una, 3 biopsias hepticas.
La manera ms sencilla de distinguir entre ambos modelos es pensar que, si se repitiera el estudio
un tiempo despus, en un modelo I las muestras seran iguales (no los individuos que las forman)
es decir corresponderan a la misma situacin, mientras que en un modelo II las muestras seran
distintas.
Aunque las asunciones iniciales y los propsitos de ambos modelos son diferentes, los clculos y
las pruebas de significacin son los mismos y slo difieren en la interpretacin y en algunas
pruebas de hiptesis suplementarias.
Anlisis de la varianza de dos factores
Es un diseode anova que permite estudiar simultneamente los efectos de dos fuentes de
variacin.
En cualquier caso, el investigador puede estar interesado en estudiar si hay, o no, diferencia en
la evolucin segn el sexo. En un anova de dos vas se clasifica a los individuos de acuerdo a dos
factores (o vas) para estudiar simultneamente sus efectos. En este ejemplo se haran cinco
grupos de tratamiento para los hombres y otros cinco para las mujeres, en total diez grupos; en
general, si el primer factor tiene a niveles y el segundo tiene b, se tendrn ab muestras o unidades
experimentales, cada una con n individuos o repeticiones.
Una observacin individual se representa como:
El primer subndice indica el nivel del primer factor, el segundo el nivel del segundo factor y el
tercero la observacin dentro de la muestra. Los factores pueden ser ambos de efectos fijos (se
habla entonces de modelo I), de efectos aleatorios (modelo II) o uno de efectos fijos y el otro de
efectos aleatorios (modelo mixto). El modelo matemtico de este anlisis es:
i o Ai b el efecto del nivel i del 11 factor, j es la media global, Donde o Bj e el efecto del nivel
j del 2 factor y ijk las desviaciones aleatorias alrededor de las medias, que tambin se asume
que estn normalmente 2.distribuidas, son independientes y tienen media 0 y varianza
A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo aade la de
aditividad de los efectos de los factores.
B)ij, se les )ij, (AB)ij, ( A los trminos ( denomina interaccinentre ambos factores y
representan el hecho de que el efecto de un determinado nivel de un factor sea diferente para
cada nivel del otro factor.
Para entender mejor este concepto de interaccin veamos un ejemplo sencillo sobre un anova
de dos factores, cada uno con dos niveles: supngase un estudio para analizar el efecto de un
somnfero teniendo en cuenta el sexo de los sujetos. Se eligen al azar dos grupos de hombres y
otros dos de mujeres. A un grupo de hombres y otro de mujeres se les suministra un placebo y a
los otros grupos el somnfero. Se mide el efecto por el tiempo que los sujetos tardan en dormirse
desde el suministro de la pldora.
Se trata de un anova de dos factores (sexo y frmaco) fijos, cada uno con dos niveles (hombre y
mujer para el sexo y somnfero y placebo para el frmaco). Los dos tipos de resultados posibles
se esquematizan en la figura
En la figura A se observa que las mujeres tardan ms en dormirse, tanto en el grupo tratado como
en el grupo placebo (hay un efecto del sexo) y que los tratados con placebo tardan ms en
dormirse que los tratados con somnfero en ambos sexos (hay un efecto del tratamiento). Ambos
efectos son fcilmente observables.
Sin embargo en la figura B es difcil cuantificar el efecto del somnfero pues es distinto en ambos
sexos y, simtricamente, es difcil cuantificar el efecto del sexo pues es distinto en ambos grupos
de tratamiento. En este caso, se dice que existe interaccin.
Podra, incluso, darse el caso de que se invirtieran los efectos de un factor para los distintos
niveles del otro, es decir, que las mujeres se durmieran antes con el somnfero y los hombres
antes con el placebo.
La interaccin indica, por tanto, que los efectos de ambos factores no son aditivos: cuando se
dan juntos, su efecto no es la suma de los efectos que tienen cuando estn por separado, por lo
que, si en un determinado estudio se encuentra interaccin entre dos factores, no tiene sentido
estimar los efectos de los factores por separado. A la interaccin positiva, es decir, cuando el
efecto de los factores actuando juntos es mayor que la suma de efectos actuando por separado,
en Biologa se le denomina sinergiao potenciacin y a la interaccin negativa inhibicin. En el
ejemplo de la figura B, se dira que el ser mujer inhibe el efecto del somnfero, o que el ser
hombre lo potencia (segn el sexo que se tome como referencia).
4. Anlisis de Varianza a una va: Diseo completamente aleatorizado
Hay varias formas en las cuales puede disearse un experimento ANOVA. Quizs el ms comn
es el diseo completamente aleatorizado a una va. El trmino proviene del hecho que varios
sujetos o unidades experimentales se asignan aleatoriamente a diferentes niveles de un solo
factor. Por ejemplo: varios empleados (unidades experimentales) pueden seleccionarse
aleatoriamente para participar en diversos tipos (niveles diferentes) de un programa de
capacitacin (el factor).
El anlisis de varianza se basa en una comparacin de la cantidad de variacin en cada uno de los
tratamientos. Si de un tratamiento al otro la variacin es significativamente alta, puede
concluirse que los tratamientos tienen efectos diferentes en las poblaciones.
a. Esta variacin entre el nmero total de las 14 observaciones. Esto se llama variacin total.
b. Existe variacin entre los diferentes tratamientos (muestras). Esto se llama variacin entre
muestras.
c. Existe variacin dentro de un tratamiento dado (muestra). Esto se denomina variacin
dentro de la muestra.
BIBLIOGRAFIA
http://www.indec.mecon.ar/
http://www.isapre.cl/lado-graficos99.htm
Utilizamos esta pgina para extraer los grficos con los que apoyamos o contrariamos nuestra
hiptesis.
http://www.ing.unp.edu.ar/estadisitio/graficos.htm
http://www.ull.es/publicaciones/latina/z8/r4el.htm
http://www.monografias.com/trabajos15/estadistica/estadistica.shtml
http://es.wikipedia.org/wiki/Estad%C3%ADstica
http://www.hrc.es/bioest/estadis_1.html
http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-indice.html
http://es.wikipedia.org/wiki/Estad%C3%ADstica_inferencial
http://www.mitecnologico.com/iem/Main/EstadisticaInferencial
http://sitios.ingenieria-usac.edu.gt/estadistica/estadistica2/estadisticadescriptiva.html
http://www.ditutor.com/inferencia_estadistica/estadistica_inferencial.html
http://www.slideshare.net/freddygarcia/estadistica-inferencial-presentation
http://eilae12007.blogspot.com/

Texto Paralelo

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Texto Paralelo

Uploaded by

Copyright:

Available Formats

UNIVERSIDAD RURAL DE GUATEMALA

Facultad de Ciencias Jurdicas y Sociales

Estadstica es el Conjunto de informes numricos derivados de los censos de poblacin, de datos

Conjunto de mtodos cientficos ligados a la toma, organizacin, recopilacin, presentacin y

La estadstica es una ciencia referente a la recoleccin, anlisis e interpretacin de datos, ya sea

Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay

BREVE HISTORIA DE LA ESTADISTICA

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir

Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos

Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior desarrollo del

LA RELACION DE LA ESTADISTICA CON OTRAS CIENCIAS

La estadstica es una rama de la matemtica que se refiere a la recoleccin, estudio e interpretacin

Estadstica: es comnmente considerada como una coleccin de hechos numricos expresados en

Es el conjunto de procedimientos y tcnicas empleadas para recolectar, organizar y analizar datos,

ESTADSTICA INDUCTIVA Y DEDUCTIVA

Uno de los problemas fundamentales de la Estadstica es el estudio de la relacin existente entre

Deductiva: cuando a partir del conocimiento de la poblacin se trata de caracterizar cada

Inductiva: Cuando a partir del conocimiento derivado de una muestra se pretende

ESTADSTICA DESCRIPTIVA E INFERENCIAL

En sus particularidades la Inferencia distingue la Estimacin y la Contrastacin de Hiptesis. Es

El anlisis estadstico es todo el proceso de organizacin, procesamiento, reduccin e

Cuando se consideran los mtodos de organizacin, reduccin y anlisis de datos estadsticos, se

Variables: es toda caracterstica que vara de un elemento a otro de la poblacin.

METODOS DE REPRESENTACIN DE DATOS CUANTITATIVOS

Arreglo de Datos. Es una forma de presentar los datos en un arreglo ascendente o

Organizacin de datos agrupados

GRFICOS DE UNA DISTRIBUCIN DE FRECUENCIAS

Curvas de frecuencia: no es ms que la curva suavizada que se traza sobre el polgono y

Ojivas: Cuando se trata de relacionar observaciones en un mismo aspecto para dos

Es un subconjunto de casos o individuos de una poblacin estadstica.

Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin,

Agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de

Elementos fundamentales para elaborar una distribucin de frecuencia:

4)EL NUMERO DE CLASES.

5) VALOR DEL INTERVALO O AMPLITUD

MEDIDAS DE TENDENCIA CENTRAL MEDIA, MEDIANA Y MODA

Variable Frecuencias absolutas Frecuencias relativas

Vamos a calcular los valores de las distintas posiciones centrales:

1.- Media aritmtica:

Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm.

2.- Media geomtrica:

X = ((1,20^ 1) * (1,21^4) * (1,22^ 4) * .....* (1,29^3)* (1,30^3)) ^

Medidas de Dispersin Desviacin Estndar, Varianza

Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos

3.- Desviacin tpica: Se calcula como raz cuadrada de la varianza.

Variable Frecuencias absolutas Frecuencias relativas

MOMENTOS, SESGO Y CURTOSIS

Consideremos la funcin g(X) = Xk, k =1, 2, A la esperanza matemtica de Xk se le denomina k-

Si k = 1 , se tiene que el primer momento de X es la media de X, es decir

E[X1] = m (compare con la definicin de la seccin 4.4). [4.8]

Si g(X) = (X-m )k,, obtenemos el k-simo momento central de X. Esto es:

Si el primer momento central existe, debe ser igual a cero.

El segundo momento central de X es la varianza (compare con la definicin de varianza de la

Obsrvese que de aqu se llega a

SESGO Y CURTOSIS DE UNA DISTRIBUCIN

como la medida de la simetra, ya que cuando una distribucin es simtrica,

g=0 g>0 g<0

La cantidad se usa como la medida de la altura o curtosis de una

Fig. 4. 11 Distribucin Distribucin Distribucin leptocrtica

g * < 30 g*=3 g*>3

FUNCION GENERATRIZ DE MOMENTOS

Derivando esta expresin

Cuando t = 0, la expresin del lado derecho es el k-simo momento de X

g * < 30 g=3 g>3