You are on page 1of 60

Estadstica Bsica

RESEA
HISTRICA
Manejo de grandes
cantidades de
informacin o datos de
carcter estadsticos.

EMPERADOR
YAO
REY
(CHINA) HERDES
Empadronamiento
Realizacin de un
en el tiempo de
censo.
Jess.
La estadistica como
disciplina

Inicio en Alemania a mediados del siglo


XVII, en el reinado de Godofredo de
Achewall (1719-1772), se utiliz la
palabra estadistica y se separ de la
Sociologa.
ESTADSTICA

Ciencia de los datos,


implica la coleccin,
clasificacin, sntesis,
organizacin, anlisis e
interpretacin de los
datos.
Por qu es importante la
estadstica?
OBJETIVO PRINCIPAL DE LA
ESTADSTICA

Mtodo que permite no


slo describir el hecho o
fenmeno, sino que
permite deducir, evaluar y
sacar conclusiones acerca
de una poblacin, con los
resultados obtenidos a
travs de una muestra.

La estadstica est asociada, por ejemplo con el # de


nacimientos, defunciones, transacciones comerciales,
valor de las acciones en el mercado de valores, beneficios
y utlidades de la empresa, demanda de algn producto,
etc.
ESTADSTICA

Es la Ciencia de la
Sistematizacin, ordenacin y presentacin de los datos
referentes a un fenmeno que presenta variabilidad o
incertidumbre para su estudio metdico con objeto de

deducir las leyes que rigen esos


fenmenos

y poder hacer previsiones sobre los


mismos, tomas decisiones u obtener
conclusiones.
Sirve para analizar situaciones en las
TEORA DE LA que intervienen el azar. Ej., lanzamiento

PROBABILIDAD de una dado, resultado de un partido de


ftbol, elecciones presidenciales, etc.

ESTADSTICA INFERENCIA
DESCRIPTIVA ESTADSTICA

Distribucin de las unidades de anlisis de


acuerdo a variable 1

D A
10% 20%

C B
40% 30%

RAMAS DE LA Se refiere al anlisis e

ESTADSTICA interpretacin de una muestra


de datos para poder as dar
conjeturas sobre un grupo
mayor denominado poblacin.
Subdivisiones de la Estadstica
N trabajadores que
X
iR X
i
( X ) 2

N das X , S
se ausentaron n n 1

0-4 4
5-9 10 Estadstica
10-14 8
Descriptiva: Conjunto
de mtodos
50
45 estadsticos que se
40
35 relacionan con el
30 Industrial
25 Sistemas resumen y descripcin
20 Civil
15
10
Electrnica de datos, como tablas,
5
0
grficas y el anlisis
Ciclo 1 Ciclo2
mediante algunos
clculos.
Estadstica Inferencial.- Conjunto de mtodos cuya
finalidad es hacer generalizaciones o inferencia
sobre una poblacin, utilizando la informacin de
una parte de ella.
Ejercicios.
Qu campo de la estadstica ser necesario utilizar?.

1. Un material que se fabrica continuamente, antes de ser cortado


y enrollado en grandes rollos, debe ser vigilado en cuanto a su
espesor (mediante un calibrador). Se registr diez mediciones de
papel, en mm, y el promedio result 30.1 .
2. Un lote de 1000 flash memory debe pasar
por control de calidad, se elige al azar 30
flash memory para decidir si el lote pasa o no
el control de calidad y pueda estar listo para
su distribucin .
POBLACIONES Y PARMETROS

Determinada coleccin o
conjunto de observaciones. Es toda medida descriptiva de
una poblacin.
Conjunto de medidas, o el
recuento de todos los Es una cantidad numrica
elementos o individuos que calculada sobre una poblacin.
presentan una caracterstica
comn. El punto clave para recordar es
que un parmetro describe una
La poblacin es la coleccin variable de una poblacin.
completa de todas las
observaciones de inters.
PARMETRO
POBLACIN
MUESTRAS Y ESTADSTICOS

Porcin ms pequea y ms Es una medida descriptiva de


manejable de una poblacin. una muestra

Subconjunto de la poblacin El estadstico es a la muestra-


seleccionada cientficamente o lo que el parmetro es a la
seleccionadas al azar. poblacin

Es una parte representativa de El estadstico sirve como una


la poblacin que se selecciona estimacin del parmetro.
para ser estudiada.

MUESTRA ESTADSTICO
VARIABLE
Es una caracterstica definida en la poblacin
y que puede tomar dos o ms valores o
modalidades.
TIPO DE DATOS

POBLACIN
CONTINUOS DISCRETOS NOMINALES JERARQUIZADOS

Clase de tercer
Edad, peso N en el grupo Nios / Nias 3 grado
grado
N de
Automviles Km/h m/s colores Ms sucio
defectos/auto
Ventas de bienes
Valores en USD. N de ofertas sobrevaluado Ms caro
races
Ejercicio1.-

Revisar todos los artculos fabricados que salen de una lnea


de ensamble con el fin de detectar defectos sera un
procedimiento costoso que demandara mucho tiempo. Un
mtodo econmico y eficaz para determinar la cantidad de
artculos defectuosos implica la seleccin y examen de una
fraccin de los artculos por parte de un ingeniero de control
de calidad. Se calcula el porcentaje de los artculos
examinados que salieron defectuosos y esta cifra se usa para
estimar el porcentaje de todos los artculos fabricados en la
lnea que tienen defectos.

Identifique la poblacin, la muestra y el tipo de inferencia


estadstica que puede hacerse para este problema.
Ejercicio2.-
En una revista especializada, se inform de las dimensiones de
desempeo de redes de distribucin de agua en el rea de
Filadelfia. En una parte del estudio recabaron los siguientes
datos para una muestra de secciones de tuberas de agua.
Identifique los datos como cuantitativos o cualitativos.
1. Dimetro de la tubera (pulgadas)
2. Material de la tubera.
3. Edad (ao de instalacin)
4. Ubicacin.
5. Longitud de la tubera (pies)
6. Estabilidad del suelo circundante (inestable,
moderadamente estable o estable)
7. Corrosividad del suelo circundante (corrosivo o no
corrosivo)
IMPORTANCIA DEL MUESTREO

El anlisis sobre
Las muestras son
las muestras
necesarias debido a
implica una
que con frecuencia
distincin entre
las poblaciones son
las dos
demasiado grandes
principales ramas
para ser estudiadas
del anlisis
en su totalidad.
estadstico.
La exactitud de toda estimacin es de enorme
importancia, depende en gran parte de la forma
como se tom la muestra, y del cuidado que se
tenga para garantizar que la muestra proporcione
una imagen confiable de la poblacin.
Si la muestra no es del
todo representativa de
la poblacin y
resultar un Error de
muestreo.

Es la diferencia entre el
parmetro desconocido de la
poblacin y el estadstico de la
muestra utilizado para calcular el
parmetro.
Existen dos causas posibles
del error de muestreo.
EL AZAR
Es posible Puede producir un gran
seleccionar sin darse nmero de elementos
de muestra que sean
cuenta elementos inusualmente pequeos,
atpicos que no produciendo una
representan la subestimacin del
poblacin. parmetro.
Otra forma de error de muestreo, es el Sesgo
Muestral, ocurre cuando hay alguna tendencia a
seleccionar determinados elementos de muestra en
lugar de otros.

En un proceso de muestreo puede


favorecer de manera inherente la
seleccin de hombres excluyendo a las
mujeres, o de personas casadas
excluyendo a las solteras
DESCRIPCIN DE LOS CONJUNTOS DE
DATOS

La recoleccin de datos revela


muy poco por si sola. Es
extremadamente difcil
determinar el verdadero
significado de un grupo de
nmeros que simplemente se
han registrado en un papel.

Las herramientas estadsticas


resultan de particular utilidad
para organizar, describir los
datos de manera concisa y
significativa.
Tablas de
frecuencia que
colocan todos los
datos en clases
especficas. Diversos grficos que
pueden proporcionar
una representacin
visual de los datos.

Tablas de contingencia y diagramas


de "tallo y hoja", los cuales tambin
permiten la presentacin de un
conjunto grande de datos de manera
concisa y discernible.
MTODOS DE AGRUPACIN DE DATOS

Los mtodos principales para


organizar datos estadsticos
Los datos agrupados se pueden resumir
comprenden el ordenamiento de
grficamente, o en tablas, y mediante el
elementos en subconjuntos que
uso de medidas numricas, como la
presenten cualidades semejantes (por
media, la amplitud o rango , la desviacin
ejemplo, misma edad, misma
estndar, y otras ms.
finalidad, misma escuela, misma
ciudad, etc.)

Los datos ordenados en grupos o


categoras recibe el nombre de
DISTRIBUCIN DE
FRECUENCIAS.
Una distribucin de frecuencia es
El procedimiento para
un agrupamiento de datos en
clases, que muestra el nmero o
elaborar realmente una

porcentaje de observaciones de distribucin de frecuencias


cada una de ellas. Una para un conjunto de datos,
distribucin de frecuencia se depende del tipo de datos
puede presentar en forma particulares (esto es,
tabular y grfica. Tambin se las continuos, discretos,
conoce como Serie estadstica de
nominales, de orden o
frecuencias o de intervalos.
jerarquizados).
ELABORACIN DE UNA TABLA DE FRECUENCIAS PARA
DATOS CUANTITATIVOS (CONTINUOS DISCRETOS)
FRECUENCIA ABSOLUTA
El nmero de veces que aparece un valor, donde el subndice representa
cada uno de los valores. La suma de las frecuencias absolutas es igual al
nmero total de datos, representado por N.

FRECUENCIA RELATIVA
El resultado de dividir la frecuencia absoluta de un determinado valor
entre el nmero total de datos, La suma de la frecuencias relativas es
igual a 1.

FRECUENCIA ABSOLUTA ACUMULADA


Es la suma de frecuencias absolutas de todos los valores iguales o
inferiores al valor considerado.

FRECUENCIA RELATIVA ACUMULADA


Es el resultado de dividir la frecuencia acumulada entre el nmero total
de datos
Una vez que se han recolectado los datos de una determinada variable, el
paso siguiente para la ordenacin de los mismos es la elaboracin de una
distribucin de frecuencia .
DISTRIBUCIN DE FRECUENCIAS
VARIABLE CONTINUA
1. Calcular el rango o recorrido:
Valor mximo y mnimo que toma la variable.

X X =a
mx mn

2. Nmero de intervalos(clases), aplicar el mtodo de sturges:

m= 1+3,3 log n

5 < m < 16
(Un # arbitrario que sea mayor o igual que 5 y menor o igual
que 16)
3. Calcular la amplitud del intervalo (clases)

a.c= a/m

NOTA: es necesario aproximar, por pequea que sea la


fraccin, sino se aproxima quedarn valores observados
fuera del rango.
ELABORACIN DE GRFICAS

Las grficas no
La mejor grfica es la Las grficas deben ser
sustituyen al cuadro, le
ms simple. tan sencillas y claras.
complementan.

La grfica es
La finalidad de las considera como el
grficas es visualizar medio de expresin de
mejor la informacin. la estadstica, ms
llamativa y sugestiva.
GRFICAS APLICADAS A LA ESTADSTICA

DIAGRAMA DE
FRECUENCIAS

Son muy utilizadas para representar las frecuencias


absolutas y relativas, incluyendo las acumuladas que
ocurren con respecto a una variable discreta.
Se representa por lneas delgadas ya sean verticales u
horizontales, colocando las frecuencias.
HISTOGRAMA

Son diagramas de frecuencias unidimensionales, en los


cuales se levantan rectngulos de reas, proporcionales a
las frecuencias de clases sobre los intervalos del eje
horizontal, por lo tanto es utilizado para representar a la
variable discreta y continua, cuando la amplitud es
constante.
OJIVA

Se determinan los puntos


de interseccin entre
La representacin grfica para cada valor de la variable
las frecuencias absolutas y y su respectiva
relativas acumuladas en una frecuencia, luego se unen
variable discreta y continua, secon trazo rectilneo.
hace a travs de una ojiva
ascendente. Prcticamente en un
Polgono de frecuencias,
con la diferencia de ser
aplicado a una tabla de
frecuencias absolutas
acumuladas.
POLGONO DE
FRECUENCIAS

En la variable discreta y continua es bastante


utilizado este diagrama, fijando puntos,
utilizando las marcas de clase y las
frecuencias, luego se unen dando una lnea
quebrada.

Si en el histograma de frecuencias
unimos los puntos medios en la parte
superior de cada rectngulo,
obtenemos el polgono de frecuencias.
MEDIDAS DE TENDENCIA
CENTRAL

Las medidas de Permiten determinar la


posicin o de tendencia posicin de un valor
central se llaman respecto a un conjunto
tambin como de datos, el cul es ms
promedios. representativo o tpico.

Estas medidas aplicadas


a las caractersticas en Las medidas aplicadas
una muestra se a las caractersticas de
denomina estimadores una poblacin se
o estadgrafos. denomina parmetros.
Un promedio es
un valor en la Se calcula para
escala de las X, representarla en
correspondiente a calidad de medida
una distribucin tpica del grupo.
de frecuencias.

Un valor Las tres medidas


promedio intenta que ms
representar o comnmente se
resumir las emplean son la
caractersticas de media, la
un conjunto de mediana y la
valores. moda.
MEDIA ARITMTICA

Es la medida de posicin
o promedio ms
conocida y utilizada en
el muestreo, sus
frmulas admiten
tratamiento algebraico.
Se define como la
suma de todos los
valores observados,
divididos por el total de
observaciones. Esta
definicin solo se aplica
en datos sin agrupar o
tambin conocidos como
datos originales.
MEDIA ARITMTICA SIMPLE

Se trabaja con datos sin agrupar u


originales, sean muestras o poblaciones.

(Minsculas en las
muestras)
(Maysculas y letras
griegas en la
poblacin).

Ejemplo 1: para determinar


el nmero de unidades con
piezas defectuosas, con una
muestra de 30 cajas; se
tendr que:
MEDIA ARITMTICA PONDERADA-
VARIABLE DISCRETA Y CONTINUA

Se aplica en datos
agrupados, es decir
aquellos que se encuentran
organizados en una tabla
de frecuencia, siendo sus
frecuencias absolutas sus
ponderaciones.
DESVIACIONES

Las desviaciones con respecto


a la media aritmtica, se
definen como las diferencias
que hay entre los distintos
valores que toman la variable
y la media aritmtica, tanto en
datos sin agrupar como en
datos agrupados.
Ejemplo 6: Se tiene una fuente de informacin con 8 datos sin
agrupar, 6, 10, 4, 10, 8, 2, 6, 2, calcular la media aritmtica y sus
desviaciones.
MEDIANA (Me)

Es el valor central de un conjunto ordenado


de observaciones.
Clculo en datos sin agrupar u
originales

a) Nmero impar de
observaciones:
Primero se deben
ordenar de menor a
mayor o de mayor a
menor.
b) Nmero par de
observaciones:
Encontramos dos
valores en el centro
de la serie, por tal
razn la mediana
deber ser el
promedio de ellos.
Valor de la variable
que ms se repite o
aquel valor que
presenta la
mxima frecuencia.
Una distribucin es
Una distribucin es
PLURIMODAL O
BIMODAL cuando tiene
MULTIMODAL, cuando
dos Modas.
hay ms de dos Modas.

Es la nica medida de
posicin o tendencia Esta medida fue utilizada
central que puede ser formalmente en 1984 por
utilizada en ATRIBUTOS Karl Pearson.
( Caracterstica es
cualitativa)
DATOS AGRUPADOS

Tanto en la variable
discreta como en la En la variable
continua, la MODA continua la amplitud
corresponder a del intervalo debe
aquel valor que ser constante.
representa la mayor
frecuencia.

You might also like