You are on page 1of 29

Probabilidad y Estadstica

Alexis Rojas Pineda


Lic. en Matemtica PUC Magster en Estadstica PUC Doctor(c) en Estadstica PUC

Qu es la Estadstica? Originalmente la palabra estadstica ha estado


asociada al procesamiento de datos, entendindose por esto la representacin grfica, la tabulacin y el clculo de medidas resumen, que permiten analizar e interpretar un conjunto de datos. La estadstica es una disciplina que se preocupa de desarrollar tcnicas y modelos que permitan estudiar la forma como la incertidumbre sobre un fenmeno es es alterada por la informacin disponible.

Qu es Poblacin? P

Conjunto formado por TODAS las unidades (personas, animales o cosas) que tienen algo en comn. La poblacin debe ser listada en lo que llamaremos Marco Muestral.

Qu es una muestra?
M

Una muestra es un subconjunto de la poblacin. Ella debe cumplir con ser REPRESENTATIVA.

Porqu una muestra?


Es de menor costo que un censo. Ocupa menos tiempo que un censo. Tiene menos error que un censo.

Tcnicas de Muestreo
Las ms comunes son: Muestreo Aleatorio Simple. Muestreo Estratificado.

Qu es una variable?
Caracterstica que cambia de sujeto a sujeto.

Qu es un dato?
Es una realizacin de una caracterstica o variable, al ser evaluada en un sujeto.

Qu es Informacin?
Llamaremos informacin al conjunto de datos.

Tipos de Variables Variable Cualitativa: Variable Cuantitativa: Nominal Ordinal Discreta Continua

Tabulacin
La informacin que a continuacin se muestra representa el nivel de instruccin de 20 personas: B,M,S,S,B,B,M,M,M,S,S,M,B,B,M,M,B,M,S,B
Nivel de Instruccin Bsico Medio Superior Total Frecuencia Absoluta 7 8 5 20 Porcentaje 35 40 25 100

Supongamos que tenemos una muestra de 110 fumadores y se examina la marca del cigarrillo. Tenemos la siguiente tabla:
Marca de Cigarros Advance Belmont Derby Viceroy Total
35

Frecuencia Absoluta 22 27 31 30 110


G rfic o de B arras para la prefe re nc ia de m arca de cigarrillo

Porcentaje 20,00 24,55 28,18 27,27 100,00

30

25 Frecuencia Absoluta

20

15

10

0 A dvance B elm ont M arca de C igarrillo D erby V iceroy

Porcentaje de fumadores segn marca de cigarro

Advance 20% Viceroy 27%

Belmont 25%

Derby 28%

Tabulacin caso contnuo


Considere las notas de 20 alumnos: 6.2; 4.8; 3.8; 4.6; 4.4; 5.7; 6.4; 5.4; 6.3; 4.8; 4.9; 3.1; 3.8; 5.5; 5.1; 6.8; 4.7; 5.5; 7.0; 4.2

Formula de Sturger: K = 1+ [3.3 log10 (n )] En este ejemplo K=1+[4.29]=5 R=Rango=Mximo - Mnimo=7.0 - 3.1= 3.9

R 3.9 = 0 . 78 C i= = K 5

Tabla de Frecuencia
Nota 3,10-3,88 3,88-4,66 4,66-5,44 5,44-6,22 6,22-7,00 Marca de Clase 3,49 4,27 5,05 5,83 6,61 Frecuencia Absoluta 3 3 6 4 4 20 Frecuencia Frec. Absoluta Frec. Relativa Relativa Acumulada Acumulada 0,15 3 0,15 0,15 6 0,30 0,30 12 0,60 0,20 16 0,80 0,20 20 1,00 1,00

Diagrama de Tallo y Hoja


3 4 5 6 7 1 2 1 2 0 8 4 4 3 8 6 7 8 8 9 5 5 7 4 8
3 3 4 4 5 5 6 6 7 1 8 2 6 1 5 2 8 0 8 4 7 8 8 9 4 5 7 3 4

0 | 3444455555566666677 2| 4| 6| 8| 10 | 0

Si a los datos anteriores agregamos un dato ms digamos 100

Medidas Resmenes
Llamaremos medidas resmenes a aquellas cantidades que resumen y describen la informacin de manera que sean representativos del conjunto de datos.
Medidas Tendencia Central Moda Mediana Promedio Percentiles Dispersin Rango Rango Intercuartlico Varianza Coeficiente de Variacin Forma Asimetra

MODA (MO): Es la realizacin que tiene mayor frecuencia. Para datos agrupados en intervalos se adopta como moda la marca de clase del intervalo con mayor frecuencia. En caso de existir ms de una moda hablaremos de multimodalidad. Ejemplo:
Marca de Cigarros Advance Belmont Derby Viceroy Total Frecuencia Absoluta 22 27 31 30 110 Porcentaje 20,00 24,55 28,18 27,27 100,00

Medidas de Tendencia Central

Moda
En el caso de datos agrupados en intervalo, la moda se calculara como:
1 Moda = LI i + + ci 2 1

OBSERVACION: La moda puede existir o no existir La moda puede ser nica o existir mas de una moda

Promedio o Media Aritmetica


PROMEDIO (X ) : Sean x1 , , xn los datos X =
k

x
i=1

X n
i

En el caso de datos agrupadosen intervalos X =

i=1

PERCENTIL- Llamaremos percentil % a aquel valor de la variable en estudio, que acumula el % de la informacin. Necesariamente no es una medida de tendencia central. 1) Calcular la posicin: n 100 X + X ( m ) ( m+1) 2) Si posicin es un entero (m): P =
2

En caso contrario (m.dec):

P = X (m+1)

PERCENTIL- En el caso de datos agrupados en intervalo: 1) Calcular la posicin: n 100 2) Determinar en que intervalo cae la posicin obtenida en 1) 3) Del intervalo obtenido en 2): LI i , ni , ci , N i 1 4)
n ci P = LI i + N i 1 100 ni

MEDIANA

Me = P50

En el ejemplo de las notas de los 20 alumnos:


Nota 3,10-3,88 3,88-4,66 4,66-5,44 5,44-6,22 6,22-7,00 Marca de Clase 3,49 4,27 5,05 5,83 6,61 Frecuencia Absoluta 3 3 6 4 4 20 Frecuencia Frec. Absoluta Frec. Relativa Relativa Acumulada Acumulada 0,15 3 0,15 0,15 6 0,30 0,30 12 0,60 0,20 16 0,80 0,20 20 1,00 1,00

Calcular el promedio, moda, mediana, P25 y P75.

Cuartiles

Q1= P 25 , Q2= P 50 y Q3= P 75

Medidas de Dispersin

R= Mx Mn RI = Q3 Q1

S= S
S CV = X

(x
S =
2 i=1

X)

n 1

Medidas de Dispersin
Para datos agrupados la varianza es calculada como:

n (X
i

X)

S =

i=1

n 1
2

En el ejemplo de las notas de 20 alumnos:

R = 3 . 9 RI = 1 .63 S = 1. 1063 S = 1 . 0518 CV = 0 . 2034

Cajn con Bigotes

Se realiz un experimento para comparar el efecto de dos dietas (A y B) sobre el aumento de peso en 20 sujetos que son distribuidos al azar en dos grupos. Los datos fueron: Dieta A: -1.0 0.0 2.1 3.1 3.3 4.3 5.0 5.2 5.5 6.8 Dieta B: 2.5 3.0 4.0 5.7 6.0 6.9 7.0 7.2 7.3 8.1
Dieta Min Q1 Me Promedio Q3 Mx R RI 2 S CV A -1.0 1.05 3.8 3.43 5.1 6.8 7.8 4.05 6.14 0.72 B 2.5 3.5 6.45 5.77 7.1 8.1 5.6 3.6 3.8 0.33

You might also like