Professional Documents
Culture Documents
ESTADSTICA DESCRIPTIVA
Estadstica: Es la parte de las matemticas que trata de obtener Estadstica a partir de unos datos
numricos.
Estadstica descriptiva: se encarga de la recogida, organizacin y presentacin de los datos
obteniendo una serie de parmetros que los representen. Es totalmente objetiva.
Estadstica inferencial: se encarga del anlisis y toma de decisiones a partir de los datos
anteriores. Es un poco subjetiva. Hace uso del clculo de probabilidades.
Definiciones:
Llamamos poblacin a un conjunto de elementos con una caracterstica comn.
A cada elemento de la poblacin, lo llamamos individuo.
Llamamos muestra a cualquier conjunto de la poblacin.
Al nmero de individuos que componen la muestra se los llama tamao muestral.
Llamamos variable estadstica a cualquier caracterstica de los individuos de la poblacin que
podemos analizar.
Variables categricas o cualitativas: son aquellas que no se pueden cuantificar
numricamente.
Variables cuantitativas: aquellas que se pueden cuantificar numricamente. Se pueden
clasificar en:
o Discretas: aquellas que pueden tomar un numero finito o infinito numerable de
valores.
o Continuas: aquellas que pueden tomar todos los infinitos valores de un intervalo.
Definicin: Llamamos frecuencia absoluta ni de un valor Xi al nmero de veces que aparece dicho
valor.
m
n
i 1
i n tamao muestral Suponiendo X={x1,x2,...,xm}
Llamamos frecuencia absoluta acumulada Ni de un valor Xi al nmero de veces que aparece dicho
valor y todos los anteriores a l.
N i n j n1 n2 ... ni
j i
Nm n
i 1
f i f1 f 2 ... f m 1 2 ... m 1 2
n n n n
1
n
Diagrama de barras
24 26
16
8
1
1 2 3 4 5
Diagrama de sectores
8%
4% 30%
27%
31%
Para variables continuas o discretas con muchos valores, los datos se agrupan en clases.
Para formar las clases:
1) Redondeamos los valores (depende de los datos y precisin necesaria)
2) Elegimos el nmero de clases (entre 5 y 20) n n
3) Escribimos las clases de manera que cada elemento est perfectamente situado en 1 y solo 1 de
ellas.
Al punto medio se le llama marca de clase Xi
l i , l i 1 marca de clase X i li li 1
2
Histograma:
Lo que se debe ver en un histograma es:
Casos atpicos: son casos que son raros en funcin de los datos.
Simetra: se observa si el histograma es uniforme o simtrico en alguna de sus partes.
Ejemplo: Altura
Medidas asociadas a una variable:
Centralizacin:
x1 n1 x 2 n2 ... x m nm 1 m
1- Media aritmtica: x x i ni
n n i 1
Caractersticas:
Tiene en cuenta todos los datos: es muy representativa.
Es muy sensible a los datos atpicos y asimtricos.
No se puede calcular para variables categricas.
2- Moda (Mo): Es el valor de la variable que ms se repite.
Es la nica medida de centralizacin que se puede obtener para variables
categricas.
Cuando tengamos clases hablaremos de clase modal.
Si dos valores tienen frecuencia mxima hablaremos de variable
bimodal.
1- Mediana (Me): Es un valor de la variable que deja el 50% de la distribucin ordenada a
su derecha y el otro 50% a su izquierda.
No tiene en cuenta los valores de la variable, sino su situacin.
No es nada sensible a datos atpicos.
Cuando trabajamos con clases, hablamos de clase mediana.
Clculo:
n 1
Si el n de datos es impar, tomamos el elemento xi con i
2
Si el n de datos es par, la Me es la semisuma de los dos datos centrales.
Medidas de dispersin:
1- Rango o recorrido: R max{xi } min{xi }
1 m
2
2- Varianza: S x xi x 2 .ni
n 1 i 1
Tiene en cuenta todos los valores.
Es muy sensible a los valores atpicos y asimtricos.
Se expresa en las unidades de la variable al cuadrado.
3- Desviacin Tpica: S x S x 2
4- Rango intercuartlico: Ri Q3 Q1
Cuartiles: Son 3 valores Q1, Q2 y Q3 que dividen a la distribucin ordenada en 4 partes
iguales.
Q2=Me;
Q1= Me de los valores situados a la derecha de Q2;
Q3= Me de los valores situados a la izquierda de Q2.
Sx
Definicin: Coeficiente de variacin: CV
x
Series temporales:
Series Temporales
Distribuciones Bivariantes:
Suponemos que x e y son dos variables sobre la misma poblacin.
1 m n m xi . y i .ni
Covarianza: S xy xi x y i y ni x. y
n 1 i 1 n 1 i 1 n
Siendo ni la frecuencia de (xi,yi)
La covarianza relaciona los parmetros x e y.
S xy
Coeficiente de correlacin: r adimensional
S x .S y
-1 r 1
Diremos que hay una mayor relacin entre las 2 variables cuando r se vaya acercando a los
extremos, mientras que si est cerca del 0 se dice que hay poca relacin entre las 2 variables.
15
10
Se puede representar
5 como un eje de
coordenadas
0
0 2 4 6 8
Funciones linealizables:
Funcin exponencial:
y a.e bx
ln y ln a.e bx
ln y ln a ln e bx
ln y ln a bx y ' A bx
Modelo potencial:
y a.x b
ln y ln a.x b
ln y ln a b. ln x y ' A bx'
Tema 2
FUNDAMENTOS DE LA TEORA DE LA
PROBABILIDAD
Definicin: Llamamos experimento aleatorio o estocstico a aquel que realizado en idnticas
circunstancias nunca podemos predecir los resultados. Como por ejemplo: lanzar un dado; extraer una
carta.
En caso contrario el experimento se llama determinista. Por ejemplo: cada libre.
Definicin: A cada una de las veces que repetimos un experimento aleatorio la llamamos prueba.
Definicin: Al conjunto de los posibles resultados de un experimento aleatorio se le llama espacio
muestral (E).
Definicin: Llamamos suceso a cualquier subconjunto del espacio muestral. En el ejemplo de lanzar
un dado:
E={1,2,3,4,5,6}
Sucesos: A={salir 1}
B={salir par}={2,4,6}
C={1,2,3,4,5,6}=E
D={}
Tipos de sucesos:
Suceso elemental: compuesto por un solo elemento muestral. Ejemplo: A
Suceso compuesto: formado por 2 o ms puntos muestrales. Ejemplo: B
Suceso cierto o seguro: siempre se verifica coincide con el espacio muestral.
Ejemplo: C
Suceso imposible: nunca se verifica . Ejemplo: D
Definicin: Diremos que n sucesos de un espacio muestral E; A1,A2,...,An forman un sistema completo
de sucesos si:
n
1. Ai E
i 1
2. Ai A j 0 i j
Propiedades:
A B B A
I. Conmutativas:
A B B A
A B C A B C
II. Asociativas:
A B C A B C
A A A
III. Idempotentes:
A A A
A B C A B A C
IV. Distributivas:
A B C A B A C
A E E
V.
EA A
A A
VI.
A
A A E
VII.
A A
E
VIII. E
A A
A B A B
IX. Leyes de Morgan:
A B A B
P:
A P ( A)
que cumple 3 axiomas:
1 P( E ) 1
2 0 P ( A) 1
3 Si A y B incompatib les P ( A B ) P ( A) P ( B )
Consecuencias:
1. P() 0
En efecto:
E E y E
P ( E ) P ( E ) P () P () P ( E ) P ( E ) 0
2. P ( A ) 1 P ( A)
En efecto:
E A A y A A
P ( E ) P( A) P( A ) P ( A ) P ( E ) P ( A) P ( A ) 1 P ( A)
3. P( A B) P( A) P( B) P( A B)
En efecto:
A B ( A B ) ( A B) ( A B)
P( A B ) P ( A B ) P ( A B) P ( A B) *
A ( A B ) ( A B ) P ( A) P ( A B ) P( A B )
B ( A B) ( B A ) P ( B ) P ( A B) P ( B A )
* P ( A B ) P ( A) P( A B) P( A B) P ( B) P( A B)
4. Si A B P( A) P( B)
En efecto:
B A ( B A)
P ( E ) P ( A) P ( B A)
1
5. Si E est compuesto por n sucesos elementales A1,A2,...,An equiprobables entonces P ( Ai )
n
En efecto:
E A1 A2 ... An
1
1 P ( E ) P ( A1 ) P ( A2 ) ... P ( An ) n.P ( Ai ) P ( Ai )
n
6. Regla de Laplace: Si E est compuesto por n sucesos elementales equiprobables y sea A un
suceso compuesto por k sucesos, entonces:
k casos favorables
P ( A)
n casos posibles
Reglas de conteo:
Combinatoria
n= n de elementos disponibles
m= n de elementos elegidos
Probabilidad condicionada
Definicin: Dados 2 sucesos A y B, llamamos probabilidad de A condicionado a B a:
B P(PA(B)B)
P A
Demostracin:
n n
B B E B Ai B Ai
i 1 i 1
B Ai B A j i j porque Ai A j i j
n
P( B ) P Ai .P B
i 1 Ai
Teorema de Bayes
En las mismas condiciones del teorema anterior
P Ai .P B
P Ai B Ai
P i
A
n
B
P A j .P B
P( B )
i 1 A j
Tema 3
VARIABLES ALEATORIAS I
Definicin: Una variable aleatoria es una funcin que asocia a cada elemento del espacio muestral un
numero real.
X :E
Observacin: Sobre un mismo espacio muestral se pueden definir varias variables aleatorias.
Ejemplo:
Experimento: Lanzar un dado
E={1,2,3,4,5,6}
X (i) i
7 si i 6
Y (i) 0 si i 5
2 si i 1,2,3,4
Observacin: Si el resultado del experimento son valores numricos se les suele asociar el mnimo
valor.
Si son resultados cualitativos se les asocia cualquier nmero.
Ejemplo:
Experimento: Lanzar moneda
E={C(cara),+(cruz)}
1 si sale cara
X
0 si sale cruz
Exp: Lanzar 3 monedas
E={CCC,CC+,C+C,+CC,C++,+C+,++C,+++}
X " n de caras obtenidas" {0,1,2,3}
Definicin: Funcin de distribucin es una funcin que asocia a cada valor de la variable aleatoria la
probabilidad acumulada hasta dicho valor.
F : 0,1
F ( Xi ) P X Xi
Ejemplo:
0 si t 1
1 si 1 t 2
6
26 si 2 t 3
FX 63 si 3 t 4
4 si 4 t 5
6
56 si 5 t 6
1 si t 6
Propiedades:
F(t) es creciente t1 t 2 F t1 F t 2
F(t) es continua por la derecha tlim F t F a
a
lim F t 1
t
lim F t 0
t
0 F t 1
P x t 1 F t
P a X b F b F a
Definicin: Sea X una v.a discreta con funcin puntual de probabilidad p X i P X X i . Llamamos
varianza de la v.a. X a:
Var X 2 E X
2
siendo E ( X )
Propiedades:
Var X E X 2 E ( X )
2
Demostracin:
Var ( X ) E X E X 2 2 X 2 E X 2 2 .E X E 2 E X 2 2 2 2
2
Var ( X ) E X 2 2
Propiedades:
1) Si C cte Var (C) 0
Var aX b a 2
.Var X Var b
2) Var CX C .Var ( X )
2
cte
Definicin: Sea X una v.a. continua con funcin de densidad f(X). Llamamos varianza de X 2 a:
Var X 2 f ( X ). X .dx
2
E Exito
soluciones
F Fracaso
0 si sale F
X
1 si sale E
P(0) P X 0 q
p q 1
P(1) P X 1 p
P X r p r .q 1 r Funcin puntual de probabilidad de la distribucin de Bernouilli
E X 0.q 1. p p
Var X E X 2 E X p p 2 P(1 p ) p.q
2
E X 2 0 2.q 12. p p
r
Es funcin puntual de probabilidad:
n
n r n r n n
r1r.pq pq1
X la podemos considerar como suma de n variables Xi que siguen una distribucin de
Bernouilli.
n n
E X E Xi E Xi p n. p
i 1 i 1 i 1
n n n
Var X Var Xi Var Xi p.q n. p.q
i 1 i 1 i 1
Observacin: Tanto la distribucin Binomial como la Poisson son reproductivas respecto a los
parmetros n y respectivamente.
X B n1 , p
X Y B n1 n2 , p
Y B n2 , p
X P 1
X Y P 1 2
Y P 2
2. f ( x ).dx 1
- +
Tipificacin de la normal
X
Si X N , 2 si defino Z Z N 0,1
Ejemplo:
X N 15,2 2
X 15 17 15
P X 17 P P Z 1 0,8413
2 2
X 15 12 15
P X 12 P P Z 32 P Z 1,5 1 P Z 1,5 1 0,9332 0,0668
2 2
Teorema de Moivre-Laplace
X n. p 1
t X2
P t
Si X B n, p entonces nlim
e 2 dx
n. p.q 2
Explicacin:
Si X B n, p n
X
N np , npq
Observacin: La distribucin de Poisson se puede aproximar a una normal cuando >5
Si X P
5
X ' N ,
Distribucin exponencial: Son variables asociadas a tiempos de espera para recibir determinados
servicios. X sigue una distribucin exponencial de parmetros X
Si tiene por funcin de densidad
x
f ( x) e
Funcin de distribucin
x
F ( x) 1 e
Esperanza
1
E ( x)
Varianza
1
Var ( x)
2
Observacin: Tanto la distribucin normal como la exponencial son reproducidas respecto a sus
parmetros.
X N 1 , 1
2
X Y N ,
2
2
Y N 2 , 2
2 1 2 1 2
X 1
X Y 1 2
Y 2
Tema 4
VARIABLES ALEATORIAS II
Definicin: Si X e Y son dos v.a. definidas sobre el mismo espacio muestral. Llamamos variable
aleatoria bidimensional (X,Y) a una funcin
x, y : E 2
t X (t ), y (t )
Distribuciones Marginales
Si (x,y) es una v.a.b. con funcin de distribucin F(x,y). Llamamos funciones marginales de
distribucin de x e y a:
F1 ( x) lim F x, y P X x
y
F2 ( y ) lim F x, y P Y y
x
si la v.a. es discreta
p1 ( x) p x, y P X x funcin puntual de probabilidad de X
y
si la v.a. es continua
f1 ( x) f x, y dy funcin de densidad marginal de X
f 2 ( y)
f x, y dx funcin de densidad marginal de Y
INDEPENDENCIA DE VARIABLES
Definicin: Si (x,y) es una v.a.b. diremos que X e Y son independientes si la funcin de distribucin
conjunta es el producto de las marginales
X e Y independientes F x, y F1 ( x ).F2 ( y )
si la v.a. es discreta
X e Y independientes p x, y p1 ( x). p 2 ( y )
si la v.a. es continua
X e Y independientes f x, y f 1 ( x). f 2 ( y )
Definicin: Muestreo Aleatorio Simple (M.A.S.) es el que obtiene la muestra teniendo en cuenta:
1. Todos los individuos de la poblacin tienen la misma posibilidad de ser elegidos.
2. Las extracciones han de realizarse con reemplazamiento.
Si la poblacin es muy grande el reemplazamiento no tiene importancia.
Estadsticos muestrales
Suponemos que tenemos una v.a. X definida sobre una determinada poblacin. Sea (X1,X2,...,Xn) una
m.a.s. de tamao n. A cada (X1,X2,...,Xn) se le llama realizacin de la muestra.
Si llamamos M al conjunto de todas las posibles realizaciones de la muestra; llamamos estadstico
muestral a toda funcin real:
T :M
x1 , x2 , , x n T x1 , x2 , , x n
Observacin: como un estadstico es funcin de variables aleatorias este tambin ser variable
aleatoria con funcin de densidad
n
f T x1 , x2 , , x n f X i
i 1
por ser Xi independientes e idnticamente distribuidas.
X
Observacin: si no conocemos la varianza poblacional de la v.a. X entonces S
2
sigue una
n
distribucin que se llama T de Student con n-1 grados de libertad.
Si n
p 1 p p p
p N p, N 0,1
n p 1 p
n
Graficas de control
Definicin: Diremos que un proceso esta bajo control. Si la variable que lo describe sigue la misma
distribucin a lo largo del tiempo.
Definicin: Las grficas de control son instrumentos que se utilizan para ver si un proceso se encuentra
bajo control.
Grafica de control
X i
es un estimador de
X i 1
Observacin:
A E se llama sesgo
Observacin:
1. Si tenemos 2 estimadores con propiedades contradictorias. Entonces tomamos el que menor
error cuadrtico medio tenga, siendo: E.C.M . E
2
Var
n
0
n
X
Z
n
X
P Z Z 1
1
2
1
2
n
P Z . X Z . 1
1
2
n 1
2
n
P X Z . X Z . 1
1
2
n 1
2
n
P X Z . X Z . 1
1
2
n 1
2
n
Ejemplo: El tiempo de reaccin de un motor sigue una distribucin N (, 0.052) Cuntas medidas
deben hacerse para que al nivel de confianza al 95% error de la estimacin X no sea mayor de 0.01?
E X Z .
1
2 n
Datos:
E 0,01
0,05 2
0,05 0,05
n? 0,1 1,96. n 1,96. 96,04
n 0,01
Z 1,96
1
2
Observacin:
La potencia nos mide la fiabilidad del test. Consideramos fiable si la potencia es superior a 0,8
El nivel de significacin , si no lo tenemos, suponemos por defecto que es =0,05
X 0
7. Z 0
n
Z 0 Z
1
2
8. Rechazamos H0 si
Z 0 Z1
2
-Z Z0 Z
No tenemos argumentos para rechazar H0 si 1-
1-
2 2
n 16
Suponemos X N , 2 m.a.s.
X 5,6
H0 : 5
H1 : 5
X
Z N 0,1
n
5,6 5
Z0 1,2
2
16
Se mide la fiabilidad del test
Observacin: Para calcular la potencia tenemos que tener una alternativa fija
Observacin: En el caso de contraste bilateral como hay 2 zonas de rechazo, entonces calculamos
Tema 8
INFERENCIA PARA LA MEDIA
Suponemos que queremos estimar la media de una poblacin en la que la varianza sea desconocida,
1) Si n es suficientemente grande aproximamos 2 (varianza poblacional) por medio de S2
X
Z ~ N 0,1
(varianza muestral) y aplicamos lo anterior: S
n
X
T ~ t n 1
2) Si n no es suficientemente grande entonces usamos el estadstico: S
n
tn= distribucin t de Student con n-1 grado de libertad
Intervalo de confianza:
X
T ~ t n 1
S
n
X S S
P t n 1,1 t n 1,1 1 P X .t n 1,1 X .t n 1,1
2 S 2 n 2 n 2
n
Contraste de hiptesis:
X~N(,2) con 2 desconocida: tomamos una m.a.s. de tamao n<30
H 0 : 0
Contraste unilateral
H1 : 0
X
T ~ t n -1
S
n
X 0
T0
S
n
Rechazo H0 si T0 t n 1,1
2
Acepto H0 si T0 t n 1,1
2