You are on page 1of 29

Tema 1

ESTADSTICA DESCRIPTIVA
Estadstica: Es la parte de las matemticas que trata de obtener Estadstica a partir de unos datos
numricos.
Estadstica descriptiva: se encarga de la recogida, organizacin y presentacin de los datos
obteniendo una serie de parmetros que los representen. Es totalmente objetiva.
Estadstica inferencial: se encarga del anlisis y toma de decisiones a partir de los datos
anteriores. Es un poco subjetiva. Hace uso del clculo de probabilidades.

Definiciones:
Llamamos poblacin a un conjunto de elementos con una caracterstica comn.
A cada elemento de la poblacin, lo llamamos individuo.
Llamamos muestra a cualquier conjunto de la poblacin.
Al nmero de individuos que componen la muestra se los llama tamao muestral.
Llamamos variable estadstica a cualquier caracterstica de los individuos de la poblacin que
podemos analizar.
Variables categricas o cualitativas: son aquellas que no se pueden cuantificar
numricamente.
Variables cuantitativas: aquellas que se pueden cuantificar numricamente. Se pueden
clasificar en:
o Discretas: aquellas que pueden tomar un numero finito o infinito numerable de
valores.
o Continuas: aquellas que pueden tomar todos los infinitos valores de un intervalo.
Definicin: Llamamos frecuencia absoluta ni de un valor Xi al nmero de veces que aparece dicho
valor.
m

n
i 1
i n tamao muestral Suponiendo X={x1,x2,...,xm}

Llamamos frecuencia absoluta acumulada Ni de un valor Xi al nmero de veces que aparece dicho
valor y todos los anteriores a l.
N i n j n1 n2 ... ni
j i

Nm n

Definicin: Llamamos frecuencia relativa fi de un valor Xi al cociente de la frecuencia absoluta de Xi y


el tamao de la muestra.
ni
fi
n
m
n n n n n ... nm n

i 1
f i f1 f 2 ... f m 1 2 ... m 1 2
n n n n
1
n

Llamamos frecuencia relativa acumulada Fi de un valor Xi a la suma de las frecuencias relativas de


dicho valor y de los anteriores a l.
Fi f j f1 f 2 ... f i
j i

Observacin: Si fi.100 obtenemos el % de incidencia del valor Xi sobre la muestra.


Representaciones grficas:
Ejemplos: (OA)

Diagrama de barras

24 26
16
8
1
1 2 3 4 5

Diagrama de sectores

8%
4% 30%

27%

31%

Para variables continuas o discretas con muchos valores, los datos se agrupan en clases.
Para formar las clases:
1) Redondeamos los valores (depende de los datos y precisin necesaria)
2) Elegimos el nmero de clases (entre 5 y 20) n n
3) Escribimos las clases de manera que cada elemento est perfectamente situado en 1 y solo 1 de
ellas.
Al punto medio se le llama marca de clase Xi
l i , l i 1 marca de clase X i li li 1
2

Diagrama de tallo y hojas:


Ejemplo: Altura

Histograma:
Lo que se debe ver en un histograma es:
Casos atpicos: son casos que son raros en funcin de los datos.
Simetra: se observa si el histograma es uniforme o simtrico en alguna de sus partes.

Ejemplo: Altura
Medidas asociadas a una variable:
Centralizacin:
x1 n1 x 2 n2 ... x m nm 1 m
1- Media aritmtica: x x i ni
n n i 1
Caractersticas:
Tiene en cuenta todos los datos: es muy representativa.
Es muy sensible a los datos atpicos y asimtricos.
No se puede calcular para variables categricas.
2- Moda (Mo): Es el valor de la variable que ms se repite.
Es la nica medida de centralizacin que se puede obtener para variables
categricas.
Cuando tengamos clases hablaremos de clase modal.
Si dos valores tienen frecuencia mxima hablaremos de variable
bimodal.
1- Mediana (Me): Es un valor de la variable que deja el 50% de la distribucin ordenada a
su derecha y el otro 50% a su izquierda.
No tiene en cuenta los valores de la variable, sino su situacin.
No es nada sensible a datos atpicos.
Cuando trabajamos con clases, hablamos de clase mediana.
Clculo:
n 1
Si el n de datos es impar, tomamos el elemento xi con i
2
Si el n de datos es par, la Me es la semisuma de los dos datos centrales.

Medidas de dispersin:
1- Rango o recorrido: R max{xi } min{xi }
1 m
2
2- Varianza: S x xi x 2 .ni
n 1 i 1
Tiene en cuenta todos los valores.
Es muy sensible a los valores atpicos y asimtricos.
Se expresa en las unidades de la variable al cuadrado.
3- Desviacin Tpica: S x S x 2

Observacin: Se estima que en el intervalo x Sx , x Sx se encuentra el 68%


aproximadamente de los valores de la variable.
En el intervalo x 2 S x , x 2S x 95%
En el intervalo x 3S x , x 3S x 99,7%

4- Rango intercuartlico: Ri Q3 Q1
Cuartiles: Son 3 valores Q1, Q2 y Q3 que dividen a la distribucin ordenada en 4 partes
iguales.
Q2=Me;
Q1= Me de los valores situados a la derecha de Q2;
Q3= Me de los valores situados a la izquierda de Q2.

Sx
Definicin: Coeficiente de variacin: CV
x

Series temporales:
Series Temporales

Ene Feb Mar Abr May


Se tom a generalm ente TIEMPO

Distribuciones Bivariantes:
Suponemos que x e y son dos variables sobre la misma poblacin.

x toma valores x1,x2,...,xn


(x,y) toma valores (x1,y1),(x2,y2),...,(xn,yn)
y toma valores y1,y2,...,yn

1 m n m xi . y i .ni
Covarianza: S xy xi x y i y ni x. y
n 1 i 1 n 1 i 1 n
Siendo ni la frecuencia de (xi,yi)
La covarianza relaciona los parmetros x e y.

S xy
Coeficiente de correlacin: r adimensional
S x .S y
-1 r 1
Diremos que hay una mayor relacin entre las 2 variables cuando r se vaya acercando a los
extremos, mientras que si est cerca del 0 se dice que hay poca relacin entre las 2 variables.

Ajuste por mnimos cuadrados:


Nube de puntos (x1,y1),(x2,y2),...,(xn,yn)

15

10
Se puede representar
5 como un eje de
coordenadas
0
0 2 4 6 8

Recta de regresin de y sobre x


16 La ideal recta que se
14 y=ax+b busca es la que hace
12 mnima la distancia a
10 todos los puntos, pero al
8 ser difcil de encontrar:
min{ axi b y i }
2
6
4
2
0
0 5 10 15 20

Funciones linealizables:
Funcin exponencial:
y a.e bx

ln y ln a.e bx
ln y ln a ln e bx
ln y ln a bx y ' A bx
Modelo potencial:

y a.x b

ln y ln a.x b
ln y ln a b. ln x y ' A bx'
Tema 2
FUNDAMENTOS DE LA TEORA DE LA
PROBABILIDAD
Definicin: Llamamos experimento aleatorio o estocstico a aquel que realizado en idnticas
circunstancias nunca podemos predecir los resultados. Como por ejemplo: lanzar un dado; extraer una
carta.
En caso contrario el experimento se llama determinista. Por ejemplo: cada libre.

Definicin: A cada una de las veces que repetimos un experimento aleatorio la llamamos prueba.
Definicin: Al conjunto de los posibles resultados de un experimento aleatorio se le llama espacio
muestral (E).
Definicin: Llamamos suceso a cualquier subconjunto del espacio muestral. En el ejemplo de lanzar
un dado:
E={1,2,3,4,5,6}
Sucesos: A={salir 1}
B={salir par}={2,4,6}
C={1,2,3,4,5,6}=E
D={}
Tipos de sucesos:
Suceso elemental: compuesto por un solo elemento muestral. Ejemplo: A
Suceso compuesto: formado por 2 o ms puntos muestrales. Ejemplo: B
Suceso cierto o seguro: siempre se verifica coincide con el espacio muestral.
Ejemplo: C
Suceso imposible: nunca se verifica . Ejemplo: D

Definicin: Dado un suceso cualquiera A, llamamos suceso opuesto, contrario o complementario A


A C a aquel que se verifica cuando no se verifica A.
Ejemplo: lanzar un dado
A={salir par}={2,4,6}
A C ={salir impar}={1,3,5}

Operaciones con sucesos:


Inclusin: diremos que A est incluido en B, o que A implica B si cuando se verifica A entonces
tambin se verifica B. Ejemplo:
B={salir par}; A={salir 4}
Igualdad: diremos que A es igual a B si A est incluida en B y B est incluida en A (A=B).
Ejemplo:
A={salir par}
B={salir 2,4,6}
Unin: dados 2 sucesos A y B, llamamos unin de A y B A B a otro suceso que se verifica
si se verifica A se verifica B. Ejemplo:
A={salir par}={2,4,6}
B={salir primo}={2,3,5}
A B ={2,3,4,5,6}
Interseccin: dados 2 sucesos A y B, llamamos interseccin de A y B A B a otro suceso que
se verifica si se verifica A y se verifica B. Ejemplo:
A={salir par}={2,4,6}
B={salir primo}={2,3,5}
A B ={2}
Definicin: Diremos que A y B son sucesos incompatibles si A B = (no se verifican
simultneamente)

Diferencia: dados 2 sucesos A y B, llamamos diferencia de A y B A B a otro suceso que se


verifica cuando se verifica A y no se verifica B. A B A B
Ejemplo:
A={salir par}={2,4,6}
B={salir primo}={2,3,5}
AB={4,6}
BA={3,5}

Diferencia simtrica: dados 2 sucesos A y B, llamamos diferencia simtrica de A y B AB a


otro suceso que se verifica A y no se verifica B se verifica B y no se verifica A.
AB A B A B A B B A A B B A
Ejemplo:
A={salir par}={2,4,6}
B={salir primo}={2,3,5}
AB {3,4,5,6}

Definicin: Diremos que n sucesos de un espacio muestral E; A1,A2,...,An forman un sistema completo
de sucesos si:
n

1. Ai E
i 1

2. Ai A j 0 i j

Propiedades:
A B B A
I. Conmutativas:
A B B A

A B C A B C
II. Asociativas:
A B C A B C

A A A
III. Idempotentes:
A A A

A B C A B A C
IV. Distributivas:
A B C A B A C

A E E
V.
EA A

A A
VI.
A

A A E
VII.
A A

E
VIII. E
A A
A B A B
IX. Leyes de Morgan:
A B A B

Introduccin al concepto de probabilidad


Probabilidad es la medida de la incertidumbre asociada a un suceso

Definicin: Llamamos probabilidad de un suceso A al valor entorno al cual tiende a estabilizarse la


frecuencia relativa del suceso A cuando se repite un n suficiente de veces.
n
P ( A) lim f a lim A
n n n

Definicin axiomtica de Kolmogorov:


Definicin: Llamamos funcin de probabilidad a una aplicacin del espacio de sucesos ().

P:
A P ( A)
que cumple 3 axiomas:

1 P( E ) 1
2 0 P ( A) 1
3 Si A y B incompatib les P ( A B ) P ( A) P ( B )

Consecuencias:
1. P() 0
En efecto:
E E y E
P ( E ) P ( E ) P () P () P ( E ) P ( E ) 0
2. P ( A ) 1 P ( A)
En efecto:
E A A y A A
P ( E ) P( A) P( A ) P ( A ) P ( E ) P ( A) P ( A ) 1 P ( A)
3. P( A B) P( A) P( B) P( A B)
En efecto:
A B ( A B ) ( A B) ( A B)
P( A B ) P ( A B ) P ( A B) P ( A B) *
A ( A B ) ( A B ) P ( A) P ( A B ) P( A B )
B ( A B) ( B A ) P ( B ) P ( A B) P ( B A )
* P ( A B ) P ( A) P( A B) P( A B) P ( B) P( A B)
4. Si A B P( A) P( B)
En efecto:
B A ( B A)
P ( E ) P ( A) P ( B A)

1
5. Si E est compuesto por n sucesos elementales A1,A2,...,An equiprobables entonces P ( Ai )
n
En efecto:
E A1 A2 ... An
1
1 P ( E ) P ( A1 ) P ( A2 ) ... P ( An ) n.P ( Ai ) P ( Ai )
n
6. Regla de Laplace: Si E est compuesto por n sucesos elementales equiprobables y sea A un
suceso compuesto por k sucesos, entonces:
k casos favorables
P ( A)
n casos posibles

Reglas de conteo:
Combinatoria
n= n de elementos disponibles
m= n de elementos elegidos

SI Variaciones con repeticin de n


elementos tomados de m en m
NO Se pueden VRn,m=nm
repetir elementos? NO Variaciones Vn,m=n(n-1).
SI n=m?
(n-2)...(n-m+1) n nm
!
!
Influye el orden
de eleccin? SI Permutaciones
(Pn=n!)
NO se SI combinaciones con repeticin
pueden repetir n n!
elementos? NO combinaciones Cn,m= m!( n m )!
m

Probabilidad condicionada
Definicin: Dados 2 sucesos A y B, llamamos probabilidad de A condicionado a B a:
B P(PA(B)B)
P A

Definicin: Decimos que A y B son independientes si P(A)=P(A/B)


En caso contrario se dicen dependientes.

Proposicin: A y B son independientes si y solo si P( A B ) P ( A).P( B )


En efecto:
P( A) P A B P(PA(B)B) P( A B) P( A).P( B)
Definicin: Experimentos compuestos: aquel que esta formado por 2 o ms experimentos compuestos.

Teorema de la probabilidad compuesta:


Sean A1,A2,...,An; n sucesos tales que P ( A1 A2 An 1 ) 0

Entonces: P( A1 A2 An ) P( A1 ).P
A2 . A3 P An
A3 A1 A2
A A A
1 2 n 1

Teorema de la probabilidad total


Sean A1,A2,...,An; un sistema completo de sucesos con P ( Ai ) 0
Sea B un suceso cualquiera.
n

Entonces: P ( B) P A1 .P B A P A2 .P B A P An .P B A P Ai .P B A
1 2 n i 1 i

Demostracin:
n n
B B E B Ai B Ai
i 1 i 1
B Ai B A j i j porque Ai A j i j

n
P( B ) P Ai .P B
i 1 Ai

Teorema de Bayes
En las mismas condiciones del teorema anterior
P Ai .P B
P Ai B Ai
P i
A
n
B
P A j .P B
P( B )
i 1 A j
Tema 3
VARIABLES ALEATORIAS I
Definicin: Una variable aleatoria es una funcin que asocia a cada elemento del espacio muestral un
numero real.
X :E
Observacin: Sobre un mismo espacio muestral se pueden definir varias variables aleatorias.
Ejemplo:
Experimento: Lanzar un dado
E={1,2,3,4,5,6}

X (i) i
7 si i 6

Y (i) 0 si i 5
2 si i 1,2,3,4

Observacin: Si el resultado del experimento son valores numricos se les suele asociar el mnimo
valor.
Si son resultados cualitativos se les asocia cualquier nmero.
Ejemplo:
Experimento: Lanzar moneda
E={C(cara),+(cruz)}

1 si sale cara
X
0 si sale cruz
Exp: Lanzar 3 monedas
E={CCC,CC+,C+C,+CC,C++,+C+,++C,+++}
X " n de caras obtenidas" {0,1,2,3}

Definicin: Funcin de distribucin es una funcin que asocia a cada valor de la variable aleatoria la
probabilidad acumulada hasta dicho valor.
F : 0,1
F ( Xi ) P X Xi
Ejemplo:
0 si t 1
1 si 1 t 2
6
26 si 2 t 3

FX 63 si 3 t 4
4 si 4 t 5
6
56 si 5 t 6

1 si t 6

Propiedades:
F(t) es creciente t1 t 2 F t1 F t 2
F(t) es continua por la derecha tlim F t F a
a

lim F t 1
t

lim F t 0
t

0 F t 1
P x t 1 F t
P a X b F b F a

Variables Aleatorias Discretas: Funcin Puntual de Probabilidad


Definicin: Diremos que una variable aleatoria X es discreta si puede tomar un numero finito de
valores o infinito numerable.
Definicin: Llamamos funcin puntual de probabilidad a una funcin que asocia a cada valor de la
variable su probabilidad.
P : X 0,1
X i p( X i ) P ( X X i )
Propiedades:
1. P X i 0
n
2. P X 1
i 1
i X { X 1 , X 2 , , X n }

Nota: estas 2 propiedades caracterizan una funcin puntual de probabilidad.


3. Ordenando los valores X 1 X 2 X n
F t P X i
X i t

Caractersticas de una Variable Aleatoria Discreta


Definicin: Sea X una v.a. discreta con funcin puntual de probabilidad p X i P X X i llamamos
esperanza matemtica de la v.a. X a:
n
E ( X ) X i .P X i
i 1
Observacin: La existencia de E(X) depende de la convergencia de la serie cuando X toma un n
infinito numerable de valores.
Propiedades de la esperanza:
1. Si C cte E (C ) C
E aX b aE X b
2. E (CX ) C .E ( X )
3. E X Y E X E Y
4. E X Y E X E Y
5. E X .Y E X .E Y

X E X en general
6. E
Y EY

Definicin: Sea X una v.a discreta con funcin puntual de probabilidad p X i P X X i . Llamamos
varianza de la v.a. X a:
Var X 2 E X
2

siendo E ( X )

Propiedades:
Var X E X 2 E ( X )
2

Demostracin:

Var ( X ) E X E X 2 2 X 2 E X 2 2 .E X E 2 E X 2 2 2 2
2

Var ( X ) E X 2 2
Propiedades:
1) Si C cte Var (C) 0
Var aX b a 2
.Var X Var b
2) Var CX C .Var ( X )
2
cte

3) Var X Y Var ( X ) Var (Y )


Definicin: Llamamos desviacin tpica de la v.a. X a la raz cuadrada positiva de la varianza
Var X

Variables Aleatorias Continuas: Funcin de Densidad


Definicin: Una v.a es continua cuando puede tomar todos los valores de un intervalo.
Ejemplo: Altura de las personas, longitud de un tornillo, etc.
Observacin: No se puede calcular la probabilidad de una valor determinado ya que siempre vale 0.
Entonces calculamos la probabilidad de que la variable se site en un intervalo.
P a X b
Definicin: Supongamos que tomemos una v.a. continua y los valores que toma los distribuimos en
clases. Entonces podemos hacer el histograma de esa variable.
Llamamos funcin de densidad f(X) a la funcin hacia cuya grfica tienden los histogramas de la v.a.
cuando elegimos las clases cada vez mas pequeas.
Propiedades:
1 f (X ) 0

Caracterizan una funcin de densidad
2 f ( X ).dx 1

x
3 F ( X ) f (t ).dt

b
4 P a X b F (b) F ( a ) f ( X ).dx
a

5 Si f ( X ) es continua en a F ' (a) f (a)

Caractersticas de una Variable Aleatoria Continua


Definicin: Sea X una v.a. continua con funcin de densidad f(X).
Llamaremos esperanza de X X a:

E X X X . f ( X ).dx

Observacin: La existencia de E(X) depende de la convergencia de la integral.

Definicin: Sea X una v.a. continua con funcin de densidad f(X). Llamamos varianza de X 2 a:

Var X 2 f ( X ). X .dx
2

Definicin: Llamamos desviacin tpica de X a: Var ( X )

Distribuciones Asociadas a Variables Aleatorias Discretas

1) Distribucin de Bernouilli: Suponemos que un experimento aleatorio tiene 2 posibles

E Exito
soluciones
F Fracaso

0 si sale F
X
1 si sale E
P(0) P X 0 q
p q 1
P(1) P X 1 p
P X r p r .q 1 r Funcin puntual de probabilidad de la distribucin de Bernouilli

E X 0.q 1. p p

Var X E X 2 E X p p 2 P(1 p ) p.q
2


E X 2 0 2.q 12. p p

2) Distribucin Binomial: Suponemos que repetimos un experimento un numero n de veces de


manera independiente. Si definimos:
X= n de xitos obtenidos en los n experimentos
n n de exp erimentos
Diremos que X sigue una distribucin Binomial de parmetros. p probabilid ad del xito
X B n, p
n r n r
P X r .p .q Funcin puntual de probabilidad de la distribucin Binomial

r
Es funcin puntual de probabilidad:

n
n r n r n n
r1r.pq pq1

X la podemos considerar como suma de n variables Xi que siguen una distribucin de
Bernouilli.

n n
E X E Xi E Xi p n. p
i 1 i 1 i 1

n n n
Var X Var Xi Var Xi p.q n. p.q
i 1 i 1 i 1

3) Distribucin de Poisson: Suponemos que estudiamos un suceso que ocurre espordicamente a


lo largo de un soporte continuo
X= n de veces que aparece dicho suceso en un periodo de tiempo
Diremos que X sigue una distribucin de Poisson de parmetro
X P Si se cumplen 2 condiciones:
i. El suceso aparece, a largo plazo, un n medio de veces
ii. La aparicin del suceso ocurre de manera independiente (el n de veces que
ocurre en un intervalo de tiempo no induce a saber el n de veces que ocurrir en
el siguiente intervalo).
r
P X r .e
r!
Es funcin puntual de probabilidad:

r
r
r! .e
r 0

e r!
r 0
e .e e 0 1


r
r
E X r. .e e r. e . .e
r 0 r! r 0 r r 1!

Var X E X 2 E X
2

Observacin: Tanto la distribucin Binomial como la Poisson son reproductivas respecto a los
parmetros n y respectivamente.
X B n1 , p
X Y B n1 n2 , p
Y B n2 , p
X P 1
X Y P 1 2
Y P 2

Distribuciones Asociadas a Variables Aleatorias Continuas

Distribucin Normal: Una v.a. X sigue una distribucin normal de parmetros y X , 2


Si tiene por funcin de densidad
1
x 2
f ( x) .e 2 2
2
Observacin:
1. f ( x) 0

2. f ( x ).dx 1

3. Es simtrica respecto de =Me=Mo


4. Tiene puntos de inflexin en - y +
t

5. f(x) no tiene primitiva F (t ) f ( x).dt


- +
Tipificacin de la normal
X
Si X N , 2 si defino Z Z N 0,1

Ejemplo:

X N 15,2 2
X 15 17 15
P X 17 P P Z 1 0,8413
2 2
X 15 12 15
P X 12 P P Z 32 P Z 1,5 1 P Z 1,5 1 0,9332 0,0668
2 2

Teorema de Moivre-Laplace
X n. p 1
t X2
P t

Si X B n, p entonces nlim
e 2 dx
n. p.q 2

Explicacin:
Si X B n, p n

X
N np , npq
Observacin: La distribucin de Poisson se puede aproximar a una normal cuando >5
Si X P
5
X ' N ,

Distribucin exponencial: Son variables asociadas a tiempos de espera para recibir determinados
servicios. X sigue una distribucin exponencial de parmetros X
Si tiene por funcin de densidad
x
f ( x) e
Funcin de distribucin
x
F ( x) 1 e
Esperanza
1
E ( x)

Varianza
1
Var ( x)
2

Observacin: Tanto la distribucin normal como la exponencial son reproducidas respecto a sus
parmetros.

X N 1 , 1
2

X Y N ,
2

2



Y N 2 , 2
2 1 2 1 2

X 1
X Y 1 2
Y 2
Tema 4
VARIABLES ALEATORIAS II
Definicin: Si X e Y son dos v.a. definidas sobre el mismo espacio muestral. Llamamos variable
aleatoria bidimensional (X,Y) a una funcin
x, y : E 2
t X (t ), y (t )

Definicin: Llamamos funcin de distribucin de una variable aleatoria bidimensional (x,y) a


F ( x, y ) P X x, Y y

VARIABLES ALEATORIAS BIDIMENSONALES DISCRETAS


Si llamo C al conjunto de posibles resultados de la v.a.b. (X,Y).
Si C tiene una cantidad finita o infinita numerable (x,y) se llama v.a.b. discreta.
Definicin: Llamamos funcin puntual de probabilidad conjunta de una v.a.b. discreta a una funcin:
p:C
x, y P x , y P X x , Y y
con
1. P x, y 0
2. p x, y 1
x y

VARIABLES ALEATORIAS BIDIMENSONALES CONTINUAS


Si C tiene una cantidad infinita de puntos (X,Y) se llama v.a.b. continua.
Definicin: Llamamos funcin de densidad conjunta de una v.a.b. continua:
f :C
x, y P x, y f x, y
con
1. f x, y 0


2.

f ( x, y ) dx dy 1

Distribuciones Marginales
Si (x,y) es una v.a.b. con funcin de distribucin F(x,y). Llamamos funciones marginales de
distribucin de x e y a:
F1 ( x) lim F x, y P X x
y

F2 ( y ) lim F x, y P Y y
x
si la v.a. es discreta
p1 ( x) p x, y P X x funcin puntual de probabilidad de X
y

p 2 ( y ) p x, y P Y y funcin puntual de probabilidad de Y


x

si la v.a. es continua

f1 ( x) f x, y dy funcin de densidad marginal de X


f 2 ( y)

f x, y dx funcin de densidad marginal de Y
INDEPENDENCIA DE VARIABLES
Definicin: Si (x,y) es una v.a.b. diremos que X e Y son independientes si la funcin de distribucin
conjunta es el producto de las marginales
X e Y independientes F x, y F1 ( x ).F2 ( y )
si la v.a. es discreta
X e Y independientes p x, y p1 ( x). p 2 ( y )
si la v.a. es continua
X e Y independientes f x, y f 1 ( x). f 2 ( y )

Observacin: Si X e Y son independientes E X .Y E X .E Y


Tema 5
MUESTREO Y DISTRIBUCIONES MUESTRALES
Definicin:
Poblacin: es un conjunto de elementos con una caracterstica comn (que ser el objeto de estudio).
Individuo: es cada uno de los elementos de la poblacin.
Muestra: es cualquier subconjunto de la poblacin.
Tamao muestral: es el numero de elementos que componen la muestra.
La caracterstica principal de una buena muestra es que sea representativa de la poblacin a estudiar.

Definicin: Muestreo Aleatorio Simple (M.A.S.) es el que obtiene la muestra teniendo en cuenta:
1. Todos los individuos de la poblacin tienen la misma posibilidad de ser elegidos.
2. Las extracciones han de realizarse con reemplazamiento.
Si la poblacin es muy grande el reemplazamiento no tiene importancia.

Otros tipos de muestreo:


Muestreo sistemtico: seleccionamos el primer elemento de manera aleatoria y los dems
sistemticamente como se halla fijado.
Muestreo estratificado
Muestreo por conglomerados

Estadsticos muestrales
Suponemos que tenemos una v.a. X definida sobre una determinada poblacin. Sea (X1,X2,...,Xn) una
m.a.s. de tamao n. A cada (X1,X2,...,Xn) se le llama realizacin de la muestra.
Si llamamos M al conjunto de todas las posibles realizaciones de la muestra; llamamos estadstico
muestral a toda funcin real:
T :M
x1 , x2 , , x n T x1 , x2 , , x n
Observacin: como un estadstico es funcin de variables aleatorias este tambin ser variable
aleatoria con funcin de densidad
n
f T x1 , x2 , , x n f X i
i 1
por ser Xi independientes e idnticamente distribuidas.

Distribucin de la media muestral: Teorema central de lmite


Suponemos que X una v.a. que sigue una distribucin normal de media , y varianza 2. Tomamos
(X1,X2,...,Xn) una m.a.s. y definimos
X X2 Xn
X 1
n
E X E . X 1 X 2 X n .E X 1 X 2 X n . E X i .n.E X
1 1 1 n 1
n n n i 1 n
Varianza:
Var X Var X 1 X 2 X n 2 .Var X 1 X 2 X n 2 . Var X i
1 1 1 n
n n n i 1
1 1 2
.n.Var X .n. 2

n2 n2 n
2
Si XN(,2) X N ,
n
Teorema central de lmite
Si X es una v.a. cualquiera con media y varianza 2 y (X1,X2,...,Xn) es una m.a.s. de tamao n
X n
N 0,1

n

Observacin: n es suficientemente grande si n30

X
Observacin: si no conocemos la varianza poblacional de la v.a. X entonces S
2
sigue una
n
distribucin que se llama T de Student con n-1 grados de libertad.

Distribucin asociada a la proporcin muestral


Suponemos que p es la proporcin de individuos de una poblacin de una determinada caracterstica.
Si tomamos una muestra aleatoria simple de tamao n y denotamos p a la proporcin muestral
n de exitos individuos de la muestra con la caracterstica n E
p
n n
n E B n, p
n 1 1
E p E E .E n E .n. p p
n n n
n 1 1 p.q p 1 p
Var p Var E 2 .Var n E 2 .n. p.q
n n n n n

Si n
p 1 p p p
p N p, N 0,1
n p 1 p
n

Graficas de control
Definicin: Diremos que un proceso esta bajo control. Si la variable que lo describe sigue la misma
distribucin a lo largo del tiempo.
Definicin: Las grficas de control son instrumentos que se utilizan para ver si un proceso se encuentra
bajo control.
Grafica de control

Pasos a seguir para hacer una grfica de control


1. Definimos la variable que nos define el proceso
2. Tomamos muestras de pequeo tamao a lo largo del tiempo
3. Dibujar una lnea central en la media
LS 3n
Dibujar las 2 lneas de control
LI 3n
4. Representamos en la grfica los puntos correspondientes a las medidas de todas las muestras
5. Ver si el proceso est bajo control.
Estar bajo control si:
a) Algn punto queda fuera de los limites de control, el proceso est fuera de control
b) Si aparecen 9 o ms puntos seguidos entre la lnea media y una de las 2 lneas de
control
3 3
c) Si 2 de cada 3 puntos estn situados entre las lneas de control y las
n n
2 2
lneas est fuera de control
n n
Tema 6
INTRODUCCIN A LA TEORA DE LA
APROXIMACIN
ESTIMACIN PUNTUAL
Definicin: Un estimador es un estadstico que intenta aproximar el verdadero valor de un parmetro
poblacional desconocido.
Ejemplo: X N , 2 donde es desconocido.

Tomamos una m.a.s. de tamao n


n

X i
es un estimador de
X i 1

n Cualquiera de los 2 es vlido pero X se


aproximar mas al valor
X2 es un estimador de m

Propiedades de los estimadores:


Definicin: Diremos que un estimador es centrado insesgado se la esperanza del estadstico coincide
con el parmetro poblacional estimado.

E = parmetro poblacional (desconocido)
= estimador

Observacin:
A E se llama sesgo

Definicin: Llamamos eficiencia o precisin de un estimador a la inversa de la varianza


Precisin 1

Var

Observacin:
1. Si tenemos 2 estimadores con propiedades contradictorias. Entonces tomamos el que menor
error cuadrtico medio tenga, siendo: E.C.M . E
2

2. Si an as no nos satisface exigiremos que al menos sea consistente



E
n

Var
n
0

ESTIMACIN POR INTERVALOS DE CONFIANZA


Definicin: Llamamos intervalo de confianza para un parmetro poblacional desconocido con nivel de
confianza 1- a una expresin del tipo 1 2 de manera que P 1 1
Observacin: Esto quiere decir que en el 100.(1-)% de los intervalos que fabriquemos con las
muestras obtenidas de la poblacin, el verdadero valor del parmetro se encuentra dentro del intervalo.

Intervalo de confianza para la media poblacional con 2


Supongo que X N , 2 con 2 conocido y queremos fabricar un intervalo de confianza para con
nivel de confianza (1-).
n

Tomamos una m.a.s. de tamao n; X i


es un buen estimador puntual de , y sabemos que
X i 1

n
X
Z

n


X
P Z Z 1
1
2
1
2
n

P Z . X Z . 1
1
2
n 1
2
n

P X Z . X Z . 1
1
2
n 1
2
n

P X Z . X Z . 1
1
2
n 1
2
n

Intervalo de confianza para con 2 conocido para X normal



X Z 1 . , X Z 1 .
2
n 2
n

Determinacin del tamao muestral


Error mximo cometido E X al estimar mediante X es:

E Z .
1
2 n
para una confianza dada 1-

Por tanto fijado el error:


2

n Z . es el tamao muestral para cometer como mximo dicho error
1 2 E

Ejemplo: El tiempo de reaccin de un motor sigue una distribucin N (, 0.052) Cuntas medidas
deben hacerse para que al nivel de confianza al 95% error de la estimacin X no sea mayor de 0.01?

E X Z .
1
2 n
Datos:
E 0,01
0,05 2
0,05 0,05
n? 0,1 1,96. n 1,96. 96,04
n 0,01
Z 1,96
1
2

Por tanto la muestra debe ser: n 97


Tema 7
INTRODUCCIN A LOS CONTRASTES
Definicin: Una hiptesis estadstica es una proposicin (afirmacin) sobre un parmetro
(desconocido) de una o varias poblaciones.
Definicin: Un test o contraste de hiptesis es un procedimiento que nos hace tomar decisiones sobre
determinadas proposiciones.
Definicin: Hiptesis nula H0 que es la que suponemos cierta de partida
Definicin: Hiptesis alternativa H1 que es la que suponemos cierta cuando rechacemos H0.
Definicin: Error tipo I es el que cometemos al rechazar H0 siendo sta cierta.
Definicin: Error tipo II es el que cometemos al aceptar H0 siendo H1 cierta (H0 falsa).

Decisin H0 cierta H0 cierta


Acepto H0 Decisin correcta Error tipo II
Rechazo H0 Error tipo I Decisin correcta

Observacin: Lo ideal sera que P(Error tipo I)=P(Error tipo II)=0

Definicin: Llamamos nivel de significacin un n fijo a de manera que P(Error tipo I)


Definicin: Llamamos potencia del test a la probabilidad de rechazar H0 siendo H1 cierta

H0 cierta H0 cierta = P(Rechazar H0 /H0 cierta)


Decisin 1- = P(Aceptar H0 /H0 cierta)
Decisin correcta Error tipo II = P(Aceptar H0 /H1 cierta)
Acepto H0
1- 1- = P(Rechazar H0 /H1 cierta)
Error tipo I Decisin correcta
Rechazo H0
1-

Observacin:
La potencia nos mide la fiabilidad del test. Consideramos fiable si la potencia es superior a 0,8
El nivel de significacin , si no lo tenemos, suponemos por defecto que es =0,05

Procedimiento a seguir para un test de hiptesis


1) Seleccionamos el parmetro que queremos contrastar
2) Planteamos la hiptesis nula H0
3) Planteamos la hiptesis alternativa H1
4) Seleccionamos el nivel de significacin
5) Elegimos un estadstico adecuado
6) Distinguimos entre la regin de aceptacin y rechazo para dicho estadstico
7) Calculamos el valor de dicho estadstico bajo la hiptesis nula
8) Tomamos decisiones sobre H0

Contraste para la media de una poblacin normal 2 conocida


Suponemos X N , 2 con varianza 2 conocida
1. Queremos hacer un contraste para
2. H 0 : H 0
H1 : 0 0 0
3.
contraste contraste
bilareral unilateral
4. Tomamos
5. Sabemos que X es un buen estimador de
X
Z N 0,1
El estadstico adecuado ser
n
6.

X 0
7. Z 0
n

Z 0 Z
1
2
8. Rechazamos H0 si
Z 0 Z1
2
-Z Z0 Z
No tenemos argumentos para rechazar H0 si 1-

1-

2 2

Definicin: p-valor es el menor nivel de significacin para el que rechacemos H0


Test unilaterales: p 1 P Z Z 0
Test bilaterales: p 21 P Z Z 0

Clculo de la potencia del test

n 16
Suponemos X N , 2 m.a.s.
X 5,6
H0 : 5
H1 : 5
X
Z N 0,1

n
5,6 5
Z0 1,2
2
16
Se mide la fiabilidad del test

Observacin: Para calcular la potencia tenemos que tener una alternativa fija

Suponemos que la alternativa =6


1- = P(Rechazar H0 /H1 cierta)=
2 X X 5
X N , N 0,1 N 0,1
n 2
n 16

X 5
6 P Z 0 1,64 / H 1 cierta P H 1 cierta
2
16

P X .1,64 5 H 1 cierta P X 5,82 H 1 cierta P X 5,82 6
1
2

X 6 5,82 6
P P Z 0,36 P Z 0,36 0,6406
2 2
16 16

Observacin: El test ser fiable si 1 0,8

Segunda forma de calcular la potencia


65
1 0 2
Calculamos 2
n 16

Z0 No sigue una N(0,1)


Z0- Sigue una N(0,1)

6 P Z 0 1,64 6 P Z 0 1,64 P Z 1,64 2 P Z 0,36 P Z 0,36


6 0,6406

Observacin: En el caso de contraste bilateral como hay 2 zonas de rechazo, entonces calculamos
Tema 8
INFERENCIA PARA LA MEDIA
Suponemos que queremos estimar la media de una poblacin en la que la varianza sea desconocida,
1) Si n es suficientemente grande aproximamos 2 (varianza poblacional) por medio de S2
X
Z ~ N 0,1
(varianza muestral) y aplicamos lo anterior: S
n
X
T ~ t n 1
2) Si n no es suficientemente grande entonces usamos el estadstico: S
n
tn= distribucin t de Student con n-1 grado de libertad

Intervalo de confianza:
X
T ~ t n 1
S
n


X S S
P t n 1,1 t n 1,1 1 P X .t n 1,1 X .t n 1,1
2 S 2 n 2 n 2
n

Contraste de hiptesis:
X~N(,2) con 2 desconocida: tomamos una m.a.s. de tamao n<30

H 0 : 0
Contraste unilateral
H1 : 0

X
T ~ t n -1
S
n

X 0
T0
S
n

Rechazo H0 si T0 t n 1,1
2

Acepto H0 si T0 t n 1,1
2

Inferencia para dos medias:


Suponemos que tenemos dos poblaciones

X 1 ~ N 1 , 12 con 12 conocida; tomamos una m.a.s. de tamao n1
X2 ~ N , con
2
2
2 2
2
conocida; tomamos una m.a.s. de tamao n2
12
X 1 ~ N 1 ,
n1 12 22
X X ~ N ,
2 1 2 1 2 n n
1 2
X 2 ~ N 2 , 2
n2
Estadstico:
X1 X 2 ~ N 0,1
12 22

n1 n 2

Inferencia para dos poblaciones con varianzas poblaciones desconocidas (distintas)


Suponemos que tenemos dos poblaciones

X 1 ~ N 1 , 12 con 12 conocida; tomamos una m.a.s. de tamao n1
X2 ~ N , con
2
2
2 2
2
conocida; tomamos una m.a.s. de tamao n2
Estadstico: Aproximamos 12 por S12 y 22 por S22
X X 2 1 2 ~ Frmula General de k
T 1
2
S1 S 2 2 t k
S12 S 22

n1 n2
k n1 n2
2 2
k min{n1 1, n n 1} 1 S12 1 S 22

n1 1 n1 n2 1 n2

You might also like