You are on page 1of 6

Pag.

1
MUESTRAS ALEATORIAS Y DISTRIBUCIONES DE MUESTREO

Definición: Si las variables aleatorias x1.x2...........xn. tienen la misma función de


densidad de probabilidad que la de la distribución de la población, y su función de
distribución conjunta de probabilidad es igual al producto de las marginales, entonces
x1.x2............xn forman un conjunto de n variables aleatorias independientes e
idénticamente distribuidas (IID) que constituyen una muestra aleatoria de la
población.

Definición: Un Parámetro es una caracterización numérica de la distribución de la


población de manera que describe, parcial o completamente la función de densidad de
población de la característica de interés.

Definición: Una estadística (un estadístico) es cualquier función de las variables


aleatorias que se observaron en la muestra, de manera que esta función no contiene
cantidades desconocidas.

Definición: La distribución de muestreo de una estadística es la distribución de


probabilidad que puede obtenerse como resultado de un número infinito de muestras
aleatorias independientes, cada una de tamaño n provenientes de la población de
interés.

TEOREMA : Sean x1.x2...........xn, un conjunto de variables aleatorias independientes


normalmente distribuidas con medias E(xi) = µ y varianzas Var(xi) = σ i2, para i =
1.2.......n. Si Y = a1x1 + a2x2 + ......+anxn, en donde a1.a2...an son constantes, entonces “Y”
es una variable aleatoria distribuida normalmente con media
E(y) = a1µ 1 + a2µ 2 +......+ anµ n y varianza Var(y) = a12σ 12 + a22σ 22 +...+ an2σ n2.

TEOREMA DEL LÍMITE CENTRAL :


Sean x1.x2.........xn, n variables aleatorias independientes idénticamente distribuidas con
media µ y varianza σ 2 ambas finitas. La suma de esas variables S n = x1+x2+ ...+ xn es
una variable aleatoria con media nµ y varianza nσ 2, entonces
S n
− nµ
Z= se distribuye como una normal N(0;1). En otras palabras, el teorema
nσ 2

expresa que cuando n crece sin límite, la variable z tiende a distribuirse normalmente.
Si las variables no son idénticamente distribuidas, se podría demostrar igualmente que:
∑ x - ∑µ i i
z = se distribuye como una normal N(0;1), es decir que la suma de
∑σ
2
i
variables independientes tiende a ser normal con media suma de medias y varianza
suma de varianzas.

Estadística I
Prof. Luis Ramírez
Pag. 2
DISTRIBUCIÓN DE LA MEDIA MUESTRAL X :
Def. Sea x1,x2,… xn una muestra aleatoria de tamaño “n” de una población con función de
densidad f(x) con media µ y varianza σ2 . La media muestral representada por x , es
n

la media aritmética de los elementos de la muestra, es decir: ∑x i


.
x= i =1
n
Teorema: Sea x1,x2,…..,xn, una muestra aleatoria que consiste de n variables aleatorias
independientes normalmente distribuidas con medias E(xi) = µ y varianzas Var(xi) =
σ2 , i = 1,2, ……, n. Entonces la distribución de la media muestral x es normal con

σ
2
media µ y varianza . En efecto:
n
E(x)=E(
∑x i )=
1 ∑E ( x ) = 1/n(n.μ) ⇒ E( x ) = μ.
i
n
n
 ∑ xi 
Var ( x ) = Var  
∑ Var( x ) = nσ i
2

⇒ Var ( x ) = σ
2

 n  = 2 2
.
  n n n
x−µ ( )
σ
2
De aquí se tiene que x ~N(μ, .) Luego: Z = σ ~ N(0,1)
n n

Teorema: Sean x1,x2, ……..xn una muestra aleatoria de tamaño n, de una distribución
2
normal con media μ y varianza σ . Entonces zi = (xi – μ)/σ son variables aleatorias
2
 xi - µ 
∑1 zi = ∑  
n n
2
normales estándar e independientes, i = 1,2,..,n y tiene una

 σ 
i=1

distribución χ 2 con n grados de libertad


En la tabla correspondiente a esta distribución, podemos encontrar valores de
χ tales que P ( χ 2 > χ α.
2 2
)=
α α

Estadística I
Prof. Luis Ramírez
Pag. 3

χ
2

La distribución de muestreo de S2:

Teorema: Sea X1, X 2,…, Xn, una muestra aleatoria de una distribución normal con media

μ y varianza σ2. Entonces:


n

i =1
(
∑ xi − x )2

=
( n −1) s 2
σ2
tiene una distribución χ 2 con
σ2
(n-1) grados de libertad. x y s2 son también variables aleatorias independientes.
Ejemplo: Si X1, X2,…., X10 es una muestra aleatoria de una población distribuida
normalmente con media 8 y varianza 9. Calcular la probabilidad de que la varianza
muestral sea mayor que 3,753

Definición: Sea Z una variable aleatoria normal estándar y sea χ 2 una aleatoria Ji-
cuadrada con v grados de libertad. Entonces si Z y χ 2 son independientes:
Z
T= se dice que tiene una distribución t con v grados de libertad.
χ2 v
Si no se conoce σ y n < 30, se tiene sustituyendo en la expresión anterior:

x - µ 
 σ  n x -µ

T= = s ~ t n-1 g.l.
(n - 1)s 2 n
(n - 1)σ 2

Distribución F: Supóngase que deseamos comparar las varianzas de dos poblaciones


normales basados en la información contenida en muestras aleatorias independientes
de las poblaciones. Supóngase que una muestra aleatoria contiene n1 variables

σ
2
aleatorias distribuidas normalmente con una varianza común y que la otra muestra
1
aleatoria contiene n2 variables aleatorias distribuidas normalmente con una varianza

σ
2 2 2
común
2
. Si calculamos s 1
de las observaciones en la muestra 1, entonces s 1

σ
2 2
es una estimación de
1
. De manera similar s 2
calculada a partir de las

σ
2
observaciones de la segunda muestra es una estimación para . Así intuitivamente
2
2

podríamos pensar en utilizar


s 1
para hacer inferencias con respecto a las magnitudes
2
s 2

σ σ σ
2 2 2 2
relativas de
1
y
2
; si dividimos cada s1
por
1
entonces la razón siguiente:

Estadística I
Prof. Luis Ramírez
Pag. 4
2
s 1

σ
2
1 σ 22 s12
= 2 2 tiene una distribución “F” con(n1-1) y (n2-1) grados de libertad. La
2 σ 1 s2
s 2

σ
2
2
definición general de una distribución F es como sigue:
χ χ
2 2
Definición: Sean y variables aleatorias independientes con v1 y v2 grados de
1 2

χ
2

1
v1
libertad respectivamente. Entonces: F = se dice que tiene una distribución F
χ
2

2
v2
con v1 grados de libertad del numerador y v2 grados de libertad del denominador.

DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL: En una población binomial, dada


una muestra aleatoria (con reemplazamiento), la proporción muestral se define como el
cociente del número de elementos de la muestra que tienen la característica deseada,
x
entre el número total de elementos de la muestra pˆ = .
n
1
E ( p̂ ) = E(x/n) = 1/n E(x) = n np ⇒ E ( p̂ ) = p

1 1 p.q
Var ( p̂ ) = Var(x/n) = 2 Var(x) = 2 n.p.q
⇒ Var ( p̂ ) = luego p̂ ~N
n n n
(p; pq/n), es decir:
p̂ - p
Z = pq ~ N (0,1).
n

PROBLEMAS

1.- Una fábrica productora de alimentos envasa mermelada de frutas por medio de un proceso
automático. EL peso neto de un frasco se considera una variable aleatoria con un promedio de
420 gr. Y una desviación estándar de 15gr. El peso neto de cada frasco no afecta ni es afectado
por el peso neto de los otros. Una vez llenos los frascos se empacan en cajas de 72 frascos cada
una. ¿cuál es la probabilidad de que una caja contenga menos de 30 Kg. De mermelada.

Estadística I
Prof. Luis Ramírez
Pag. 5
2.- Una empresa firma un contrato para la entrega de 1290 unidades de un producto en
un mes. La empresa tiene 64 obreros, el número de unidades producidas por obrero por
mes es una variable aleatoria con media de 20 unidades y desviación estándar de 2..
¿Cuál es la probabilidad de que el contrato sea cumplido?.

3.- Para un nivel de ingresos, el SENIAT sabe que las cantidades declaradas por
concepto de deducciones médicas, contribuciones caritativas y gastos varios son
variables aleatorias independientes, normalmente distribuidas con medias $400; $800 y
$100 y desviaciones estándar $100; $250 y $40 respectivamente. A) ¿Cuál es la
probabilidad de que la cantidad total declarada por concepto de estas tres deducciones
no sea mayor de $1600? B) Si una persona con este nivel de ingresos declara por
concepto de estas deducciones un total de $2100, ¿qué tan probable es tener una
cantidad igual o mayor a este monto bajo las condiciones dadas?.

4.- Se tiene una máquina de llenado para vaciar 500 gr. de cereal en una caja de
cartón. Supóngase que la cantidad de cereal que se coloca en cada caja es una
variable aleatoria normalmente distribuida con media 500gr. Y desviación estándar igual
a 20gr. Para verificar que el peso promedio de cada caja se mantiene en 500 gr., se
toma una muestra aleatoria de 25 de éstas en forma periódica y se pesa el contenido
de cada caja. El gerente de la planta ha decidido detener el proceso y encontrar la falla
cada vez que el valor promedio de la muestra sea mayor de 510gr. o menor de 490gr.
Obtener la probabilidad de detener e proceso.

5.- Supóngase que el número de barriles de petróleo crudo que produce un pozo
diariamente es una variable aleatoria con una distribución no especificada. Se observa
la producción en 64 días, seleccionados en forma aleatoria, y si se sabe que la
desviación estándar del número de barriles por día es 16, determínese la probabilidad
de que la media muestral se encuentra a no más de 4 barriles del verdadero valor de la
producción por día.

6.- Un investigador desea estimar la media de una población usando una muestra
suficientemente grande, para que la probabilidad de que la media muestral no difiera de
la media de la población en más del 25% de la desviación estándar, sea 0,95. ¿De qué
tamaño debe tomarse la muestra?

7.- Si x1.x2.........x10 es una muestra aleatoria de una población distribuida normalmente


con media 8 y varianza 9. Calcular la probabilidad de que la media de la muestra sea
mayor que 9.

8.- La resistencia a la tensión para cierto tipo de alambre se distribuye normalmente con
una media µ y una varianza desconocida σ 2. Se seleccionaron al azar 6 segmentos
de alambre de un rollo grande; encuentre la probabilidad de que la media muestral esté
s
a lo sumo a 2,015 de la verdadera media poblacional µ .
n

9.- Si x1.x2.....x16 es una muestra aleatoria de una población binomial con p = 0,7.
¿ Cuál es la probabilidad de que la proporción muestral sea menor que 0,5?.

Estadística I
Prof. Luis Ramírez
Pag. 6
10.- Supóngase que quiere encontrar la proporción de los habitantes de Caracas que
favorece la construcción de una línea del METRO. ¿A cuántos habitantes se le debe
preguntar para que la probabilidad de que la proporción observada a favor de la
construcción de la línea difiera de la verdadera proporción en menos del 5% sea 0,98?.

11.- Un fabricante de cigarrillos asegura que el contenido promedio de nicotina en una


de sus marcas, es de 0,6 mg. por cigarrillo. Una organización independiente mide el
contenido de nicotina de 16 cigarrillos de esta marca y, encuentra que el promedio y la
desviación estándar es de 0,75 y 0,175 mg. Respectivamente de nicotina. Si se supone
que la cantidad de nicotina en estos cigarrillos es una variable aleatoria normal, ¿qué
tan probable es el resultado muestral dado el dato proporcionado por el fabricante?.

12.- El Departamento de Protección al Medio Ambiente asegura que, para un automóvil


compacto en particular, el consumo de gasolina en carretera es de un galón por cada
45 millas. Una organización independiente de consumidores adquieren uno de estos
automóviles y lo somete a prueba con el propósito de verificar la cifra proporcionada por
el DPMA. El automóvil recorrió una distancia de 100 millas en 25 ocasiones. En cada
recorrido se anotó el número de galones necesarios para realizar el viaje. Los 25
ensayos, el valor promedio y la desviación estándar tuvieron un valor de 43,5 y 2,5
millas por galón respectivamente. Si se supone que el número de milla que se recorre
por galón es una variable aleatoria distribuida normalmente, con base en esta prueba
¿existe alguna razón para dudar de la veracidad del dato dado por el DPMA?.

Estadística I
Prof. Luis Ramírez

You might also like