You are on page 1of 16

Problemas Ingeniería Civil en Minas

Intervalos Estadísticos basados en una muestra

Problema Nº1
El área de marketing de una empresa dedicada a la fabricación de computadores está
preocupada por las posibles fallas que estos presentan en un lapso de tiempo de 3 meses,
para verificar su forma de ensamblaje se observó lo siguiente en distintos años:

Año 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
PCs con fallas 6 8 7 10 5 6 7 4 5 7 6 4

Los análisis según gráficos han mostrado que las fallas se distribuyen de forma normal. Se
necesita saber un intervalo de confianza de 95% para la media de las fallas observadas en
los distintos años.

Problema Nº2
Un fabricante de libros de texto para universidades está interesado en estimar la
resistencia de la encuadernación hecha por una máquina en particular. La resistencia se
puede medir si se registra la fuerza necesaria para arrancar las páginas de la
encuadernación. Si esta fuerza se mide en libras, ¿cuántos libros deben probarse para que
el error cometido en la estimación del verdadero promedio sea no mayor a 0,1 lb con 95%
de confianza? Suponga que = 0,8 lb.

Problema Nº3
Considere los siguientes 1000 intervalos de confianza al 95% para que un consultor en
estadística obtendrá para varios clientes. Suponga que los conjuntos de datos sobre los que
están basados los intervalos se seleccionan de manera independiente entre sí.
a) ¿Cuántos de estos 1000 intervalos espera usted que capturen el valor correspondiente
de ?
b) ¿Cuál es la probabilidad de que entre 940 y 960 de estos intervalos contenga el valor
correspondiente de ?

Problema Nº4
Se determinó la cantidad de expansión lateral (mils) para una muestra de n = 9 soldaduras
de arco de metal y gas accionado por pulsos, empleados en tanques contenedores de gas
licuado natural en barcos. La desviación estándar muestral resultante fue s = 2.81 mils.
Suponiendo normalidad, determine un intervalo de confianza de 95% para 2 y . ¿Cuál
debería ser el nuevo tamaño muestral para que el límite superior del IC para , no sea
superior en más del 40% al inferior?

Problema Nº5
Sea X 1 , X 2 ,......, X n una muestra aleatoria de la duración de información en CDs (“tiempos
de vida” de la información en los CDs, en años). El fabricante de estos CDs, argumenta
que la función de densidad de probabilidad de los CDs es exponencial. Para determinar
esto, recopiló la siguiente información sobre la duración de la información (en años) de 32
CDs:

1,7608 4,3192 2,8868 12,426 27,7359 7,8288 0,905 2,7391


4,9092 0,8376 10,8476 3,3335 9,8361 1,505 3,3382 15,4049
1,8298 16,19 9,9817 6,2342 2,7197 4,2868 5,7499 2,7448
0,1682 6,9115 3,6457 6,2786 3,0316 3,9912 1,282 1,6601

a) Determine la distribución asintótica del MLE de para una distribución exponencial.


Utilice este hecho para derivar un IC del 100(1 - )% para basado en muestras
grandes. Utilizando los datos proporcionados (consideraremos que n = 32 es una
muestra grande) para determinar un IC del 95% para el verdadero tiempo promedio
de duración de los CDs.
n
Se puede demostrar que la variable aleatoria 2 X i , cuando Xi ~ Exp( ), tiene una
i 1

distribución chi cuadrado con 2n grados de libertad. Utilice este hecho y además
suponga que la afirmación del fabricante es cierta para:
b) Derivar un IC del 100(1 - )% para el verdadero tiempo promedio de duración de los
CDs. A partir de los datos entregados, calcule un IC del 95% y explique su
significado. Compare el resultado obtenido con el inciso a) y concluya.
c) Derivar un IC del 100(1 - )% para la confiabilidad del tiempo de duración de los
CDs, a los t años. A partir de los datos entregados, calcule un IC del 95% para la
confiabilidad de los CDs al año.
Intervalos Estadísticos y Pruebas de Hipótesis basadas en una muestra

Problema Nº6
Una compañía desea lanzar al mercado un nuevo producto. Para conocer la aceptación del
mismo realiza previamente una encuesta entre 200 personas elegidas al azar, de las que 37
manifiestan su disposición a comprarlo. Obtener un intervalo con un 95% de confianza
para la proporción p de compradores potenciales de este nuevo producto.

Problema Nº7
El área de marketing de una empresa dedicada a la fabricación de chanchitos de greda con
fines financieros (alcancías), está preocupada por las posibles consecuencias que podrían
producirse en el mercado debido a la crisis del gas natural con Argentina (se cree que si las
tarifas de electricidad aumentan, la gente dedicará menos dinero al ahorro y por lo tanto,
la venta de chanchitos de greda podría disminuir significativamente). La empresa ha
recopilado información histórica anual de ventas de chanchitos. Esta información se
presenta a continuación en la siguiente tabla:

Año Ventas Año Ventas Año Ventas


1993 1540 1997 1610 2001 1504
1994 1320 1998 1590 2002 1496
1995 1610 1999 1475 2003 1388
1996 1495 2000 1430

Los análisis gráficos preliminares indican que las ventas han tendido a distribuirse en
forma normal a lo largo del tiempo.
a) Como un primer paso en el análisis de la situación se le pide a usted desarrollar una
expresión que le permita encontrar un rango de valores dentro de los cuales podrían
encontrarse las ventas de chanchitos de greda del año 2004 con niveles de confianza
del 90%.
b) Determine un intervalo en el cuál tengamos un 99% de confianza que se encuentran al
menos el 95% central de la venta anual de chanchitos.

Problema Nº8
Sea 1 > 0, 2 > 0, con 1+ 2= . Entonces:
X
P z 1
z 2
1
/ n
a) Utilice esta ecuación para obtener una expresión más general para un IC de 100(1 –

)% para , del cual el intervalo x z /2 ,x z /2 es un caso especial.


n n
b) Sea = 0,05, 1 = /4 y 2 = 3 /4. ¿El resultado es un intervalo más preciso o menos

preciso que el intervalo x z /2 ,x z /2 ? Justifique.


n n
c) Demuestre que cuando 1 = 2 = /2, el IC es el más preciso, es decir el de menor
longitud que se puede encontrar (en otras palabras, el intervalo simétrico es el más
corto). [Sugerencia : a) Plantee una expresión general para la longitud del intervalo
general en función de 1 y 2; b) Por definición de z , z 1 , de modo que
1
1 z ; c) La relación entre la derivada de una función y f x y su
1 d 1 1
función inversa x f y es f y ]
dy f' x

Problema Nº9
El superintendente de un gran distrito escolar, que alguna vez cursó probabilidad y
estadística, piensa que el número de maestros ausentes en cualquier día dado tiene una
distribución de Poisson con parámetro . Se han muestreado 50 días, obteniéndose los
siguientes resultados:

Número de
0 1 2 3 4 5 6 7 8 9 10
ausencias
Frecuencia 1 4 8 10 8 7 5 3 2 1 1

Asumiendo que el superintendente tiene la razón, responda lo siguiente:


a) Derive un IC de muestras grandes para el parámetro de una población que se
distribuye Poisson. Recuerde el uso del TCL y que si X ~ P E X V X
. Así realice una derivación similar a la realizada en la derivación del IC para la
proporción p de una población, sin estimar el error estándar del estimador X del
parámetro λ.
b) Repita el inciso a), pero esta vez estime el error estándar del estimador X del
parámetro .
c) Aplique lo encontrado en los incisos a) y b) anteriores en el problema dado, y
verifique si la precisión de los IC (para 90%, 95% y 99%) es notoriamente diferente
cuando se estima el error estándar del estimador de cuando no se hace, usando los
datos entregado al comienzo. Estime el aumento o disminución porcentual en la
longitud de cada IC (para cada nivel de confianza).

Problema Nº10
Antes de convenir en la compra de un pedido grande de hojas de polietileno, para un tipo
de cables eléctricos de alta presión, llenos de aceite para submarino, una compañía desea
ver evidencia concluyente de que la verdadera desviación estándar de grosor del forro es
menor de 0,05 mm. ¿Cuáles hipótesis deben probarse y por qué? . En este contexto, ¿cuáles
son los errores de tipo I y tipo II?

Problema Nº11
Se toman muestras de agua utilizada para el enfriamiento, mientras se descarga de una
planta eléctrica en un río. Se ha determinado que la temperatura media del agua
descargada sea a lo sumo de 150°F, así no habrá efectos negativos en el ecosistema del río.
Para investigar si la planta cumple los reglamentos que prohíben una temperatura media
del agua descargada arriba de 150°F, se toman 50 muestras en horas seleccionadas al azar
y se registra la temperatura de cada una. Los datos resultantes se utilizarán para probar las
hipótesis H0: µ = 150°F contra la alternativa Ha: µ > 150°F. En el contexto de esta situación,
describa los errores del tipo I y tipo II ¿Cuál tipo de error considera que es más grave?
Explique.
Pruebas de Hipótesis basadas en una muestra

Problema Nº12
Una mezcla de ceniza pulverizada de combustible y cemento Portland para techar, debe
tener una resistencia a la compresión de más de 1300 kN/m2. La mezcla no se utilizará a
menos que una evidencia experimental indique de manera concluyente que se ha
satisfecho la especificación de resistencia. Supongamos que la resistencia a la compresión
para especímenes de esta mezcla está distribuida normalmente con σ = 60. Representemos
con el verdadero promedio de resistencia a la compresión.
d) ¿Cuáles son las hipótesis nula y alternativa adecuadas? ¿Qué significa aceptar o
rechazar la hipótesis en el contexto del problema?
e) Denotemos por X el promedio de la resistencia muestral compresiva para n = 20
especimenes seleccionados al azar. Considere ahora el procedimiento de prueba con
estadístico de prueba X y región de rechazo x 1331.26 . ¿Cuál es la distribución de
probabilidad del estadístico de prueba cuando H0 es verdadera? ¿Cuál es la
probabilidad de un error tipo I para el procedimiento de prueba?
f) ¿Cuál es la distribución de probabilidad del estadístico de prueba cuando µ = 1350?
Considerando el procedimiento de prueba del inciso b) ¿cuál es la probabilidad de
que la mezcla se considere no satisfactoria cuando de hecho µ = 1350?
g) ¿Cómo cambiaría ud. el procedimiento de prueba del inciso b) para obtener una
prueba con nivel de significancia de 0.05? ¿Qué impacto tendría este cambio en la
probabilidad de error del inciso c)?
X 1300 X 1300
h) Considere el estadístico de prueba estandarizado Z . ¿Cuáles
/ n 13, 42
son los valores de Z correspondientes a la región de rechazo del inciso b)?

Problema Nº13
Para determinar si los jugadores de tenis prefieren las cuerdas de tripa por sobre las de
nylon, se les entregaron raquetas a 20 tenistas las cuales aparentemente eran idénticas,
excepto que una tenía cuerdas de nylon y la otra tenía cuerdas de tripa. Tras varias
semanas de jugar alternadamente con ambas raquetas, se les preguntó a los deportistas
por sus preferencias. Sea p la proporción de tensitas que prefieren tripa y X el nº de
tenistas de la muestra que prefieren tripa. Considere la H0: p = 0,5 (a lo sumo el 50% de los
deportistas prefiere tripa).
a) ¿Cuál de las siguientes regiones de rechazo es más apropiada y por qué las otras no lo
son?: {15, 16, 17, 18, 19, 20}, {0,1,2,3,4,5} ó {1,2,3,17,18,19,20}
b) ¿Cuál es la probabilidad de cometer error del tipo I para la región seleccionada en el
inciso a)?
c) Si el 60% de los tensitas prefieren tripa, calcule la probabilidad de error tipo II usando
la región elegida en el inciso a)?
d) Si 13 de 20 jugadores prefieren cuerdas de tripa, ¿debe rechazarse H0 si se utiliza un
nivel de significación de 0,10?
e) ¿Cuál sería su respuesta a la pregunta anterior si no se le informara a usted el nivel de
significación de la prueba?

Problema Nº14
Marcela Hernando, candidata a alcalde por Antofagasta, afirma que más del 50% de los
antofagastinos votarán por ella en las elecciones del próximo domingo 26 de octubre. Un
alumno de la carrera de ICI incrédulo ante la afirmación de la candidata, decide
consultarle a 18 compañeros de universidad, inscritos en el registro electoral, a través de
una réplica del voto de alcalde que llenarán el próximo domingo. De los alumnos
encuestados, 10 se mostraron de acuerdo en votar a favor de la candidata.
a) Plantee claramente las hipótesis adecuadas, y explique verbalmente, basándose en sus
hipótesis, cada posible error al tomar una decisión.
b) ¿Cuánto es la máxima probabilidad de que el alumno de ICI no concuerde con lo
afirmado por la candidata, si el alumno está en lo correcto?
c) ¿Cuál debe ser la región de rechazo si queremos tener una confianza del 95%?
d) ¿Cuál es la probabilidad de que el alumno de ICI no concuerde con lo afirmado por la
candidata si la verdadera proporción de antofagastinos que votarán por la candidata
el próximo domingo es p = 52% y mantenemos el 95% de confianza?

Problema Nº15
W.A. Company tiene un departamento de servicio al cliente que maneja preguntas y
reclamos de sus clientes. Los procesos de este departamento están configurados para
responder de manera rápida y segura a los clientes que llaman por sus problemas. Sin
embargo, hay una minoría de clientes que prefieren dejar sus reclamos a través de cartas.
Tradicionalmente, el departamento de servicio al cliente no ha sido muy eficiente en
responder a estos clientes.
Los clientes que escriben, primero reciben un correo solicitándoles que llamen al
departamento de servicio al cliente, y cuando ellos llaman el representante de dicho
departamento, quién responde por teléfono, típicamente no tiene conocimiento de los
problemas del cliente. Hace dos meses atrás, el gerente del departamento estimaba que el
15% de los clientes que dejan sus reclamos por escrito, no habían obtenido una respuesta
satisfactoria dentro de 30 días desde que sus cartas fueron recibidas. La meta del gerente
es reducir este valor al menos a la mitad.
Para lograr esta meta, hace un mes y medio atrás el gerente cambió el proceso de respuesta
a los clientes que dejan por escrito sus reclamos. Bajo el nuevo proceso, estos clientes
reciben una carta de forma amable y rápida, la cual responde a sus problemas (reclamos).
La carta establece que si el cliente aún tiene problemas, puede llamar al departamento. El
gerente también archiva las cartas originales, de modo que si el cliente llama de nuevo, el
representante sea capaz de encontrar su carta rápidamente y responder inteligentemente.
Hasta el momento, con este nuevo proceso el gerente ha encontrado que sólo 2 de 25 de
ellas han sido encontradas no satisfechas después de 30 días.
a) ¿Ha logrado el gerente su meta?. Utilice el método del valor p.
b) Utilizando un 85% de confianza, ¿cuál es la probabilidad de que el gerente estime que
ha logrado la meta, cuando la verdadera proporción de clientes insatisfechos después
de 30 días es del 6%?
c) Determine el número de cartas que el gerente debe recolectar, para lograr una
probabilidad no mayor al 85% de que el gerente estime que no ha logrado la meta,
cuando en realidad la proporción de clientes insatisfechos después de 30 días es del
6% y una probabilidad de que el gerente estime que ha logrado la meta cuando no lo
ha hecho del 15%.

Problema Nº16
Altos ejecutivos de la radio Corazón se encuentran preocupados, debido a que en las
últimas semanas han notado un descenso en el número promedio de llamados telefónicos
que realizan los auditores al programa el Chacotero Sentimental. Antes de esta situación el
programa era muy rentable ya que como mínimo se recibían 20 [llamadas/programa], lo
cual era muy llamativo para los auspiciadores. Para resolver esta problemática, los
ejecutivos de la radio han solicitado al productor del programa información sobre el
número de llamadas recibidas durante los dos últimos meses (40 programas), se donde se
obtuvo que x 17,56 [llamadas/programa] y s1 5, 23 [llamadas/programa]. Suponga
que el número de llamadas recibidas durante cada programa es una v.a. Poisson.
a) Con la información dada, ¿sigue el programa siendo llamativo para los
auspiciadores? Utilice el método del valor p.
b) ¿Cuál es la probabilidad de que el programa no siga siendo llamativo para los
auspiciadores, si en verdad el número medio de llamadas recibidas por programa es
18? Considere una probabilidad de no rechazar correctamente del 95%.
c) ¿Cuál es la máxima probabilidad de que el programa siga siendo llamativo para los
auspiciadores, cuando realmente corresponda?

Problema Nº17
Un arqueólogo sostiene que la antigüedad de una pieza es de 5.000 años. Esta afirmación
se basa en medidas de partículas radioactivas que él ha hecho a la pieza. Por
conocimientos previos del arqueólogo, se sabe que el número de partículas radioactivas
emitidas por minuto, sigue una distribución de Poisson y estima que para esta pieza, el
número promedio de partículas radioactivas por minuto es ½. Si llegasen a ser más, su
afirmación sobre la antigüedad de la pieza estaría muy subestimada. Para confirmar su
afirmación el arqueólogo hizo 9 observaciones de partículas radioactivas emitidas por
minuto, en diferentes momentos de un día, las cuales resultaron en:

0 1 2 0 1 3 2 1 0
d) Plantee claramente las hipótesis adecuadas, y explique verbalmente, basándose en sus
hipótesis, cada posible error al tomar una decisión.
e) Diseñe un procedimiento de prueba, creando un estadístico de prueba el cuál tenga
una distribución conocida cuando H0 es cierta. Plantee la forma de la región de
rechazo. [Sugerencia: Recuerde la propiedad reproductiva de la distribución Poisson]
f) Realice un procedimiento de prueba, a un nivel 5% y decida a partir de la muestra
dada. ¿Cuál es el valor p de esta prueba?. Explique qué cambios, eventualmente,
podrían haber en su decisión si cambiamos el nivel de significación de la prueba.
g) Otro arqueólogo afirma que la antigüedad de la pieza es 10.000 años, por lo que el
verdadero número promedio de partículas radioactivas por minuto es en realidad 1,5.
Suponiendo que esta afirmación es verdadera, ¿cuál es la probabilidad de detectar
este hecho, con una confianza del 95%?
Inferencias basadas en dos muestras

Problema Nº18
Los representantes del Centro de Alumnos de la carrera de Lobotomía de la Universidad
Nacional están conduciendo un estudio para determinar si existe diferencia entre las
calificaciones obtenidas por los alumnos que asisten al curso de Estadística con dos
profesores diferentes A y B. Sean 1 y 2 los verdaderos promedios de las calificaciones
obtenidas por los alumnos de los profesores A y B respectivamente. El muestreo de
calificaciones llevado a cabo por el CEAL se indica a continuación:
Profesor A 3,7 4,5 3,3 3,8 5,5 5,3 4,8
Profesor B 3,7 3,6 5,1 4,9 4,5 4,0 -
h) El presidente del CEAL sospecha que las notas de ambos paralelos poseen
variabilidades diferentes ¿Qué respondería usted utilizando el método del valor p?
i) Ahora el presidente del CEAL desea evaluar el desempeño de los profesores a partir
del rendimiento de los alumnos mostrado en sus calificaciones, ¿podemos afirmar que
en promedio el desempeño de los alumnos es el mismo? Utilice el método del valor p
para concluir.

Problema Nº19
La pintura de una autopista se surte en dos colores: blanco y amarillo. El interés se centra
en el tiempo de secado de la pintura; se sospecha que la de color amarillo se seca más
rápido que la blanca. Se obtienen mediciones de ambos tipos de pintura. Los tiempos de
secado (en minutos) son los siguientes:
Blanca 120 132 123 122 140 110 120 107
Amarilla 126 124 116 125 109 130 125 117 129 120

a) Encuentre un intervalo de confianza del 95% para la diferencia entre los tiempos de
secado medios, suponiendo que las desviaciones estándar poblacionales son iguales.
Suponga además que el tiempo de secado se distribuye normalmente.
b) A partir del inciso anterior, ¿podría afirmarse que la pintura amarilla se seca más
rápidamente que la blanca?
c) ¿Podría decirse que el supuesto de que las desviaciones poblacionales son iguales es
correcto? ¿Cuál es el valor p de esta prueba?

Problema Nº20
Las meseras han empleado diversas estrategias para aumentar sus propinas. Un artículo
en el “The New Yorker”, del 5 de Septiembre de 2005, reporta que “en un estudio una
mesera recibió 50% más en propinas cuando ella se presentó por su nombre que cuando
no lo hizo”. Considere los siguientes datos (ficticios) de cantidad de propinas como un
porcentaje de la cuenta:
Presentación m = 50 x 22,63 s1 = 8,23
Sin Presentación n = 50 y 14,15 s2 = 5,68

¿Sugieren estos datos que una presentación incrementa el promedio de las propinas en
más de un 50%?. Realice todos los supuestos necesarios. Utilice el método del valor p.

Problema Nº21
Un fabricante de automóviles debe elegir entre un determinado tipo de piezas de acero
suministradas por un proveedor A y otras suministradas por otro proveedor B. Para
proceder a la elección ha analizado la resistencia a la tracción de las piezas suministradas
por ambos proveedores, tomando una muestra de tamaño 10 de las piezas del primero, y
otra de tamaño 12 del segundo. La resistencia media de la muestra de A es de 54.000
unidades y la de la muestra de B es de 49.000 unidades siendo las desviaciones muestrales
sA = 2.100 y sB = 1.900. Las resistencias de las piezas de ambos proveedores se distribuyen
normalmente. Las piezas del proveedor B son más económicas que las del proveedor A,
por lo que estas últimas sólo son rentables si tienen una resistencia media al menos 2.000
unidades mayor que las de B, y la misma variabilidad.
a) ¿A qué proveedor habría que comprar las piezas a la vista de los resultados
muestrales?. Utilice el método del valor p.
b) Asumiendo que los resultados muestrales son representativos, ¿qué tamaño debería
tener una futura muestra (nA = nB = n) para que cambiara su decisión en el inciso a)?

Problema Nº22
La carrera de Ingeniería Civil Industrial de la UCN ha comenzado a realizar un curso de
capacitación de MS Excel Avanzado para los alumnos de último año, con tal de mejorar las
habilidades que estos poseen en dicho software, cuyo dominio es indispensable para el
trabajo en el mundo laboral. Para medir el nivel de efectividad del curso se tomaron 9
alumnos al azar y se les evalúa antes y después de la capacitación, su dominio del
software, obteniendo los siguientes resultados:

Alumno 1 2 3 4 5 6 7 8 9
Antes 78 91 78 78 84 67 92 70 76
Después 81 87 86 82 90 86 96 73 95

El Jefe de Carrera les solicita a los alumnos de Estadística Aplicada 2 que analicen la
efectividad del curso de capacitación, realizando un test adecuado al problema, y usando
el valor p para tomar sus decisiones.

Problema Nº23
En cierta región de Chile, una muestra de 300 residentes urbanos adultos dejó ver que 63
estaban a favor de aumentar el límite de velocidad en carreteras de 100 a 120 kilómetros
por hora, mientras que una muestra de 180 residentes rurales indicó que 75 estaban a favor
del aumento.
a) ¿El sentir de aumentar la velocidad es coincidente? Utilice el método del valor p.
b) Un asesor del directorio asegura que los residentes de zonas rurales son más
contrarios al aumento de velocidad por su cultura y forma de ser. ¿Qué puede decir
usted? Utilice el método del valor p.
c) Si las verdaderas proporciones a favor del aumento son en realidad 20% para
residentes en zonas urbanas y 40% para residentes en zonas rurales, ¿cuál es la
probabilidad de detectar esta discrepancia?, respecto a la coincidencia.
d) Si las verdaderas proporciones a favor del aumento son en realidad 20% para
residentes en zonas urbanas y 40% para residentes en zonas rurales, y se desea un
nivel de significancia del 5% y una probabilidad de detectar esta discrepancia del
90%, respecto a la coincidencia; ¿qué tamaño muestral (igual para ambos tipos de
residentes) se necesitaría para cumplir con estas condiciones?.

Para comparar la eficiencia de dos compiladores de Pascal, se ejecutaron con cada uno de
ellos 10 programas seleccionados aleatoriamente. Los tiempos de ejecución, en segundos,
vienen indicados en la siguiente tabla:

Programa 1 2 3 4 5 6 7 8 9 10
Compilador A 4,2 4,7 4,6 3,8 2,7 3,6 4,2 4,5 3,9 4,1
Compilador B 4,2 3,9 3,3 3,5 2,7 3,1 3,3 4,7 4,2 3,7

Suponga que el tiempo empleado por compilador para compilar un programa tiene una
distribución normal.
a) A partir de la información anterior, ¿podemos inferir que el compilador A es más
lento que el compilador B?. Justifique el procedimiento de prueba utilizado. Utilice el
método del valor p. Plantee los errores que se pueden cometer al utilizar esta muestra
en el procedimiento de prueba.
b) ¿Es posible concluir que el tiempo de ejecución de cada programa en cada compilador
se aleja en promedio de su promedio respectivo en la misma cantidad?. Utilice el
método del valor p.

Problema Nº24
A veces, los experimentos donde intervienen respuestas de éxito o fracaso se corren por
pares o de la manera antes/después. Suponga que antes de un discurso político importante
de un candidato se seleccionan n personas y se les pregunta si están (S) o no están (F) a
favor del candidato. Después, tras el discurso, a las mismas n personas se les hace la
anterior pregunta. Las respuestas se anotan en una tabla como sigue:
Después
S F
S X1 X2
Antes
F X3 X4

donde X1 + X2 + X3 + X4 = n. Represente con p1 , p 2 , p 3 y p 4 las probabilidades de las


cuatro celdas, de modo que p1 = P(S antes y S después), etc. Deseamos probar que la
hipótesis de la verdadera proporción de simpatizantes (S) después del discurso, no ha
aumentado contra la alternativa de que sí ha aumentado.
a) Exprese las dos hipótesis de interés en términos de p1 , p 2 , p 3 y p 4 .
b) Cuando n sea grande, se puede demostrar que la variable aleatoria (Xi - Xj)/n tiene
2
una distribución normal aproximada con varianza dada por [ pi p j ( pi p j ) ]/n.
Utilice esto para construir un estadístico de prueba con aproximadamente una
distribución normal estándar cuando H0 es verdadera.
c) Si x1 = 350, x2 = 150, x3 = 200 y x4 = 300, ¿qué se puede concluir?

Problema Nº25
En investigaciones médicas, la proporción p1 / p2 es con frecuencia de más interés que
la diferencia p1 p 2 (por ejemplo, ¿cuántas veces es más probable que se recuperen
personas que reciben el tratamiento 1 en comparación con las del tratamiento 2?). Sea
ˆ pˆ1 / pˆ 2 . Cuando m y n sean grandes, el estadístico ln ˆ tiene aproximadamente una
distribución normal con valor medio ln( ) y desviación estándar aproximada
(m x) /(mx) (n y ) /(ny) .
a) Utilice la información anterior para obtener una fórmula del intervalo de confianza
del 100(1- )% con muestras grandes, para estimar ln( ) y después uno para
misma.
b) Cierto artículo informó que se puede reducir el riesgo de sufrir ataques al corazón
ingiriendo aspirina. Esta conclusión estuvo basada en un experimento diseñado
donde participaron dos grupos, el de control, con individuos a los que se les
administró un placebo, y el de tratamiento, con individuos que ingirieron una dosis
específica de aspirina. De los 11.034 individuos del grupo de control, 189 sufrieron
posteriormente ataques al corazón, en tanto que sólo 104 de los 11.034 del grupo de
tratamiento los sufrieron. Calcule un intervalo de valores de posibles de con un
nivel de confianza de 95%. ¿Qué parece indicar este intervalo acerca de la eficacia del
tratamiento con aspirina?
c) Basándose en los datos del inciso b), calcule un IC del 95% para la diferencia p1 p 2 .
¿Qué parece indicar este intervalo acerca de la eficacia del tratamiento con aspirina?
Pruebas de Bondad de Ajuste y Tablas de Contingencia

Problema Nº26
Defina X como el número de botellas “a medio llenar” provenientes de una pack de 24
botellas. Sesenta packs de botellas son inspeccionados obteniéndose los siguientes valores
observados x de la v.a. X:
Valores (x) 0 1 2 3
Frecuencia 39 23 12 1

Basándose en estas 75 observaciones encontradas, ¿parece la distribución binomial un


modelo apropiado para la variable X? Use el método del valor p.

Problema Nº27
Una agencia de viajes desea determinar si la duración de las llamadas telefónicas que
realizan sus clientes pueden ser modelas de forma adecuada por medio de la distribución
exponencial. La última semana, la agencia registró la duración de las llamadas,
obteniéndose los siguientes resultados (en segundos):
4 6 5 8 9 10 12 8 16 20 24 27
33 37 43 50 58 68 70 78 88 100 120 130

¿Indican estos datos que la variable duración de las llamadas de los clientes puede ser
modelada correctamente por medio de una distribución exponencial? Utilice el método del
valor p. Para determinar k, use la fórmula k n .

Problema Nº28
Se diseña un generador de números pseudo aleatorios de modo que los enteros 0 a 9
tengan la misma probabilidad de ocurrencia. Los primeros 10 mil números son:

0 1 2 3 4 5 6 7 8 9
967 1008 975 1022 1003 989 1001 981 1043 1011

¿El generador trabaja de manera apropiada? Concluya basándose en el valor p de esta


prueba.

Problema Nº29
El fabricante de un determinado tipo de ampolletas afirma que la duración de éstas (en
miles de horas) sigue una distribución exponencial desfasada, cuya función de densidad
de probabilidad es:
x
e si x
f X x; ,
0 d.o.f.

Para corroborar esta información, se han probado experimentalmente 64 ampolletas, de las


cuales se obtuvieron los siguientes tiempos de fallo:

3,7346 4,8581 2,0257 0,3970 1,4413 1,6748 5,1771 0,4317


5,1069 2,0892 0,7331 1,3676 5,5930 1,2898 2,9058 0,8674
0,4224 6,5537 3,8840 1,7715 2,5751 1,5000 0,4583 2,9236
2,0397 2,0153 0,6533 0,9823 5,2483 2,9613 0,9080 2,3090
0,7581 2,7633 0,3482 1,4328 2,7595 0,7092 0,2174 1,0696
1,3400 1,0855 1,9263 0,4755 0,7876 1,7710 2,4326 2,1987
1,4058 1,3914 2,4478 0,9071 0,5165 4,8724 2,9548 0,8927
0,3979 4,1927 2,2579 2,6174 0,8695 18,1270 0,2175 1,9478

¿Existe evidencia para contradecir la afirmación del fabricante? Utilice el método del valor
p. Para determinar k, use la fórmula k n .

Problema Nº30
El fabricante de un determinado tipo de turbinas de vapor afirma que la duración de éstas
(en miles de horas) sigue una distribución Weibull, con parámetro de forma = 2. Para
corroborar esta información, se han probado experimentalmente 100 turbinas, de las
cuales se obtuvieron los siguientes tiempos de fallo:

5,4476 10,7148 6,432 4,8502 7,5622 13,4607 1,7397 11,9515 7,3981 10,6839
8,6489 5,0303 4,463 8,8636 6,6119 6,7642 8,0335 12,3192 7,6689 5,4247
4,9143 6,8759 16,5398 2,9201 10,8548 9,2527 6,1411 4,8079 3,5114 5,6728
8,6507 7,3842 7,1686 4,0023 2,6913 3,8961 7,6704 6,8087 7,7336 11,7298
3,6296 6,9242 3,1186 6,1015 7,7103 10,6065 3,2517 12,9063 2,2185 4,9816
13,7769 9,7152 12,7336 2,2583 11,3072 6,4763 3,6927 13,5638 10,5226 4,2721
3,5341 5,6084 10,4193 8,8795 4,7746 6,8273 13,2823 8,2852 2,3597 6,6418
2,6892 2,8443 4,2145 9,7132 3,2909 2,0992 2,3235 3,2299 11,3221 3,129
6,5873 9,8637 3,6592 5,1261 5,1013 17,2169 12,156 15,7213 8,1765 5,6077
6,3539 4,8017 5,7458 6,0672 9,6748 8,9102 7,7512 5,4662 6,723 9,0627

¿Existe evidencia para contradecir la afirmación del fabricante? Utilice el método del valor
p. Para determinar k, use la fórmula k n .

Problema Nº31
Una compañía opera cuatro máquinas tres turnos al día. De los registros de producción, se
obtienen los datos siguientes sobre el número de fallas:
Máquinas
Turno A B C D
1 41 20 12 16
2 31 11 9 14
3 15 17 16 10

Pruebe la hipótesis de que el número de fallas es independiente del turno. Encuentre el


valor p de esta prueba.

You might also like