You are on page 1of 19

Club GeoGebra Iberoamericano

Club GeoGebra Iberoamericano

10
PROBABILIDAD E INFERENCIA ESTADSTICA

Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

PROBABILIDAD E INFERENCIA ESTADSTICA

INTRODUCCIN
Este tema estar dedicado a exponer las opciones que GeoGebra ofrece para trabajar
la probabilidad. Comenzaremos con las distintas opciones de recuento para continuar con las
distribuciones de probabilidad, finalizando con algunas actividades sobre contraste de
hiptesis.

TCNICAS DE RECUENTO
A continuacin, describimos los comandos que ofrece GeoGebra para obtener el
nmero de variaciones, permutaciones o combinaciones.
Variaciones sin repeticin de m elementos tomados de n en n se calculan utilizando el
comando nPr.
Al escribir nPr[m, n] en la vista CAS obtendremos la expresin que nos permite
obtener la variaciones sin repeticin de m elementos tomados de n en n.

Por ejemplo, si ejecutamos el comando nPr[6,2] obtendremos 30 como nmero de


variaciones de 6 elementos tomados de dos en dos.

El comando nPr se puede utilizar tambin en la lnea de entrada, siempre que los
argumentos que utilicen sean numricos. En el caso que algn coeficiente sea simblico, slo
se podr utilizar desde la vista CAS.
Recordemos que para obtener el nmero de variaciones con repeticin de me
elementos tomados de n en n bastar con calcular el valor de
.
Permutaciones sin repeticin de m elementos se obtienen calculado el valor del
factorial de m, por lo que bastar escribir m!

Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

Por ejemplo, al calcular 5! Obtendremos 120 como resultado. Este clculo se puede
realizar tanto en la vista algebraica como en la vista CAS.

Para obtener las permutaciones de m elementos en los que el primer elemento se


repite a veces, el segundo b veces, el tercero c veces, , hay que aplicar la frmula:

Combinaciones de m elementos tomados de n en n se obtienen utilizando el comando


NmeroCombinatorio.
As, NmeroCombinatorio[m, n] devolver la expresin de las combinaciones de m,
tomadas de n en n (en la vista CAS).

Por ejemplo, al ejecutar NmeroCombinatorio[6,2] obtendremos 15 como nmero de


combinaciones de seis elementos tomados de dos en dos.

Actividades propuestas
Actividad 1
Utilizando slo las cifras impares, responde a las siguientes cuestiones:
a. Cuntos nmeros de tres cifras distintas se pueden formar?
b. Cuntos nmeros de cinco cifras se pueden formar? Cuntos de estos nmeros
comienzan por la cifra 3 y tienen como cifra final 1?
c. Cuntos nmeros de tres cifras se pueden formar de manera que la suma de sus
cifras sea distinta?

Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

Actividad 2
En un cierto pas, las matrculas de los autos tienen la forma siguiente: A-XYZT-BC, en
las que:
A es una letra que puede ser tanto una vocal como una consonante; XYZT son cifras
que se pueden repetir y BC son letras que no pueden ser vocales.
Con estas condiciones, determina cuntas matrculas distintas se pueden formar,
considerando que del abecedario se pueden utilizar los caracteres siguientes:
ABCDEFGHIJKLMNOPQRSTUVWYZ.
Actividad 3
Intenta determinar cuntas combinaciones son posibles en cada una de las apuestas
siguientes:
a. Una lotera en la que el nmero premiado es de cinco cifras que se pueden repetir.
b. Una quiniela de futbol con 14 resultados que admiten 1, X, 2 como opcin.
c. Una lotera en la que hay que marcar 6 nmeros de 49 posibles.

DISTRIBUCIONES DE PROBABILIDAD
En las ltimas versiones de GeoGebra encontramos, tanto en la vista de hoja de clculo
como en la vista CAS, la herramienta Calculadora de probabilidades
podemos trabajar con distintas distribuciones.

con la que

Al pulsar sobre esta herramienta aparecer la siguiente ventana:

Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

Observamos que adems de la grfica en la que representa la probabilidad, disponemos de


dos pestaas, una para determinar el tipo de distribucin y otro para establecer la
probabilidad que deseamos obtener.

Actividad 4
La probabilidad de que un jugador de golf haga hoyo en un lanzamiento a una cierta
distancia es de 0,2. Si lo intenta cinco veces, calcula las siguientes probabilidades:
a. No acierte ninguna vez.
b. Acierte alguna.
c. Acierte dos veces.
Con los datos anteriores podemos determinar que se trata de una distribucin

binomial B5,0.2 .

Por lo que una vez seleccionada la


herramienta Clculo de probabilidades, establecemos
que se trata de una distribucin binomial e
introducimos los valores 5 para n y 0,2 para p.

En la parte derecha de la imagen aparecer la


tabla con las distintas probabilidades.
A partir de los valores anteriores, podemos
determinar la probabilidad correspondiente a los
apartados a y c.
P(0 aciertos) = P(X=0)=0,3277
P(dos aciertos)=P(X=2)=0,2048
Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

Para determinar la probabilidad de acertar alguna podemos calcular P(X>0)=1-P(X=0) o


utilizar la opcin que ofrece la ventana anterior, estableciendo en probabilidad el valor por el
lado derecho, introduciendo 1 como valor para el extremo inferior del intervalo.

Por tanto P(X1)=0,6723.


Actividad 5
El peso de los adultos de una determinada poblacin sigue una distribucin Normal de
media 70 kg y desviacin tpica 16. Si elegimos al azar, muestras de tamao 4, cul ser la
probabilidad de que el peso medio de una de esas muestras est comprendido entre 65 y 72
Kg? Cul es la probabilidad de que el peso medio sea menor que 70 kg?

Para una muestra de tamao 4 la distribucin de la media muestral seguir una


N ,

.
distribucin Normal cuyos parmetros sern
Una vez seleccionada la herramienta Clculo de probabilidades indicamos que la
distribucin sigue una Normal e introducimos los valores de la media y la desviacin tpica, que

16

N 70,
N 70, 8
4

en nuestro ejemplo sern


.
Ya solo queda establecer que deseamos obtener la probabilidad de un intervalo,
indicando los valores correspondientes, tal y como aparece en la imagen siguiente:

Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

Por tanto, P(65 X 72) 0.3327


Para obtener la probabilidad de que el peso medio sea menor que 70 Kg bastar con
seleccionar Por lado izquierdo en la pestaa Probabilidad, introduciendo al continuacin el
valor 70. Los resultados aparecen en la siguiente imagen:

Actividades propuestas
Actividad 6
En una empresa de 20 trabajadores se ha comprobado que cada uno falta al trabajo el
4% de los das. Calcula la probabilidad de que en un determinado da: a) no se registre ninguna
ausencia; b) Falten al trabajo menos de tres trabajadores; c) Falte un nico empleado.
Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

Actividad 7
En una universidad, la calificacin de los alumnos sigue una distribucin Normal de
media 6.2 y desviacin tpica 1 punto. Se seleccion de manera aleatoria una muestra de
tamao 25. Determina la probabilidad de que la media de las calificaciones de los alumnos de
una de esas muestras est comprendida entre 6 y 6,6 puntos.

INFERENCIA ESTADSTICA. INTERVALOS DE CONFIANZA


Recordemos algunos conceptos bsicos.
Intervalo caracterstico
Sea X una variable aleatoria que se distribuye normalmente.
Un intervalo caracterstico es un intervalo simtrico entorno
a la media ( -k, +k) en el que la probabilidad de que un valor de la
variable est en ese intervalo es p, es decir:
P[-k < x < +k] = p.
La probabilidad que dejamos fuera del intervalo caracterstico la notaremos con . Es
claro entonces que la probabilidad que queda en el intervalo ser p = 1-.
Intervalo caracterstico en la N(0,1)
Si tenemos la distribucin N(0,1) la media es 0, por tanto los
intervalos caractersticos son de la forma (-k, k).
Vamos a calcular los intervalos caractersticos para los valores
ms comunes que toma .
Buscamos k tal que P[-k< x <k]=1-

Este valor se denomina valor crtico, corresponde a la probabilidad p = 1- .


Si llamamos

al valor de la variable que deja a su derecha una probabilidad , es

decir,
, entonces se tiene que
Si =0.1 entonces 1- =0.9 y /2=0.05; hay que hallar k tal que P [ x <k] = 0.95
Buscamos en las tablas: k=1.645
Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

En N(0,1) el intervalo caracterstico cuyo valor crtico es 0.1 es: (-1.645 , 1.645)
Si =0.05 entonces 1- =0.95 y /2=0.025; hay que hallar k tal que P[ x <k] = 0.975
Buscamos en las tablas: k= 1.96
En N(0,1) el intervalo caracterstico cuyo valor crtico es 0.05 es: (-1.96 , 1.96)
Si =0.01 entonces 1- =0.99 y /2=0.005; hay que hallar k tal que P [ x <k] = 0.995
Buscamos en las tablas: k= 2.575
En N(0,1) el intervalo caracterstico cuyo valor crtico es 0.01 es: (-2.575 , 2.575)

Intervalo de confianza para la media


Se desea estimar la media, , de una poblacin cuya desviacin tpica, , es conocida.
Para ello se recurre a una muestra de tamao n en la cual se obtiene una media
muestral, . Si la poblacin de partida es normal, o si el tamao de la muestra es n > 30,
entonces el intervalo de confianza de con un nivel de confianza de (1 - ).100% es:

siendo

el valor comentado en el apartado de intervalos caractersticos. GeoGebra calcula

directamente el intervalo de confianza.


Para ello seleccionamos la herramienta Clculo de probabilidades, y en ella la pestaa
Estadsticas.

Probabilidad e inferencia estadstica

Club GeoGebra Iberoamericano

Actividad 8
Elegimos, en la vista anterior, la opcin Z estimada de una Media.
En una muestra aleatoria de 100 individuos se ha obtenido, para la edad, una media de
17.5 aos. Se sabe que la edad en la poblacin, de la que procede esa muestra, sigue una
distribucin Normal con una desviacin tpica de 0.8 aos. Obtenga un intervalo de confianza,
al 94%, para la edad media de la poblacin.
Introducimos los datos:

Probabilidad e inferencia estadstica

10

Club GeoGebra Iberoamericano

Por tanto el intervalo de confianza es: (17 '3495, 17'6505). El error mximo cometido
en la estimacin es de 01505.

Intervalo de confianza para la proporcin


Se desea estimar la proporcin de individuos con una cierta caracterstica que hay en una
poblacin. Para ello se recurre a una muestra de tamao n, en la que se obtiene una
proporcin muestral p.
El intervalo de confianza de la proporcin con un nivel de confianza (1 ).100% es:

Actividad 9
Elegimos, en la vista anterior, la opcin Z estimada de una Proporcin.
En un estudio de mercado del automvil en una ciudad se ha tomado una muestra
aleatoria de 300 turismos, y se ha encontrado que 75 de ellos tienen motor disel. Para un
nivel de confianza del 94%. Determine un intervalo de confianza de la proporcin de turismos
que tienen motor disel en esa ciudad.
Introducimos los datos:

Probabilidad e inferencia estadstica

11

Club GeoGebra Iberoamericano

Por tanto el intervalo de confianza es: (0203,0297). El error mximo cometido en esta
estimacin es de 0047.

Actividades propuestas
Actividad 10
En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para
estudiar la temperatura media de sus enfermos. La media de la muestra ha sido de 371 C y la
desviacin tpica de la poblacin, de 104 C. Calcula un intervalo de confianza para la media
poblacional con un nivel de confianza del 99%.
Actividad 11
En las ltimas elecciones se ha tomado una muestra de 450 personas a la salida de los
colegios electorales y 125 de ellas afirmaron haber votado al partido A. Hallar un intervalo de
confianza para el porcentaje de votantes del partido A con un nivel de confianza del 90%.
INFERENCIA ESTADSTICA. CONTRASTE DE HIPTESIS
Recordemos algunos conceptos bsicos.
Un contraste de hiptesis es un procedimiento que nos permite decidir si una
hiptesis realizada sobre un parmetro desconocido de la poblacin, se acepta o se rechaza
con una probabilidad prefijada , llamada nivel de significacin.
El primer paso del contraste consiste en plantear estas hiptesis:

La hiptesis nula, H0, que es la afirmacin que inicialmente se considera verdadera


y que se quiere contrastar.
La hiptesis alternativa, H1, que es la afirmacin contraria a la planteada en la
hiptesis nula.

Cuando formulamos la hiptesis nula, H0, relacionamos el parmetro con un valor.


Segn la relacin que establecemos entre ambos resultan:

Contrastes bilaterales, si la relacin es una igualdad.


Contrastes unilaterales, si la relacin es una desigualdad.

El segundo paso del contraste consiste en calcular la zona de aceptacin:


La zona de aceptacin est formada por los valores para los que se acepta la hiptesis
nula H0.

Probabilidad e inferencia estadstica

12

Club GeoGebra Iberoamericano

La zona crtica o de rechazo est formada por los valores para los que se rechaza la
hiptesis nula H0.
El nivel de significacin, fijado previamente en el contraste, delimita las zonas de
aceptacin y de rechazo. Pueden darse estas situaciones:

OBSERVACIN: En un contraste bilateral, el valor crtico que se analiza es Z mientras que en


2

un contraste unilateral el valor crtico es Z .


Este tipo de problemas se suelen resolver hallando el intervalo de aceptacin y
valorando, a continuacin, si se acepta la hiptesis nula o alternativa en funcin de que el
valor que se compara est en la zona de aceptacin o en la de rechazo.
Sin embargo, GeoGebra los resuelve de dos formas diferentes.
Primer mtodo: Tipificar el valor muestral y compararlo con el intervalo de aceptacin
expresado en valores de la distribucin Normal N(0,1). Los estadsticos de contraste que vamos
a utilizar son
normal y

para el caso de distribuciones normales o que se aproximen a la


para el caso de proporciones. Sabemos que ambos siguen una

distribucin N (0,1). GeoGebra los proporciona directamente; son los valores de Z en los
apartados sealados con flecha en las siguientes ventanas:

Probabilidad e inferencia estadstica

13

Club GeoGebra Iberoamericano

Segundo mtodo: Calcular el valor exacto del nivel de significacin correspondiente al


resultado muestral Z hallado anteriormente.
GeoGebra los proporciona directamente; son los valores de P en los apartados sealados con
flecha en las siguientes ventanas:

Se aplica la siguiente regla:


Probabilidad e inferencia estadstica

14

Club GeoGebra Iberoamericano

Si P es mayor que el
nivel de significacin fijado en el
enunciado, el resultado no es
significativo y por tanto se acepta
H0.

Si P es menor que el
nivel de significacin fijado en el
enunciado,
el
resultado
es
significativo y por tanto se rechaza
H0.

Contraste de hiptesis bilateral


para la media de la poblacin
Actividad 12
Un fabricante garantiza que
la duracin media de las bombillas
que produce es de 500 horas con
una desviacin tpica de 40. Para
comprobar lo que dice el fabricante
respecto a la duracin, se ha realizado una prueba con 49 bombillas y se ha obtenido una
duracin media de 492 horas. Podemos aceptar la afirmacin del fabricante con un nivel de
significacin del 10%?
Contraste: bilateral.

Nivel de significacin: = 01

H0: 0 = 500; H1: 0 500.

, mirando en las tablas de la N(0,1) obtenemos

De

= 1645. Por tanto el intervalo de aceptacin, en la normal, para un nivel de significacin


del 10% es (-1645, 1645).

Activamos GeoGebra:
Podemos observar que Z=-14 est en el intervalo de aceptacin; o bien que P=01615>01. En
ambos casos se concluye que se acepta la hiptesis nula H0

Probabilidad e inferencia estadstica

15

Club GeoGebra Iberoamericano

Contraste de hiptesis unilateral


para la media de la poblacin
Actividad 13
El peso en vaco de los
envases
fabricados
por
una
empresa, segn su mtodo usual, es
una variable aleatoria que sigue una
ley normal con media 20 gramos y
una desviacin tpica de 1 gramo. Se
desea contrastar si un nuevo proceso de fabricacin no aumenta dicho peso medio. Para ello,
se eligen al azar 25 envases fabricados por la nueva tcnica y se encuentra que la media de su
peso en vaco es de 20,5 gramos. Se puede afirmar, a un nivel de significacin = 0,02, que el
nuevo proceso ha aumentado el peso medio de los envases?
Nivel de significacin: = 002 H0: 0 20; H1: 0 > 20.
De
, mirando en las tablas de la N(0,1) obtenemos
= 210. Por tanto el intervalo de aceptacin, en la normal, para un nivel de significacin del
002 es
.
Contraste: unilateral.

Activamos GeoGebra:
Probabilidad e inferencia estadstica

16

Club GeoGebra Iberoamericano

Podemos observar que Z=25 est fuera del intervalo de aceptacin; o bien que P=00062 <
002. En ambos casos se concluye que se rechaza la hiptesis nula H0

Contraste de hiptesis bilateral para la proporcin de la poblacin


Actividad 14
Un estudio sociolgico afirma que el 70% de las familias cena viendo la televisin. Se
desea contrastar la veracidad de esta afirmacin y, para ello, se toma una muestra de 500
familias, en la que se observa que 340 ven la televisin mientras cenan. Decida, mediante un
contraste de hiptesis, si la afirmacin es cierta con un nivel de significacin de 001.
Contraste: bilateral.

Nivel de significacin: = 001

De

H0: p0 = 07; H1: p0 07.

, mirando en las tablas de la N(0,1) obtenemos


= 258. Por tanto el intervalo de aceptacin, en la normal, para un nivel de significacin del

1% es (-258, 258).

Activamos GeoGebra:
Podemos observar que Z=-09759
est dentro del intervalo de
aceptacin; o bien que P=03291 >
001. En ambos casos se concluye
que se acepta la hiptesis nula H0.

Probabilidad e inferencia estadstica

17

Club GeoGebra Iberoamericano

Contraste de hiptesis unilateral para la proporcin de la poblacin


Actividad 15
Un informe de un Ayuntamiento
afirma que al menos el 26% de los usuarios
del carril bici habran utilizado el coche
particular para sus desplazamientos de no
haber existido dicho carril. Sin embargo, un
peridico local anuncia la falsedad del dato,
informando que una encuesta propia indica
que solo 240 de los 1000 usuarios
encuestados afirman que habran utilizado el
coche particular. Establezca un contraste, con
hiptesis nula Ho : po 026, para verificar la
afirmacin del Ayuntamiento e indique la
regin crtica de dicho contraste para un nivel
de significacin del 5% y decida si podra
aceptarse el informe del Ayuntamiento.
Contraste: unilateral.
Nivel de
significacin: = 005 H0: p0 > 026; H1: p0 <
026.
De
, mirando en las tablas de la N(0,1)
obtenemos
= 1645. Por tanto el intervalo de aceptacin, en la normal, para un nivel de
significacin del 5% es
.
Activamos GeoGebra:
Podemos observar que Z=-14419 est dentro del intervalo de aceptacin; o bien que
P=00747 > 005. En ambos casos se concluye que se acepta la hiptesis nula H0.

Actividades propuestas
Probabilidad e inferencia estadstica

18

Club GeoGebra Iberoamericano

Actividad 16
En una poblacin escolar se ha comprobado que la estatura sigue un modelo Normal
de Probabilidad. A partir de una muestra de 81 escolares de dicha poblacin se ha calculado
una estatura media de 159 cm y una desviacin tpica de 129 cm. Podramos rechazar, con
un nivel de significacin del 5%, la hiptesis de que la estatura media de esa poblacin es de
160 cm?
Actividad 17
En un servicio de atencin al cliente, la empresa asegura que el tiempo medio de
espera para recibir atencin no supera los 6 minutos, con una desviacin tpica de 2. En una
muestra de 30 llamadas, el tiempo medio de espera ha sido 8 minutos. Plantea un contraste de
hiptesis, con nivel de significacin del 5% para decidir si el tiempo medio de espera es
superior al que indica la empresa.
Actividad 18
Una empresa dedicada a la fabricacin de tornillos asegura que slo 1% de su
produccin es defectuosa. Se selecciona una muestra de 150 tornillos y se observa que 3 de
ellos son defectuosos. Podemos aceptar la hiptesis del fabricante con nivel de significacin
del 1%?
Actividad 19
Los profesores de una academia de idiomas aseguran que el porcentaje de alumnos
que estudian ingls en su Centro, es como mnimo, del 58%. Si de una muestra de 40 alumnos,
23 de ellos estudian ingls, podemos aceptar la afirmacin de los profesores con nivel de
significacin 001?

Probabilidad e inferencia estadstica

19

You might also like