You are on page 1of 238

E stadistica 1

Mdulo Autoformativo
JOS MIGUEL CUBILLOS MUNCA
Escuela Superior de Administracin Pblica
Programa de Administracin
Pblica Territorial
Ncleo
F
U
N
D
A
M
E
N
T
A
C
I

N
31
Estadistica 1
Unidad 2
Poblacin, Muestra
y Variable
32
2
Poblacin, Muestra y Variable
33
Estadistica 1
OBJETIVOS
INTRODUCCIN
* El estudiante estar en capacidad de identificar dentro
de un problema social, las variables internas y externas
que lo afectan.
* El estudiante podr delimitar la poblacin y la muestra
necesarias para abordar un problema de investigacin.
Aunque para muchos autores los conceptos de poblacin, muestra y va-
riable se limitan a unos renglones o en el mejor de los casos a una hoja, en
este mdulo se les ha dedicado todo un captulo, ya que la claridad en su
determinacin es primordial para lograr un trabajo estadstico consistente.
Muchos esfuerzos investigativos fracasan cuando no se ha delimitado cla-
ramente la poblacin o cuando se ha tomado una muestra que no resulta
adecuada para el propsito a indagar o que no responde al tamao u otras
caractersticas de la poblacin. Adems, cuando pretendemos estudiar las
ciencias sociales como en nuestro caso, nos encontramos con el hecho
de que las frmulas son insuficientes para determinar los tamaos de las
muestras adecuados, y adems con que las variables de tipo cuantitativo
y ordinal resultan insuficientes e incluso inadecuadas para estudiar algu-
nos fenmenos.
El hecho de la medicin, exige mucha claridad conceptual, ya que no se
limita a la cuantificacin de datos sino que exige determinar el tipo de varia-
ble que ser til para el propsito investigativo. Hay que tener en cuenta
hechos como que el investigador que realiza la medicin no es un simple
observador sino que puede influir en el comportamiento del objeto obser-
vado. Las investigaciones de tipo etnogrfico y de investigacin- accin
son muy crticas en este aspecto.
Para iniciar esa discusin se ha agregado un texto complementario que
aborda un poco la epistemologa de la medicin.
Al igual que en captulo anterior se pretende que el estudiante haga la lectu-
ra y el trabajo propuesto en forma autnoma y que lleve los resultados a
discusin en la sesin de grupo. Dependiendo de la organizacin de las
horas de tutora, se podran trabajas los dos captulos en el mismo en-
cuentro.
34
2
Poblacin, Muestra y Variable
35
Estadistica 1
Poblacin, Muestra y Variable
En trabajos de descripcin, explicacin o
prediccin, cualquiera que sea la fuente de
los datos y cualquiera que sea el nivel crtico
de nuestro trabajo afirmamos, generaliza-
mos, extendemos a toda una poblacin los
resultados de una muestra. An en los jui-
cios que hacemos en nuestra vida diaria acer-
ca de personas, grupos humanos, efectos
de programas, salud pblica, delincuencia,
drogadiccin, clientelismo, violencia, etc.,
slo contamos con una muestra aveces de
tamao muy pequeo. De ah muchos erro-
res de juicio. Los trabajos que incluyen to-
dos los componentes de una poblacin, no
una muestra de ella, se llaman censos. Por
razones de tiempo, costo y confiabilidad los
censos se sustituyen por muestras.
La razn de ser de las muestras se basa en el
razonamiento de tipo inductivo, segn el
cual, a partir de casos podemos inferir la
norma general, adems, salvo las excepcio-
nes triviales, las cosas no se comportan de
forma catica sino que tienden a un orden.
Por ello, cuando estamos frente a fenme-
nos demasiado multiformes, numerosos,
extensos e inaccesibles, nos podemos con-
formar con las muestras.
* Como tiene un mdico la seguri-
dad de que el medicamento que prescribe
va a resultar efectivo en su paciente? el me-
dicamento ya ha sido probado con todas las
personas? Y cuando es un medicamento
nuevo, que ya se experiment en animales,
y aunque ello no implica con total certeza
que funcionar en personas, tampoco pudo
ser probado en todos los animales. Comen-
te con sus compaeros y escriba las conclu-
siones.
Poblacin de estudio es el conjunto de todos los entes a los
cuales se les pueden aplicar las conclusiones de la investiga-
cin.
Poblacin de datos es el conjunto de las mediciones de una
caracters-tica en cada elemento de la poblacin de estudio.
Una poblacin de estudio est determinada por sus caracters-
ticas definitorias. Por lo tanto, el conjunto de elementos que
posea esta caracterstica se denomina poblacin o universo.
Poblacin de la investigacin o de estudio es la totalidad del
fenmeno a estudiar, donde las unidades de poblacin poseen
una caracterstica comn, la que se estudia y da origen a la
poblacin de datos de la investigacin.
Por ejemplo, si se quiere de terminar cual es el nivel de ingreso
promedio de los habitantes de un municipio, tendremos una
poblacin de estudio que son las personas en edad y capaci-
dad de trabajar, y una poblacin de datos que sern los mon-
tos de los ingresos de cada persona de la poblacin de estudio.
De estas personas seleccionamos un grupo al cual le registra-
remos el monto de sus ingresos, obteniendo entonces una
muestra.
Entonces, una poblacin es el conjunto de todas las cosas que
concuerdan con una serie determinada de especificaciones.
Cuando seleccionamos algunos elementos con la intencin de
averiguar algo sobre una poblacin determinada, nos referi-
mos a este grupo de elementos como muestra. Por supuesto,
esperamos que lo que averiguamos en la muestra sea cierto
para la poblacin en su conjunto. La exactitud de la informa-
cin recolectada depende en gran manera de la forma en que
fue seleccionada la muestra.
36
2
Poblacin, Muestra y Variable
Cuando no es posible medir cada uno de los individuos de una poblacin, se toma una muestra representativa
de la misma. La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las
caractersticas que definen la poblacin de la que fue extrada, lo cual nos indica que es representativa. Por lo
tanto, la validez de la generalizacin depende de la validez y tamao de la muestra.
Si usted desea saber mucho ms...
Leyes del mtodo de muestreo.
El mtodo de muestreo se basa en ciertas leyes que le otorgan su fundamento cientfico, las cuales son:
Ley de los grandes nmeros: si en una prueba, la probabilidad de un acontecimiento o suceso es P,
y si ste se repite una gran cantidad de veces, la relacin entre las veces que se produce el suceso y la
cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez ms a la
probabilidad P.
Clculo de probabilidades: La probabilidad de un hecho o suceso es la relacin entre el nmero de
casos favorables (p) a este hecho con la cantidad de casos posibles, suponiendo que todos los casos son
igualmente posibles. El mtodo de establecer la probabilidad es lo que se denomina clculo de probabi-
lidad.
De estas dos leyes fundamentales de la estadstica, se infieren aquellas que sirven de base ms directa-
mente al mtodo de muestreo:
* Ley de la regularidad estadstica: un conjunto de n unidades tomadas al azar de un con-
junto N, es casi seguro que tenga las caractersticas del grupo ms grande.
* Ley de la inercia de los grandes nmeros: esta ley es contraria a la anterior. Se refiere al
hecho de que en la mayora de los fenmenos, cuando una parte vara en una direccin, es
probable que una parte igual del mismo grupo, vare en direccin opuesta.
* Ley de la permanencia de los nmeros pequeos: si una muestra suficientemente gran-
de es representativa de la poblacin, una segunda muestra de igual magnitud deber ser seme-
jante a la primera; y, si en la primera muestra se encuentran pocos individuos con caractersti-
cas raras, es de esperar encontrar igual proporcin en la segunda muestra.
Tipos de muestras.
Muestreo aleatorio simple: la forma ms comn de obtener una muestra es la seleccin al azar, es
decir, cada uno de los individuos de una poblacin tiene la misma posibilidad de ser elegido. Si no se
cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra
aleatoria no es viciada, debe emplearse para su constitucin una tabla de nmeros aleatorios.
37
Estadistica 1
Muestreo estratificado: una muestra es estratificada cuando los elementos de la muestra son propor-
cionales a su presencia en la poblacin. La presencia de un elemento en un estrato excluye su presencia
en otro. Para este tipo de muestreo, se divide a la poblacin en varios grupos o estratos con el fin de dar
representatividad a los distintos factores que integran el universo de estudio. Para la seleccin de los
elementos o unidades representantes, se utiliza el mtodo de muestreo aleatorio.
Muestreo por cuotas: se divide a la poblacin en estratos o categoras, y se asigna una cuota para las
diferentes categoras y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra debe
ser proporcional a la poblacin, y en ella debern tenerse en cuenta las diferentes categoras. El mues-
treo por cuotas se presta a distorsiones, al quedar a criterio del investigador la seleccin de las catego-
ras.
Muestreo intencionado: tambin recibe el nombre de sesgado. El investigador selecciona los elemen-
tos que a su juicio son representativos, lo que exige un conocimiento previo de la poblacin que se
investiga.
Muestreo mixto: se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las unida-
des de la muestra en forma aleatoria y despus aplicar el muestreo por cuotas.
Muestreo tipo: la muestra tipo (Master Simple) es una aplicacin combinada y especial de los tipos de
muestra existentes. Consiste en seleccionar una muestra para ser usada al disponer de tiempo, la
muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituir el m-
dulo general del cual se extraer la muestra definitiva conforme a la necesidad especfica de cada inves-
tigacin.
Existen algunos requisitos que debe cumplir
la muestra para que sea de utilidad, lo cual
hace ms relevante el tipo de muestreo, el
tamao y el procedimiento para recoger el
dato. Por ello debemos dar respuesta a los
siguientes interrogantes: la manera de ob-
tener la informacin es la ms adecuada?
Los datos que tomamos si se refieren a la
caracterstica que se mide? Es la muestra
representativa de la poblacin? Se puede
confiar plenamente en el dato? Es aleatoria
la muestra?.
Nos debemos asegurar que el ente que genera la informacin
no la altere a voluntad por disimular alguna falencia personal o
de grupo, por esnobismo, orgullo, prejuicio, tendencia a dar
respuestas agradables y a responder lo que se considera acep-
table por el grupo social.
Ejemplo, si le preguntamos a una dama por el nmero de ves-
tidos que hay en su armario, probablemente tender a au-
mentar el nmero. Si se indaga a una persona acerca de cuan-
tas cervezas se tom el ultimo da que sali de rumba, para
determinar el promedio de consumo de cerveza por persona,
tal vez esta tienda a decir que tomo mucho menos. El ejemplo
ms tpico es el del ingreso, ya que es una tendencia muy ge-
neralizada el mentir acerca del nivel de ingresos.
38
2
Poblacin, Muestra y Variable
Respecto a la representatividad de la muestra se debe con-
siderar tanto el nmero como lo exhaustiva que sea, es
decir que represente a todos los grupos de la poblacin
de estudio. Por ejemplo, no es representativa una mues-
tra de 30 estudiantes para determinar la preferencia por
las carreras universitarias en Colombia: No es representa-
tiva por el nmero. No es representativa una encuesta de
preferencia electoral para presidente de la repblica en
Colombia, aplicada telefnicamente, ya que se estara ex-
cluyendo un grupo considerable de la poblacin como es
la mayora de la rural y la urbana marginal que no tienen
servicio telefnico.
La aleatoriedad busca evitar el sesgo de la mues-
tra. Aleatorio significa al azar, es decir que cada
elemento de la poblacin tiene la misma proba-
bilidad de ser incluido dentro de la muestra. Por
ejemplo, cuando se pretende determinar la pre-
ferencia por el color del automvil y para tomar
la muestra recogemos la informacin del color
de 200 autos particulares que pasan el lunes a
las 10 AM por el puente de Matatigres al sur de
Bogot D.C., no es aleatoria, por que los autos
de personas que nunca se movilizan por el sur
no tendran la misma probabilidad de ser toma-
dos dentro de la muestra.
LAS VARIABLES
Una vez que alcanzamos un conocimiento relativamente am-
plio del tema que se va a investigar, debemos dedicarnos a
aislar, dentro del problema, los factores ms importantes que
en l intervienen.
Por ejemplo: si se trata de un problema de comercializacin,
los aspectos fundamentales que deberemos estudiar sern la
oferta y la demanda, las motivaciones del consumidor, la distri-
bucin, la publicidad y otros factores semejantes.
Gracias a estos factores, estaremos en condiciones de cons-
truir el marco terico dentro del que se inserta el fenmeno de
nuestro inters.
En aquellos casos en que sea posible llegar a un grado de aisla-
miento de los factores involucrados en el problema, resulta til
realizar un esquema de variables que nos permitir organizar
mejor nuestro marco terico.
Se pueden definir como todo aquello que vamos a medir, con-
trolar y estudiar en una investigacin o estudio. Por lo tanto,
es importante, antes de iniciar una investigacin, que sepamos
cules son las variables que vamos a medir y la manera en que
lo haremos. Es decir, las variables deben ser susceptibles de
medicin.
Variable es cualquier caracterstica o cuali-
dad de la realidad que es susceptible de asu-
mir diferentes valores, ya sea cuantitativa o
cualitativamente. Las variables pueden ser
definidas conceptual y operacionalmente. La
definicin conceptual es de ndole terica,
mientras que la operacional nos da las ba-
ses de medicin y la definicin de los indica-
dores.
Es decir, que puede variar. Aunque para un
objeto determinado pueda tener un valor fijo.
Por ejemplo: una mesa; no puede ser, en s,
una variable. Pero, si nos referimos a la altu-
ra de una mesa, estamos en presencia de
una variable. O sea, que esa cualidad de la
mesa (la altura) puede asumir diferentes va-
lores. No quiere decir que la altura de una
mesa determinada deba variar, sino que el
concepto genrico altura de una mesa
puede variar de un caso a otro.
Las variaciones pueden tambin producirse
para un mismo objeto, y no slo entre dife-
rentes objetos. Por ejemplo: el caudal de un
ro.
39
Estadistica 1
El tiempo es siempre considerado una
variable.
Tambin podemos decir que una variable es
todo aquello que vamos a medir, controlar y
estudiar en una investigacin o estudio.
Las variables pueden ser definidas conceptual
y operacionalmente. Adems de la definicin
de variables que aparece a continuacin, com-
plementaremos con una discusin que se pre-
senta en la lectura complementaria del captu-
lo acerca de la medicin.
Para definir las variables, nos podemos basar
en los indicadores, que constituyen el conjun-
to de actividades o caractersticas propias de
un concepto. Por ejemplo, si hablamos de inte-
ligencia, podemos decir que est compuesta
por una serie de factores como la capacidad
verbal, capacidad de abstraccin, etc. Cada fac-
tor puede ser medido a travs de indicadores.
En otras palabras, los indicadores son algo es-
pecfico y concreto que representan algo ms
abstracto o difcil de precisar.
No todos los indicadores tienen el mismo valor.
Es decir, aunque haya varios indicadores para
un mismo fenmeno, habr algunos ms im-
portantes que otros, y por lo general cualquier
indicador que se tenga est basado en una pro-
babilidad de que realmente represente al fen-
meno.
Algunos criterios para escoger los indicadores:
Se debe tener el menor nmero de indicadores de una
variable, siempre y cuando stos sean realmente repre-
sentativos de la misma. Se deben poseer formas de me-
dicin especficas para cada indicador. Hay que tener en
cuenta que los indicadores slo poseen una relacin de
probabilidad con respecto a la variable.
En la prctica, muchas de las caractersticas que nos in-
teresan estudiar no son tan simples... Resulta muy senci-
llo medir y comparar la variable cantidad de hijos que
posee una persona, pero nos enfrentamos con una difi-
cultad mayor si pretendemos conocer el rendimiento
de un estudiante.
Cuando nos hallamos frente a variables complejas que
resumen o integran una multiplicidad de aspectos diver-
sos, debemos recurrir a subdividir o descomponer la va-
riable en cualidades ms simples y fciles de medir. A
estas sub - cualidades que en conjunto integran la varia-
ble se las denomina dimensiones de la misma.
Dimensin es un componente significativo de una varia-
ble, que posee una relativa autonoma.
As, el patriarcalismo de una sociedad es una sntesis de
un cierto tipo de organizacin familiar, determinados va-
40
2
Poblacin, Muestra y Variable
lores individuales y pautas definidas de organizacin econmi-
ca.
Un ejemplo ms simple: el tamao de un objeto est determi-
nado por su altura, largo y ancho.
Cuando hablamos de relativa autonoma, hacemos referen-
cia a que las dimensiones pueden presentar diferentes valores
unas de otras, pero siempre dentro de ciertos lmites de con-
gruencia. Si el largo de un objeto se modificara al variar su
altura, no estaramos en presencia de dos dimensiones de una
misma variable, sino frente a dos variables diferentes, una de
las cuales influye sobre la otra.
Una misma cualidad puede considerarse como una variable en
s o como una dimensin de una variable mayor, segn el enfo-
que y los propsitos que guen cada investigacin, pues se tra-
ta de definiciones de carcter instrumental que el cientfico rea-
liza de acuerdo con la naturaleza del problema planteado.
Si nos interesa conocer y distinguir a las personas de acuerdo a
su nivel socio - econmico, podemos descomponer esta varia-
ble en dos dimensiones: el nivel social y el nivel econmico.
Pero, si estamos estudiando el ingreso de las familias, debemos
manejar el concepto nivel econmico como una variable en
s y nos veremos en la necesidad de descomponerla en algunas
de las dimensiones que la integran.
Una calidad intervienen como variable en una investigacin
cuando nos es til relacionarla como un todo con otra u otras
variables. En cambio, debemos tomarla slo como una dimen-
sin cuando su sentido como cualidad aislada sea poco signifi-
cante y deba agruparse con otras cualidades para poder ser
relevante.
Cada una de las variables y dimensiones que hemos aislado
debe ser definida con la mayor rigurosidad posible, asignndo-
le un sentido unvoco y claro para evitar que se originen ambi-
gedades, distorsiones e innecesarias discusiones sobre la ter-
minologa.
Clases de variables.
Cualitativas. Sobre ellas no se construye
una serie numrica. Por ejemplo: colores.
Cuantitativas. Admiten una escala num-
rica de medicin. Ejemplo: el ndice de infla-
cin.
Categricas. Tienen la caracterstica de que
todos los miembros de una categora se con-
sideran iguales en lo que se refiere a esa va-
riable. Por ejemplo: las mujeres. Estas varia-
bles se subdividen en nominales y ordinales.
Nominales. Los valores que pueden asu-
mir sirven para clasificarlos pero no para or-
denarlos. Ejemplo: Nombre del Barrio. En
caso de usarse nmeros, slo se adoptan
como nombres o identificaciones.
Ordinales. Los valores que puede asumir
la variable son categoras que conllevan un
juicio de valor que exige comparar a los di-
ferentes elementos de la muestra con res-
pecto a esta variable con el objeto de esta-
blecer un orden. Es decir que los datos se
organizan a travs de las relaciones de igual-
dad, mayor o menor.
41
Estadistica 1
Medidas. Se pueden asignar numerales a
las personas u objetos basndose en que po-
seen cantidades de alguna caracterstica o
propiedad. Experimentales o manipuladas.
Cuando los investigadores establecen con-
diciones experimentales, crean o producen
variables.
Luego de haber precisado los factores que
intervienen en un problema, de haberlos
definido y analizado hasta determinar el tipo
de condicionamiento que los une, habremos
obtenido un conjunto de variables relacio-
nadas entre s de una cierta manera. Debe-
mos entonces organizar estas relaciones
observadas de modo tal que podamos cons-
truir un esquema coherente que exprese el
cuadro general del problema.
Una variable independiente es aquella que,
dentro de la relacin establecida, no depen-
de de ninguna otra, aunque pudiera estar
dependiente si estudiramos otro problema.
Son las condiciones manipuladas por el in-
vestigador a fin de producir ciertos efectos.
La variable independiente es aquella pro-
piedad de un fenmeno a la que se le va a
evaluar su capacidad para influir, incidir o
afectar a otras variables. La variable inde-
pendiente por manipulacin es la que el in-
vestigador aplica segn su criterio, se hace
en estudios de carcter experimental. Todo
aquello que el experimentador manipula,
debido a que cree que existe una relacin
entre sta y la variable dependiente. La va-
riable independiente asignada o selecciona-
da es la que el investigador no puede modi-
ficar, no es manipulable, pero se desea saber
si influye sobre la variable dependiente.
La variable dependiente puede ser definida como los cam-
bios sufridos por los sujetos como consecuencia de la mani-
pulacin de la variable independiente por parte del experi-
mentador.
Por ejemplo, si el investigador sostiene la hiptesis de que si
administra una determinada droga a un grupo de nios, el
grado de aprendizaje de stos se incrementar. En este caso,
la variable independiente estar representada por la droga
manipulada por el experimentador, y la variable dependien-
te ser el grado de aprendizaje de los nios.
Al hablar de variables independientes y dependientes, debe-
mos tener cuidado de no caer en el error de afirmar que la
variable dependiente es causada por la variable independien-
te. A este tipo de conclusiones se puede llegar en muy con-
tadas situaciones. En ciencias sociales, es conveniente ha-
blar de relaciones entre variables, y no de causas.
Una variable es interviniente cuando resulta un factor que
interviene entre dos variables modificando o alterando con
su propio contenido las relaciones que existen entre esos
dos elementos. Por ejemplo:
Variable A: alimentacin que se recibe en la infancia (varia-
ble independiente). Variable B: nivel de inteligencia posterior
de la persona (variable dependiente). Variable C: nivel socio
- econmico (variable interviniente que influye a A).
Conviene analizar si la variable interviniente aparece a partir
de la variable independiente, es decir, es posterior a ella y
con anterioridad a la variable independiente, o si acta como
factor concerniente en la relacin de variables.
Es normal que una variable no slo afecte a otra ms, sino a
varias simultneamente, as como que una variable depen-
diente sea influida por dos, tres o ms variables indepen-
dientes.
42
2
Poblacin, Muestra y Variable
Adems de estas tres posiciones bsicas que las variables
pueden adoptar al relacionarse entre s, existe una cuarta
posibilidad que se refiere a las dos caractersticas del uni-
verso que ejercen una influencia de tipo difuso y general
sobre todo el conjunto de los hechos considerados. Las
variables contextuales indican el mbito general donde se
desarrollan los fenmenos que se estudian. Por ejemplo:
los valores presentes en una sociedad, el tipo de estructura
econmica.
La variable antecedente es la que se supone como antece-
dente de otra. Ejemplo: para realizar el aprendizaje se su-
pone un grado mnimo de inteligencia. Por lo tanto, la va-
riable inteligencia es antecedente de la variable aprendizaje.
Una variable continua es aquella que puede asumir cual-
quier valor numrico y que puede cambiar en cualquier can-
tidad. Entre uno y otro valor existen infinitas posibilidades
intermedias. Por ejemplo: la altura de una persona, el peso
de un objeto, el rendimiento de un estudiante.
Una variable discreta es aquella que tiene valores numri-
cos enteros previamente establecidos, los cuales no pue-
den cambiarse arbitrariamente. Cuando estas posiciones
intermedias carecen de sentido, pues la variable se modifi-
ca de a saltos entre un valor y otro, y no en forma paula-
tina.
Por ejemplo: la cantidad de hijos que puede tener una per-
sona, el nmero de pases que intervienen en una confe-
rencia. Sin embargo, s tiene sentido, y se emplea usual-
mente, calcular promedios sobre estas variables.
Un caso particular de las variables discretas, es la variable
dicotmica, que es aquella que slo admite dos posibilida-
des: muerto/vivo; hombre/mujer.
Las variables inter son aquellas que estudian simultnea-
mente varios grupos de sujetos. Las comparaciones se es-
tablecen entre (inter) los grupos. Las variables intra son aque-
llas que pueden estudiar al mismo grupo en diferentes
perodos. O sea, las comparaciones se esta-
blecen dentro de un mismo grupo.
Las variables extraas son todas aquellas
que el investigador no controla directamen-
te, pero que pueden influir en el resultado
de su investigacin. Deben ser controladas,
hasta donde sea posible, para asegurarnos
de que los resultados se deben al manejo
que el investigador hace de la variable inde-
pendiente, ms no a variables extraas, no
controladas.
En otras palabras, una variable extraa es
una independiente no relacionada con el
propsito del estudio, pero que puede pre-
sentar efectos sobre la variable dependien-
te. Por tal razn, un estudio bien diseado
es aquel que nos asegura que el efecto so-
bre la variable dependiente slo puede atri-
buirse a la variable independiente y no a va-
riables extraas.
Ejemplo: si deseamos evaluar el efecto de
determinado mtodo de enseanza, pode-
mos considerar que la inteligencia es una
variable extraa.
Otro ejemplo: si parte de la investigacin
consiste en la aplicacin de pruebas psico-
lgicas, y en el momento de la aplicacin
hay mucho ruido o se corta la luz, estas al-
teraciones pueden considerarse como varia-
bles extraas.
43
Estadistica 1
Si usted desea saber un poco ms revise esto...
Algunos mtodos para realizar el control de variables son los siguientes:
Eliminacin. Cuando sabemos que existe una variable extraa que puede alterar los resultados de la
investigacin, podemos controlarla mediante la eliminacin.
Constancia de condiciones. Si, por ejemplo, en un estudio experimental deseamos estudiar dos o ms
grupos de sujetos, stos se deben someter exactamente a las mismas condiciones, tanto fsicas como de
lugar, manteniendo, de esta manera, constantes las circunstancias bajo las cuales se investiga.
Balanceo. Cuando tenemos una variable extraa puede influir de manera definitiva en nuestro estudio
y, si no la podemos eliminar ni igualar las condiciones de los grupos, deberemos recurrir al balanceo. Este
mecanismo distribuye en forma equitativa la presencia de la variable extraa entre los grupos.
Contrabalanceo. En algunas investigaciones se pide a los sujetos que respondan varias veces a un
mismo estmulo o a varios estmulos diferentes. Esta serie de respuestas puede provocar en los mismos
dos reacciones: por un lado, fatiga, porque los sujetos se cansan de estar respondiendo; por otro lado,
aprendizaje, ya que despus de presentar 2 o 3 veces el mismo estmulo el sujeto ya sabe cmo respon-
der. Para evitar estos problemas, los grupos se pueden subdividir en subgrupos para que los efectos de la
fatiga y/o aprendizaje queden anulados.
Aleatorizacin. Este mtodo de control es uno de los ms sencillos y ms utilizados en ciencias socia-
les, sobre todo cuando se llevan a cabo estudios experimentales. Se parte del postulado de que si la
seleccin y distribucin de sujetos en grupos de control fueron hechas al azar, podemos inferir que las
variables extraas, desconocidas por el investigador, se habrn repartido tambin al azar en ambos gru-
pos, y as quedarn igualadas.
44
2
Poblacin, Muestra y Variable
Lectura Complementaria.
4
Un Aporte a la Discusin sobre el Status Metodolgico
de las Variables y Escalas de Medicin
Introduccin
La ciencia moderna trajo consigo la observacin sistemti-
ca, y con ella la medicin. La medicin en este contexto se
transform en una herramienta que, en algunos sentidos,
adquiri suficiente trascendencia como para dirimir lo que
era cientfico de lo que no lo era.
Fue tal vez el positivismo el movimiento filosfico que ms
fuertemente estimul y defendi el acto de observar, y en
consecuencia de medir, como manera de deslindar el co-
nocimiento cientfico de la metafsica. As, las ciencias so-
ciales, apegadas en sus inicios a los mtodos etnogrficos,
esencialmente cualitativos, se orientaron en la bsqueda
de tcnicas y procedimientos que les posibilitaran la medi-
cin y, por ende, el estatuto de verdadera ciencia.
La medicin se transforma as en un acto propio de la cien-
cia, en detrimento de la reflexin u otras formas de pro-
duccin de conocimiento. No obstante, surgen dificulta-
des de la ciencia positiva para la resolucin de nuevos
emergentes, las que traen consigo discusiones y debates
acerca del lugar que le cabe a la medicin.
El presente trabajo tiene por objeto aportar algunos ele-
mentos de juicio que contribuyan al esclarecimiento del
concepto de medicin y, desde all, a la discusin sobre la
naturaleza de las variables y sus escalas.
La Naturaleza de la Medicin
Definir el acto de medir trae no pocas dificultades. As, para
Galtung (1965) la medicin es un proceso de clasificacin
de unidades de anlisis segn alguna caracterstica elegida;
en tanto que Carmines y Zeller (1979) la definen como un
Anbal R. Bar. Maestra en Epistemologa y Metodo-
loga de la Investigacin. Facultad de Humanidades.
Universidad Nacional del Nordeste 3500 Resisten-
cia (Chaco) Repblica Argentina. Publicado en Cin-
ta de Moebio No. 7. Marzo 2000. Facultad de Cien-
cias Sociales. Universidad de Chile.
http://rehue.csociales.uchile.cl/publicaciones/
moebio/07/frames03.htm
4
proceso de vincular conceptos abstractos
con indicadores empricos, proceso que su-
pone una previa planificacin de operacio-
nes, tanto de clasificacin como de cuantifi-
cacin.
En ambas definiciones se pondera el acto
clasificatorio como la operacin sine qua
non de la medicin. Para Hempel (1979) la
asignacin de clases como acto lgico, sig-
nifica dividir un conjunto o clase de objetos
en subclases. Los objetos clasificables
constituyen los elementos o miembros del
conjunto, en tanto que el universo del dis-
curso es el conjunto mismo.
Si bien las clasificaciones ms elementales
refieren a objetos concretos, tambin son
susceptibles de clasificacin las entidades
abstractas. La pregunta que cabe ante esta
afirmacin de Hempel es, cmo se puede
dar cuenta de objetos inobservables, o cmo
no caer en cuestiones metafsicas. Como
respuesta posible se puede invocar a Carmi-
nes y Zeller (1979) cuando dicen que medir
implica vinculacin de elementos inobserva-
bles, los conceptos, con elementos obser-
45
Estadistica 1
vables, los indicadores empricos. Dicho de otro modo,
siendo que las leyes y conceptos no son estructuras posi-
bles de medida en forma directa, s lo son sus manifesta-
ciones. Hasta qu punto las manifestaciones del fenme-
no muestran lo que prescriben sus leyes es una cuestin
que suscita continuos debates no slo en el plano de la
epistemologa, sino en el de la propia disciplina.
Otras concepciones refieren a qu tipo de cosa es lo que
se mide. As, Russell (1938), la significa como un mtodo
que permite establecer correspondencias entre magnitu-
des de un mismo gnero, y ciertas clases de nmeros (in-
tegrales, racionales o reales). Campbell (1938) supone que
medir es asignar numerales a las propiedades de los siste-
mas materiales segn las leyes que presiden esos atribu-
tos. Stevens (1951) concibe el acto de medir como la atri-
bucin de numerales a los objetos o sucesos conforme
con leyes o reglas.
En las dos primeras definiciones la medicin se centra en
operaciones sobre las variables, en tanto que en la de
Stevens, al igual que la de Galtung, sobre las unidades de
anlisis.
Independientemente del concepto de medicin, dicho
acto slo es posible a travs de la operacionalizacin de
las variables. Al respecto dice Hempel (1979), que para
que los principios del operacionalismo permitan las cons-
trucciones tericas de la ciencia excluyendo aquellas sin
significado experiencial, deber caracterizarse con preci-
sin el tipo de oraciones que pueden usarse para dar cuen-
ta de sentidos posibles de los trminos no observaciona-
les significativos sobre la base del vocabulario
observacional. Hempel supone que esto propendera a
una especificacin de los conceptos y procedimientos l-
gico-matemticos y evitara la nocin psicologista de ope-
racin mental. De todas maneras, la convencin sigue
siendo la nica forma de asumir cules son las operacio-
nes vlidas y cmo debern de interpretarse los resulta-
dos de los tests.
Samaja (1993), concibe a los indicadores
como procedimientos aplicados a ciertas di-
mensiones relevantes de variables con el
objetivo de realizar la medicin. En este
concepto aparecen nuevamente los dos ele-
mentos citados por Carmines y Zeller
(1979), los conceptos y los indicadores
empricos, pero a diferencia de estos lti-
mos, no asimila el indicador emprico con
la dimensin observable. Samaja no conci-
be la presencia de dimensiones observables,
sino dimensiones o conceptos inobserva-
bles a los cuales los procedimientos los tor-
nan en tal. Posiblemente el diseo de di-
chos procedimientos se realiza en la
planificacin de operaciones previas a que
aluden Carmines y Zeller en su definicin.
Las Escalas y los Niveles de Medicin
Se ha dicho que la medicin, segn distin-
tas concepciones, se realiza sobre las uni-
dades de anlisis o sobre las variables, pero,
es esta ltima la que posibilita la divisin en
clases, ya que la primera es constante.
Tanto para las escalas cualitativas como
cuantitativas existen operaciones clasifica-
torias, o sea ubicacin de las unidades de
anlisis en clases. Por ejemplo, dada una
poblacin puede decirse cules de los indi-
viduos son solteros, casados, divorciados o
cualquiera otra categora de la variable es-
tado civil. Para las mismas personas tam-
bin se pueden estimar los valores, agrupa-
dos por intervalos de, estatura, peso, nivel
de ingresos, o cualquiera otra variables ex-
presada en cantidades.
46
2
Poblacin, Muestra y Variable
Como se advierte en los ejemplos citados, la clasificacin
es un acto propio de la medicin. Ahora bien, ambos casos
difieren en los modos en que se manifiesta la variable. En el
caso de estado civil, el acto queda restringido a clasificar
las unidades de anlisis que muestran tal o cual caracters-
tica; en los dems casos se puede estimar objetivamente
no slo la presencia o ausencia de determinado atributo,
sino tambin la intensidad con que la propiedad se mani-
fiesta, propiedad que se asume en cantidades.
Entre las formas de clasificar variables por referencia al tipo
de escala o nivel de medicin, se hallan aquellas basadas
en criterios de calidad-cantidad.
No existe acuerdo pleno entre los autores acerca de las
categoras de dicho sistema. As, Bancroft (1976) y Corta-
da de Kohan (1994), conciben variables cualitativas, cuan-
titativas discretas y cuantitativas continuas. Incluyen entre
las primeras a las que pueden ser divididas en clases sepa-
radas, mutuamente excluyentes; diferenciando stas en dos
categoras, sin ordenamiento o con l. Ambos autores con-
sideran a las escalas como cuantitativas cuando stas se
expresan numricamente, y cuando dicha expresin nu-
mrica no refiere slo a orden. Estas escalas son discretas
cuando sus valores asumen nmeros enteros, y continuas
cuando pueden tener cualquier valor en un mbito finito
de valores continuos.
Lison (1976), no refiere directamente a variables, pero s a
clases de datos (escalas). Distingue tres clases de datos, de
medicin, de enumeracin y de seriacin. Define a los pri-
meros como determinaciones cuantitativas acerca de pro-
piedades susceptibles de variar de manera continua. El autor
afirma que los datos de enumeracin resultan de contar
individuos y que dicha operacin debe desarrollarse nece-
sariamente por unidades discretas. Por ltimo, concibe a
los datos de seriacin como observaciones en la que los
objetos son clasificados por orden de mrito, sin que pue-
dan darse valores exactos para el criterio adoptado.
Esta ltima clasificacin no incluye a las
variables discretas entre las de naturaleza
cuantitativa. Lison las concibe en clases de
datos diferentes, datos de medicin, las
cuantitativas continuas, y datos de enume-
racin, las discretas.
Si se analiza los trabajos de Bancroft y Cor-
tada de Kohan, se observa que ambos au-
tores indican las mismas clases de grficos
para representar variables cualitativas y dis-
cretas. Formas de representacin coinci-
dentes no constituyen una casualidad, sino
un rasgo comn que debiera indagarse.
Contar y medir no significan lo mismo, en
tanto que lo primero alude al acto de deter-
minar frecuencias en que se presentan cier-
tas unidades de anlisis de un nivel inferior;
lo segundo refiere a variaciones cuantitati-
vas de las propiedades.
Lo que aqu se sostiene es que las variables
discretas no son variables cuantitativas y
que operan en diferentes niveles de inte-
gracin modificndose slo en su dimen-
sin numrica.
Un ejemplo podra ser el que se cita a con-
tinuacin, para la unidad de anlisis indivi-
duo, las variables que lo describen podran
ser, estatura, sexo, y nmero de gl-
bulos rojos por mililitro de sangre. La va-
riable estatura es cuantitativa y se expre-
sa en escalas continuas de centmetros o
metros; la variable sexo es cualitativa y se
muestra en alguna de sus dos categoras,
masculino o femenino.
47
Estadistica 1
Segn Samaja (1993), las variables del nivel de anclaje
pueden comportarse como unidades de anlisis de nivel
subunitario; esto es que tanto estatura como sexo,
podrn transformarse, previa entificacin y objetivacin
en unidades de anlisis. Por ejemplo el concepto de sexo
(variable) podra transformarse en rganos sexuales o con-
ducta sexual observable (unidades de anlisis); o estatura
(variable), en registro de estaturas (unidad de anlisis). Lo
que ocurre con la variable nmero de glbulos rojos por
mililitro de sangre es distinto; dicho atributo se converti-
ra, en el nivel subunitario, en glbulos rojos.
En las dos primeras variables debi resignificarse el senti-
do a los efectos de la objetivacin, en tanto que en la
tercera se asumi una diferencia de mero nmero.
Cuando se elabora una tabla de frecuencias para cual-
quier variable, se introduce sin advertirse, una nueva
variable, esto es el nmero de veces que se presenta cier-
ta unidad de anlisis. Esta variable que puede describir
tanto al nivel de anclaje, como a entidades de nivel supe-
rior (nivel supraunitario), es ms ni menos, una variable
discreta.
En las variables discretas se cuenta dos veces, una, cuan-
do se obtiene el nmero de veces con que se presenta el
elemento al que refiere la variable, y otra cuando se cuen-
tan las unidades de anlisis.
Resumidamente, puede decirse que las variables discretas
son frecuencias de unidades de anlisis cuya nica pro-
piedad comn es justamente el nmero de veces que cierto
objeto se presenta, independientemente de su naturale-
za.
Segn Bateson (1997), el nmero es diferente que la can-
tidad, y esta diferencia es bsica para cualquier clase de
teorizacin en ciencias de la conducta. Para este autor,
los nmeros son el producto del recuento, y las cantida-
des el producto de la medicin. Argumen-
ta diciendo que se puede tener exactamen-
te tres tomates, pero jams podr tenerse
exactamente tres litros de agua, pues la
cantidad es siempre aproximada.
Bateson reconoce que los nmeros ms
pequeos no se obtienen por recuento sino
por reconocimiento de una pauta general,
como por ejemplo los dgitos del sistema
decimal; y que la percepcin de esa pauta
es holstica. Diferencia as el nmero de la
cantidad, a la que asimila con el mundo
analgico y probabilstico.
El Nmero como Nombre, Orden
o Medida
Para Cohen y Nagel (1979), los nmeros
pueden tener por lo menos tres usos dis-
tintos, como rtulos o marcas de identifi-
cacin; como signos que indican la posi-
cin de un grado en una serie de grados; o
como signos que indican las relaciones
cuantitativas entre cualidades. De lo dicho
se desprende que slo la ltima de las acep-
ciones relaciona el nmero con la medicin.
Esta forma de concebir los nmeros con-
duce a una clasificacin de variables o es-
calas en funcin de los atributos que pre-
senta una serie numrica. Dichos atributos
son, el orden, la distancia y el origen.
Las escalas nominales carecen de todas
estas propiedades, y en este caso el nme-
ro slo puede adoptarse como nombre o
identificacin.
48
2
Poblacin, Muestra y Variable
Las escalas ordinales, como su nombre lo indica, slo po-
seen orden, es decir que organizan sus datos a travs de
las relaciones de igualdad, mayor o menor.
Las escalas intervlicas poseen atributos de orden, y dis-
tancia o estimacin precisa de las unidades. Pero carecen
de origen, o cero natural, o ausencia de la propiedad. No
obstante estas escalas acuden a la utilizacin del cero con-
vencional.
Las escalas proporcionales o racionales son las nicas que
cuentan con las tres propiedades y, por lo tanto, se cons-
tituyen en verdaderas series numricas.
Las dos ltimas clases de escalas son las que realmente
miden, no obstante, al carecer las intervlicas de cero natu-
ral, no pueden establecerse proporciones.
A menudo, datos provenientes de escalas ordinales nu-
mricas son tratados como si fuera informacin verdade-
ramente cuantitativa, lo que constituye una falacia, pues
no miden, aunque s clasifican. En este caso se encuadran
los tests psicomtricos, los cuales nicamente pueden es-
timar el orden de puntuacin, pero nunca la distancia en-
tre dos valores.
Con mucha frecuencia, las puntuaciones de dichos tests
reciben tratamiento de variables intervlicas y, consecuen-
temente, el clculo de medidas de tendencia central y dis-
persin, adems de otras operaciones derivadas de ellas.
Dichas operaciones no son vlidas por cuanto asignan a
las escalas un status que en realidad no tienen.
Otras veces, las puntuaciones sirven a ciertos tests como
son los de correlacin y regresin. Al respecto, dice Gould
(1988), ...gran parte de la fascinacin de las estadsticas
radica en nuestro sentimiento visceral de que las medidas
abstractas que resumen amplios cuadros de datos tienen
que expresar algo ms real y ms fundamental que los
datos mismos. La tcnica de correlacin se
ha prestado particularmente a ese tipo de
abuso porque parece proporcionar una va
para hacer inferencias sobre la causalidad.
Gould (1988) sostiene que el anlisis facto-
rial, una de las tcnicas utilizadas en el cam-
po de la psicologa, a pesar de ser de un
instrumento matemtico, se invent en un
determinado contexto social y respondien-
do a claros objetivos. Utilizar dicha tcnica
es asumir que el intelecto es una entidad
fsica localizada en el cerebro, y que puede
medirse como un valor numrico especfi-
co posibilitando clasificaciones unilineales
de las personas en virtud de la cantidad
que cada cual posea del mismo.
49
Estadistica 1
Conclusin
Los conceptos de medicin analizados dejan ver
divergencias acerca de qu es lo que se mide;
algunos autores aluden a que dicha operacin
se realiza sobre los atributos (variables), en tan-
to que otros, sobre los objetos (unidades de
anlisis). Los objetos como constantes que son
en su naturaleza, no son medibles, s, sus pro-
piedades. Se puede ejemplificar diciendo que si
las unidades de anlisis son viviendas, todas ellas
tienen en comn una cierta estructura que las
identifica como viviendas, y no otra cosa; en
tanto que sus atributos: ubicacin en el espa-
cio, materiales que la constituyen, altura, etc.
pueden mostrar diferencias de una vivienda a
otra.
Los objetos si bien no pueden ser medidos, s
pueden ser contados. En este sentido, las vi-
viendas emplazadas en un barrio o ciudad po-
drn ser contadas, o bien, inferido su nmero.
Si contar no es medir, entonces, las definicio-
nes de Russell (1938), y Campbell (1938) sobre
medicin, parecen ms apropiadas.
Segn se ha desarrollado aqu, el uso de escalas
de medicin involucra tres procesos diferentes,
clasificar, contar y medir. Lo que aqu se ha lla-
mado conteo y medicin no son ms que ope-
raciones derivadas de la primera accin clasifi-
catoria. En ambas situaciones, los valores de
variables se expresarn numricamente, aunque
en un caso slo se aludir a frecuencias, y en la
otra a variacin cuantitativa de propiedades.
Las discusiones sostenidas aportan a la idea de
que las variables discretas constituyen un tipo
de entidad diferente de las variables cualitativas
y cuantitativas, aunque muestras propiedades de
unas y otras.
El uso de variables discretas implica, primero, diferenciar las
unidades de anlisis a contar, de aquellas que tambin cons-
tituyen parte del universo del discurso, lo que supone una
operacin de clasificacin, para luego proceder a la obten-
cin de frecuencias. Se asemejan a las variables cualitativas
en cuanto a que sus categoras se construyen sobre la pre-
sencia de ciertos atributos, sin ponderacin cuantitativa de
los mismos. Se parecen a las variables cuantitativas (pro-
porcionales) en cuanto parecen poseer las tres propieda-
des de las series numricas, orden, distancia y origen; aun-
que en lo que hace a la distancia, las variables discretas
slo asumen nmeros enteros, pues la accin de contar se
fundamenta en las propiedades de los nmeros naturales.
Esta diferencia es fundamental, ya que la presencia de n-
meros en las escalas discretas no se relaciona con intensi-
dad de propiedades, sino con operaciones de enumera-
cin.
En lo concerniente a qu clase de propiedad es una varia-
bles discreta, puede decirse que aunque expresada como
variable refiere a una unidad de anlisis en tanto que da
cuenta de algo constante como entidad. Lo que lo hace
ser variable reside slo en el nmero o frecuencia de apari-
cin de la entidad significada.
Finalmente si la recurrencia al uso de escalas, a los efectos
de medir, implica una relacin de isomorfismo entre la natu-
raleza lgica del sistema numrico y la estructura que se
manifiesta en las propiedades que se miden; deber de te-
nerse en cuenta que la escala construida al efecto deber
dar cabal cuenta de dicha relacin isomrfica. Dicho de
otro modo, deber tenerse presente que la medicin, en
sentido estricto, slo es lcita cuando es posible asimilar la
variacin de la propiedad con la variacin cuantitativa.
50
2
Poblacin, Muestra y Variable
Bibliografa
* Bancroft H. 1976. Introduccin a la bioestadstica.
Eudeba. Bs. As.
* Bateson G. 1997. Espritu y naturaleza.
Amorrortu. Bs As.
* Cohen M. y Nagel E. 1979. Introduccin a la lgica
y al mtodo cientfico II. Amorrortu. Bs As.
* Cortada de Kohan. 1994. Diseo estadstico.
Para investigadores de las Ciencias Sociales
y de la Conducta. Eudeba. Bs. As.
* Gould S. J. 1988. La falsa medida del hombre.
Orbis. Hispamrica. Bs. As.
* Hempel C. 1979. La explicacin cientfica. Estudios
sobre filosofa de la ciencia. Paidos. Bs. As.
* Lison L. 1976. Estadstica aplicada a la biologa
experimental. Eudeba. Bs. As.
* Samaja J. 1993. Epistemologa y Metodologa.
Elementos para una teora de la investigacin
cientfica. Eudeba. Bs. As.
51
Estadistica 1
PROBLEMAS PROPUESTOS
1. En la situacin expresada en la siguiente lectura encuentre las variables que intervinieron y clasifquelas de
acuerdo con todas las categoras estudiadas:
Ordenamiento territorial:
el debate nacional
Por: Jos Antonio Snchez
(Fragmento del artculo publicado
en el Espectador el 31 de Julio de 2001
...Los mismos gobernadores han criticado el
enfoque del proyecto gubernamental. Gui-
llermo Gaviria Correa, gobernador de Antio-
quia y presidente de la Federacin de gober-
nadores, sostuvo que es triste decirlo pero,
a pesar de lo que se pregona y de las bonda-
des que indudablemente tiene el proyecto,
es quizs el ms centralista de los casi once
que se han presentado.
Si la suerte est del lado de los gobernadores
y el Congreso aprueba el proyecto, podran
surgir nuevas dudas sobre la viabilidad que
tendran estos nuevos escenarios del orde-
namiento territorial en el pas.
Jaime Castro se pregunta si el Gobierno cen-
tral estara dispuesto a hacer nuevas trans-
ferencias a las regiones para sostenerlas.
Tampoco es pensable que los departamen-
tos cedan algunas de sus rentas a las regio-
nes, aade el ex constituyente liberal.
Mucho menos, dice Castro, se podra exigir a
los colombianos el pago de nuevos impues-
tos para financiar a las regiones. Conclusin:
No hay que hacerse ilusiones de que el pro-
yecto va a ser el remedio para los problemas
regionales del pas, hay que ser realistas, re-
querimos un nuevo modelo de ordenamien-
to territorial.
Orlando Fals Borda, el otro constituyente experto en el
tema, seala el camino ms expedito para fortalecer la
autonoma regional. No se necesita la ley orgnica de
ordenamiento territorial, sino la aplicacin inmediata del
Artculo 306 de la Constitucin Nacional.
Fals Borda insiste que con la suscripcin de un protocolo
entre los gobernadores de varios departamentos se pue-
den crear las Regiones Administrativas de Planeacin
(RAP), lo que sostuvo la semana pasada durante el en-
cuentro de Regiones y Provincias que se realiz en Iba-
gu, pero este esfuerzo es slo el comienzo.
Los gobernadores de sur ven cmo el Gobierno central
prepara una reforma de la Ley 60 que define las compe-
tencias de los entes territoriales y cmo sus reclamos de
acabar con los institutos descentralizados (Sena, ICBF,
Inurbe) para trasladar estas funciones a las regiones y
exigir la creacin de nuevos impuestos regionales, no
producen mayor eco en Bogot.
Entonces, cul es la autonoma que estn alcanzando?
El mismo gobernador del Tolima, Guillermo Alfonso Ja-
ramillo, el impulsor de esta idea de descentralizacin,
reconoce que an falta mucho para madurar la idea. Hay
que dilucidar un poco ms en qu estamos de acuerdo,
dijo el mandatario durante el acto de clausura del en-
cuentro de provincias. Incluso en la declaracin final de
este evento los gobernadores del sur se juegan dos car-
tas. La primera, insistir en su idea de conformar una re-
52
2
Poblacin, Muestra y Variable
gin administrativa y de planificacin con la adopcin
de un plan de desarrollo regional. Y la segunda, pese a
las crticas, insistir en la aprobacin de la ley de ordena-
miento territorial, pero con un amplio consenso.
Quiz la autonoma para estos seis departamentos an
est en proceso de maduracin. Por lo pronto, los man-
datarios del sur recuperaron una herramienta que te-
nan extraviada sus antecesores: el poder de interlocu-
cin ante el Gobierno central. Por lo menos eso
demostraron al obligar al Gobierno a escuchar sus que-
jas sobre el proceso de fumigacin de cultivos ilcitos.
Su interlocucin podra ser clave en escenarios como la
Comunidad Europea, donde estn dispuestos a respal-
dar los programas de carcter social como los que quie-
ren desarrollar en sus regiones. Entre tanto, la autono-
ma regional seguir en veremos en Colombia.
Mientras persiste el tira y afloje entre el Gobierno, la cla-
se poltica anidada en el Congreso y los mandatarios
regionales por el tema del ordenamiento territorial, Co-
lombia podra estar perdiendo una oportunidad para
desenredar el proceso de paz.
As lo estimaron varios expertos que acudieron a Ibagu
a trabajar en el tema de la descentralizacin y la auto-
noma regional. La reforma regional es una de las cla-
ses de la guerra y la paz, dijo Jaime Castro.
El ex constituyente asegur que el poder actual no es
suficiente para reinsertar a la guerrilla. No hay cama pa
tanta gente, asegur. Por eso, sostuvo que es necesa-
rio crear nuevos espacios en las regiones, en los que la
guerrilla pueda participar en un futuro, cuando se firme
un pacto de paz.
Germn Jimnez, del Colegio de Estudios de Quirama,
que defiende la idea de un Estado federal en Colombia,
estim que este esquema de ordenamiento territorial
podra ser til en el marco de un acuerdo general con
la guerrilla.
Habra ciertas regiones en las que la guerrilla podra
acceder a las gobernaciones. Valdra la pena intentar
soluciones que le den relevancia a la guerrilla, dijo Ji-
mnez.
El experto coincidi que Colombia no puede
llegar a un nivel intermedio de descentrali-
zacin como el que asumi el estado espa-
ol. O se es una cosa o se es otra. Ponerse
a inventar un nivel intermedio de autonoma
regional es irrelevante. Jimnez insisti en
la adopcin de un autntico sistema fede-
ral.
De hecho, en el segundo semestre de 1998,
el Eln lanz la propuesta de conformar unos
cantones en Colombia en los que ellos, los
guerrilleros, pudieran tener injerencia en los
asuntos polticos-administrativos. La idea
caus revuelo y el rechazo del establecimien-
to.
Un ao antes, en 1997, las Farc exigieron al
Gobierno del entonces presidente Ernesto
Samper la desmilitarizacin de 13.161 kil-
metros cuadrados en el departamento de
Caquet para entregar a los soldados que
haban sido secuestrados o tomados como
prisioneros de guerra en la toma a la base
militar de Las Delicias (30 de agosto de
1996).
La experiencia se repiti despus. El mismo
grupo guerrillero exigi una zona desmilita-
rizada, de 42.000 kilmetros cuadrados en
el Cagun, como condicin para entablar
las negociaciones de paz.
53
Estadistica 1
2. Clasifique los siguientes items en variables y constantes, en el primer caso diga de cual tipo son:
* Color de uniforme * El dimetro de la luna
* Intensidad de la luz de la luna * La inflacin en U.S.A.
* Nmero de candidatos a la alcalda * Los volmenes de EDA en los municipios
de Bogot en 1999 de Colombia
* Altura de un rbol * Las tasas de empleo
* Velocidad de la luz * Las clases de empleo
* Indice de inflacin *
* Indice de mortalidad infantil * La inflacin en Colombia en enero de 2001.
en Guatemala a junio de 2001.
* Altura de la torre Eifel * Edad de los estudiantes
* Duracin del vuelo Bogot Miami * Nmero de pasajeros por da
* Nombre de los estudiantes * Nmero de pases de Amrica
3. Establezca la diferencia entre variable, dimensin e indicador.
4. Tome un artculo del peridico, tome de l las variables que intervienen en el asunto descrito y clasifquelas.
A partir del mismo artculo ejemplifique los conceptos de indicador y dimensin de una variable.
5. Para cada uno de los siguientes tipos de variable, escriba tres ejemplos diferentes relacionados con su carrera.
Continua Discreta Inter
Intra Cualitativa Cuantitativa
Nominal Ordinal Categrica
54
2
Poblacin, Muestra y Variable
6. Diga que variables extraas podran afectar el siguiente trabajo:
El Instituto SINCHI esta desarrolla una investigacin sobre Aspectos sociales del desarrollo huma-
no sostenible de Caquet y Putumayo Se busca caracterizar los asentamientos humanos (cabeceras muni-
cipales y reas rurales) de los departamentos de Caquet y Putumayo, desde las dimensiones social, eco-
nmica, poltica y de organizacin e integracin funcional del espacio, como punto de referencia para la
planeacin y la toma de decisiones sobre su ordenamiento y desarrollo.
7. De las variables que aparecen en el siguiente caso, cual puede considerarse como extraa:
Se desarrolla una investigacin sobre las causas y consecuencias sociales de la exclusin social
como resultado de la raza o el origen tnico, y el alcance de las polticas y programas disponibles para
combatirla; para descifrar las causas, costos y posibles soluciones destinadas a resolver el problema de la
exclusin social por raza u origen tnico.
El estudio agrupa datos de hogares relativos a los ingresos de los trabajadores, el capital humano y las
caractersticas de las fuentes de empleo con series de tiempo sobre proporcin de alumnos/profesor por
estado durante 1960/2000. Esa informacin se utiliza para investigar la funcin de la raza, los anteceden-
tes y diferencias familiares tanto en cantidad como calidad de la educacin y sus resultados en el mercado
en lo que se refiere a desigualdad entre blancos y afrocolombianos.
Las conclusiones preliminares sugieren que la considerable ventaja de los blancos en la cantidad y calidad
de la educacin que reciben en comparacin con los afrocolombianos explica gran parte la desigualdad en
los ingresos sobre una base racial, lo cual tambin tiene una influencia importante en la desventaja interge-
neracional de los afrocolombianos en lo que se refiere a capital humano. Tambin se encuentra que los
patrones de heterogeneidad en los resultados educacionales que son congruentes con el color de la piel
desempean un papel importante en el acceso a fuentes de empleo mejor remuneradas y estn condicio-
nados a las caractersticas observadas del trabajador. El descenso en el nivel de empleo ha agravado tam-
bin el problema.
8. En los datos recolectados el ejercicio anterior, se acord que 1 significaba ser negro o mulato, 2 ser blanco, 3 ser
mestizo, 4 indgena y 5 otros. La variable raza en este caso es cuantitativa por que los valores que toma son
nmeros?. Explique.
9. Para cada variable que escribi en el ejercicio 5, diga otra clase a la que tambin pertenezca cada una.
10. Construya un mapa conceptual acerca de la interdependencia entre variables.
11. Elabore un cuadro sinptico en el que se anoten de manera sucinta las caractersticas de cada tipo de muestra.
55
Estadistica 1
12. Con la informacin del ejercicio No. 1. Si se quiere investigar la intencin de voto de los congresistas acerca
del proyecto de ley de ordenamiento territorial con el fin de poder decir algo con respecto a la posible
viabilidad de la iniciativa, Describa la poblacin de estudio? Cul sera la poblacin de datos? Cul
sera la muestra a tomar y como se recolectara?
13. Con la informacin del ejercicio No. 1. Suponga que usted va a investigar cual es la opinin de las clases
dirigentes del orden departamental y municipal acerca de la constitucin o no de regiones administrativas y
de planificacin. Diga cuales seran:
* La poblacin de estudio
* La poblacin de datos
* La muestra con base en la cual se va analizar el problema
14. Al final del mismo texto se plantea la problemtica referente al papel de la reforma del ordenamiento
territorial frente al proceso de paz. Lalo nuevamente y:
* Defina un problema de investigacin
* Que elementos se tendran en cuenta para la investigacin?
* Plantee las hiptesis sobre los elementos relevantes
* Cmo definira una muestra para estudiar el problema y de que forma la recolectara?
15. Calificar las siguientes muestras entre aleatorias y sesgadas, dando la explicacin correspondiente.
* Poblacin de estudio: Asistentes al encuentro de provincias. Objetivo del estudio: Determinar
la preferencia entre dos cartas que segn la lectura del ejercicio No. 1., se estaban jugando los
gobernadores. Tcnica de muestreo: Se interceptaron y encuestaron los 8 primeros asistentes
que salieron del evento.
* Poblacin de estudio: Residentes en Bogot D.C. Objetivo: Estimar la calificacin que se da a la
prestacin del servicio de telefona local para determinar cual es el operador que satisface ms
al cliente. Tcnica de muestreo: En una cola de usuarios que se disponen a pagar la factura del
servicio telefnico en un banco situado en un centro comercial durante un da, se hacen 2
preguntas a cada uno.
* Poblacin de estudio: Habitantes de Barranquilla entre 12 y 25 aos. Objetivo: estimar los
niveles de drogadiccin entre la poblacin adolescente y joven. Tcnica de muestreo: se esco-
gen al azar 5 personas de cada barrio que estn dentro del rango de edad y se les hace llenar
un cuestionario escrito.
* Poblacin de estudio: Residentes mujeres en Bogot D.C. Objetivo: estimar el nivel de popula-
ridad del alcalde mayor dentro de la poblacin femenina. Tcnica de muestreo: Un encuesta
56
2
Poblacin, Muestra y Variable
dor se ubic en la entrada de un centro comercial, haciendo tres preguntas a una de cada cuatro
mujeres que pasaba. Se repite el experimento durante ocho das en diferentes centros comer-
ciales.
* Poblacin de estudio: Habitantes del barrio X. Objetivo: Determinar cuales son las necesidades
mas sentidas en el barrio para establecer luego un plan de desarrollo barrial que se pueda incluir
dentro del municipal. Tcnica de muestreo: Se aplica una encuesta de 10 preguntas a una perso-
na adulta por cada casa esquinera del barrio.
16. A partir de la lectura complementaria y de su indagacin personal haga un escrito de una pgina
con sus conclusiones sobre la pregunta Hasta qu punto las manifestaciones del fenmeno muestran
lo que prescriben sus leyes?.
PROBLEMAS RESUELTOS
1. Clasifique las siguientes variables
a) Nmero de habitaciones por casa
b) Tipo de piso de la vivienda
c) Precio por apartamento
d) Combustible usado para cocina
e) rea de locales comerciales
f) Impuestos recaudados por ao
g) Tipo de gobierno
h) Estratos socioeconmicos
i) Peso de un adulto
j) El ingreso familiar
k) Marca de auto usado
l) Tiempo de experiencia laboral en aos y meses
m) Nmero de llamadas telefnicas que se hacen en una lnea por semana
n) Numero de hijos por familia
o) Barriles de petrleo bombeados por da
SOLUCIN. a) Discreta, ordinal, cuantitativa; b) nominal, cualitativa; c) discreta, ordinal, cuantitativa; d)
continua, ordinal, cuantitativa; e) continua, ordinal, cuantitativa; f) continua, ordinal, cuantitativa; g) cate-
grica nominal, cualitativa; h) categrica nominal, cualitativa; i) continua, ordinal, cuantitativa; j) discreta,
ordinal, cuantitativa; k) categrica nominal, cualitativa; l) Discreta, ordinal, cuantitativa; m) discreta, ordi-
nal, cuantitativa; n) discreta, ordinal, cuantitativa; o) continua, ordinal, cuantitativa.
57
Estadistica 1
2. Se realiza un estudio sobre la edad promedio de las personas que entran a los casinos en Medelln en un ao
determinado. Cul es la poblacin de estudio? Cules son las variables de inters y de que tipo son? Cul
es la poblacin de datos? Cul sera una muestra adecuada para el propsito y como se recogera?
SOLUCIN. La poblacin de estudio son todos las personas que asisten a los casinos de Medelln durante
el ao respectivo; la variable de inters es la edad la cual es discreta si se toma en aos cumplidos, ordinal
y cuantitativa; la poblacin de datos es el conjunto de los valores de las edades de todos los miembros de
la poblacin de estudio. Una muestra, podra ser el escoger al azar 30 casinos de manera tal que se tomen
de las diversas zonas de la ciudad. En cada uno de estos se ubicar un encuestador que a la salida
verificar la edad en la cdula de 20 clientes que salgan despus de haber participado en algn juego, as
se tendr una muestra con las edades de 600 personas.
3. Para cada una de las siguientes caractersticas diga si es constante o variable. Un investigador toma un grupo
de 30 vigilantes y de ellas identifica:
* Sexo
* Sueldo mensual
* Procedencia geogrfica
* Ocupacin
RTAS: Variable, variable, variable, constante.
4. Un estudiante de Administracin Pblica basado en el grupo de personas del ejercicio anterior, toma las
siguientes caractersticas. Identifique cada una de ellas como discreta o continua.
* Inflacin
* Estatura
* Nmero de aos cursados
* Nmero de hermanos
RTAS: Continua, continua, discreta, discreta.
5. En los dos casos siguientes diga si se trata de una variable discreta o continua:
* Si estamos midiendo el nmero de familias que por piso habitan en un edificio de apartamentos.
* Se quiere medir el tiempo que tardan diferentes personas en desarrollar una prueba de habilidad
manual.
RTAS: Discreta, contnua.
58
2
Poblacin, Muestra y Variable
6. Se busca determinar cual es la opinin de los habitantes de un municipio referente a una decisin que debe
adoptar el concejo municipal, que por los bajos recursos propios debe optar entre anexar la entidad territorial
a otro municipio vecino o aumentar significativamente los impuestos predial y de industria y comercio. Al
momento de aplicar la encuesta se evidencia que la mayora de los habitantes corresponden a poblacin
flotante cuya actividad econmica se desarrolla en una ciudad cercana y que llegan slo por temporadas de
descanso a sus fincas de recreo, dinamizando el comercio local por esos das. Diga si hay una variable
extraa y cual es.
SOLUCIN. En este caso puede considerarse como variable extraa el lugar donde los habitantes desa-
rrollan su actividad econmica, ya que esta puede incidir en el inters que tengan dichas personas en que
el municipio siga siendo independiente. Otra variable extraa que puede influir en esta posicin es el
lugar de nacimiento de los pobladores, ya que si son de origen forneo tambin podran tener un inters
diferente.
7. En los siguientes casos calificar la tcnica de muestreo aplicada:
Se pretende estimar la calidad del servicio pblico de acueducto en la ciudad de Bucaramanga, y para ello
de aplica una encuesta puerta a puerta tomando 100 casas al azar pero teniendo en cuenta que se
incluyan todos los barrios y adems viviendas de los diferentes estratos. La encuesta se aplica el da
sbado que es cuando se presume que la mayora de personas estn en la casa.
SOLUCIN. Aunque hay estratificacin y aleatoriedad en el muestreo, no se dice nada acerca de s la
cuota de cada parte de la muestra tomada es proporcional a las viviendas por cada estrato o por cada
barrio. La muestra se recoge informacin de los distintos sectores pero dicha representatividad se ve
cuestionada si no se establece que se tom teniendo en cuenta la proporcionalidad de cada componen-
te.
El coordinador de una regional de la ESAP busca determinar si a los estudiantes les gusta la forma en que
se les estn dictando todas las clases, para ello unos monitores se ubican en la puerta de entrada de cada
CETAP y le preguntan a 1 de cada 5 estudiantes que salen, durante un da.
SOLUCIN. La forma de seleccionar al encuestado es aleatoria por que los estudiantes no toman un
orden para salir, tambin se esta tomando una muestra representativa que incluye el 20 % de los estu-
diantes. SI es una regional con un gran volumen de estudiante podra resultar dispendioso el proceso.
59
Estadistica 1
BIBLIOGRAFIA
No creas todo lo que leas, pero sigue leyendo para que puedas creer.
Reto al estudiante para que explore otros
textos no incluidos aqu y contribuya con
su crtica a mejorar muy pronto este tex-
to.
Los textos que se usaron como apoyo
para el desarrollo de esta unidad fueron:
BUNGE, Mario. La Ciencia, su Mtodo y su Filosofa.
FERNANDEZ, Felipe; MONROY, Olga L.; RODRIGUEZ, Lilia-
na. Diseo, desarrollo y evaluacin de situaciones problemticas en
estadstica. Universidad de los Andes: una Empresa Docen-
te. Bogot D.C., 1998.
PARDINAS, Felipe. Metodologa y tcnicas de investigacin en cien-
cias sociales. Siglo Veintiuno Editores. 27 edicin, corregida
y aumentada. Mxico, 1984.
PEREZ MENDEZ, Alvaro. Estadstica Descriptiva. Mdulo Au-
toformativo. Escuela Superior de Administracin Pblica
ESAP. Bogot D.C., 1989.
PERRY, Patricia Ins; MESA, Vilma Mara; FERNANDEZ, Feli-
pe; GOMEZ, Pedro. Matemticas, Azar y Sociedad. Conceptos
bsicos de estadstica. Universidad de los Andes: Una Empresa
Docente, Bogot D.C., 1998.
PICK, Susan y LPEZ, Ana Luisa. Cmo Investigar En Ciencias
Sociales. 5 edicin. Editorial Trillas S.A. 1998 Obtencin y
Ordenamiento De Datos. Mxico, 1994.
SABINO, Carlos A. El Proceso De Investigacin. Editorial Lu-
men - Humanitas. Argentina, 1996.
TAMAYO Y TAMAYO, Mario. El Proceso De La Investigacin Cien-
tfica. 3 ed. Ed. Limusa S.A.; Mxico, 1998.
61
Estadistica 1
Unidad 3
Organizacin y Presentacin
de la Informacin
62
3
Organizacin y Presentacin de la Informacin
63
Estadistica 1
OBJETIVOS
INTRODUCCIN
* Adquirir habilidad en la organizacin de datos esta
dsticos en tablas, su conteo, ordenamiento y clasifi-
cacin.
* Al trabajar el captulo, el estudiante lograr a partir de
datos no agrupados, ordenarlos y elaborar una tabla
de distribucin de frecuencias y sus representaciones
grficas.
El contenido de esta Unidad es bsicamente procedimental, por
lo que se recomienda su trabajo en grupo o bien de forma aut-
noma si se part de unas orientaciones iniciales por parte del
profesor. Esto por que requiere recordar algunas habilidades
como la graficacin de puntos en el plano para la elaboracin
de ojivas e histogramas, conceptos como el de intervalo y su-
matorias.
Para el trabajo con tablas es necesario apoyarnos en la hoja de
clculo, ya que se presentan unas actividades en Excel, las cuales
buscan agilizar los clculos repetitivos. Igualmente, nos sirve
para la representacin grfica de los histogramas, polgonos
de frecuencia y ojivas.
Apyese en los ejercicios resueltos para desarrollar los pro-
puestos y tome nota de las dificultades para presentarlas al
profesor en la sesin presencial.
64
3
Organizacin y Presentacin de la Informacin
65
Estadistica 1
De dnde vienen los datos? La fuente es parcial? Es
posible que haya un inters en proporcionar datos que
conduzcan a una cierta conclusin ms que a otras?
Los datos comprueban o contradicen otras evidencias
que se poseen? Hace falta alguna evidencia cuya au-
sencia podra ocasionar que se llegue a una conclusin
diferente? Cuntas observaciones se tienen? Repre-
sentan a todos los grupos que se desea estudiar? La
conclusin es lgica? Se ha llegado a conclusiones que
nuestros datos no confirman? Vale la pena usar los
datos o debemos esperar y recabar ms informacin
antes de actuar?
Con respecto a las muestras y poblaciones vimos que:
Muestra y poblacin son trminos relativos. Una pobla-
cin es un todo y una muestra es una fraccin o seg-
mento de ese todo. El estudio de muestras es ms sen-
cillo que el estudio de la poblacin completa, cuesta
menos y lleva menos tiempo. Adems, se ha probado
que el examen de una poblacin entera todava permite
la aceptacin de elementos defectuosos, por tanto, en
algunos casos, el muestreo puede elevar el nivel de ca-
lidad.
Una poblacin es un conjunto de todos los elementos
que estamos estudiando, acerca de los cuales intenta-
mos sacar conclusiones. Debemos definir dicha pobla-
cin de modo que quede claro cundo un cierto ele-
mento pertenece o no a la poblacin.
Una muestra es una coleccin de algunos elementos de
la poblacin, pero no de todos. Cualquier grupo que
cumple con los requisitos de la poblacin, puede cons-
tituir una muestra, siempre y cuando el grupo sea una
fraccin de la poblacin completa. Una muestra repre-
sentativa contiene las caractersticas relevantes de la
poblacin en las mismas proporciones en que estn in-
cluidas en tal poblacin.
Recapitulacin
En las dos unidades anteriores vimos que:
Los datos son colecciones de cualquier can-
tidad de observaciones relacionadas. Una
coleccin de datos se conoce como conjunto
de datos, y una sola observacin es un pun-
to de dato. Para que los datos sean tiles,
necesitamos organizar nuestras observacio-
nes, de modo que podamos distinguir pa-
trones y llegar a conclusiones lgicas.
Los especialistas en estadstica seleccionan
sus observaciones de manera que todos los
grupos relevantes estn representados en los
datos. Los datos pueden provenir de obser-
vaciones reales o de registros que se man-
tienen para otros propsitos.
Los datos pueden ayudar a los responsables
de tomar decisiones a hacer suposiciones
bien pensadas acerca de las causas y, por
tanto, de los efectos probables de ciertas
caractersticas en situaciones dadas. Tam-
bin el conocimiento de tendencias adquiri-
do de la experiencia previa puede permitir
estar al tanto de posibles resultados y ac-
tuar en consecuencia.
Cuando los datos son ordenados de mane-
ra compacta y til, los responsables de to-
mar decisiones pueden obtener informacin
confiable sobre el ambiente y usarla para
tomar decisiones inteligentes. Los adminis-
tradores deben tener mucho cuidado y ase-
gurar que los datos utilizados estn basados
en suposiciones e interpretaciones correc-
tas. Para ello, se utilizan las pruebas para
datos:
66
3
Organizacin y Presentacin de la Informacin
Datos tratados: conjunto de datos que ha
sido objeto de algn tipo de ordenamiento
o procesamiento.
La forma ms bsica de organizar los datos
es la tabla. Esta se compone de lneas y co-
lumnas y los elementos esenciales en esta
son:
* Ttulo, en el que se destaca el ob-
jeto de la tabla. Respondemos aqu a que,
cuando y donde; si es necesario se agregan
notas con explicaciones.
* Columna principal en que se ano-
tan las categoras.
* Encabezado de las columnas en el
que se explica el objeto de cada una.
* Cuerpo, es decir la parte que con-
tiene la informacin.
* Notas al pie con el objeto de acla-
rar ciertas operaciones y relaciones que se
utilizan en la tabla; tambin se debe indicar
en ella la fuente de informacin.
Supongamos que el contador de una em-
presa comunitaria que produce y comercia-
liza abrigos en cuero, presenta in informe
semestral as: semestre enero junio de
2001. Unidades vendidas: 38.810. Distribui-
das as: ventas en Bogot 17.850 unidades
a $370.000 c/u por un total de
$6.604.500.000; ventas a otras ciudades:
12.560 unidades a $410.000 c/u con un
total de $5.149.600.000; ventas de expor-
tacin: 8.400 unidades a $480.000 c/u con
un total de $4.032.000.000. Total de ven-
tas: $15.786.100.000.
ORGANIZACIN DE LOS DATOS
Bsqueda de un patrn significativo en los datos:
Existen muchas formas de organizar los datos. Pode-
mos slo colectarlos y mantenerlos en orden; o si las
observaciones estn hechas con nmeros, entonces
podemos hacer una lista de los puntos de dato de me-
nor a mayor segn su valor numrico. Pero si los datos
son trabajadores especializados o los distintos tipos de
automviles que ensamblan todos los fabricantes, de-
bemos organizarlos de manera distinta. Necesitaremos
presentar los puntos de dato en orden alfabtico o me-
diante algn principio de organizacin. Una forma co-
mn de organizar los datos consiste en dividirlos en ca-
tegoras o clases parecidas y luego contar el nmero de
observaciones que quedan dentro de cada categora.
Este mtodo produce una distribucin de frecuencias.
El objetivo de organizar los datos es permitirnos ver r-
pidamente algunas de las caractersticas de los datos
que hemos recogido: el alcance (los valores mayor y
menor), patrones evidentes, alrededor de qu valores
tienden a agruparse los datos, qu valores aparecen con
mayor frecuencia, etc.
Datos sin procesar (Datos no ordenados):
La informacin obtenida, antes de ser organizada y ana-
lizada, se conoce como datos sin procesar puesto que
an no han sido tratados mediante ningn mtodo es-
tadstico.
La cantidad de datos ms grande y los detalles ms mi-
nuciosos pueden no contener la informacin ms til
para la toma de decisiones administrativa. Una parte
importante de la planeacin de sistemas de informacin
administrativa consiste en resumir y presentar los datos
de modo que se pueda obtener la informacin crtica de
manera rpida y sencilla.
67
Estadistica 1
Como son las cifras del informe? Se captan con facilidad en una
simple lectura?.
Ahora si los organizamos en una tabla, preferiblemente, haciendo uso
de una hoja de calculo tendremos lo siguiente:
Figura No. 3.1 Uso de la hoja de clculo para elaborar tablas con facilidad.
Como se puede ver, la informacin aparece mucho ms organizada y nos aho-
rramos muchos clculos. Veamos ahora las formulas que se utilizan en la hoja
de calculo y notemos como, slo requerimos introducir los datos bsicos del
problema: precio unitario y cantidad:
Figura 3.2. Formulas en una hoja de clculo
68
3
Organizacin y Presentacin de la Informacin
Otro aspecto importante es la eleccin de las unidades de medida
de las magnitudes, se debe indicar si se trabaja con cientos, miles
o millones. La buena eleccin de las unidades determina la clari-
dad y el tamao del cuadro.
Un tipo especial y muy til de tablas es el de arreglo cronolgico o
histrico, se utilizan para mostrar
variaciones periodo a periodo ya
sea de produccin, poblaciones,
agentes climticos, etc. El perio-
do de tiempo depende de lo que
se desee mostrar o comparar. Por
ejemplo el siguiente cuadro mues-
tra la variacin del ndice de Pre-
cios al Consumidor en Colombia
durante los primeros siete meses
de 2.001.
Figura 3.3. Hoja de clculo con tabla de arreglo cronolgico.
Los incrementos se calculan as:
(ndice de perodo actual ndice
de perodo base)/(ndice de pero-
do base)
Revisemos como se realizan los cl-
culos en la hoja y comparemos con
la frmula anterior.
Figura 3.4. Formulas usadas en la hoja de clculo para tablas histricas
Ordenamiento de datos utilizando su arreglo y distribucin de frecuencias:
Arreglo de datos: organizacin de los datos sin procesar por observacin, tomados en orden ascendente o
descendente.
La ordenacin de datos es una de las formas ms sencillas de presentarlos, los forma en orden ascendente o
descendente.
69
Estadistica 1
Ventajas:
* Podemos notar rpidamente los valores mayor y
menor de los datos.
* Podemos dividir fcilmente los datos en seccio-
nes.
* Podemos ver si algunos de los valores aparecen
ms de una vez en ese ordenamiento.
* Podemos observar la distancia entre valores su-
cesivos de datos.
En ocasiones, un ordenamiento de datos no
resulta til. Debido a que da una lista de todos
los valores, es una forma incmoda de mostrar
grandes cantidades de datos. Cuando se tie-
nen estas tablas numerosas en hojas de clculo
se puede recurrir al uso de las tablas dinmi-
cas.
La distribucin de frecuencias.
Una forma en que podemos comprimir los da-
tos es la tabla de frecuencias o distribucin de
frecuencias. Las distribuciones de frecuencias
sacrifican algunos detalles, pero ofrecen nue-
vas perspectivas sobre los patrones de datos.
Consisten en despliegues organizados de datos
que muestran el nmero de observaciones del
conjunto de datos que entran en cada una de
las clases de un conjunto de clases mutuamen-
te exclusivas y colectivamente exhaustivas. Asig-
nacin de frecuencias a cada uno de los valo-
res de una variable o atributo.
Se trabajan en estadstica cuatro tipos de fre-
cuencia, que se refieren a la misma caractersti-
ca pero nos brindan informacin diferente. Es-
tas son: la frecuencia absoluta o nmero de
veces que se repite un determinado valor de
una variable o atributo, la frecuencia relativa o porcentaje
de veces que se repite un valor, la frecuencia acumulada
o numero de datos que estn por encima o por debajo de
cierto valor y las frecuencias relativo-acumuladas o acu-
mulado-relativas o porcentajes de la frecuencia acumula-
da respecto del total de datos.
Caractersticas de las distribuciones de frecuencias
relativas.
Podemos expresar la frecuencia de cada valor como una
fraccin o un porcentaje del nmero total de observacio-
nes. Para obtener este valor, dividimos la frecuencia de
esa clase entre el nmero total de observaciones del con-
junto de datos. La respuesta se puede expresar como una
fraccin, un nmero decimal o un porcentaje.
La suma de todas las frecuencias relativas es igual a 1,00
o a 100%. Esto es as debido a que una distribucin de
frecuencias relativas aparea a cada clase con su fraccin
o porcentaje apropiados del total de datos. Por consi-
guiente, las clases que aparecen en cualquier distribucin
de frecuencias, ya sean relativas o simples, son completa-
mente inclusivas. Todos los datos caen en una u otra ca-
tegora. Las clases son mutuamente exclusivas, es decir,
ningn punto de dato cae en ms de una categora.
70
3
Organizacin y Presentacin de la Informacin
En las distribuciones de frecuencias no aparecen clases que
se traslapen.
Podemos, tambin, clasificar la informacin de acuerdo con
caractersticas cualitativas, como raza, religin y sexo, que
no entran de manera natural en clasificaciones numricas.
Como clases de atributos cuantitativos, stas deben ser com-
pletamente inclusivas y mutuamente exclusivas.
La categora otros se conoce como clase de extremo abier-
to cuando permite que el extremo inferior o el superior de
una clasificacin cuantitativa no estn limitados.
Los esquemas de clasificacin pueden ser tanto cuantitati-
vos como cualitativos y tanto discretos como continuos.
Las clases discretas son entidades separadas que no pasan
de una clase discreta a otra sin que haya un rompimiento.
Los datos discretos son aquellos que pueden tomar slo un
nmero limitado de valores.
Los datos continuos pasan de una clase a otra sin que haya
un rompimiento. Implican mediciones numricas. Recorde-
mos que, los datos continuos pueden expresarse con n-
meros fraccionarios o con enteros y las variables discretas
son cosas que se pueden contar y las continuas son cosas
que aparecen en algn punto de una escala.
Construccin de una distribucin de frecuencias:
Lo primero es decidir el tipo y nmero de clases para dividir
los datos. De acuerdo con la medida cuantitativa o un atri-
buto cualitativo. Necesitamos decidir cuntos in-
tervalos de clase distintos usar y el ancho de cada
uno. Un intervalo de clase es un agrupamiento de
valores de una variable.
El nmero intervalos de clase depende del nme-
ro de puntos de dato y del rango de los datos
recolectados. Cuantos ms puntos de dato se ten-
gan o cuanto ms grande sea el rango, ms clases
se necesitarn para dividir los datos. Como regla
general, los estadsticos rara vez utilizan menos
de 6 y ms de 15 clases.
Debido a que necesitamos hacer los inter-
valos de clase de igual tamao, el nmero
de clases determina el ancho de cada clase,
salvo cuando se requieran clases de extre-
mo abierto. Una clase de extremo abierto es
la que permite que el extremo superior o in-
ferior de un esquema de clasificacin cuan-
titativo no tenga lmite.
Ejemplo. Si tenemos que el instructor fsico
de una institucin de formacin deportiva
tiene a su cargo 108 deportistas de 11 a 15
aos; para analizar el comportamiento de las
estaturas de estos los mide redondeando las
alturas al centmetro ms prximo y las anota
en la ficha de registro de cada uno. Con los
datos de las fichas elabora un listado en el
que aparecen sin ningn orden. Estos co-
rresponden a datos no ordenados.
Luego procede a ordenar los datos elabo-
rando un cuadro en el que aparecen las es-
taturas de menor a mayor, de manera que
por cada dato que va contando coloca una
raya al frente, haciendo con las rayas cua-
dros con una raya al travs de manera que
cada uno completo quedar formado por 5
rayas. Esto facilitar el conteo final de las
rayas.
Tabla 3.1. Datos ordenados.
71
Estadistica 1
Alcance o rango de los datos: diferencia en-
tre el mayor y menor valor de la serie.
Rango = 162 125 = 37
Ancho de los intervalos de clase = (valor
unitario siguiente despus del valor ms gran-
de de los datos valor ms pequeo de los
datos) / nmero total de intervalos
Debemos utilizar el siguiente valor ms alto
de las mismas unidades, ya que estamos
midiendo el intervalo entre el primer valor
de una clase y el primer valor de la siguien-
te.
Ancho de clase = (163 - 125) / 8 = 4,75
Hemos optado por tomar 8 clases. Redon-
deamos el ancho de clase a 5, quedando con
un rango ajustado de 40. El exceso del ran-
go ajustado lo distribuimos en el primero y
el ltimo intervalo. As, los intervalos parti-
rn desde 124 hasta 164.
Ahora formamos intervalos de clase de an-
cho 5 con lmites reales que se ubican en el
punto medio entre el lmite superior de una
clase y el lmite inferior de la siguiente. Lue-
go observamos si hay ambigedad en los
datos, en este caso no la hay por que se
redondearon las medidas al
centmetro ms cercano
aplicando la regla del redon-
deo y as los datos son en-
teros. Cuando se presentan
las ambigedades utilizamos
la expresin menor que el l-
mite superior, de manera
que este no quedar inclui-
do en el intervalo, mientras
el lmite inferior si.
Hallamos ahora las marcas de clase que co-
rresponden al punto medio de un intervalo
de clase y su valor es igual a la mitad de la suma de los lmites
superior e inferior de la clase. Luego de clasificar los datos en
clases, contamos el nmero de datos que hay en cada clase y
elaboramos la tabla siguiente.
DISTRIBUCIN DE FRECUENCIAS ABSOLUTAS
Tabla 3.2. Distribucin de frecuencia absoluta
72
3
Organizacin y Presentacin de la Informacin
Representacin grfica de las distribuciones
de frecuencias:
Las grficas dan los datos en un diagrama de dos dimensiones.
Sobre el eje horizontal podemos mostrar los valores de la va-
riable (la caracterstica que estamos midiendo). Sobre el eje
vertical sealamos las frecuencias de las clases mostradas en el
eje horizontal.
Las grficas de distribuciones de frecuencias simples y de dis-
tribuciones de frecuencias relativas son de utilidad debido a
que resaltan y aclaran los patrones que no se pueden distinguir
fcilmente en las tablas. Atraen la atencin del que las observa
hacia los patrones existentes en los datos. Las grficas pueden
tambin ayudarnos a resolver problemas concernientes a las
distribuciones de frecuencias. Nos permitirn estimar algunos
valores con slo una mirada y nos proporcionarn una verifi-
cacin visual sobre la precisin de nuestras soluciones.
Histogramas.
Un histograma consiste en una serie de rectngulos, cuyo an-
cho es proporcional al alcance de los datos que se encuentran
dentro de una clase, y cuya altura es proporcional al nmero
de elementos que caen dentro de cada clase. Si las clases que
utilizamos en la distribucin de frecuencias son del mismo an-
cho, entonces las barras verticales del histograma tambin tie-
nen el mismo ancho. La altura de la barra correspondiente a
cada clase representa el nmero de observaciones de la clase.
Como consecuencia, el rea contenida en cada rectngulo (an-
cho por altura) ocupa un porcentaje del rea total de todos los
rectngulos igual al porcentaje de la frecuencia de la clase co-
rrespondiente con respecto a todas las observaciones hechas.
Un histograma que utiliza las frecuencias relativas de los pun-
tos de dato de cada una de las clases, en lugar de usar el n-
mero real de puntos, se conoce como histograma de frecuen-
cias relativas. Este tipo de histograma tiene la misma forma
que un histograma de frecuencias absolutas construido a par-
tir del mismo conjunto de datos. Esto es as debido a que en
ambos, el tamao relativo de cada rectngulo es la frecuencia
de esa clase comparada con el nmero total de observaciones.
Polgono de frecuencias:
Representacin grfica de la distribucin de
frecuencias en forma suavizada de una va-
riable contnua con una lnea que une los
puntos medios de cada clase de un conjun-
to de datos, trazada a la altura correspon-
diente a la frecuencia de datos.
Son otra forma de representar grficamente
distribuciones tanto de frecuencias simples
como relativas. Para construir un polgono
de frecuencias sealamos stas en el eje ver-
tical y los valores de la variable que estamos
midiendo en el eje horizontal. A continua-
cin, graficamos cada frecuencia de clase
trazando un punto sobre su punto medio y
conectamos los resultantes puntos sucesi-
vos con una lnea recta para formar un pol-
gono.
73
Estadistica 1
Se aaden dos clases, una en cada extremo
de la escala de valores observados. Estas dos
nuevas clases que contienen cero observa-
ciones permiten que el polgono alcance el
eje horizontal en ambos extremos de la dis-
tribucin.
Un polgono de frecuencias es slo una
lnea que conecta los puntos medios de
todas las barras de un histograma. Por
consiguiente, podemos reproducir el
histograma mediante el trazado de l-
neas verticales desde los lmites de cla-
se y luego conectando tales lneas con
rectas horizontales a la altura de los pun-
tos medios del polgono.
Un polgono de frecuencias que utiliza
frecuencias relativas de puntos de dato
en cada una de las clases, en lugar del n-
mero real de puntos, se conoce como polgono de frecuencias
relativas. Este polgono tiene la misma forma que el polgono
de frecuencias construido a partir del mismo conjunto de da-
tos, pero con una escala diferente en los valores del eje verti-
cal.
Ventajas de los histogramas:
Los rectngulos muestran cada clase de la distribucin por se-
parado. El rea de cada rectngulo, en relacin con el resto,
muestra la proporcin del nmero total de observaciones que
se encuentran en esa clase.
Ventajas de los polgonos de frecuencias:
Es ms sencillo que su correspondiente histograma. Traza con
ms claridad el perfil del patrn de datos. Se vuelve cada vez
ms liso y parecido a una curva conforme aumentamos el n-
mero de clases y el nmero de observaciones.
Un polgono alisado mediante el aumento de clases y de pun-
tos de dato se conoce como curva de frecuencias.
Ojivas. Una ojiva grfica de una distribucin de frecuencias
acumuladas absolutas o relativas.
Una distribucin de frecuencias acumuladas nos permite ver
cuntas observaciones estn por encima de ciertos valores, en
lugar de hacer un mero registro del nmero de elementos que
hay dentro de los intervalos.
Tabla: 3.3. Dis tribucin de frecuencias absoluta,
relativa y acumulada
74
3
Organizacin y Presentacin de la Informacin
En ocasiones, la informacin
que utilizamos se presenta en
trminos de frecuencias acu-
muladas mayores que. La
ojiva adecuada para tal infor-
macin tendra una inclinacin
hacia abajo y hacia la derecha,
en lugar de tener una inclina-
cin hacia arriba y a la dere-
cha.
Figura 3.5. Ojivas Mayor que y Menor que
Podemos construir una ojiva de una distribucin de frecuen-
cias relativas de la misma manera en que trazamos la ojiva de
una distribucin de frecuencias absolutas. Slo habr un cam-
bio: la escala del eje vertical.
Del ordenamiento de datos podemos construir distribuciones
de frecuencias. A partir de las distribuciones de frecuencias
podemos construir distribuciones de frecuencias acumuladas.
A partir de stas podemos trazar una ojiva. Y de esta ojiva po-
demos aproximar los valores que tenemos en el ordenamiento
de datos. Sin embargo, no podemos recobrar de manera nor-
mal los datos originales exactos a partir de cualquiera de las
representaciones grficas que hemos analizado.
Tratamiento de una variable discreta:
Se utilizan los diagramas de barras, diagramas de lnea, picto-
gramas o pictgrafos y pasteles.
Las frecuencias acumuladas de variables discretas se grafican
por medio de una ojiva en forma de escalera, debido a que la
frecuencia aumenta de a saltos.
Las barras son menos llamativas que los pictogramas y los pas-
teles, pero en cambio proporcionan mas informacin y permi-
ten una apreciacin estadstica ms rigurosa. Se diferencian
del histograma en que los rectngulos no se tocan entre s;
esto se debe a que, al ser la variable discreta, entre los valores
sucesivos no hay valores intermedios.
75
Estadistica 1
Figura 3.6. Diagrama de barras usando la hoja
de clculo.
En el diagrama anterior vemos que si estuvi-
ramos comparando ms categoras la grfica se
volvera difcil de observar. Sin embargo el diagra-
ma de barras tiene entre sus ventajas el permi-
tir presentar comparaciones entre entidades y
a la vez las variaciones peridicas de estas me-
didas.
Los diagramas de lnea son equivalentes a los
diagramas hechos para las funciones en el pla-
no cartesiano, trabajadas ya en el curso de
matemticas. Sin embargo, teniendo en cuen-
ta que la informacin estadstica se prepara para
ser vista por otras personas, debemos tener en
cuenta al trazar los diagramas de lnea que:
* El cero de la escala vertical siempre
debe colocarse. Si se hace necesario interrum-
pir la escala vertical, esto debe mostrarse en
forma clara y franca con una lnea de zig-zag.
* La lnea debe trazarse mas gruesa que
las coordenadas para que resalte, en especial si
se tiene que trabajar con un solo color.
* Los ttulos deben ser claros y todos los letreros y
notas deben colocarse horizontalmente.
* Las unidades que se utilizan deben destacarse con
claridad.
* La longitud de los ejes se debe seleccionar de modo
que la grfica resulte balanceada a lo largo y a lo ancho.
* Si hay que mencionar puntos particulares de la
curva, deben indicarse con notas al pie.
* Al igual que en las tablas, indique siempre la fuen-
te de informacin.
Un pictograma es una representacin de datos estadsticos
por medio de smbolos que por su forma sugieren la natu-
raleza del dato. Se utilizan para mostrar comparaciones que
impacten, llamando la atencin del pblico en general, cual-
quiera que sea su nivel. La magnitud de los datos dados por
los pictogramas son aproximaciones burdas y no sirven para
anlisis serios de estadstica, por ello slo se usan en publi-
caciones de inters general y no especializadas, para atraer
la atencin del pblico con presentaciones vistosas y lla-
mativas de la informacin.
76
3
Organizacin y Presentacin de la Informacin
Figura 3.7. Pictogramas o pictgrafos
Los pictogramas anteriores resultan ser poco explcitos, por
eso se debe indicar en el encabezado, con claridad, la canti-
dad que representa cada figura. Se deben utilizar figuras del
mismo tamao, como las de la figura y las aproximaciones se
hacen por fraccin de figura, mitad y hasta cuartos. Veamos el
siguiente ejemplo:
CUBRIMIENTO DE LINEAS TELEFONICAS POR SECTOR
Barranquilla 1999
Fuente: Empresas de telefona bsica local.
Figura 3.8. Pictgrafos sobre cubrimiento de servicio telefnico.
Los diagramas circulares o de pastel se utilizan para representaciones grficas de distribucio-
nes porcentuales. No resultan muy aptos para representaciones cronolgicas por que hacen
necesario dibujar crculos de igual radio, uno por cada ao, mostrando en cada crculo la
correspondiente distribucin porcentual.
77
Estadistica 1
Los diagramas de pastel resultan ser un poco complicados
de dibujar manualmente, sin embargo, con la ayuda de
una hoja de clculo resulta ser un trabajo muy fcil, que
adems brinda distintas posibilidades grficas. Los siguien-
tes datos corresponden al
valor de las ventas de ve-
hculos automotores de
produccin nacional en
Colombia durante el ao
2.000 y el correspondien-
te diagrama de pastel.
Figura 3.9. Grfico de pastel en una dimensin usando hoja de clculo.
El crculo completo tiene un rea que equivale al 100%: un
sector representa un tanto por ciento equivalente a la razn
entre el ngulo que forman los radios que limitan el sector y
360 que son el total de grados de la circunferencia. Se ubica
primero el sector de mayor valor partiendo de las doce del
reloj, seguido por los otros en orden descendente. As en la
figura 3.7. tenemos:
(597.997.215 / 1.176.458.620) X 360 = 50.8% X 360 = 183
(172.811.413 / 1.176.458.620) X 360 = 14.7% X 360 = 53
(177.858.532 / 1.176.458.620) X 360 = 15.1% X 360 = 54
(154.579.935 / 1.176.458.620) X 360 = 13.1% X 360 = 47
(573.211.525 / 1.176.458.620) X 360 = 6.2% X 360 = 22
En realidad el clculo y el dibujo manual son dispendiosos.
Afortunadamente los software para estadstica y las hojas de
calculo han simplificado el proceso, dejndonos la tarea de
analizar el resultado.
78
3
Organizacin y Presentacin de la Informacin
RECOMENDACIONES:
* Cuando se trabaja con muestras, recopilar el mayor nmero de datos posible.
* Usar 5 clases como mnimo y 15 como mximo para agrupar los datos, en funcin
del nmero de datos disponibles.
* Trabajar con intervalos de clase de igual longitud.
* Tener cuidado con la clasificacin automtica que hacen los paquetes estadsticos.
* Al calcular frecuencias relativas como proporcin trabajar con cuatro dgitos
despus de la coma, para evitar errores de redondeo en la suma.
* Al dibujar un grfico, no exagerar la escala vertical u horizontal. Un grfico despro
porcionado complica su interpretacin y puede resultar engaoso a simple vista.
EJERCICIOS PROPUESTOS
1. Completar los elementos que faltan de la siguiente la siguiente tabla,
referente a las exportaciones no tradicionales de Colombia en millones de dla-
res FOB, segn el DANE:
79
Estadistica 1
2. Con el siguiente informe de consumo de energa elctrica para usos co-
merciales y domsticos, elabore un cuadro que destaque el porcentaje de consumo
de cada ciudad respecto del total nacional y porcentaje del consumo de cada una
de las cuatro ciudades sobre el total de estas. Total en Colombia ao 1982: 7.144.899
megavatios hora; Barranquilla: 563.953, Bogot: 2.170.057, Medelln: 1.804.332 y
Cali: 806.952.
3. A partir de la siguiente tabla elabore tres diferentes tomando en cada caso
un pas o grupo comercial de destino, en las que se muestren los incrementos
respecto al ao anterior y respecto a un ao fijo de referencia.
Colombia, destino de las exportaciones
1994-2001 / Millones de dlares FOB
1/La suma de los parciales no es equivalente al total de las exportaciones
* Corresponde al perodo enero - mayo / Fuente: DANE
4. En una empresa industrial y comercial del Estado la n-
mina mensual por estamentos en miles de pesos fue: personal de
administracin $450.230, personal de ventas $ 580.415, pro-
duccin $2.456.381. Elaborar un cuadro que destaque (a) El
porcentaje de cada estamento respecto al total de la nmina, (b)
el porcentaje de la nmina de pago de cada estamento respecto
al total de ventas que fue de $11.456.985 para ese mes.
80
3
Organizacin y Presentacin de la Informacin
5. Un colegio departamental tienen 1.470 alumnos y para
su funcionamiento tiene el siguiente personal: un rector y dos vi-
cerectores, cuatro coordinadores, 39 profesores, cuatro psiclo-
gos, 7 vigilantes, 9 empleados de aseo y mantenimiento, 2 bilblio-
teclogas y 3 secretarias. Elaborar un cuadro que muestre por
personal, uno por cada tantos alumnos.
6. Complete el siguiente cuadro cronolgico calculando los
incrementos respecto a 1.985, calcule luego los incrementos res-
pecto al ao anterior y concluya acerca de las caractersticas del
resultado que se obtiene:
7. Elabore un mapa conceptual acerca de las formas de representar grficamente las varia-
bles.
8. Cree cinco ejemplos de pictogramas sobre temas que se relacionen con el tema de estudio
de la carrera. Adicionalmente, critique el siguiente pictograma, sealando sus carencias y sus bon-
dades.
81
Estadistica 1
9. Para dividir un segmento de 60 centmetros e 4 partes, halle:
* Cuntos puntos debe marcar?
* Si se pide que las partes sean iguales, indique los valores en que se deben colocar los puntos.
* Si el primer punto se coloca a 27 centmetros del extremo inicial separando una primera parte y
se indica que las otras tres partes deben ser iguales, halle los valores en que debe colocar los
puntos.
10. Si en una regla de 1oo unidades (100%) marca un punto en la mitad y luego otro punto en
medio de la mitad superior, halle:
* En cuantas partes se dividi 100
* Cuantas unidades hay hasta el primer punto marcado
* Cuantas unidades hay hasta el segundo punto marcado
* Que tanto por ciento expresa el segundo punto marcado
* Que parte de 100 es la distancia entre el segundo punto marcado y el final de la regla.
11. Un examen de estadstica fue presentado por 40 alumnos y se calific con puntos de 1 a 50. Los
resultados obtenidos fueron: 31 13 34 32 31 29 7 39 27 30 37 36
38 36 29 38 12 41 30 27 11 29 13 26 35 29 34
9 46 12 27 19 41 32 36 38 44 14 39 40
82
3
Organizacin y Presentacin de la Informacin
* Ordene los datos.
* Halle el rango.
* Agrupando en las siguientes clases de igual anchura: malo, deficiente, regular,
bueno y excelente, halle el intervalo.
* Halle los lmites reales de clase y las marcas de clase.
* Elabore un cuadro de frecuencias relativas y acumuladas.
12. Usted esta estudiando las caractersticas generales del municipio de Cha para
elaborar el plan de desarrollo municipal. Los datos que se muestran a continuacin
corresponden al uso del suelo en el municipio. Con base en ellos podemos ver el desa-
rrollo del aspecto socio econmico en Cha.
Fuente: Grupo de consultora Pedro Gmez y Cia.
* Cul es la variable de estudio, de que tipo es y cuantos
valores toma?
* Represente grficamente la informacin contenida en la
tabla.
13. Un administrador pblico territorial pretende determinar
que tipo de mecanismo prefieren las personas para elegir al candi-
dato: el tarjetn o la papeleta. Uno de sus asistentes aplica una
encuesta en un municipio cercano a Bogot, Tabio, a 180 perso-
nas y encuentra que 30 no votan, 96 prefieren el tarjetn y 54
prefieren la papeleta.
* Cul es la poblacin de estudio?
* cual es la muestra de estudio y su tamao? Es repre
sentativa la muestra?
* Cul es la variable de estudio? Comente los resultados
obtenidos por el asistente, con respecto a la variable que
83
Estadistica 1
l pretende medir. Proponga una manera de eludir el problema que presentan
los resultados.
* Represente grficamente la informacin obtenida.
14. Un estudiante de administracin pblica en Ccuta, quiere saber cual
es el candidato para alcalde de esa ciudad por el cual se inclinan la mayora de
los estudiantes de la universidad. Para eso, toma una muestra aleatoria de 80
estudiantes y cada uno de ellos da su voto a favor de uno de los siguientes
candidatos: el del Partido Liberal, el del Partido Conservador o el Independien-
te. Los resultados son:
15. Con los datos de la tabla 3.1. construya una dis-
tribucin de frecuencias con 12 clases. Incluya en estas
las frecuencias absoluta, relativa y acumulada relativa.
16. Para la distribucin de frecuencia del ejercicio
anterior dibuje el histograma y el polgono de frecuencia
correspondiente. Dibuje tambin la ojiva a la izquierda y a
la derecha.
17. Dibuje el histograma y el polgono de frecuencia
correspondientes a la siguiente distribucin de frecuen-
cias.
84
3
Organizacin y Presentacin de la Informacin
18. La siguiente distribucin de frecuencias relativas nos
muestra la poblacin ocupada de manera informal en las siete
ciudades principales (Bogot D.C., Barranquilla, Cali, Medelln, Bu-
caramanga, Manizales y pasto) por grupo de edad
en el ao 2.000.
* Elabore la distribucin de fre
cuencia acumulada relativa.
* Dibuje el histograma de frecuen-
cias relativas.
* Dibuje la ojiva a la izquierda y la
ojiva a la derecha.
* Plantee un tema de discusin a
partir de los resultados obtenidos.
19. Investigue cuales son los datos de ocupacin informal
por edades para las mujeres en Colombia, en el ltimo ao. Ela-
bore la tabla de frecuencias y desarrolle los mismos puntos que
se exigen para el ejercicio anterior.
20. En la siguiente tabla se ven las reas de los ocanos en
millones de millas cuadradas. Representar los datos usando: (a)
un grfico de barras y (b) un grfico circular o de pastel.
PROBLEMAS RESUELTOS
1. Elaborar una tabla para destacar la proporcionalidad uno por tantos con los
siguientes datos: en una industria de confecciones trabajan 84 costureras bajo el con-
trol de 7 supervisores encargados de la entrega de materiales y vigilancia del buen
terminado de la confeccin. Interesa destacar la produccin como resultado del con-
trol de un supervisor por cada doce operarios; la estadstica de produccin debe mos-
trar la variacin de la produccin al aumentar la relacin un supervisor por tantos ope-
rarios. En cierta semana las costureras producen 420 vestidos, de los cuales en el control
final se rechazan 32 por defectos de costura.
85
Estadistica 1
CONTROL DE PRODUCCION
Semana del 2 al 6 de julio de 2000
Fuente: Planillas de produccin diaria.
2. Las exportaciones mensuales colombianas durante el ao 200, en millones de
kilogramos fueron: 4.192, 6.934, 6.956, 4.017, 5.851, 6.641, 3.568, 5.216, 5.351, 3.053,
4.459, 9.814 elabore un cuadro cronolgico en el que se evidencien los incrementos mes
por mes y respecto al primer mes. Apyese en la hoja de clculo.
En la siguiente figura se pueden ver las operaciones aplicadas por la hoja de clculo:
86
3
Organizacin y Presentacin de la Informacin
3. Las reas de los continentes (en millones de millas cua-
dradas) se recoge en la siguiente tabla. Representar los datos gr-
ficamente.
AREA DE LOS CONTINENTES
Fuente: Naciones Unidas
Solucin.
Primer mtodo. Grfico de barras horizontales.
Resulta sencillo de hacer y de interpretar, sin embargo es ms
vistoso un diagrama de pastel.
Segundo mtodo. Diagrama de pastel. Para construirlo, hace-
mos que el rea total, 51.5 millones de millas cuadradas, co-
rresponda a los 360 del crculo. As, un milln corresponde a
360/51.5. Se deduce que frica con 11.7 millones, ocupa un
arco de 11.7/(360/51.5) = 82 mientras que Asia, Europa,
Norteamrica, Oceana y Amrica del Sur ocupan 128, 13,
66, 23 y 48 respectivamente. Veamos.
87
Estadistica 1
4. Los pesos de 40 estudiantes varones, con preci-
sin de 1 libra, figuran en la siguiente tabla. Construir una
distribucin de frecuencias.
Solucin. Los pesos extremos son 176 y 119 lb, luego el
rango es 176-119=57 lb. Si se usan 7 intervalos de clase, su
anchura ser 58/7=8.3 luego tomamos 9 por exceso.
La tabla de frecuencia nos quedara as:
5. Construir (a) un histograma y (b) un polgono de
frecuencias para la distribucin de pesos del problema ante-
rior.
88
3
Organizacin y Presentacin de la Informacin
Tenemos un histograma generado por el paquete estadstico,
ahora veamos sobre este el polgono de frecuencia.
6. A partir de la siguiente distribucin de frecuencia, construir
una ojiva mayor que y una menor que.
Tendremos primero que ampliar nuestra tabla de distribucin de frecuen-
cias con el fn de facilitar el proceso de graficacin, as:
A partir de estas obtenemos nuestras ojivas:
89
Estadistica 1
BIBLIOGRAFA
Los textos que se usaron como apoyo para el
desarrollo de esta unidad fueron:
LEVIN, Richard I.; RUBIN, David S. Estadstica Para
Administradores, Editorial PRENTICE HALL, Sexta
Edicin., 1996
MENDENHALL, William. Estadstica para Administra-
dores. Traducido por Dirk Valckx Verbeeck. Grupo
Editorial Iberoamrica. Mxico, 1990.
PERRY, Patricia Ins; MESA, Vilma Mara; FERNAN-
DEZ, Felipe; GOMEZ, Pedro. Matemticas, Azar y
Sociedad. Conceptos bsicos de estadstica. Universidad
de los Andes: Una Empresa Docente, Bogot D.C.,
1998.
PICK, Susan y LPEZ, Ana Luisa. Cmo Investigar En
Ciencias Sociales. 5 edicin. Editorial Trillas S.A. 1998
Obtencin y Ordenamiento De Datos. Mxico, 1994.
PORTUS GOVINDEN, Lincoyan. Curso Prctico de
Estadstica. Editorial Mc Graw Hill. Bogot D.C., 1985.
SPIEGEL, Murray R. Estadistica, 2da Edicin.
SCHAUM Mc. Graw Hill. Bogot, 1998
TAMAYO Y TAMAYO, Mario. El Proceso De La Investi-
gacin Cientfica. 3 edicin Editorial Limusa S.A.;
Mxico, 1998.
91
Estadistica 1
Unidad 4
Tendencia Central
92
4
Tendencia Central
93
Estadistica 1
OBJETIVOS
INTRODUCCIN
* Dado un conjunto de datos agrupados o no, el estu-
diante podr calcular medidas de tendencia central
ms conocidas como: media, mediana, moda, me-
dias geomtrica y armnica.
* A partir de datos agrupados, calcular las medidas de
posicin relativa como cuartles, decles y percentles
Una vez disponemos de los datos agrupados en el captulo an-
terior, nos disponemos ahora a analizar las caractersticas de
dichas distribuciones, para ello utilizamos medidas como las
de dispersin, curtosis, sesgo y de tendencia central. Buscan-
do simplificar el estudio de estas, abordamos primero las de
tendencia central y para el prximo captulo las dems.
Las medidas de tendencia central se aplican tanto a datos agru-
pados como a los no agrupados, por lo que se presentan aqu
para los dos casos. Adicionalmente se presentan las medidas
relativas de posicin que si bien no son todas clasificables como
de tendencia central, si nos aportan mucho en cuanto a la me-
dicin de la forma como estn distribuidos los datos.
Para trabajar este captulo y los siguientes es de gran ayuda la
calculadora o el computador con un software de tipo estadsti-
co como SPSS e incluso las funciones estadsticas de Excel.
Se recomienda que la sesin presencial se aproveche con un
taller prctico en el computador preparado por su profesor.
94
4
Tendencia Central
95
Estadistica 1
MEDIDAS DE TENDENCIA CENTRAL
En la unidad anterior vimos formas de presentar
la informacin y a partir de ellas podemos con-
cluir que:
Los mtodos grficos son muy tiles para obte-
ner una descripcin rpida y general de los da-
tos coleccionados y para presentarlos. Esto apo-
ya, en muchos aspectos, el dicho de una figura
vale mas que mil palabras.
Por ejemplo, supngase que deseamos discutir
nuestros datos con un grupo de personas y que
solamente podemos discutir los datos verbal-
mente. Estaramos obligados a utilizar otras me-
didas descriptivas, al no poder presentar el his-
tograma visualmente, que transmitiran a los
interlocutores una imagen visual del histograma.
Una segunda limitacin, no tan obvia del histo-
grama y de otras tcnicas grficas, es que son
difciles de usar para hacer inferencias estadsti-
cas. Utilizamos probablemente el histograma
muestral para hacer inferencias acerca de la for-
ma y posicin del histograma poblacional, que
describe la poblacin y que desconocemos.
Nuestra informacin se basa en la suposicin
correcta de que existir cierto grado de similitud
entre ambos histogramas, pero nos enfrentamos
entonces al problema de medir el grado de simi-
litud. Sabemos cuando dos figuras son idnti-
cas, pero esta situacin no se presenta proba-
blemente en la prctica.
* Si los histogramas de la poblacin y la
muestra difieren, Cmo podemos medir el gra-
do de diferencia o, concretamente, el grado de simi-
litud?
Se pueden superar las limitaciones del mtodo gr-
fico para describir datos, utilizando medidas descrip-
tivas numricas. Las medidas de esta clase para una
poblacin se llaman parmetros. Las medidas des-
criptivas numricas obtenidas a partir de una mues-
tra, se denominan estadsticos.
Con los histogramas y polgonos se puso en eviden-
cia un significativo comportamiento de los datos en
cuanto a la frecuencia con que se presentan los va-
lores: algunos de estos valores son ms frecuentes
que otros. Adems, se observ una clara tendencia
de agrupacin en el vecindario de los valores ms
frecuentes, haciendo que las curvas representativas
adquirieran formas de campana. Por lo general, la
mayor densidad de frecuencia est en la parte cen-
tral de las grficas, de aqu deriva el nombre de me-
didas de tendencia central. En estadstica es cos-
tumbre usar letras griegas para designar los
parmetros y las ltimas letras minsculas del alfa-
beto para los estadsticos.
96
4
Tendencia Central
Medida de tendencia central (o de posicin) es toda aquella
que indica el valor esperado de un punto de datos tpico o
situado en el medio. Cantidades numricas que dan una idea
sobre la ubicacin de la distribucin de frecuencias.
* Si consideramos la variable, aos de vida al morir de
los colombianos varones, existe algn valor de la variable que
represente la mayora de los valores del conjunto de datos?
Qu significado tiene la esperanza de vida al nacer de un co-
lombiano varn?
Media. Medida de tendencia central que representa el prome-
dio aritmtico de un conjunto de observaciones. La media para
la poblacin (parmetro) la simbolizamos como s y para la
muestra (estadstico) la simbolizamos como
Para calcular la media de datos no agrupados simplemente su-
mamos todos los datos y el resultado lo dividimos por el n-
mero total de estos, as:
Ejemplo. La media de los nmeros 8, 3, 5, 12 y 10 es:
Para datos agrupados, el numerador de la expresin cambia.
La sumatoria no es de cada dato, sino de los productos de las
marcas de clase por las frecuencias absolutas.
Mediana. Punto situado a la mitad de conjunto de datos, medida de localizacin que divide al conjunto de
datos en dos partes iguales. Se simboliza frecuentemente como M
e
.
Para calcular la mediana de datos no agrupados necesitamos ordenarlos y tomar de estos, el ms central. Si
tenemos un grupo de 11 datos ordenados, la mediana ser el 6. Si tenemos 16 datos ordenados, la mediana
ser el promedio entre los datos 8 y 9. Esa regla se aplica en general para cantidades impares y pares
respectivamente.
97
Estadistica 1
Ejemplo. La mediana de los nmeros 8, 3, 5, 12 y 10 es 8. Vea-
mos.
3, 5, 8, 10,12 es claro que 8 es el ms central.
Para datos agrupados la mediana est dada por
Donde:
L
1
Limite inferior de la clase mediana.
N Nmero de datos.
( f)
1
Suma se frecuencias de las clases inferiores a la clase
mediana.
f
Me
Frecuencia de la clase mediana
c ancho del intervalo de la clase mediana.
La clase mediana es aquella en la cual se completa el 50% de los
datos. Esto es facil mirarlo en las frecuencias relativo - acumula-
das.
Geomtricamente la mediana es el valor de X (abscisa) que corres-
ponde a la recta vertical que divide un histograma en dos partes
de igual rea.
Moda. El valor que ms a menudo se repite en un conjunto de
datos. Est representado por el punto ms alto de la curva de
distribucin de un conjunto de datos. Se simboliza frecuentemen-
te como M
o
. La moda puede no existir, e incluso no ser nica en
caso de existir. Una distribucin con moda nica se llama unimo-
dal.
En el caso de los datos agrupados donde se haya construido
una curva de frecuencias para ajustar los datos, la moda ser
el valor (o los valores) de X correspondiente al pico mximo (o
mximos) de la curva. A partir de una distribucin de frecuen-
cias puede deducirse con la ecuacin
98
4
Tendencia Central
Donde:
L
1
Limite inferior de la clase modal
f
i
Frecuencia absoluta de la clase modal
f
i-1
Frecuencia absoluta de la clase anterior a la clase
modal
f
i+1
Frecuencia absoluta de la clase posterior a la clase
modal
C Ancho del intervalo de la clase modal
Retomando el ejemplo del captulo anterior referente a las es-
taturas de los deportistas, miremos en que consisten las medi-
das de tendencia central.
Para la media tenemos:
La mediana ser:
Y la moda:
99
Estadistica 1
De las medidas de tendencia central, la media es la nica que
se presta a tratamientos algebraicos, con los que se demues-
tran varias propiedades de la media. Tambin es posible obte-
ner medias ponderadas de varias medias. Ejemplo. Durante
diciembre un pequeo empresario vendi lechones a negocios
en tres sectores de la ciudad, en el sector A vendi 35 a un
precio promedio de $320.000, en el sector B vendi 19 por un
precio de $286.500 y en el sector C vendi 9 por un precio
promedio de $336.000. Calcular el precio promedio por le-
chn del total de las ventas del microempresario.
Evaluemos la siguiente situacin, si tenemos los siguientes da-
tos 3, 5, 7, 7, 8 que corresponden a la edad en que entran a la
escuela los nios de una pequea aldea, la media es
(3+5+7+7+8)/5=6;
* Es el 6 un valor que puede representar a los dems?
Tiene coherencia decir que los nios de esta aldea
inician el estudio en la escuela alrededor de los seis
aos?
Si cambiamos el valor extremo 8 por 23, los datos sern 3, 5,
7, 7, 23, cuya media es (3+5+7+7+23)/5=9.
* Podremos ahora decir que el 9 puede representar a
los dems valores? Tiene coherencia decir que las
personas de esta aldea inician el estudio en la escuela
alrededor de los nueve aos?
* Qu podemos concluir acerca de la media?
* Cul es la mediana de las dos series?
* Qu podemos decir entonces ahora acerca de la
mediana?
De las tres medidas de tendencia central que hemos estudiado, la media aritmtica es muy sensible a los
valores extremos, en tanto que la mediana y la moda no lo son. En el ejemplo anterior que la mediana por ser
insensible a los valores extremos no vari al cambiar 8 por 18 y fue 7 en ambas series. La moda en ambas
series tambin es 7 por ser el valor ms frecuente.
100
4
Tendencia Central
Debido a la gran sensibilidad de la media a los valores extre-
mos, a veces resulta que su valor produce efectos engaosos.
As, por ejemplo, si se est estudiando el ingreso diario de un
grupo de personas y se tienen los valores 320, 400, 400, 400,
450, 500, 550, 2000, 2900, a esta serie le corresponde:
Media 880
Mediana 450
Moda 400
Se observa que solo dos personas tienen ingresos altos y las
siete restantes tienen salarios de 550 o menos, o sea que en
este caso la media result atpica. La media de 450 y la moda
de 400 resultan ms representativas para esa distribucin. El
conocimiento de las tres medidas de tendencia central da una
buena apreciacin de la distribucin de los valores. Pero si se
debe hacer una apreciacin con una sola medida, es mejor
usar la mediana que corresponde al valor del medio.
La siguiente grfica nos muestra la ubicacin de las medidas en
una curva de distribucin de frecuencias.
Figura 4.1. La curva de distribucin de frecuencias y las medidas de tendencia central.
En la grfica verificamos que:
La media aritmtica es un punto de equilibrio, similar al centro de gravedad,
La mediana tiene la propiedad de que su ordenada divide el rea bajo la curva en dos partes iguales.
La moda es la abscisa correspondiente a la mayor ordenada o pico de la curva.
101
Estadistica 1
La grfica nos muestra una distribucin que no es simtrica lo
cual hace que las tres medidas no se ubiquen en el mismo lugar.
En una distribucin simtrica las tres medidas de tendencia cen-
tral son idnticas, y si la distribucin se torna asimtrica no se
produce cambio en la moda; la mediana y la media se corren en
direccin de la asimetra. La asimetra es positiva hacia la derecha
y negativa hacia la izquierda. En la simetra positiva la mediana
aumenta por el mayor nmero de frecuencias hacia la derecha y
la media aumenta mas, ya que hay un aumento en la frecuencia y
el valor de las observaciones. En las asimetras negativas ocurre lo
contrario: la mediana disminuye y la media disminuye mas que la
mediana.
Al elegir la medida mas adecuada debemos recordar que:
* La medida de tendencia central que se debe utilizarse depende de la informacin
que se tenga y el objetivo que se persiga.
* Si la distribucin es aproximadamente simtrica, pueden utilizarse indistintamente
las tres medidas, que resultan aproximadamente iguales.
* Si los datos no estn ordenados, puede resultar ms fcil el clculo de la media
aritmtica que el de la mediana; la moda se encuentra por simple bsqueda del
valor ms frecuente.
* Si los datos son irregulares y hay lagunas en los valores de la clase mediana, esta
medida de tendencia central no resulta muy buena ya que su ubicacin puede
resultar falsa.
* Si desea calcular totales, la nica medida utilizable es la media aritmtica. As, si
basados en una experiencia deseamos conocer en una empresa el posible gasto de
energa elctrica para el periodo futuro, la nica medida utilizable es la media.
* Si deseamos ubicar las condiciones de una persona en una clase, la mediana resulta
la medida ms indicada ya que por comparacin pone en evidencia si la persona
esta por sobre la mitad o por debajo de ella.
Media Geomtrica. Es til en el clculo de tasas de crecimiento y se define como la raz n-sima del
producto de N trminos positivos.
As la media geomtrica de 2, 4, 6, 12, 18 es
102
4
Tendencia Central
En este ejemplo se han usado los valores de la variable que
va creciendo, para obtener el valor nominal de crecimiento
promedio. Sin embargo, tambin se pueden usar los valo-
res porcentuales de las tasas de crecimiento, expresando
por ejemplo porcentajes de crecimiento continuo de 5%,
17%, 12% y 20% como 1,05; 1,17; 1,12 y 1,20 como fac-
tores dentro de la raz. Vanse el ejercicio resuelto No. 1 del
presente captulo.
Recuerde que la extraccin de una raz se puede expresar
como una potencia del exponente fraccionario. Esta opera-
cin es muy fcil de hacer con la calculadora usando la tecla
X
y
o la tecla X
1/y
.
La Media Armnica. Esta medida de una serie de nmeros
es el recproco o inverso de la media aritmtica de los recpro-
cos de los nmeros de una serie. Se usa para encontrar mode-
los o comportamientos tipo, para ser utilizados en la elabora-
cin y evaluacin de proyectos.
Ejemplo. La media armnica de los nmeros 2, 4 y 8 es
Para la media armnica de datos agrupados se tiene la siguiente ecuacin.
Para la distribucin de frecuencia de las estaturas de los deportistas, tenemos
103
Estadistica 1
La media geomtrica de una coleccin de nmeros positivos es
menor o igual que su media aritmtica, pero mayor o igual que su
media armnica.
La Media Cuadrtica. Es un tipo de promedio que se utiliza
frecuentemente en las aplicaciones fsicas.
Ejemplo. La media cuadrtica del conjunto 1, 3, 4, 5 y 7 es
MEDIDAS DE POSICION RELATIVA.
Percentiles, Cuartiles, Deciles.
A veces se desea conocer la posicin que tiene una observacin
respecto de un conjunto de datos. Por ejemplo si se present un
examen de admisin y se obtuvo una calificacin de 640, intere-
sara conocer el porcentaje de participantes que obtuvieron una
calificacin menor que 640. Tal medida de posicin relativa den-
tro de un conjunto de datos se llama centil o percentil.
Si un conjunto de datos esta ordenado por magnitud, el valor central que divide al conjunto en dos partes
iguales es la mediana. Extendiendo esa idea, la medida que divide el conjunto en cuatro partes iguales, es el
cuartil. Los cuartiles se denotan como Q
1
, Q
2
y Q
3
. El Q
2
coincide con la mediana M
e
.
Anlogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles, y se denotan D
1
, D
2
,
..., D
9
, mientras que los valores que los dividen en 100 partes iguales son los que ya llamamos percentiles.
El decil 5 y el percentil 50, coinciden con la mediana. Los cuartiles 1 y 3 coinciden con los percentiles 25 y 75
respectivamente.
Ejemplo. Para la distribucin de frecuencia correspondiente al grupo de deportistas tenemos que el primer
cuartil tendr el siguiente nmero de observaciones
104
4
Tendencia Central
El primer cuartil cae en el intervalo de clase 138.5 143.5; hay
14 deportistas en las tres clases anteriores, es decir, para com-
pletar los 27 de Q
1
debemos hacer una interpolacin lineal para
los 13 que faltan as:
En la clase que contiene el cuartil hay 24 observaciones en un
ancho de 5 centmetros.
1 observacin corresponde a 5/24 centmetros;
13 corresponden a 13(5/24)=2.7 centmetros
Tomamos entonces el lmite inferior de la clase, hasta donde
sabemos que hay 14 observaciones y le agregamos la medida
correspondiente a los 13 restantes.
138.5 + 2.7 = 141.2 centmetros.
El primer cuartil es de 141.2 centmetros y quiere decir que el
25% de los deportistas tiene una estatura de 141.2 centme-
tros o inferior.
El segundo cuartil que equivale a la mediana, lo podemos ob-
tener as:
Se ubica en el intervalo 143.5 148.5 de manera que
Hasta 148.5 se encuentra el 62.0 %
Hasta 143.5 se encuentra el 35.2 %
Restando 5 centmetros corresponden a un 26.8 %
Podemos hallar cuantos centmetros corresponden al 50 % - 35.2 % = 14.8 % y sumrselos a los 143.5
centmetros del lmite inferior.
Podemos tambin hallar cuantos centmetros corresponden a 62.0 % - 50 % = 12 % y restrselos a los 148.5
centmetros del lmite superior. En este caso parece ser la opcin ms fcil. Si lo hacemos en un paquete
estadstico, estos clculos pierden significado, sin embargo el practicarlos y descifrarlos nos ayudan a enten-
der con claridad lo que estamos buscando.
105
Estadistica 1
Si 26.8 % corresponden a 5 centmetros; 1 % corresponde a 5/
26.8; 12% corresponde a 12(5/26.8)=2.24
Restamos entonces a 148.5 - 2.24 = 146.26 que es el mismo
valor que habamos obtenido anteriormente con una frmula
para la mediana. Existen ecuaciones para calcular todos los
deciles, cuartiles y percentiles, sin embargo como estos los aplica
el programa contable en forma oculta, resulta valioso el proce-
dimiento anterior para captar el significado de la medida.
Obtuvimos que Q
2
= D
5
= P
50
= M
e
= 146.6
* Compare el procedimiento que se us para calcular
Q
1
con el que se us para Q
2
.
* Vuelva a hacer el calculo pero usando para Q
1
el pro
ceso usado anteriormente para Q
2
y viceversa.
* Que concluimos a cerca del procedimiento?
* Calcule ahora Q
3
.
EJERCICIOS PROPUESTOS
1. La poblacin de un pas creci en los ltimos 5 aos de 4.200.000 a 4.775.000; halle (a) la
tasa de crecimiento total en los cinco aos. (b) La tasa de crecimiento anual.
2. Los salarios aumentaron en los ltimos 4 aos en 8%, 9.6%, 7,75% y 11.3%, halle: (a) la tasa
de crecimiento total en los cuatro aos; (b) la media anual de crecimiento; (c) la media geomtrica
anual de crecimiento.
3. En una industria se ha controlado el tiempo que tardan tres obreros en ensamblar un mo-
tor. Uno demora 6 horas, otro 8 horas y un tercero demora5 horas. Halle el rendimiento de un obrero
tipo que sirva de base para anlisis financieros.
4. Una empresa de transportes tiene tres automotores diferentes que emplean en el recorrido
entre dos pueblos 16, 15 y 12 horas respectivamente. Halle el tiempo que empleara un automotor
tipo que sirva de base para un estudio de costos.
106
4
Tendencia Central
5. En un concurso de mritos se tienen unas calificaciones de 8 personas en los diferentes
aspectos a evaluar, cada aspecto tiene una ponderacin y sus valores se indican entre parntesis.
Hallar (a) la media ponderada del grupo, (b) la media de cada concursante y (c) explique si en este caso
tendran alguna utilidad la media armnica, la media geomtrica o la media cuadrtica.
6. La poblacin de un pas aument en 4 aos de 16.320.430 habitantes a 17.840.210;
halle: (a) el porcentaje de aumento en los cuatro aos; (b) el promedio geomtrico anual.
7. El aumento en el consumo de energa de los usuarios de una empresa del servicio publico
de energa elctrica, fue en los ltimos 5 aos de: 28%; 12%; 19%; 24%; 22%; halle: (a) el porcentaje
del incremento del ltimo ao con base en las ventas del servicio en el primer ao; (b) el promedio
geomtrico de incremento anual.
8. La prdida en el valor adquisitivo de la moneda de un pas fue en los ltimos 4 aos de:
12%, 17%, 14% y 15%; halle: (a) el porcentaje de prdida del valor del ltimo ao con relacin al
primer ao; (b) el promedio geomtrico de prdida anual.
9. En cierta industria se control la produccin de un artculo y se encontr que la produc-
cin de tres obreros de una seccin fue de 93, 84 y 102 piezas respectivamente; halle la produccin
de un obrero tipo para esta seccin.
10. Halle el valor promedio para el kilogramo de mercanca adquirida en tres lotes as: 340
kilogramos a $2830 cada uno, 260 kilogramos a $3010 cada uno y 535 a $2750 cada kilogramo.
11. Al hacer un estudio del transporte pblico de una ciudad se midi el tiempo empleado por
los buses en el recorrido de cierta ruta y se encontr los siguientes tiempos para los 5 buses asigna-
dos al recorrido: 7.3 horas, 6.8 horas, 7.4 horas, 6.4 horas y 7.6 horas; halle el tiempo que se debe
asignar a un bus tipo para estudios econmicos.
12. Un contratista recibe dos ofertas para pintar un edificio; una cuadrilla de obreros ofrece
pintar el edificio en 28 das, otra cuadrilla se compromete a pintarlo en 35 das. El contratista decide
entregar el trabajo a las dos cuadrillas para que trabajen simultneamente. Halle el tiempo que
emplearn en pintar el edificio.
107
Estadistica 1
13. En el municipio de Cota (Cundinamarca) para 1990 haba un potencial electoral de 13.875.
Unos politlogos deseaban saber cual de las edades represent mayor afluencia en las elecciones
presidenciales de ese momento. Se tom una muestra de 100 personas, teniendo en cuenta su edad
dentro del proceso electoral. Esto con el fin de determinar cual fue la edad de los votantes que decidie-
ron los resultados de la eleccin.
Los politlogos obtuvieron los siguientes datos: de 9.680 personas que votaron, se registraron las
siguientes edades de 100 personas:
18 18 23 20 19 70 19 47 32 43 43 45
19 20 24 19 21 21 26 20 65 19 71 21
33 18 29 40 19 52 24 23 44 20 34 24
47 29 39 40 21 55 30 21 18 45 41 61
35 35 23 27 33 21 18 19 34 61 37 18
63 38 35 46 41 34 23 36 19 20 26 40
28 40 34 29 39 28 50 48 20 23 20 37
24 32 30 19 30 27 29 53 27 44 32 21
43 23 21 37
* Identifique la poblacin de estudio y la muestra de estudio.
* Cul es la variable que se quiere medir? De que tipo es?
* Elabore una tabla de frecuencias para organizar la informacin y con base en ella haga un
diagrama que le permita mostrar claramente cual fue la edad con mayor nivel de votacin.
* A partir de la tabla de frecuencias calcule los deciles D
3
, D
6
y D
8
.
* Cul es la medida de tendencia central ms apropiada para el estudio de los politlogos?
Explique la respuesta.
* Encuentre la mediana grficamente a partir de la ojiva. Use papel milimetrado.
* Calcule la mediana para datos agrupados y compare el resultado con el obtenido grficamen-
te.
* Cual es la edad de la persona mayor del 30 % de menor edad?
* Calcule el cuartil Q
3
y los percentiles P
35
y P
85
.
14. Tres profesores de economa dieron notas medias en sus cursos, con 32, 25 y 17 estudiantes,
de 79, 74 y 82 puntos, respectivamente. Hallar la puntuacin media de los tres cursos.
15. Si el precio de un artculo se duplica en un periodo de 4 aos, Cul es el porcentaje medio de
crecimiento anual?
108
4
Tendencia Central
16. Qu capital final se tendr al cabo de 6 aos, si se invierten U$ 1000 al 8% de inters anual?
17. Hallar la moda de los datos del problema No. 13.
18. La tabla siguiente nos muestra el nmero de bodas en U.S.A. para hombres y mujeres de distin-
tos grupos de edad durante 1984.
* Hallar la mediana de edad de hombres y mujeres en esas bodas.
* Hallar la media y la moda de la edad de hombres y de mujeres.
* Por qu la mediana es una medida de tendencia central mas adecuada que la media en este
caso?
* Comprobar la mediana por el mtodo grfico.
* Elaborar el histograma para varones y para mujeres.
* Hallar la edad de la mayor de las mujeres del 25% de menor edad al casarse.
* Hallar la edad del hombre ms joven del 20% de mayor edad al momento de casarse.
* Hallar la edad de la mujer ms joven de entre el 85% de las mujeres mayores.
19. El volumen de consumo de energa en 60 hogares durante un mes fue de:
109
Estadistica 1
* Elaborar una tabla de frecuencias.
* Dibujar un histograma y el polgono de frecuencias correspondiente.
* Hallar la media para datos no ordenados (apyese en la calculadora con funciones estads-
ticas), luego halle la media para datos agrupados y diga si resulta ser apropiada.
* Calcule la moda y la mediana para datos agrupados.
* Cul es menor consumo del 35% de los hogares con mayor consumo de energa?.
* Cul es el mayor consumo del 40% de los hogares con menor consumo?
* Entre que valores de consumo se encuentra el 80% de los hogares ms cercano al consumo
promedio?
* Halle Q
1
, Q
3
, D
3
, D
4
, D
6
, D
7
, P
15
, P
45
, P
73
y P
87
.
EJERCICIOS RESUELTOS
Solucin.
1. Si el crecimiento de las ventas en un negocio fue en los
ltimos tres aos de 26%, 32% y 28%, hallar la media anual de su
crecimiento.
La tasa de crecimiento es de 28.6% anual.
2. Un obrero puede pintar una casa en 6 das y otro puede pintarla en
8 das. Hallar el rendimiento de un obrero cuyo rendimiento sea representati-
vo de los rendimientos de los dos obreros (obrero tipo) y comprobar el ejerci-
cio.
110
4
Tendencia Central
Comprobacin. Dos obreros tipo demoran en pintar la casa
6
6/7
2
=
3
3/7
das.
Los dos obreros del problema pintan en un da de la casa.
En pintar toda la casa demoran
24/7
= 3
3/7
das.
3. El Departamento Administrativo del Medio Ambien-
te, buscando determinar el nivel de contaminacin por bixido
de carbono (CO
2
) en el centro de Bogot se hicieron 200
mediciones, cuyos datos se agruparon en la siguiente tabla
de frecuencias. Hallar la media.
Nivel de contaminacin del aire por CO
2
en el centro de Bogot durante el 2001
Fuente: DAMA
4. Con los datos del ejercicio anterior calcular la moda y la mediana
y a partir de estas determinar si la distribucin tiene asimetra positiva o
negativa.
Primero debemos completar la tabla de frecuencias, para poder usar las
frecuencias acumuladas.
111
Estadistica 1
Por el resultado vemos que la media es menor que la mediana y la moda, que son prcticamente iguales.
Podemos pensar entonces que la distribucin es asimtrica hacia la izquierda. A partir de ello tenemos
argumentos para decir que los niveles de contaminacin pueden tener variaciones, presentndose ms
casos de niveles inferiores al valor ms tpico que superiores.
5. Con la informacin del ejercicio 3 calcular los cuartiles Q
1
y Q
3
y ubquelos sobre el histograma.
Para el primer cuartil tenemos que se ubica en el intervalo 20 % a 22 % donde se completan los 256/
4=64 primeros elementos.
Hasta una concentracin de CO
2
de 20% hay 21 mediciones
Hasta una concentracin de CO
2
de 22% hay 78 mediciones
Dentro de un ancho de clase de 2% hay 57 mediciones
Cada medicin corresponde a 2/57=0.035 %
112
4
Tendencia Central
De manera que para las mediciones que faltaban entre el lmite
inferior y las 64 mediciones, es decir a 64-21=43 tendramos
0.035%x43=1.51% que le sumaremos al lmite de clase infe-
rior:
20 % + 1.51 % = 21.51 %. Podemos decir que una cuarta
parte de las observaciones arrojan una medicin del nivel de
contaminacin por CO
2
inferior a 21.51%. Este resultado preli-
minar tambin nos indica el considerable apuntalamiento que
tendra el polgono de frecuencia para esta distribucin.
El cuartil 3 corresponde a 192 mediciones y se ubica en el inter-
valo de clase que va de 24 % a 26 %.
Hasta una concentracin de CO
2
de 26% hay 240 mediciones
Hasta una concentracin de CO
2
de 24% hay 167 mediciones
Dentro de un ancho de clase de 2% hay 73 mediciones
Cada medicin corresponde a 2/73=0.0274 %
De manera que para las mediciones que faltaban entre el lmite
inferior de la clase cuartlica y las 192 mediciones, es decir a
192-167=25 tendramos 0.00274%x25=0.685% que le suma-
remos al lmite de clase inferior:
24 % + 0.685 % = 24.685 %.
Podemos decir que tres cuartas
partes de las mediciones hechas al
nivel de contaminacin en el cen-
tro de Bogot, mostraron concen-
traciones inferiores a 24.685 % de
CO2; o que una cuarta parte de las
mediciones fueron iguales o supe-
riores a 24.685 % de CO2 en el aire.
113
Estadistica 1
6. Con la informacin del ejercicio 3 hallar D1, D6, P85.
Para el primer decil tenemos que se ubica en el intervalo 20 % a
22 % donde se completan los 256/10=26 primeros elementos.
Hasta una concentracin de CO
2
de 20% hay 21 mediciones
Hasta una concentracin de CO
2
de 22% hay 78 mediciones
Dentro de un ancho de clase de 2% hay 57 mediciones
Cada medicin corresponde a 2/57=0.035 %
De manera que para las mediciones que faltaban entre el lmite
inferior y las 26 mediciones, es decir a 26-21=5 tendramos
0.035%x5=0.18% que le sumaremos al lmite de clase inferior:
20 % + 0.18 % = 20.18 %. Podemos decir que una dcima
parte de las observaciones arrojan una medicin del nivel de
contaminacin por CO
2
inferior a 20.18%.
Para el sexto decil tenemos que se ubica en el intervalo 22 % a
24 % donde se completan los 6x256/10=156 primeros elemen-
tos.
Hasta una concentracin de CO
2
de 24% hay 167 mediciones
Hasta una concentracin de CO
2
de 22% hay 78 mediciones
Dentro de un ancho de clase de 2% hay 99 mediciones
Cada medicin corresponde a 2/99=0.02 %
De manera que para las mediciones que faltaban entre el lmite inferior y las 78 mediciones, es decir a
156-78=78 tendramos 0.02%x78=1.58% que le sumaremos al lmite de clase inferior:
22 % + 1.58 % = 23.58 %. Podemos decir que seis dcimas partes de las observaciones arrojan una
medicin del nivel de contaminacin por CO
2
inferior a 23.58 %.
El percentil 85 corresponde a 218 mediciones y se ubica en el intervalo de clase que va de 24 % a 26 %.
Hasta una concentracin de CO
2
de 26% hay 240 mediciones
Hasta una concentracin de CO
2
de 24% hay 167 mediciones
Dentro de un ancho de clase de 2% hay 73 mediciones
Cada medicin corresponde a 2/73=0.0274 %
114
4
Tendencia Central
De manera que para las mediciones que faltaban entre el
lmite inferior de la clase percentlica y las 218 mediciones,
es decir a 218-167=51 tendramos 0.00274 % x 51 = 1.4
% que le sumaremos al lmite de clase inferior:
24 % + 1.397 % = 25.4 %.
7. Si una empresa de energa quiere determinar el
consumo de energa para un periodo futuro, cual ser la
medida de tendencia central mas apropiada?
Solucin. Aunque para este propsito sera mas adecuado
trabajar con una serie de tiempo o una curva de tendencia,
definitivamente, la media resulta ser la medida de tendencia
central que ms se adecua a la pretensin de estimar un
valor futuro ya que puede acercarse mas a la tendencia de
la variable en cuestin, al contrario de la mediana que nos
proporciona una informacin referente a un periodo ubica-
do en la parte central de nuestra distribucin.
8. Si un jefe de recursos fsicos necesita adquirir el
calzado para proveer de dotacin al personal que devenga
menos de dos salarios mnimos, necesitamos saber cual es
el valor ms representativo de la talla usada por los emplea-
dos, con el fn de mantener mas cantidad en el stock, te-
niendo en cuenta que sacar un inventario persona por per-
sona resulta difcil por la cantidad de personal que entra y
sale de la entidad. Cul medida de tendencia central es la
ms adecuada?
Solucin. La moda resulta ser mas adecuada, por obvias
razones, primero por que si indica el valor de la talla que se
usa con ms frecuencia, mientras que la media y la mediana
podran ser valores que no correspondan a ninguna talla.
115
Estadistica 1
Unidad 5
Dispersin y Asimetra
116
5
Dispersin y Asimetra
117
Estadistica 1
OBJETIVOS
INTRODUCCIN
* A partir de una distribucin de frecuencia el estudiante
estar en capacidad de determinar el grado de dispersin ab-
soluta o relativa, usando las medidas correspondientes.
En la unidad anterior se estudiaron las medidas de tendencia
central que describen el comportamiento de los datos en una
distribucin de frecuencia. Pero las informaciones que esas
medidas proporcionan son limitadas y nada nos dicen sobre la
forma en que estn diseminados o dispersos los datos con
relacin a la tendencia central; adems, poco nos indican so-
bre un determinado dato con relacin a los otros de la distribu-
cin.
Por ejemplo al investigar acerca del nivel de ingreso por familia,
si conocemos la media, la mediana y la moda, an no sabe-
mos nada acerca de si hay familias con ingresos muy por de-
bajo o por encima del promedio, es decir no podemos evaluar
como es la distribucin del ingreso, si este esta concentrado en
un valor alrededor de la tendencia central o si encontramos las
familias equidistribuidas en distintos niveles de ingreso.
Al estudiar la media aritmtica y algunas de sus propiedades,
se advirti que de las medidas de tendencia central la media es
la nica que se utiliza en desarrollos matemticos y que en esa
valiosa propiedad radica su gran importancia y sus numero-
sas aplicaciones en el campo de la estadstica. Entre las medi-
das de dispersin a estudiar en esta unidad estn las que tienen
relacin con la media aritmtica y que, al igual que la media,
tienen propiedades algebraicas que les permiten intervenir en
relaciones matemticas que son la base estructural de los an-
lisis estadsticos. Por sus propiedades algebraicas estas medi-
das de dispersin son las mas importantes y de ms frecuente
aplicacin.
118
5
Dispersin y Asimetra
119
Estadistica 1
El estudio de la variabilidad de los datos,
conocido en estadstica como dispersin,
tiene como objeto el describir y cuantificar
por medio de medidas caractersticas (par-
metros) la uniformidad que presentan los
datos en estudio.
Cuando los datos tratan de acumularse al-
rededor de un valor central caracterstico se
dice que hay poca dispersin. Cuando los
valores individuales se alejan del valor cen-
tral (media) se dice que existe mayor disper-
sin. Se hace necesaria entonces una medi-
da que indique cual es el grado de dispersin
o variacin que tienen los datos, para poder
describirlos con mayor precisin, lo mismo
que para hacer posible la comparacin de
varios conjuntos de datos correspondientes
a situaciones o escenarios diferentes.
Partiendo de este concepto, la variacin de
los datos se da a lado y lado del punto co-
rrespondiente a la media y por tanto origina
formas diferentes en la distribucin de los
elementos. Esta caracterstica de las distri-
buciones que describe el grado de deformi-
dad o sesgo hacia la derecha o izquierda de
la media la conocemos como asimetra.
Una distribucin de datos es simtrica, cuan-
do existe equilibrio en el nmero de elemen-
tos y en la separacin de estos, que se en-
cuentran a uno y otro lado del valor
promedio respecto del cual se comparan o
contrastan dichos valores es decir de la me-
dia. En el caso contrario se habla de asime-
tra, refirindonos a la deformidad o desequi-
librio en la concentracin de los datos
alrededor de una medida de tendencia cen-
tral que generalmente es la media.
La variabilidad es la caracterstica fundamental de los elemen-
tos de una poblacin, y la mayor parte del trabajo estadstico
se dedica a su anlisis. Los datos cuantitativos expresan la dis-
paridad entre los valores individuales, y desde el punto de vista
estadstico, la medida o descripcin de esta disparidad es tan
importante como la descripcin de la tendencia que estos ele-
mentos pueden presentar alrededor de un valor caracterstico.
Las medidas de tendencia central y las de dispersin son com-
plementarias en la medicin de la forma en que estn distribui-
dos los datos y por tanto resultan muy tiles al anlisis estads-
tico. La media no sirve para expresar representatividad si no
est acompaada por el valor de la dispersin o variabilidad
que tienen los datos en torno a l, por que de lo contrario, la
variacin de los datos en la serie queda oculta. Si se encuentra
que el valor de la dispersin es muy grande, debe concluirse
que los datos de que se trata difieren entre s en forma amplia
y por consiguiente el promedio no los representa. Al contrario,
si el valor de la dispersin es pequeo, significa que la diferen-
cia entre el valor de la media y el de cada dato particular es
pequea y por tanto los datos son muy semejantes y la media
los representa.
En sntesis, la dispersin o grado de significacin sirve para
conocer cuan representativo es el valor de la media en una
poblacin de datos. Las medidas utilizadas para cuantificar la
dispersin pueden ser absolutas cuando estn expresadas en
las mismas unidades de los datos; o relativas las que se expre-
san en forma de razn o proporcin.
120
5
Dispersin y Asimetra
MEDIDAS DE DISPERSIN ABSOLUTA
El Rango.
Consideremos la situacin siguiente. En dos ciudades diferen-
tes se recolectaron muestras para determinar el ingreso diario
promedio de un vendedor ambulante, con el fin de idear y apli-
car polticas referentes a su seguridad social y para establecer
el volumen de impuesto con que se le podra gravar. Los resul-
tados se agrupan en la siguiente tabla de distribucin de fre-
cuencias:
Niveles de ingreso de vendedores ambulantes en las ciudades
A y B
Figura 5.1. Distribuciones con distinto rango
* Observe los diagramas correspondientes a las distri-
buciones de frecuencia de los niveles de ingreso en cada ciu-
dad, de acuerdo con esa observacin determine en que ciudad
existe mayor equilibrio en cuanto al ingreso. Explique su res-
puesta.
* Calcule la media para las dos distribuciones.
* Sirve para comparar las dos distribuciones, emplear
la media de cada una de ellas? Por qu?
* Qu significa, en trminos de ni-
vel de ingreso, que la media de los dos con-
juntos de datos sean iguales?
* Por qu, a pesar de que la media
de las dos distribuciones es aproximadamen-
te la misma, ellas no reflejan que las dos ciu-
dades tengan diferencias notorias en el vo-
121
Estadistica 1
lumen de ingreso de los trabajadores informales, en este caso
los vendedores ambulantes?
* En cual de las dos ciudades se presenta un nivel de
ingreso mas equilibrado y justo?
Si usted prefiera la distribucin de ingreso de la ciudad B, muy
seguramente habr notado que la diferencia entre los dos
diagramas es la dispersin. El diagrama para la ciudad A pre-
senta mayor variabilidad que el de la ciudad B, ello nos indica
que el ingreso es ms homogneo en la ciudad A que en la
ciudad B.
Los datos para la ciudad A se encuentran ms dispersos, pues-
to que el ingreso mnimo es menor que el ingreso mnimo en la
ciudad B, y adems, la medida del ingreso mximo obtenido en
la ciudad A es mayor que el mximo ingreso de la ciudad B. En
otros trminos, podemos decir que en la ciudad A los ingresos
de los vendedores ambulantes varan en intervalo ms grande
de valores.
El rango es el tamao del intervalo en el cual varan los elemen-
tos de un conjunto de datos numricos y se calcula encon-
trando la diferencia entre el mayor valor y el menor valor de
dicho conjunto.
* El rango es una medida muy fcil de calcular. Cree
usted que el rango sirve para comparar eficientemente la dis-
persin entre los elementos de cualquier par de conjuntos? Es
universal?, Es decir, sirve para todos los casos?
Consideremos ahora la siguiente situacin. En un concurso de
mritos para la construccin de dos escuelas se presentaron
diversas propuestas, las cuales obtuvieron las calificaciones que
se representan en el siguiente diagrama:
Figura 5.2. Distribuciones con igual rango y diferente dispersin.
122
5
Dispersin y Asimetra
* Observe cuidadosamente los dos diagramas y diga
que informacin nos proveen.
* Cul grfica, refleja mayor dispersin de los datos?
Para cul escuela cree usted que se presentaron propuestas
cuya calificacin fue mas uniforme?
* Cul es el rango de cada conjunto de datos? Sirve
en este caso el rango como medida adecuada para comparar
la dispersin de los dos conjuntos de datos? Justifique su res-
puesta.
* Determine cual es la causa por la cual el rango no es
una buena medida de la dispersin que se aplique a todos los
casos.
Se vio en el segundo ejemplo que aunque tenemos dos distri-
buciones con distintos grados de dispersin, el rango resulta
ser el mismo. La dispersin en la calificacin de las propuestas
para la escuela Bellavista es mayor que para la otra escuela.
Tenemos entonces que el rango no refleja lo que la observa-
cin de la grfica nos muestra como evidente.
Al encontrar el problema de que el rango depende exclusiva-
mente de los valores extremos mientras que la dispersin tiene
que ver con todos los datos de la distribucin, nos vemos en la
necesidad de buscar otra medida de dispersin que supere esta
dificultad.
En conclusin, podemos decir que el rango es la medida ms
burda de dispersin, sin embargo tiene un gran valor dentro
del diseo y anlisis estadstico. Por basarse slo en los extre-
mos presenta algunos inconvenientes en su aplicacin:
* Por ser una medida de posicin, puede estar afectada
por un valor no caracterstico o inusual dentro del conjunto de
valores.
* No es una medida de dispersin de todos los valores
que intervienen en el anlisis.
* Es altamente sensible al nmero de elementos en es-
tudio. Cuando se incrementa el tamao de la muestra puede
ocurrir que dentro de los nuevos valores aparezcan datos con
mayor valor que el superior, o menor valor que el inferior, ha-
ciendo variar el valor del rango.
* Es la medida de dispersin menos
fiable en especial si se le compara con la
desviacin tpica que estudiaremos luego.
Tambin tiene como desventaja el ser poco
estable.
Sin embargo, el rango es una medida til de
la dispersin en especial cuando el tamao
de la muestra es pequeo. Una muestra es
pequea cuando el numero de datos es in-
ferior a 30. Por ejemplo en muestras para el
control de calidad donde usualmente el n-
mero de elementos no sobrepasa los 10.
Tambin es usual para expresar las variacio-
nes en las temperaturas ambientales diarias,
mensuales o anuales o para conocer la dis-
persin extrema en el comportamiento bur-
stil (valores mximo y mnimo de la cotiza-
cin de las acciones), expresando el margen
de beneficio de las transacciones.
123
Estadistica 1
Rango Intercuartil.
Para eliminar la influencia de los valores extremos, en estadsti-
ca se busc una medida que analizara la situacin del interme-
dio de la distribucin, tomando la diferencia entre el tercer cuartil
Q
3
y el primer cuartil Q
1
y que se llam rango intercuartil.
Rango Intercuartil Q = Q
3
Q
1
Rango Semi-intercuartlico o desviacin cuartil. Es la mitad del
rango intercuartil.
Ejemplo. Para la distribucin de frecuencia de las edades de los
deportistas, que se trabajaron en las dos unidades anteriores,
hallar Q y Q
D
.
Q = 151,7 141,2 = 10,5 centmetros.
Q
D
= 10,5/2 = 5,25 centmetros.
Lo que permite decir que la mitad de los deportistas tienen una
estatura con desviacin respecto a la mediana hasta de 5,25
centmetros.
A pesar que el rango intercuartil y la desviacin cuartil, como
medidas de variabilidad de las observaciones son ms adecua-
das que el rango, presentan varios inconvenientes que demeri-
tan su uso:
*
No toman en consideracin todos los valores de la
distribucin y puede ocurrir que los valores inferiores a Q
1

o
s
uperiores a Q
3
e
stn muy compactados o muy diversos, y los
valores de Q y Q
D

no cambiaran por ello.
*
No es posible, conociendo slo Q o Q
D
,
hacer la ubicacin precisa de una observacin dentro de la
distribucin.
* Al igual que la mediana, que es el segundo cuartil, no tienen propiedades que les permitan intervenir
en las relaciones matemticas que utiliza la estadstica.
124
5
Dispersin y Asimetra
El ejemplo fue tomado del libro Matem-
ticas, azar y sociedad y que se cita en la
bibliografa al final de esta unidad.
5
Desviacin Tpica o Estndar.
Para superar la dificultad de tropezar con las debilidades de las
medidas anteriores de dispersin que no toman en cuenta to-
dos los valores del conjunto y no solamente valores extremos
o valores de cuartiles. Cmo podemos medir la dispersin con
una herramienta que verdaderamente represente la sensacin
de dispersin y que se aplique de manera universal a todos los
casos?. La siguiente forma de llegar al concepto de desviacin
estndar fue propuesta por Perry y otros
5
nos permite una
fcil comprensin, veamos:
Suponga que, para cada una de las situaciones representadas
en las grficas siguientes, se va a realizar este procedimiento,
Primero, calcular, para cada valor, la distancia que hay de l a
un dato fijo; segundo, sumar esas distancias; y tercero,
emplear dicho resultado como medida de dispersin de la
correspondiente distribucin.
* Qu relacin hay entre esas sumas de distancias? Es
decir, en que caso resultar mayor esa suma de distancias?
Figura 5.3. Distribuciones con diferente dispersin.
* Generalizando la respuesta a la pregunta anterior, qu
relacin hay entre la suma de distancias a un dato fijo para una
distribucin muy dispersa y la correspondiente suma de dis-
tancias para una distribucin menos dispersa?
En este momento debe ser claro, que para medir la dispersin
de un conjunto de datos, es necesario tener en cuenta la dis-
tancia que hay de cada uno de los datos del conjunto a otro
125
Estadistica 1
dato, que se va a tener como referencia. El problema consiste
en determinar cul es la mejor referencia. Veamos si conviene
que el mnimo sea tal referencia.
Considere cada una de las siguientes distribuciones:
Distribucin 1: 1, 2, 3, 4
Distribucin 2: 5, 6, 7, 8
* Alguna de las distribuciones es ms dispersa que la
otra? Por qu?
* Halle el mnimo de cada una de las dos distribuciones
y calcule la distancia que hay de cada uno de los datos de la
primera distribucin al mnimo de dicha distribucin (diferen-
cia entre un valor de la distribucin y el mnimo de la misma) y
haga la suma de esas distancias. Tambin calcule la suma de
las distancias que hay de cada uno de los datos de la segunda
distribucin al mnimo de la misma. (D su respuesta comple-
tando la siguiente tabla.)
* Corroboran los nmeros que encontr en el tem
anterior su intuicin con respecto a la dispersin de las dos
distribuciones que estamos analizando? Es decir, se puede
pensar que la suma de distancias de cada uno de los valores de
la distribucin al mnimo de la distribucin es una buena medi-
da de la dispersin?
Ahora, considere las distribuciones siguientes:
Distribucin 3: 1, 4, 6, 9
Distribucin 4: 1, 1, 2, 3
126
5
Dispersin y Asimetra
* Cul de las dos distribuciones es ms dispersa? por
qu?
* Emplee el mismo criterio que se utiliz en la tabla an-
terior, para hallar los nmeros que permitan comparar la dis-
persin de las dos distribuciones. (De su respuesta completan-
do la siguiente tabla.)
* Al usar ese criterio, se corrobora su intuicin?
Considere la distribucin:
Distribucin 5: 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4
* Haga el diagrama de las distribuciones 1 y 5. Intuiti-
vamente, alguna de esas dos distribuciones es mas dispersa
que la otra? Cul?
* Emplee el mismo criterio para comparar la dispersin
de las dos distribuciones 1 y 5. Se corrobora su intuicin?
Observe que las distribuciones tienen la misma dispersin, el
criterio que venamos utilizando y que pareca ser un buen cri-
terio para medir y comparar la dispersin de dos conjuntos,
arroja una informacin que en este caso no sirve, pues es con-
trario a la evidencia. Por tanto, la suma de todas las distancias
de los datos de un conjunto al mnimo no constituye una bue-
na herramienta para medir la dispersin pues no es universal.
* Comente la validez de esta afirmacin: La medida de
dispersin definida anteriormente no sirve por que no tiene en
cuenta el nmero de datos
127
Estadistica 1
Considere entonces otro criterio para medir la dispersin:
Se calcula la distancia de cada uno de los datos de la distribu-
cin al mnimo de dicha distribucin; segundo, se hace el pro-
medio de dichas distancias; y tercero, se emplea el resultado
como medida de dispersin de los datos de la correspondiente
distribucin.
* Utilice este nuevo criterio para medir la dispersin de
las distribuciones 1 y 5. Y, comente la bondad de este criterio.
(D su respuesta empleando una tabla como la siguiente.)
Considere las siguientes distribuciones:
Distribucin 6: 1, 5, 6, 7, 8
Distribucin 7: 1, 2, 3, 4, 8
* Intuitivamente, alguna de las dos distribuciones es
ms dispersa que la otra? Utilice el ltimo criterio definido, - el
promedio de las distancias de cada uno de los datos de la dis-
tribucin al mnimo de la misma para medir la dispersin de
las distribuciones 6 y 7 y compararlas. Se corrobora su intui-
cin? cul es el problema?. Emplee una tabla como la siguien-
te:
128
5
Dispersin y Asimetra
Debe ser claro que la ltima medida de dispersin que he-
mos definido tampoco es una buena herramienta para compa-
rar la dispersin de dos distribuciones pues depende de qu
tan alejado est el mnimo del resto de los datos de la distribu-
cin. Por tanto, an no hemos encontrado cul es la mejor
referencia con respecto a la cual debemos medir las distancias.
* Sugiera cul es una buena referencia con respecto a
la cual se deban medir las distancias, para obtener una medida
de dispersin.
Puesto que la media de una distribucin es, en trminos gene-
rales, un buen representante de la distribucin, resulta natural
pensar que la referencia que hemos estado buscando es esa
medida.
Bien, entonces definamos ahora como medida de dispersin el
promedio de las distancias (diferencias entre los valores de la
distribucin y la media de la misma) de cada uno de los datos
de la distribucin a la media de la distribucin.
Para cada una de las distribuciones 1, 5 y 6 emplee la
definicin dada anteriormente para medir y comparar la dis-
persin de los datos de cada una de las tres distribuciones.
129
Estadistica 1
* Le sorprende el resultado? En que consiste y cmo
se puede resolver el problema que hemos encontrado al definir
as la medida de la dispersin?
Usted debi encontrar que el problema reside en que los valo-
res positivos (que corresponden a los datos por encima de la
media) se anulan con los valores negativos (que corresponden
a los datos por debajo de la media). En otras palabras, no se
est haciendo el promedio de verdaderos valores de distancia.
* Cmo lograr que todas las diferencias sean positi-
vas?
Como lo que nos interesa es la distancia de cada valor a la
media, debemos obtener valores positivos (recuerde que no
existen distancias negativas). Una posible manera de obtener
valores positivos es elevar al cuadrado cada una de las diferen-
cias obtenidas. (la otra forma es trabajar con el valor absoluto
de las diferencias; sin embargo, no tomaremos ese camino.) Y,
entonces, se puede pensar en definir una herramienta que mida
la dispersin de una distribucin, como el promedio de los cua-
drados de las diferencias de cada uno de los datos a la media
de la distribucin.
Verifique que al emplear esta ltima herramienta para
medir y comparar la dispersin de cualquier par de distribucio-
nes de las dadas anteriormente, el resultado que se obtiene
corrobora la intuicin correspondiente. Para ello compare las
distribuciones 5 y 6.
130
5
Dispersin y Asimetra
Hemos encontrado, entonces, una herramienta que depende
de todos los datos de la distribucin y adems tiene en cuenta
el nmero de datos que hay en ella. Adems, proporciona re-
sultados que son coherentes con la observacin y la intuicin.
Esta medida se conoce como varianza de la distribucin.
La varianza de un conjunto de datos numricos es una medida
de su dispersin y se define como el promedio de los cuadra-
dos de las diferencias de cada valor a la media aritmtica.
En una cierta investigacin se tom una muestra de 10 nios y
por cada uno de ellos se obtuvo una medida correspondiente
a su estatura (en metros). A continuacin se da la muestra de
datos:
{1.25, 1.32, 1.38, 1.25, 1.32, 1.20, 1.32, 1.32, 1.25, 1.25}
* Determine la estatura promedio de ese conjunto de
datos. No olvide dar la respuesta en metros. Adems, utili-
ce la varianza para calcular la dispersin de los datos. En que
unidades se expresa esta medida? Comente este hecho y su-
giera alguna solucin.
Por razones como las que usted descubri en el caso de las
estaturas, en ciertas ocasiones, el valor ms comnmente em-
pleado para medir la dispersin es el llamado desviacin estn-
dar que se define como la raz cuadrada de la varianza.
La desviacin estndar de un conjunto de datos numricos es
una medida de su dispersin. Se define como la raz cuadrada
del promedio de los cuadrados de las distancias que hay de
cada uno de los datos del conjunto a la media aritmtica del
mismo.
Bastante didctico ha sido el ejemplo que se tomo del texto de
Perry y otros, fcilmente nos queda ahora construir y entender
una frmula que se pueda emplear para hacer el clculo de la
varianza y la desviacin estndar.
131
Estadistica 1
Haciendo una bifurcacin del procedimiento anterior podemos
llagar tambin a otra medida que es la dispersin media, esta
se obtiene cuando para superar el problema
de que los valores negativos se anulen con los negativos, se
utiliza el valor absoluto de las diferencias entre los valores y la
media.
La desviacin media es una medida de la dispersin bastante
objetiva: cuanto mayor sea su valor mayor es la dispersin de
los datos; sin embargo no proporciona una relacin matemti-
ca precisa entre su magnitud y la posicin de un dato dentro
de la distribucin. Por otra parte, al tomar los valores absolu-
tos mide la desviacin de una observacin sin mostrar si est
por encima o por debajo de la media aritmtica.
Desviacin estndar de una muestra. Para calcular la va-
rianza y la desviacin estndar de una muestra, utilizamos las
mismas frmulas, sustituyendo N con n 1.
Por qu utilizamos n 1 como denominador en lugar de N? Los
especialistas en estadstica pueden demostrar que si tomamos
muchas muestras de una poblacin dada, si encontramos la va-
rianza de la muestra para cada muestra y promediamos los resul-
tados, entonces este promedio no tiende a tomar el valor de la
varianza de la poblacin, a menos que tomemos n 1 como de-
nominador de los clculos.
Cmo se facilitan los clculos?. Organizndolos es lo ms fcil. Con el ejemplo que se ha venido trabajando de
la distribucin de frecuencia de las estaturas de los deportistas, veamos los pasos que se pueden seguir.
* Podemos apoyarnos en una hoja de clculo en la que utilizaremos cuatro columnas adicionales a la
distribucin de frecuencias, para realizar clculos parciales.
132
5
Dispersin y Asimetra
* En la primera hallamos los productos entre la frecuen-
cia absoluta y la marca de clase para cada intervalo. La suma-
toria en la parte inferior de esta columna permitir el fcil cl-
culo de la media. (para el ejemplo la media es de 15803/
108=146.32.
* En la segunda columna adicionada, hallamos las dife-
rencias entre las marcas de clase y la media.
* En la tercera columna, calculamos los cuadrados de
las diferencias entre las medias y las marcas de clase, es decir el
cuadrado de la columna anterior.
* En la ltima columna calcular el producto de la co-
lumna anterior por la frecuencia. La sumatoria de esta ltima
columna la podemos dividir fcilmente por el nmero de datos
y obtenemos la varianza.
Ahora nos resulta muy sencillo calcular la varianza dividiendo el
total obtenido en la ltima columna por el nmero de datos:
133
Estadistica 1
Teorema de Chevichef.
No importa qu forma tenga la distribucin, al menos 75% de
los valores de la poblacin caern dentro de dos desviaciones
estndar a partir de la media, y al menos 89% caer dentro de
tres desviaciones estndar.
Estos son dos de los casos especiales del teorema, pero los
ms representativos. La descripcin y explicacin completa
del teorema se sale de los fines del curso.
MEDIDAS DE DISPERSIN RELATIVA.
Si necesitamos comparar dos o ms conjuntos de datos, por lo
general no es posible la comparacin utilizando la dispersin
absoluta. Cuando las medidas de las observaciones son igua-
les, las dos medias pueden tener medias aritmticas diferentes;
por estar expresadas en las mismas unidades las desviaciones
estndar son comparables, pero no adoptan una correcta apre-
ciacin sobre las series que se comparan. Cuando las unidades
de medida son diferentes, las medidas de dispersin absoluta
no nos sirven para hacer la comparacin.
Otra dificultad que se tiene con las medidas de dispersin ab-
soluta, se da cuando las muestras tienen tamao de muestra
diferente, por los cambios que introducen en las medidas en
general cuando el tamao de la muestra aumenta.
Nos vemos ante la necesidad de buscar una medida de la dis-
persin que no se vea alterada o afectada por las unidades de
expresin de los datos, ni por el tamao de las muestras. Bus-
camos entonces, una medida universal para la dispersin.
Coeficiente de variacin.
La desviacin estndar no puede ser la nica base para la comparacin de dos distribuciones. Si tenemos una
desviacin estndar de 10 y una media de 5, los valores varan en una cantidad que es el doble de la media
misma. Si, por otro lado, tenemos una desviacin estndar de 10 y una media de 5.000, la variacin con
respecto a la media es insignificante. En consecuencia, no podemos conocer la dispersin de un conjunto de
datos hasta que conocemos su desviacin estndar, su media y cmo se compara la desviacin estndar con
respecto a la media.
134
5
Dispersin y Asimetra
Lo que necesitamos es una medida relativa que nos proporcio-
ne una estimacin de la magnitud de la desviacin con respec-
to a la magnitud de la media. El coeficiente de variacin es una
de estas medidas relativas de dispersin. Se relaciona la des-
viacin estndar y la media, expresando la desviacin estndar
como porcentaje de la media. Esta medida resulta muy til y
objetiva en la comparacin de distribuciones.
En el ejemplo de las estaturas, el coeficiente de variacin sera:
Coeficiente de desviacin media.
Por derivarse de la desviacin media, es menos usado que el
coeficiente de desviacin estndar. Representa la participacin
porcentual de la desviacin media en el promedio.
Este indicador se aplica casi exclusivamente a la comparacin
de dos situaciones. El resultado por si slo no brinda mucha
informacin.
Coeficiente de desviacin cuartil.
Es una medida de dispersin aplicable cuando analizamos dis-
tribuciones con intervalos abiertos o con valores bastante ex-
tremos. Igualmente, para el calculo burdo de la dispersin de
una serie.
135
Estadistica 1
Asimetria.
Nos muestra la direccin de concentracin respecto a la me-
dia, de los datos de una distribucin, se puede apreciar grfica-
mente o expresarla matemticamente usando el coeficiente de
Pearson. Puede ser negativa si los datos tienden a acumularse
a la izquierda de la medida de tendencia central y positiva si
por el contrario tienden a acumularse a la derecha.
Figura 5.4. Asimetras a la izquierda y a la derecha.
En la asimetra a la derecha la media y la mediana se desplazan
a la derecha de la moda, quedando la media situada entre las
otras dos. En la asimetra a la izquierda, la media y la mediana
se desplazan hacia la izquierda, quedando esta ltima ubicada
en medio de las otras dos medidas de tendencia central.
Coeficiente de Pearson. La asimetra se puede calcular en fun-
cin de la media y la mediana as:
Curtosis.
Las curvas de distribucin, comparadas con la curva de distribucin normal, pueden presentar diferentes
grados de apuntalamiento o de altura de la cima de la curva. Segn su apuntalamiento las curvas reciben el
nombre as: la curva normal se denomina mesocrtica, leptocrtica la de mayor apuntalamiento que la nor-
mal y platicrtica la de menor apuntalamiento que la normal.
Aunque existe mtodo matemtico para el clculo de la curtosis, el simple grfico nos brinda la informacin y
la idea suficiente de la propiedad.
136
5
Dispersin y Asimetra
RECOMENDACIONES PRCTICAS:
* Revisar cuidadosamente los datos antes de usarlos;
verificar que no contengan errores; chequear en particular los
valores extremos.
* Elaborar histogramas o cualquier otro tipo de grfi-
cos que permita visualizar la forma y las caractersticas princi-
pales de la distribucin de frecuencias.
* Diferenciar con precisin cundo se hace referencia a
un parmetro poblacional y cundo a un estadstico muestral.
* Usar en forma conjunta una media de posicin y una
de dispersin (como mnimo) para analizar el comportamiento
de la variable.
* Prestar atencin a las ventajas y desventajas de las
distintas medidas de posicin y dispersin, para decidir correc-
tamente su eleccin.
* Calcular la media aritmtica con los datos en bruto
sin agrupar siempre que se requiera su valor exacto.
* Dar preferencia al clculo de la mediana como medi-
da de posicin, cuando la serie tiene pocos datos e incluye
valores extremos.
* No tiene sentido calcular la moda en series de datos
sin agrupar.
* Tanto la mediana como la moda son valores de la va-
riable (no confundir con las frecuencias a las que estn asocia-
das).
* Comparar, siempre que se pueda, media, mediana y
moda para determinar el sesgo de la distribucin.
* El rango o alcance es una medida de dispersin poco
apropiada para describir series con muchos datos.
* La desviacin estndar es preferible a la varianza por-
que se expresa en las mismas unidades de la variable.
137
Estadistica 1
PROBLEMAS PROPUESTOS
Los siguientes ejercicios, se basan en la informacin de esta
tabla:
Fuente: DANE
1. Defina y clasifique la variable cuantificada en la tabla anterior.
2. Diga cual es la medida ms adecuada para expresar la dispersin del nmero de obras
culminadas por trimestre.
3. Calcule el rango de las obras nuevas que se paralizaron por trimestre y explique el
significado que puede tener esa medida.
4. Calcule la desviacin estndar del nmero de casas que continan en proceso por tri-
mestre en la ciudad de Pereira.
5. Cul de las columnas de la tabla tiene el mayor grado de dispersin? Por que utiliz esa
medida para comparar?
138
5
Dispersin y Asimetra
6. Calcule la desviacin media del total de obras que cada trimestre se encuentran
en proceso, y diga el significado que puede tener esa medida, por ejemplo para un anlisis
de generacin de empleo.
7. Investigue cuales fueron los ingresos totales de los municipios de su departa-
mento durante los ltimos cuatro aos y determine cual fue el ao con menor variacin en
los ingresos y cual de los municipios presenta la distribucin ms uniforme. (sugerencias,
consulte en el DANE, o en la contralora departamental)
8. Con los datos de la siguiente tabla que corresponden a la estadstica de empresas
para 1999. Si se sabe que el nmero de empresas en todos los ramos aument en 35 para
el ao 2000, determine la media y la varianza de la nueva variable y realice la interpreta-
cin del resultado obtenido.
9. En la siguiente tabla encontramos a que se dedican las empresas en Colombia. A
partir de esos datos, encontrar la media del nmero de empresas por rea, la desviacin
estndar, el coeficiente de variacin y la forma de la distribucin. Interprete y explique los
resultados.
139
Estadistica 1
10. Construya un mapa conceptual con los elementos estudiados a cerca de la disper-
sin de datos.
11. Con los datos del ejercicio resuelto No. 3 de la unidad anterior determinar la des-
viacin estndar, el tipo de distribucin segn el grado de curtosis y el sentido de la asimetra
si la hay. Explique el significado y las implicaciones de cada resultado.
12. Explique el significado de la siguiente expresin la inestabilidad en el precio del
caf oblig a los caficultores a crear un fondo que guardara dinero de las bonanzas para
reponer en las crisis del precio
13. Invente un escenario a manera de cuento o sociodrama en el que las medidas de
dispersin relativa sean muy importantes. A partir de este explique la importancia de tales
medidas.
14. En un artculo titulado You arent paranoid if you think someone eyes your every
move (Usted no es paranoico si cree que alguien observa todo lo que hace), el Wall Street
Journal seala que las grandes empresas compilan estadsticas detalladas acerca del compor-
tamiento de cada persona. Afirma que Jockey Internacional sabe cuantos juegos de ropa
interior posee; que Frito Lay Inc, sabe que prefiere comer primero trozos de pretzels en
paquete o enteros; y que, para concretar, Coca - Cola sabe que se ponen 3,2 cubos de hielo
en cada vaso. ha puesto usted alguna vez 3,2 cubos de hielo en su vaso? Qu quera decir
el artculo Wall Street Journal con esta afirmacin?
15. Encuentre el rango de los precios del dlar durante el mes pasado y explique el
significado del resultado. Es apropiada la medida para determinar la variabilidad del dlar?
16. Encuentre un ejemplo relacionado con la administracin pblica y la realidad na-
cional en el que aplique la mayora de las medidas de tendencia central y variabilidad estudia-
das en este curso.
140
5
Dispersin y Asimetra
PROBLEMAS RESUELTOS
1. Con la informacin contenida en la siguiente tabla,
calcular el ndice medio de la tasa de cambio real por pas, la
desviacin estndar para cada caso y el coeficiente de varia-
cin. Interpretar los resultados.
Indice de la Tasa de Cambio Real Bilateral de Colombia
Frente a Pases Latinoamericanos 1999 2001
Fuente: Clculos DANE con base en FMI
Para la solucin de este nos apoyaremos en la hoja de clculo,
veamos las operaciones:
141
Estadistica 1
Aunque en la figura no se alcanza a mostrar la totalidad de los datos, si es clara la
operacin que se describe en las ltimas tres filas. En la fila 28 se calcula la media de los
ndices de tasa de cambio por pas, como el promedio aritmtico de los datos de la
columna respectiva. En la fila 29 se calcula la desviacin estndar poblacional de los
mismos datos y en la fila 30 se calcula la relacin entre la desviacin tpica o estndar y
la media, que dndole formato de porcentaje a la celda de la hoja de clculo, nos indica-
r el valor del coeficiente de variacin estndar. Veamos el resultado:
A partir de la media vemos que el ndice de la tasa de cambio real es mayor para
Mxico y Venezuela cuyos valores medios son 131.60 y 121.48 respectivamente,
tambin son estos los que presentan mayor variabilidad con desviaciones estndar
respectivas de 31.43 y 34.44, notemos que el tamao de la media no en todos los
casos aument proporcionalmente a la desviacin estndar. Para el caso de Venezuela
y Mxico vemos que el ndice de tasa de cambio para Venezuela es menor al de Mxi-
co pero la desviacin estndar del mismo es mayor.
Para Brasil y Ecuador se dan los menores promedios de ndice de tasa de cambio, sin
embargo las menores variabilidades se dan para los ndices correspondientes a Chile y
Per, lo anterior nos evidencia que la media no nos puede afirmar nada acerca de la
dispersin de los datos si no se acompaa de la desviacin estndar o de la varianza.
Otro aspecto a notar es que la desviacin tpica y el coeficiente de variacin tienden a
variar en el mismo sentido, sin embargo, a pesar que estamos comparando conjuntos
de datos con tamaos iguales y con tipos de unidades iguales, vemos que por ejemplo
al comparar las medidas de dispersin para Argentina y Bolivia tenemos que para los
ndices de tasa de cambio referentes a cada pas, la desviacin tpica en el caso de
142
5
Dispersin y Asimetra
Argentina es menor que la correspondiente a Bolivia, sin embargo al evaluar el coeficien-
te de variacin estndar encontramos que es relativamente mas disperso el conjunto de
ndices para Argentina que para Bolivia.
Finalmente, vemos que si quisiramos escoger para establecer actividades comerciales
los pases con los que la tasa de cambio permanezca ms homognea, entonces escoge-
ramos en orden a Chile, Per, Bolivia y Argentina.
2. Con la informacin de la distribucin de frecuencia que hemos usado en las
unidades anteriores que se refiere a la estatura de un grupo de deportistas, evaluar la
fiabilidad del teorema de Tchebisheff cuando afirma que por lo menos el 75% de las
observaciones se encuentran entre 2 desviaciones estndar de la media.
Ya se haba calculado la media para la distribucin que es 146.32, y la desviacin estn-
dar que corresponde a 7.37, entonces debemos mostrar que dentro del intervalo [146.32
2(7.37), 146.32 + 2(7.37)] = [131.58, 161.06] estn el 75% o ms observaciones.
El resultado se nota sin necesidad de hallar el porcentaje total de datos incluidos en este
intervalo. Veamos que dentro de dicho intervalo se ubican ntegramente cinco intervalos
de clase y fraccin de otros dos. Contando solamente las observaciones contenidas en
los intervalos que estn completos tenemos 98 (veamos los intervalos sombreados en la
tabla siguiente) que corresponden ya al 90.74% de los datos. Como 90.74%75% vemos
reafirmada la certeza del teorema de Tchebicheff.
Como es una distribucin poco dispersa el teorema se hace mas cierto.
143
Estadistica 1
3. Con la informacin del ejercicio anterior, encuentre el sesgo de la distribucin.
Usemos el coeficiente de Pearson,
La distribucin es simtrica, podra decirse que no tiene sesgo o que su sesgo hacia la
derecha es casi despreciable.
4. Determine cual medida de dispersin se puede aplicar al siguiente enunciado y
calclela: El precio interno del caf present mltiples variaciones durante al ao pasado,
segn informacin proporcionada por la Federacin de Cafeteros el precio cambi en 23
oportunidades, el precio ms alto registrado fue de $450.300 y el ms bajo de $325.450
por carga
Con la informacin disponible slo podemos hallar el rango, sin embargo no sabemos nada
si esa variabilidad se vio afectada por un valor extremo, ni por cuanto tiempo se mantuvo
cada uno, ni cuanto caf se negoci a cada precio.
El rango entonces fue de 450.300 325.450 = 124.850, como vemos una medida burda
pero muy sencilla de calcular.
144
5
Dispersin y Asimetra
BIBLIOGRAFA
FERNNDEZ, Felipe; MONROY, Olga L.; RODRGUEZ,
Liliana. Diseo, desarrollo y evaluacin de situaciones proble-
mticas en estadstica. Universidad de los Andes: una
Empresa Docente. Bogot D.C., 1998.
HOEL, Paul G. Y JESSEN, Raymond J. Estadstica Bsica
para Negocios y Economa. Compaa Editorial Continen-
tal S.A. 2da Edicin. Mxico, 1985.
LEVIN, Richard I.; RUBIN, David S. Estadstica Para Admi-
nistradores, Editorial PRENTICE HALL, Sexta Edicin.,
1996
MENDENHALL, William. Estadstica para Administradores.
Traducido por Dirk Valckx Verbeeck. Grupo Editorial
Iberoamrica. Mxico, 1990.
PORTUS GOVINDEN, Lincoyan. Curso Prctico de Esta-
dstica. Editorial Mc Graw Hill. Bogot D.C., 1985.
SPIEGEL, Murray R. Estadstica. Traducido por Rafael
Hernndez Heredero. Editorial Mc Graw Hill. 2da Edi-
cin. Madrid, 1998.
145
Estadistica 1
Unidad 6
Probabilidad
146
6
Probabilidad
147
Estadistica 1
OBJETIVOS
INTRODUCCIN
* Comprender y aplicar las reglas de la probabilidad de
eventos. Usar adecuadamente las tcnicas de conteo
y anlisis combinatorio.
El reconocimiento del papel que juega el azar en todos los eventos cotidianos,
hace parte de los cambios paradigmticos que estamos viviendo. En fsica
moderna se ha visto como cuando un haz de partculas pasa a travs de una
rendija sufre un proceso de difraccin como si se tratare de una onda, haciendo
que las partculas se desven en cantidades que no corresponden al parecer a
ninguna regla (ello puede ser parte de las limitaciones que tenemos para tomar
medidas en ese mbito sin alterar el fenmeno, o puede ser simplemente pro-
ducto del azar). La probabilidad intenta delimitar ese azar, en busca de no tanto
medirlo con exactitud, sino de determinar la tendencia significativa que pueda
presentar.
La probabilidad se hace ms til en la actualidad dada la acogida que han teni-
do los mtodos de la planificacin prospectiva como el Delphi y su matriz de
impactos cruzados.
Se recomienda el estudio del captulo en forma autnoma para luego en la se-
sin presencial abordar la revisin de los ejercicios resueltos y el despeje de
dudas surgidas en el estudio del captulo, posteriormente el desarrollo de ejerci-
cios propuestos nuevamente de forma autnoma. Sin embargo, dependiendo
de la dinmica del curso, el profesor podr tomar otras estrategias para abor-
dar este captulo.
Aunque la probabilidad tiene aplicabilidad en todos los espacios de la adminis-
tracin pblica, la comprensin del tema se hace mucho ms fcil de com-
prender si se aplica a situaciones no prcticas, tales como las que se presen-
tan en ciertos juegos de azar, luego de ello si se podrn llevar estos conceptos
a situaciones prcticas de nuestro campo de estudio. Por esta razn, las defini-
ciones y las reglas de probabilidad se presentan en el contexto de modelos o
problemas idealizados, pero se supone que las mismas reglas se podrn apli-
car luego a situaciones de la vida real y en especial concernientes a lo que tiene
que ver con el Estado.
148
6
Probabilidad
149
Estadistica 1
Azar y desconocimiento.
El azar est relacionado con el desconoci-
miento. Un ejemplo nos puede ayudar; pien-
se en un proceso industrial que produce
grandes cantidades de un artculo determi-
nado. No todos los artculos producidos son
idnticos, cada artculo puede calificarse
como bueno o defectuoso. Si de toda
la produccin se escoge un artculo a cie-
gas, ese artculo puede resultar bueno o
defectuoso. Esta es una situacin azarosa
(o aleatoria) y la parte esencial de este azar
es que no sabemos si el artculo selecciona-
do es defectuoso. Claro que con experien-
cia en el proceso es posible cuantificar de
una manera numrica qu tan factible es que
el artculo sea defectuoso o n.
Azar e incertidumbre.
Hay otro concepto asociado al azar y es el
de incertidumbre. Veamos un ejemplo. Res-
pecto a una inversin, podemos estar con-
templando invertir una cantidad de dinero.
El retorno sobre la inversin puede ser fijo,
como en el caso de una cuenta en un banco
con inters fijo; pero pensemos en una em-
presa. El negocio puede resultar desde un
gran xito hasta un fracaso, es decir, la ga-
nancia no es fija, sino que depende del xito
a obtener. Si no podemos evaluar qu tan
factible es cada monto posible de la ganan-
cia, tenemos una situacin de incertidum-
bre. Por el contrario, si podemos tener una
idea de qu tan probables son los diferentes
resultados y entonces tendremos una situa-
cin de riesgo. Esta ltima es la que llama-
mos aleatoria o azarosa.
Hay experimentos que pueden repetirse o que pue-
den concebirse como repetitivos. Enumere tres ejemplos de
situaciones que se puedan repetir.
El lanzar una moneda, leer la temperatura diaria,
contar el nmero de funcionarios que llegan tarde al trabajo,
son experimentos que pueden ser repetitivos? Y, evaluar los
niveles de solidaridad de las personas frente a catastrofes na-
turales, puede ser repetitivo? Explique.
Un experimento en el que varios conejos estn ali-
mentados con diferentes raciones para determinar el creci-
miento relativo debido a las propiedades de las raciones, slo
puede realizarse una vez con los mismos animales; sin em-
bargo, el experimento puede considerarse como uno de un
ilimitado nmero de experimentos similares. Puede consi-
derarse entonces como repetitivo?. Justifique
su respuesta.
La seleccin de una muestra de una poblacin es un experi-
mento repetitivo y es, naturalmente, el tipo de experimentos
de particular inters en la solucin de problemas estadsti-
cos.
150
6
Probabilidad
Comencemos con los modelos sencillos, consideremos el ex-
perimento bsico de lanzar una moneda dos veces, o lo que es
lo mismo, lanzar dos monedas distintas simultneamente una
vez. En este experimento hay cuatro posibilidades designadas
por: CC, CS, SC, SS; donde CS significa que se obtiene una
cara en el primer lanzamiento y un sello en el segundo.
Si el experimento consiste en lanzar tres monedas o un a tres
veces, sern posibles ocho resultados: CCC, CCS, CSC, CSS,
SCC, SCS, SSC, SSS; donde CSC significa sacar una cara en el
primer lanzamiento, sello en el segundo y cara en el tercero.
Un experimento como la valuacin diaria del precio del dlar,
sin embargo, tiene un infinito nmero de resultados posibles,
puesto que el precio de una moneda en pesos es una variable
de tipo continuo. Sin embargo haremos inicialmente los anli-
sis de experimentos con un nmero finito de resultados posi-
bles.
Al estudiar el papel de la probabilidad dentro de un experimen-
to, primero debemos decidir cuales de los resultados o even-
tos posibles, son de nuestro inters. Estos se deben definir de
manera tal que sean excluyentes, es decir que en un experi-
mento se presente un solo evento como resultado. En el expe-
rimento de lanzar tres veces al aire una moneda, lo que intere-
saba saber era si la moneda mostraba cara o sello en cada uno
de los lanzamientos, por lo tanto todos los resultados posibles
son los que escribimos anteriormente. Otro juego de azar de
gran valor ilustrativo, es el que consiste en extraer una bola de
una caja que contenga tres bolas rojas, dos negras y una ver-
de. Aqu el inters est enfocado solamente en el color de la
bola extrada y no en que bola sali en particular. Aqu hay tres
posibles resultados del experimento correspondientes a tres
colores.
Analicemos ahora el ejemplo tpico del lanzamiento de dos da-
dos de diferente color (es decir que se puede diferenciar uno
del otro, en caso contrario deber lanzarse uno antes de otro)
en el que se tiene el inters de saber el nmero de puntos
mostrado en cada uno de ellos, tendremos entonces 36 resul-
tados posibles, por que cada uno tiene seis resultados posi-
bles, y estos resultados pueden combinarse de dos en dos, en
todas las formas posibles. Tabla 6.1. Espacio muestral de un par de dados.
151
Estadistica 1
El primer nmero de cada par denota el nme-
ro que saldr en el primer dado y el segundo
nmero representa la cantidad de puntos que
salieron en el segundo.
El conjunto de eventos que representan los re-
sultados posibles de un experimento se llama
espacio muestral. As tambin, Cuando se tie-
ne un espacio muestral llamamos, formalmen-
te evento a cualquier subconjunto del espacio
muestral. Decimos que un evento se realiza,
cuando el resultado del experimento aleatorio
es un elemento del evento, ello permite inferir
que existen eventos formados por asociacio-
nes de otros. Para el ltimo ejemplo tenemos
un espacio muestral de 36 eventos.
El siguiente paso en la construccin de un mo-
delo matemtico para un experimento es asig-
narle a los eventos nmeros que representen
las frecuencias relativas con que se espera que
estos ocurran. Aparte del espacio muestral, en
cada experimento aleatorio hay una asignacin
primaria de probabilidades. Basados en la ex-
periencia o en razonamientos de simetra, a cada
elemento del espacio muestral le asignamos una
evaluacin de qu tan factible es. Esta evalua-
cin se refleja en un porcentaje (nmero entre
0 y 1). Entre ms factible sea el resultado, ma-
yor es el porcentaje que se le asigna. Los casos
extremos son:
Un evento que no puede suceder (evento nulo),
tiene probabilidad cero. Muchas veces estos
eventos con probabilidad cero son imposibles
por alguna contradiccin lgica en su definicin.
Por ejemplo: que la suma de dos dados sea
nn y los dos dados tengan el mismo nme-
ro. En el otro extremo hay eventos que siem-
pre suceden y estos tienen probabilidad uno
(eventos seguros). Por ejemplo: que el nme-
ro de caras en dos cara y sellos sea menor o igual a
7.8', aunque el evento pueda resultar extrao en su
definicin, siempre sucede y tiene probabilidad igual a
1.
La asignacin toma la forma matemtica de una fun-
cin y se llama funcin de probabilidad. El dominio de
esta funcin es el espacio muestral y su codominio es el
intervalo real [0, 1].
Esta funcin nos da las probabilidades de los eventos
simples. Para un evento compuesto, simplemente su-
mamos las probabilidades de los elementos que lo com-
ponen.
Si el experimento de lanzar tres veces la moneda el aire
se repitiera un gran nmero de veces y se registrara acu-
mulativamente la proporcin de los experimentos que
dieran por resultado, por ejemplo, tres caras, podra
esperarse una proporcin aproximada a 1/8, por que se
espera que cada uno de los ocho resultados ocurra con
la misma frecuencia. En la prctica, los experimentos
de esta clase, por lo general muestran que dichas espe-
ranzas son justificadas, siempre y cuando la moneda
152
6
Probabilidad
est bien balanceada y que adems se lance al aire vigo-
rosamente. En virtud de estas consideraciones debe asig-
narse el nmero
1/
8

a cada uno de los eventos del espa-
cio muestral. En el espacio muestral se llama probabilidad
del evento e
i

al nmero que se le asigna a tal evento y se
representa como P
{e
i
}.
As, en el experimento de lanzar
tres monedas al aire, cada uno de los eventos e
1
,
e
2
,
e
3
, ...
e
8
,
posee la probabilidad
1/
8
.
Si el experimento de seleccionar un nmero dgito de
una tabla de nmeros aleatorios, se hallar que cada no
de los diez dgitos 0, 1, 2, ...9 aparece aproximadamen-
te con la misma frecuencia relativa, y por consiguiente,
que la frecuencia relativa experimental para cada uno
de los dgitos tiende a
1/
10
.
Con base en dicho experimen-
to, deber asignrsele la probabilidad de
1/
10

a cada uno
de los eventos del espacio muestral.
El experimento de lanzar dos dados se trata
casi de la misma manera que el de lanzamiento de da-
dos. qu probabilidad le corresponde en este caso a
cada evento del espacio muestral?
La simetra y la experiencia sugieren que a cada punto
del espacio de muestreo debe asignrsele una probabili-
dad de
1/
36
.
Para el experimento de sacar bolas de colores,
la situacin es un poco distinta de las anteriores. Por
qu podemos decir esto?
se espera en este caso que cada uno de los
resultados ocurra con la misma frecuencia relativa?
Explique por que.
Si las bolas se mezclan bien dentro de la caja antes de
cada extraccin y adems, siempre se vuelve a introdu-
cir entre la caja la bola extrada, de tal manera que el
contenido de la caja no cambie, puede esperarse obte-
ner una bola negra con el doble de frecuencia que una
bola verde y una bola roja con el triple de frecuencia
que una bola verde. Esto significa que si se repitiera el
experimento un gran nmero de veces, poda esperarse
que las frecuencias relativas para los tres eventos con-
?
sistentes en sacar colores rojo, negro y verde
tendieran a
3/
6
, 2/
6
y 1/
6
,
respectivamente.
A partir de los experimentos anteriores eviden-
ciamos la forma general de proceder para asig-
nar probabilidades a cada uno de los eventos
del espacio muestral. Si el experimento es de
tal naturaleza que la simetra y otras considera-
ciones similares sugieren qu frecuencias rela-
153
Estadistica 1
tivas se esperan para los diferentes resultados, entonces se esco-
gen estas como probabilidades para los eventos correspondien-
tes. Estas fueron las bases para la asignacin de probabilidades en
el experimento del cara y sello, en el de las bolas de colores y en el
de los dados. Si no hay consideraciones de simetra aplicables al
caso, pero si se encuentran los resultados experimentales, enton-
ces pueden emplearse como probabilidades las frecuencias relati-
vas obtenidas en dicha experiencia.
La asignacin de probabilidades para los eventos del espacio mues-
tral conformado por la seleccin aleatoria de dgitos estuvo basa-
da parcialmente en la experiencia y tambin en forma parcial en la
confianza que se tiene en el criterio de quienes hayan construido
la tabla de nmeros aleatorios. Hay varios mtodos para construir
tablas de nmeros aleatorios, siendo algunos de ellos muy com-
plicados. En todas estas tablas debe esperarse que cada dgito
aparezca el mismo nmero de veces y que no existan patrones de
secuencia de dgitos. Sin embargo, como a menudo tales conjun-
tos de dgitos estn basados en dispositivos fsicos, que se supone
producen dgitos que poseen dichas propiedades, no es razonable
esperar de un conjunto de tales dgitos que se comporten de esta
manera ideal. Todo lo que puede esperarse es una buena aproxi-
macin.
Invente una regla o truco para generar nmeros de una cifra, de tal forma
que parezcan lo ms aleatorios posibles, que cada uno de los dgitos tenga la mis-
ma probabilidad de salir generado y que no se presente ningn patrn de secuen-
cia.
Que fundamento tiene la fe del apostador de chance en coger la muela
(es decir el nmero terminado en el dgito que lleva ms tiempo sin salir en dicha
posicin). Verifique si se cumple tal situacin con los nmeros con que terminaron
las loteras de la ltima semana e improvise una conclusin.
Lance una moneda que no est deforme, veinticinco veces y contabilice
los resultados. Lncela nuevamente 5 veces. Tendieron los resultados de estos
ltimos intentos a compensar el evento que tuvo menos ocurrencia en los prime-
ros 25 intentos? Repita el experimento tres veces o ms si tiene dudas y escriba
una frase concluyente al respecto.
En un juego de cara y sello se obtuvieron 6 caras consecutivas, el jugador
que va perdiendo apuesta nuevamente al sello por que considera que este ahora
tiene ms probabilidad de salir. Es el azar un proceso autocorrectivo? Qu validez
tiene el razonamiento del jugador que aspira a recuperarse en el juego?
154
6
Probabilidad
Como las probabilidades asignadas a los eventos (los eventos
equivalen a puntos en trminos geomtricos dentro de un es-
pacio de muestreo) son las frecuencias relativas esperadas con
base en consideraciones de simetra, o bien las frecuencias
relativas de una larga serie de experimentos prcticos, las pro-
babilidades deben ser nmeros comprendidos entre 0 y 1 y la
suma de todas ellas debe ser 1, porque la suma de un conjunto
completo de frecuencias relativas siempre es uno. En los expe-
rimentos relativos a lanzar monedas al aire, extraer de una urna
bolas de colores, o lanzar dados, obviamente las probabilida-
des deben sumar uno, puesto que se construyeron para que
as fuera. Si las probabilidades para el experimento de los n-
meros aleatorios se hubieran basado totalmente en las frecuen-
cias relativas obtenidas en una larga serie de experimentos,
entonces esas probabilidades sumarn uno.
Ahora bien, en toda situacin experimental, ya sea acadmica
o real, es privilegio del estadgrafo el asignar las probabilidades
que l desee a los posibles resultados del experimento, siem-
pre y cuando sean nmeros entre cero y uno y, adems, la
suma total de ellos sea uno. Al asignar estos nmeros, se guia-
r por la naturaleza de la situacin y por su conocimiento de
ella. Generalmente, es muy sencillo asignar probabilidades sa-
tisfactorias a los resultados posibles de los juegos de azar; sin
embargo, ste no es el caso para la mayora
de los fenmenos que pueden estudiarse en
la vida real. Por ejemplo, si el experimento
consiste en seleccionar un individuo al azar
de entre la poblacin de una ciudad y el inte-
rs est enfocado en saber si el individuo
morir o no durante el siguiente ao, enton-
ces la nica forma satisfactoria de asignar
probabilidades aqu es aplicando la experien-
cia de las compaas aseguradoras. Si uno es-
tuviera interesado en determinar correcta-
mente las primas de seguros, sera necesario
asignar las probabilidades de muerte para
cada una de las edades. Generalmente estas
probabilidades se toman iguales a los valores
que proporciona la experiencia, muy amplia,
de las compaas aseguradoras a travs de
los aos. Como las tasas de mortalidad han
ido decreciendo a medida que transcurren
los aos, para casi todos los grupos de eda-
des, toda tabla de mortalidad con base en la
experiencia del pasado resultar obsoleta
para predecir el futuro. As pues, las proba-
bilidades que se asignan con base en
experiencias del pasado pueden no aproxi-
marse mucho a las verdaderas fre-
cuencias relativas existentes ac-
tualmente y, en consecuencia, las
primas calculadas a partir de ellas
no son muy exactas. Afortunada-
mente para las compaas de se-
guros, las primas calculadas con
base en experiencias del pasado
siempre son mayores que las que
podran obtenerse a partir de da-
tos ms recientes.
En muchas situaciones de la ad-
ministracin pblica existe muy
poca experiencia sobre la cual se
pueda basar la determinacin de
probabilidades. Aun para el tipo de
155
Estadistica 1
situacin que se presenta frecuentemente,
la experiencia pasada puede no estar al da,
como en el caso de las tasas de seguros que
debe cobrar una aseguradora como la Pre-
visora (empresa comercial del Estado). Para
situaciones nuevas en los negocios puede
no existir experiencia comparable que sirva
de ayuda en la seleccin de las probabilida-
des. Cuando se presente
cualquiera de estas dos situa-
ciones, la asignacin se fun-
dar en el criterio del hom-
bre de negocios, respecto de
los diferentes posibles resul-
tados por ocurrir. Una vez
que estas probabilidades han
sido asignadas, pueden tra-
tarse matemticamente
como probabilidades verda-
deras de la misma manera
que las probabilidades que
son asignadas por el uso de
la simetra y de la experien-
cia para juegos de azar. La
confiabilidad de un modelo
matemtico basado en un conjunto de probabilidades depen-
der, por cierto, del realismo con que se asignen dichas pro-
babilidades. El papel principal del estadstico es usar las proba-
bilidades dadas para calcular las probabilidades de diferentes
acciones consideradas, y contribuir a la interpretacin de esas
probabilidades. El gerente pblico que provee las probabilida-
des iniciales debe tomar la decisin final, basado en las proba-
bilidades calculadas de las diferentes acciones posibles y en su
confianza en la exactitud de sus juicios de probabilidad origina-
les.
De acuerdo con la discusin anterior, concluimos que la pro-
babilidad de un evento simple se interpreta como la frecuencia
relativa terica o ideal del

evento o como la medida que da un
individuo de su esperanza en la ocurrencia del evento. Esto no
implica de modo necesario que la frecuencia relativa observa-
da en la ocurrencia del evento tienda a su probabilidad para un
nmero suficientemente grande de experimentos, ya que pue-
de no haberse escogido en forma correcta el modelo; sin em-
bargo, se espera que sea as. En esta forma, si suponemos que
se tiene un dado homogneo, podemos esperar que la frecuen-
cia relativa observada de, digamos, que aparezca un 4, mues-
tre tendencia hacia la probabilidad
1/
6
a
medida que se hace un
mayor nmero de tiradas del dado; sin embargo, no debe uno
preocuparse demasiado si no tiende a
1/
6
,
debido a
las imperfecciones en cualquier artculo manufac-
turado y debido a la dificultad de simular un expe-
rimento ideal. En este sentido, debe notarse que
los operadores de casas de juego han tenido xito
financiero suponiendo que los dados se compor-
tan tal como se espera. Es indudable que ellos han
lanzado los dados un nmero de veces bastante
alto para comprobar tales suposiciones. Desde lue-
go que si la experiencia muestra que un dado no se
comporta en la forma esperada, rpidamente se
sustituye por otro.
La construccin de modelos tericos para explicar
la naturaleza es la principal funcin de los hombres
de ciencia. Si los modelos son realistas, las conclu-
siones derivadas de ellos sern probablemente rea-
156
6
Probabilidad
listas tambin. Es relativamente sencillo construir un modelo
de probabilidad para juegos de azar, pero es ms difcil cons-
truirlo para situaciones del mbito de la administracin pblica
donde existe muy poca experiencia sobre la cual fundar el
modelo. La confiabilidad de un modelo de probabilidad para la
gerencia pblica depender obviamente de la cantidad de cono-
cimiento que se tenga de la situacin en cuestin.
Evento Compuesto.
Los resultados posibles de un espacio muestral se llaman even-
tos simples. Una coleccin de varios eventos simples es un even-
to compuesto. Por ejemplo el evento A de obtener exacta-
mente dos caras en el experimento de lanzar tres monedas al
aire es un evento compuesto formado por tres eventos sim-
ples que hacen parte de los ocho eventos del espacio muestral
E. La probabilidad de que el evento compuesto ocurra es la
suma de las probabilidades de los eventos simples de los cua-
les est compuesto. Veamos el ejemplo:
E = {e
1
=
CCC, e
2
=
CCS, e
3
=
CSC, e
4
=
CSS, e
5
=
SCC, e
6
=
SCS,
e
7
=
SSC,

e
8
=
SSS}
Evento compuesto A = {e
2
=
CCS, e
3
=
CSC, e
5
=
SCC}
Como cada evento simple tiene una probabilidad de ocurren-
cia de
1/
8

entonces la probabilidad del evento compuesto A ser
de
3/
8
.
P{A} = P(e
2
)+P(e
3
)+P(e
5
) =
1/
8
+1/
8
+1/
8

=
3/
8
Otro ejemplo, para el evento compuesto de obtener un dgito
al azar menor que 4 en el experimento de nmeros aleatorios,
tenemos que est compuesto de cuatro eventos simples: 0, 1,
2, 3. As la probabilidad del evento compuesto que podemos
llamar B ser:
P{B} = P{0}+P{1}+P{2}+P{3} =
4/
10

=
2/
5
Ahora, para el evento compuesto de obtener una bola
bien sea verde o roja, al extraer una de una urna que contiene
tres rojas, dos negras y una verde. Represente el conjunto o
espacio muestral de eventos posibles y luego halle la probabili-
dad del evento compuesto.
157
Estadistica 1
En muchos experimentos de juegos de azar, se espera que los
diferentes resultados posibles ocurran con la misma frecuencia
relativa; por consiguiente, a todos los puntos del espacio de
muestreo para tales experimentos se les asigna Ia misma pro-
babilidad, esto es,

1/
n
,
donde n representa el nmero total de
puntos en el espacio de muestreo. Esto es vlido, por ejemplo,
en los experimentos de lanzar monedas al aire, de seleccionar
dgitos al azar y de tirar dados. En cambio, no es vlido para el
experimento de las bolas de colores. Cuando el experimento
es de tipo sencillo, esto es, cuando todas las probabilidades de
los eventos simples son iguales, resulta muy fcil calcular la
probabilidad del evento compuesto. Para esto basta solamen-
te sumar las probabilidades
1/
n

tantas veces como eventos sim-
ples comprenda el evento compuesto. As, si el evento com-
puesto A, consta de un total de n(A) eventos simples, el valor
de P(A ) puede expresarse mediante la frmula simple.
{ }
n
n
=
Aun cuando no siempre es posible emplear esta frmula en los
problemas de la vida real, s es ms sencillo trabajar con ella en
vez de hacerlo con la definicin general que involucra la adi-
cin de probabilidades de cada evento simple; por esta razn
la emplearemos en esta unidad para obtener frmulas bsicas.
Puede demostrarse que las frmulas as obtenidas son perfec-
tamente vlidas tambin para la definicin general y, por consi-
guiente, son aplicables a todo tipo de problemas.
Eventos derivados.
Como los eventos son subconjuntos del espacio muestral, to-
das las operaciones con conjuntos se pueden llevar a cabo entre
los eventos. Veamos algunos ejemplos de interpretacin de al-
gunas operaciones de conjuntos.
Evento complementario.
El complemento A, de un conjunto A es la coleccin de los puntos que no estn en el conjunto A. De aqu se
deduce, despus de un poco de reflexin, (reflexinelo Ud.), que cuando no se realiza el evento A entonces se
realiza el evento A.
158
6
Probabilidad
Por eso es natural llamar al complemento del evento A el even-
to no A. Por ejemplo si al tirar un dado balanceado A es el
evento que el resultado sea menor que 3, entonces A = { 1, 2
} y A = { 3, 4, 5, 6 }.
Desde el punto de vista de las probabilidades P(A) = 1 - P(A).
En el ejemplo, que acabamos de ver, del dado: P(<3) =
2/
6

y
P(no menor que 3) =
4/
6
.
Esta ltima probabilidad se entiende
porque hay 4 resultados que son nmeros no menores que
3'.
Unin de eventos.
La unin de los conjuntos A y B es la coleccin de elementos
que pertenecen a uno u otro de los conjuntos o a ambos. El
evento unin de los eventos A y B se realiza cuando sucede
alguno de los dos o ambos.
Decimos que el evento A B se realiza cuando sucede A o
sucede B o suceden ambos. Para regresar al ejemplo del dado:
Si A es el evento de que el resultado sea nn; A = { 1, 3, 5 } y
B es el evento de que el resultado sea mayor que dos;
B = { 3, 4, 5, 6 }.
A B es el evento que se realiza cuando el resultado del dado
est en cualquiera de las dos colecciones o sea:
A B = { 1, 3, 4, 5, 6 }.
En el ejemplo se puede ver el significado inclusivo de la .
Hay ocasiones, en el habla comn, en que el significado de la
o es exclusivo. Por ejemplo: si una muchacha dice que los
amigos de su hermano son muy nios o muy feos, entende-
mos que reaccionan de manera muy infantil o que no satisfa-
cen los requisitos de galanura. Quiere esto decir que entre los
amigos de su hermano no hay ninguno infantil y feo? Claro
que n!, la o que se est usando es inclusiva.
En cambio cuando el restaurante nos ofrece: caf o t, el
significado es exclusivo. No puedo pedir ambos (o me lo co-
bran extra).
Analice la exclusividad y sus implicaciones en el
caso de las siguientes afirmaciones:
?
El prximo gobierno tiene dos
alternativas, o continuar intentando en-
contrar una solucin negociada al conflic-
to armado, o hacer uso de la fuerza para
someter a la ley a quienes la estn subvir-
tiendo.
Poltica monetaria o poltica fis-
cal, dos caminos para atacar la crisis eco-
nmica del pas. Cul ser la frmula co-
rrecta?
159
Estadistica 1
Hay un caso en que los dos significados co-
inciden y es cuando los dos eventos no pue-
den ocurrir juntos. Por ejemplo: nio o nia.
A dos eventos que no pueden ocurrir juntos
se les llama excluyentes. En la notacin de
los conjuntos dos eventos son excluyentes
cuando su interseccin es el vaco.
Interseccin de eventos.
La interseccin de los conjuntos A y B es la
coleccin de los elementos que se encuen-
tran en ambos. En algunos casos esta co-
leccin no contiene a ningn elemento, en
ese caso decimos que la interseccin es va-
ca y que los conjuntos son ajenos.
Decimos que el evento A y B se realiza
cuando el resultado del experimento cabe
dentro de la definicin de A y tambin cabe
dentro de la definicin de B. Es decir A y B
sucede slo cuando ambos eventos suce-
den al mismo tiempo.
Puede pasar que el gobierno aumente los impuestos a fin de
conseguir recursos y a la vez ponga ms dinero en circulacin,
una medida no impide la ejecucin de la otra.
Otro ejemplo, piense en que se tiran dos monedas, si el evento
A es que caiga a lo ms una cara, este evento en forma de
conjunto es {SS, SA, AS} y, si el evento B es que caiga cara la
primera moneda, este evento es {AS, AA} en este caso si pue-
den ocurrir los dos eventos juntos; el evento A y B sucede
cuando las monedas caen AS.
Reglas de la probabilidad.
Teniendo en cuenta las operaciones para hacer conjuntos nue-
vos, hay algunos hechos fundamentales respecto a la probabi-
lidad que se cumplen siempre:
1. P(A) mayor o igual a 0
2. P(S) = 1 donde S es el conjunto de todos los eventos
posibles para un experimento.
3. P(A B) = P(A) + P(B) si A y B son excluyentes.
De estas tres propiedades, los matemticos deducen un mon-
tn de reglas tiles para calcular probabilidades en situaciones
ms complicadas. A este tipo de proposiciones de las que se
deducen otras, se les llama axiomas y los tres de arriba son los
axiomas de la probabilidad. Algunas de las frmulas ms tiles,
deducidas de los axiomas, son las siguientes.
P(vaco) = 0
P(A) = 1- P(A)
P(A - B) = P(A) - P(A y B)
Si el evento A est contenido en B entonces P(A)
menor o igual a P(B)
P(A) menor o igual a 1
P(A B) = P(A) + P(B) - P(A y B).
La deduccin de estas leyes a partir de los tres axiomas es un
ejercicio de ingenio matemtico al que valdra la pena asomar-
se, pero en el que no tenemos intencin de meternos de lleno.
Ya que desde el punto de vista de este curso, lo interesante es
aplicarlas.
160
6
Probabilidad
Respecto a la tercera de la reglas, note bien que la resta de
conjuntos se define as:
A - B es la coleccin de elementos de A que no estn en B.
De tal suerte que P(A - B) debe contemplar slo a elementos de
A y por eso es que a P(A) no le restamos P(B) sino solamente
P(A y B).
Otro comentario lo merece la ltima regla: P(A B) = P(A) +
P(B) - P(A y B). Es preciso restar P(A y B) ya que as no lo hici-
ramos, se estara tomando en cuenta dos veces a los elemen-
tos comunes a A y a B.
Combinaciones de eventos.
Toda la informacin matemticamente importante respecto a
un experimento aleatorio se encuentra en el espacio muestral
y la funcin de probabilidad. El clculo de la probabilidad de un
evento se simplifica partindolo en eventos ms sencillos y
uniendo los pedazos de acuerdo a la llamada ley de la adicin
para probabilidades.
Un ejemplo nos puede servir. Se van a tirar dos dados y yo
gano si la suma de los dados da siete o aunque la suma no sea
siete, si uno, al menos, de los dados cae en uno.
Los resultados de tirar los dados son 36: S = {(1,1),(1,2),(1,3),
. . . ,(6,6) }. Adems, por la simetra interna de los dados, cada
uno de estos 36 resultados es igualmente probable. Esto esta-
blece la funcin de probabilidad.
Pasemos al problema de calcular la probabilidad de ganar. Una
manera equivocada de resolver el problema es as. Yo gano si el
primer dado cae uno o el segundo dado cae uno o la suma de
los dos es siete. Como las respectivas probabilidades son:
1/
6
,
1/
6
y 1/
6
.
La probabilidad de que gane es la suma de estas tres,
1/
2
.
Lo
que tiene mal este razonamiento es que los eventos en que
hemos partido el resultado de que yo gane no son ajenos, y en
estas circunstancias no se vale sumar las probabilidades y y.
Para responder correctamente hay que partir el resultado de
que yo gane en ms pedazos: que el primer dado caiga uno y el
otro n o que el segundo caiga uno y el primero n o que los
dos caigan uno o que la suma sea siete pero
no haya ningn uno.
Las respectivas probabilidades son:
5/
36
, 5/
36
, 1/
36
y 4/
36
.
Para una probabilidad total de ganar
de:
15/
36
;
esto es menor que
1/
2

que es la que
habamos calculado mal.
Fjese que para resolver el problema lo parti-
mos en pedazos ms pequeos, los peda-
zos son ajenos; la probabilidad fue la suma
de esos pedazos.
En el ejemplo usamos un espacio muestral
equiprobable.
161
Estadistica 1
Probabilidad condicional.
?
Consideremos la siguiente situacin.
Se tienen tres urnas similares; por
fuera son idnticas. Se sabe que en
la urna 1 hay 3 bolas blancas y 19
azules, en la urna 2 hay 20 bolas
blancas y 2 azules, en la urna 3 hay
11 bolas blancas y 11 azules.
Se va a sacar una bola de una de las
urnas. Puede ser azul o blanca. Cul
es la probabilidad de que sea blanca?
Hay cuatro posibles soluciones:
1. La probabilidad de una blanca es
3/
22
.
Esto es porque si se
escoge la urna 1, hay 3 de 22 bolas que son blancas. Esta respuesta
nos deja pensando en que es muy arbitrario

decir que la urna escogida es
la 1. Si la urna escogida fuese la 1 esta sera la respuesta correcta.
2. De manera similar, podemos pensar que la urna escogida es
la 2 y entonces la probabilidad de una bola blanca es
20/
22
.
3. Claro que, tambin, la urna escogida puede ser la 3 y enton-
ces la probabilidad de blanca es
11/
22
.
4. Como no se sabe cul es la urna escogida y las tres urnas
tienen el mismo nmero de bolas, la probabilidad se calcula como si
fuese una gran urna con 66 bolas de las cuales 3 + 20 + 11 son
blancas y, as, la probabilidad es
34/
66
Cul es la respuesta correcta? o habr otra
que sea la respuesta correcta?
Una cosa es clara; si podemos suponer que la urna escogida es
la 1, la respuesta correcta es la primera. Lo mismo se puede
decir de la segunda y la tercera. La cuarta es un poquito ms
atrevida y quiz sea correcta. Por lo pronto vamos a darle un
nombre a las tres primeras: les llamamos probabilidad condi-
cional.
A la primera la llamamos probabilidad condicional de blanca
dado que la urna es la 1'. A la segunda, la llamamos de manera
similar condicional de blanca dado que la urna es la 2.
A la tercera se le da un nombre anlogo [Cul nombre?].
Ampliemos nuestras ideas sobre probabilidad condicional con
un poco de matemticas.
162
6
Probabilidad
Formalmente, definimos en clase la probabilidad condicional
de la siguiente manera:
( )
( ) B
B
B

=
El smbolo P(A|B) lo leemos como probabilidad de A dado B.
Lo interpretamos como la probabilidad de que, sabiendo que
ya sucedi B, adems suceda A. En el ejemplo de las urnas A
sera el evento la bola es blanca; B sera la urna correspon-
diente. Como lo que est abajo en el quebrado es la probabili-
dad de lo dado, la frmula no es simtrica en A y B. Si los
intercambiamos, da otro nmero. Esto se ve en el ejemplo ya
que no es lo mismo que nos informen cual es el nmero de la
urna escogida a que nos digan que la bola fue blanca y nos
pregunten cul es la urna. Esta frmula no tiene sentido mate-
mtico si P(B) = 0. En tal caso decimos que la probabilidad
condicional no est definida. Claro que eso est bien porque
no puede haber sucedido algo que es imposible.
Fjese que esta frmula se usar cuando haya una manera fcil
de calcular las probabilidades no condicionales y la condicional
sea difcil. Eso no fue el caso con el color de la bola y las urnas.
Para ejemplificar el tipo de situacin en que nos sirve la frmula
descrita, considere este problema.
Se tiran dos dados y se sabe que el primero no tiene el nmero
5. Cul es la probabilidad de que la suma de los dados sea 8?
Para resolver, llamemos B el evento: el primer dado no es 5'.
A el evento: la suma de los dados es 8'. Con los datos se ve
que:
P(B) =
30/
36
.
Porque de las 36 parejas posibles, 6 tienen 5 en el
primer dado.
P(A y B) =
4/
36
.
Porque slo se obtiene 8, con las parejas (2,6),
(3,5), (4,4) y (6,2) [La pareja (5,3) s suma ocho pero tiene un 5
en el primer dado].
y, usando la frmula, P(A|B) =
4/
30
.
Tambin hubiramos podido calcular sin la frmula, pero esa
cuenta requiere ms ingenio. En este ejemplo es fcil calcular
las probabilidades no condicionales.
Hay muchos problemas, como en el de las
urnas, en que lo contrario es lo cierto: es
fcil calcular la condicional y la podemos
usar para calcular la conjunta. Si despeja-
mos a P(A y B), tendremos una frmula para
calcular la probabilidad conjunta cuando sea
fcil calcular la condicional.
163
Estadistica 1
En ese ejemplo se ven tres cosas:
1. La probabilidad condicional nos permi-
te medir la informacin. En los ejemplos vimos como
cambia la probabilidad de A, antes de conocer
nada: P(A) y despus de conocer la ocurrencia del
evento B: P(A | B).
2. En un extremo est el cambio enorme que corresponde a que
A y B sean excluyentes (ajenos). En este caso la probabilidad podra
llegar incluso a ser cero.
3. En el otro extremo estn los eventos en los que sucede que P(A
| B) = P(A). Esto quiere decir que la informacin de que B ocurri no
cambia la probabilidad de A y decimos que A y B son independientes.
Esta ltima caracterstica, la independencia, juega un papel muy
importante en la probabilidad y merece una atencin ms de-
tallada. Por el momento debemos establecer una definicin:
A y B son eventos independientes si y slo si P(A y B) = P(A)
P(B)
En forma equivalente decimos:
A y B son eventos independientes si y slo si P(A | B) = P(A)
La equivalencia se sigue de una sustitucin algebraica muy sen-
cilla.
La consecuencia de que esta sea una definicin es que: para
comprobar la independencia de dos eventos es preciso hacer
ver que P(A y B) = P(A)P(B).
Es importante remarcar la diferencia de concepto entre even-
tos independientes y eventos excluyentes o ajenos. En nuestro
ejemplo se ve claramente que ambos conceptos son antitti-
cos. El hecho de que dos eventos se excluyan casi implica que
no son independientes. La excepcin se da en el caso degene-
rado de que alguno de ellos (o los dos), sea imposible. En el
habla cotidiana, a veces, se confunden estos conceptos.
Note que si A es imposible; P(A) = 0. Adems A y B tambin
es imposible y se tiene P(A y B) = P(A)P(B) ya que ambos lados
de la igualdad valen cero . Pero ste es el nico caso en que
dos eventos son ajenos e independientes a la vez; en trminos
geomtricos la idea de independencia se asemeja a la perpen-
dicularidad y la de ajenos al paralelismo.
164
6
Probabilidad
PROBABILIDADES DE INTERSECCIONES DE EVENTOS.
Probabilidades Conjuntas
Con la definicin que hicimos de probabilidad condicional y la
definicin de independencia se puede establecer igualdades que
nos auxilien para calcular la probabilidad de la ocurrencia si-
multnea de dos eventos.
1. Para dos eventos en general. P(A y B) = P(A) P(B | A)
Esta igualdad no es ms que la definicin de probabilidad con-
dicional volteada al revs. Para aplicar esta igualdad es preciso
que contemos, de alguna manera indirecta, con la probabili-
dad condicional. La igualdad se puede escribir tambin, condi-
cionando sobre B, as. P(A y B) = P(B) P(A | B)
2. Para dos eventos independientes P(A y B) = P(A) P(B)
Para poder usar esta igualdad se necesita saber, de otras fuen-
tes, que A y B son independientes. Esta igualdad no es ms
que la versin de la de arriba cuando P(B | A) = P(B).
Estas igualdades son muy tiles cuando el experimento aleato-
rio se va a llevar a cabo en etapas temporales. Por ejemplo,
suponga que una empresa recibe materia prima empaquetada
en sobres de 300g. que vienen en cajas de 50 sobres cada una;
suponga, adems que cada sobre puede ser: bueno o deficien-
te.
Para revisar una caja, se van a tomar, al azar, 3 sobres; si ms
de 2 sobres son deficientes se rechazar la caja completa; si
ningn sobre es deficiente, se aceptar la caja completa; si hay
1 o 2 sobres deficientes, se tomarn otros 3 sobres y si el total
de deficientes de los 6 sobres revisados, se pasa de 2, se recha-
zar la caja completa (en caso de ser 2 o menos, se acepta la
caja).
Una fuente secreta nos informa que una caja especfica tiene
10 sobres deficientes. Cul es la probabilidad de que esa caja
sea aceptada?
El problema es complejo, trate Ud. de resolverlo, la respuesta
involucra pensar en etapas, de acuerdo a los diferentes resul-
tados de la primera etapa. El problema lo resolvemos en el
saln.
Ms De Dos Eventos
Ambas igualdades se pueden llevar a tres o
ms eventos, como sigue:
P(A y B y C) = P(A) P(B | A) P(C | A y B)
o cualquier otro orden para el condiciona-
miento, por ejemplo:
P(A y B y C) = P(B) P(C | B) P(A | B y C)
Para el caso de eventos independientes la
igualdad se simplifica en su escritura:
P(A y B y C) = P(A) P(B) P(C)
165
Estadistica 1
La generalizacin de las frmulas anteriores
a ms de tres eventos es inmediata. No olvi-
de que para aplicar cualquiera de estas fr-
mulas es preciso conocer, previamente los
valores de las probabilidades involucradas.
En el siguiente ejercicio, por la especifica-
cin del evento, podemos calcular las pro-
babilidades condicionales por separado y eso
nos lleva aplicar la primera de las frmulas
vistas arriba.
Si una pistola est cargada con 15 cartuchos, de los cuales 2
son intiles y no funcionarn, Qu probabilidad hay de que el primer
cartucho funcione y los dos siguientes n?
?
Ms Sobre Independencia
Respecto a la independencia de dos eventos, hay algunas cosas
muy elementales que agregar a la definicin.
1. La independencia de dos eventos A y B, quiere decir que el
saber que A sucedi no modifica la probabilidad de que B tambin
haya sucedido. Como consecuencia saber que A no sucedi tam-
poco puede afectar a la probabilidad de B.
Escriba tres ejemplos de situaciones en que pase esto,
que tengan que ver cada una con uno de los temas siguientes: la
poltica, la economa colombiana, la participacin ciudadana.
Podemos poner esto diciendo que
Si A y B son independientes, tambin lo son las tres siguientes
pares:
A y B ; A y B ; A y B (estamos usando el apstrofe para denotar
complemento)
166
6
Probabilidad
2. Cuando se tienen tres eventos, se puede presentar una si-
tuacin muy curiosa. Puede pasar que A y B sean independien-
tes y A y C sean independientes y B y C tambin sean indepen-
dientes. Pero A, B y C NO sean independientes. Esta situacin
curiosa se describe diciendo que no basta que varios eventos
sean independientes a pares, para que sean independientes.
El ejemplo clsico es el de un experimento aleatorio con cuatro
posibles resultados igualmente probables: 1, 2, 3 y 4. Si el re-
sultado es 1, A gana y nadie ms. Si el resultado es 2, B gana y
nadie ms. Si el resultado es 3, C gana y nadie ms, pero Si el
resultado es 4, los tres A, B y C ganan. Usted puede calcular las
probabilidades para darse cuenta que:
P(A y B) = P(A) P(B)
P(A y C) = P(A) P(C)
P(B y C) = P(B) P(C) pero P(A y B y C) no es igual a P(A) P(B)
P(C).
3. Una nota final de un estilo menos matemtico. La palabra
independencia se utiliza en otros contextos para denotar un
sinnmero de conceptos diferentes. Los ejemplos ms comu-
nes son en poltica, en historia, en derecho. En la ciencia se
habla de variables independientes y el significado es diferente
que el que usamos aqu. An en otras ramas de la matemtica
se usa la palabra independencia para denotar a otros concep-
tos. Cuando queremos distinguir la definicin tcnica que usa-
mos en la probabilidad de otras nociones le ponemos un ape-
llido a la independencia y decimos independencia estocstica.
De un ejemplo de un concepto diferente al de even-
tos independientes tratado aqu, que se relacione con poltica,
otro con historia y otro con derecho. Si tiene dudas del signifi-
cado de tal concepto en esas disciplinas consulte con algunos
profesionales que pertenezcan a ellas.
Es conveniente recordar que cuando existe duda si dos even-
tos son independientes o n, la nica forma de zanjar la cues-
tin es viendo si P(A y B) es igual o diferente al resultado de
multiplicar P(A) P(B). Naturalmente que si la independencia de
dos eventos est en duda, el clculo de P(A y B) no se puede
hacer simplemente multiplicando P(A) P(B)
sino que se debe justificar de alguna otra
manera.
167
Estadistica 1
TEOREMA DE BAYES.
Veamos un problema que nos llevar a una
regla interesante de clculo de probabilida-
des que se llama: el teorema de Bayes.
En una etapa de la produccin de un artcu-
lo se aplica soldadura y para eso se usan tres
diferentes robots. La probabilidad de que la
soldadura sea defectuosa vara para cada uno
de los tres, as como la proporcin de art-
culos que cada uno procesa, de acuerdo a
la siguiente tabla.
Tenemos un par de preguntas:
Cul es la proporcin global de defectos
producida por las tres mquinas? Si tomo
un artculo al azar y resulta con defectos en
la soldadura, cul es la probabilidad de que
haya sido soldado por el robot C?
La primera pregunta nos va a llevar a lo que
se conoce con el nombre de frmula de la
probabilidad total.
Queremos conocer la proporcin global de
defectos de los tres robots. Despus de re-
flexionar un momento se ve que si todas las
soldaduras las pusiera el robot C, habra
pocos defectos, seran 0.001 o 0.1%. En
cambio, si todas las pone el B, sera un de-
sastre!, tendramos cinco veces ms: 0.005
o 0.5%. De modo que en nuestra respuesta
debemos tener en cuenta las diferentes pro-
porciones de lo maquinado en cada robot.
La idea es empezar por descomponer el evento defectuo-
so en viene del robot A y es defectuoso o viene del
robot B y es defectuoso o viene del robot C y es defec-
tuoso. En smbolos tendremos
P(d) = P(A y d) + P(B y d) + P(C y d)
P(d) = P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)
Antes de ponerle nmeros y resolver nuestro problema fi-
jmonos en la frmula obtenida.
1. Hay tres eventos A, B y C que son ajenos y
cubren todo el espacio muestral.
2. Conocemos las probabilidades de cada uno de
ellos.
3. Adems, conocemos las probabilidades condicio-
nales de otro evento dado cada uno de ellos.
La frmula de arriba se llama frmula de la probabilidad
total. Llenando con nuestros nmeros, tenemos que
P(d) = (0.18)(0.002) + (0.42)(0.005) + (0.40)(0.001)
o sea que P(d) = 0.00286 casi 3 piezas por cada mil.
168
6
Probabilidad
Es bueno comparar este resultado con los porcentajes de sol-
daduras defectuosas de cada robot por separado. Podemos
ver que el resultado se encuentra entre todas ellas y se en-
cuentra relativamente cerca de los porcentajes de los robots
ms utilizados (el B y el C). Esto es muy razonable.
La segunda pregunta es, a la vez ms simple y ms complicada.
Nos va a llevar a lo que se conoce con el nombre de teorema
de Bayes.
La probabilidad que buscamos es una condicional pero al re-
vs de las que tenemos. Buscamos P(C|d) para calcularla usa-
mos la definicin de probabilidad condicional:
( )
( ) d
d
d

=
El numerador (lo de arriba) lo calculamos con P( C y d ) = P(C)
P(d|C)
y el denominador lo calculamos con la frmula de probabilidad
total
P(d) = P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)
juntando las dos tenemos la frmula de Bayes:
( )
( ) ( ) ( ) ( ) ( ) ( ) C C
C C
C
+ +
=
Aplicndola a nuestro caso tenemos
( )
( )( ) ( )( ) ( ) ( ) 00 0 0 0 00 0 0 00 0 0 0
00 0 0 0
+ + +
= d
( )


= = d
O sea que si tomamos una pieza al azar, la
probabilidad de que haya sido soldada por
el robot C es alta, 40%. Pero, como ese ro-
bot produce slo 1 de cada mil soldaduras
defectuosas, al saber que la pieza seleccio-
nada es defectuosa, la probabilidad de que
provenga del robot C disminuye a solamen-
te 14%. Esto quiere decir que, en este caso
el saber que la soldadura es defectuosa, nos
provee una gran cantidad de informacin.
Si analizramos, usando de nuevo la frmu-
la de Bayes las probabilidades de los robots
A y B, tendramos P(B|d) = 0.7343 y P(A|d)
= 0.1259
Verifique tales resultados.
Comparadas con las probabilidades de cada
mquina sin saber que la pieza es defectuo-
sa vemos un gran incremento en la probabi-
lidad de B.
Si, por el contrario la pieza no hubiese teni-
do defectos de soldadura, el mismo teore-
ma de Bayes nos dara
haga Ud. las cuentas y verifique estos
resultados:
169
Estadistica 1
P(A|no d) = 0.1802
P(B|no d) = 0.4191 y
P(C|no d) = 0.4007
Las probabilidades no son idnticas a las
probabilidades no condicionales, pero la di-
ferencia es muy pequea.
Para apreciar mejor el cambio, pongamos en
una sola tabla las probabilidades iniciales y
las condicionales obtenidas bajo el conoci-
miento de la soldadura de la pieza.
Es tan grande el xito de los tres robots en
el soldado correcto que el saber que la pieza
no tiene defectos, prcticamente no altera
las probabilidades de produccin en uno u
otro. Por el contrario, el robot C es tan bue-
no, comparado con el B que, al saber que la
pieza es defectuosa, las probabilidades cam-
bian dramticamente.
En este ejemplo el clculo de probabilidades
condicionales nos cuantifica algo que el sen-
tido comn nos dice de otra forma. Note
que la frmula de Bayes nos sirvi para pasar de las
probabilidades no condicionales a las condicionales.
Otro ejemplo del uso del teorema de Bayes
Otro ejemplo clsico del uso del teorema de Bayes
es un problema de oro y plata. Hay tres bolsas que
tienen, cada una dos monedas. Las de la primera
son de oro, las de la segunda son de plata y las de la
tercera son una de plata y otra de oro. Se escoge
una bolsa al azar y de ella una moneda tambin al
azar. Si la moneda es de oro, cul es la probabilidad
de que la otra moneda en la bolsa sea de oro tam-
bin?
Primero notemos que la segunda bolsa no pudo ha-
ber sido elegida (porque no tiene monedas de oro),
slo pudo haber sido seleccionada la primera o la
tercera. Si la bolsa elegida hubiese sido la tercera, el
evento cuya probabilidad nos interesa no se realiza.
De modo que el evento que nos interesa es equiva-
lente a que se haya elegido la primera bolsa.
Una vez establecido lo anterior, apliquemos el teore-
ma de Bayes para calcular
( )
( ) ( ) ( ) ( ) ( ) ( ) III III II II I I
I I
I
+ +
=
Las probabilidades que entran al lado derecho de la
igualdad las sacamos, inmediatamente, de las con-
diciones del problema y despus de hacer cuentas
tenemos: P(I|Au) =
2/
3
Este problema es clsico porque existe una solu-
cin a la que muchas personas llegan y es falsa. El
argumento es el siguiente. Como todas las bolsas
son igualmente posibles, y el hecho de que la primer
moneda extrada sea de oro, nos indica que no se
trata de la segunda bolsa. Concluimos que las dos
bolsas restantes tienen igual probabilidad y, por tan-
to, la probabilidad de que la otra moneda sea de oro
es
1/
2
.
170
6
Probabilidad
Si Ud. piensa de acuerdo a este razonamiento (errneo!), es
muy difcil que encuentre en qu se equivoca.
Lo que est mal es que lo que averiguamos, al saber que la
moneda extrada es de oro, es algo ms que el rechazo de la
segunda bolsa. Si slo nos dijeran que la bolsa escogida al azar
no fue la segunda, sin informarnos del metal de la moneda
sacada, todava tendramos incertidumbre respecto a la primer
moneda; todava podramos apostar a si sta es de oro o de
plata. Al decirnos que la moneda fue de oro, estamos apren-
diendo algo ms, y eso echa por tierra el argumento de igual
probabilidad para las dos bolsas restantes.
Lo interesante del problema es que, si nos hubieran dicho que
la moneda sacada fu de plata, aplicando la frmula de Bayes,
llegamos a la conclusin de que la probabilidad de que la otra
moneda sea tambin de plata es
2/
3

[Haga Ud. las cuentas!]. Es
decir, si vamos a apostar al metal de la otra moneda, nos con-
viene apostar por el metal de la primera.
Este ejemplo nos lleva a reflexionar sobre el uso adecuado de
la informacin contenida en lo dado en el clculo de la pro-
babilidad condicional.
TECNICAS DE CONTEO.
Principio fundamental de conteo o principio
multiplicativo.
En muchos problemas podemos establecer un espacio mues-
tral equiprobable y entonces el problema de calcular probabili-
dades se convierte en un problema de contar de cuntas ma-
neras se puede hacer algo.
Para empezar con algo sencillo, veamos este problema. Tengo
tres programas para ver correo electrnico: Mail, Pine y ZMail;
adems recibo dos tipos de mensajes: de trabajo y personales.
Ud. me sorprende viendo un mensaje y anota el tipo de pro-
grama y el tipo de mensaje que estoy viendo. Cuntos puntos
tiene el espacio muestral?
Casi automticamente hemos contestado que son 6. Si alguien
no nos cree, podemos escribirle cuales son.
Sin saberlo hemos estado haciendo uso de
lo que se llama Principio Fundamental del
Conteo. Miremos esta frmula:
Si una operacin puede realizarse en n
1
f
or-
mas y si por cada una de stas, una segun-
da operacin puede llevarse a cabo en n
2
formas, entonces las dos operaciones pue-
den realizarse juntas en n
1
n
2

formas.
Aqu tiene un problema que nos puede ayu-
dar a ejemplificar su uso. Para hacer un c-
digo se van a usar 3 letras distintas y 4 dgi-
tos distintos a cero. Cuntos cdigos
diferentes se pueden hacer?
Consideramos elaborar uno de estos cdi-
gos como si hubiera siete huecos, los pri-
meros tres a llenar con letras, los otros cua-
tro con nmeros. El primer hueco puede ser
llenado con cualquiera de las 27 letras con
que contamos, pensemos que ya ha sido lle-
nado. No importa con cul letra haya sido
llenado, para el siguiente hueco tenemos de
nuevo 27 letras que podemos usar; es decir
que hay 272 formas diferentes de llenar los
primeros dos huecos. Esto que razonamos
aqu es el contenido del principio fundamen-
171
Estadistica 1
tal. Habindolo razonado, podemos ahora
aplicarlo de manera automtica, aplicndo-
lo al resto de los huecos llegamos a que hay:
27394 cdigos distintos posibles.
Diagrama de rbol.
Para resolver algunos de los problemas ms
difciles relacionados con experimentos de
dos o ms etapas, es conveniente tener
mtodos sistemticos de clculo de proba-
bilidades para eventos compuestos. Un m-
todo grfico que ha demostrado ser parti-
cularmente til se basa en lo que se ha
llamado un rbol de probabilidad.
Miremos el caso con un ejemplo: Una caja
contiene dos bolas negras, tres rojas y una
verde y se trata de extraer dos de ellas. Este
es un experimento de dos etapas para el que
existen varias posibilidades, mismas que
podemos representar con un rbol horizon-
tal. Cada nivel o etapa de un experimento
que comprende varias etapas tiene tantas
ramas como posibilidades hay en tal etapa.
En este caso hay tres ramas principales en
la primera etapa y tres ramas en cada una
de las etapas segundas, exceptuando la in-
ferior de las segundas etapas: es imposible obtener una bola
verde en la segunda extraccin si se obtuvo una bola verde en
la primera extraccin; as pues, en esta segunda etapa del r-
bol hay tan slo dos ramas. El nmero total de ramas termina-
les en un rbol semejante da el nmero total de posibles resul-
tados para el experimento compuesto y, por lo tanto, los
extremos de estas ramas terminales pueden tratarse como
puntos del espacio de muestreo correspondiente.
La probabilidad que se asigna a una rama del rbol es la proba-
bilidad condicional de que el evento al que corresponde ocu-
rra, sujeto a la condicin de que los eventos correspondientes
a las ramas antecedentes hayan ocurrido. As, el
2/
5

escrito arri-
ba de la rama terminal superior es la probabilidad condicional
de obtener una bola roja en la segunda extraccin si se obtuvo
una bola roja en la primera extraccin. El nmero escrito ade-
lante del extremo de una rama terminal es la probabilidad de
obtener la secuencia de eventos necesaria para llegar a ese
punto terminal. As, la primera probabilidad terminal (
3/
6
)(
2/
5
) es
la probabilidad de obtener una bola roja en la primera extrac-
cin multiplicada por la probabilidad condicional de volver a
hacerlo en la segunda extraccin. Usando este rbol es relati-
vamente sencillo contestar preguntas variadas.
Los rboles de probabilidad proporcionan un mtodo grfico
sencillo para calcular probabilidades en las que normalmente
se debera usar la frmula de Bayes.
Veamos un segundo ejemplo: considrese que una caja contie-
ne dos bolas rojas y una blanca, y otra caja que contiene dos
bolas rojas y dos blancas. Se selecciona una caja al azar y se
extrae una bola de ella. El problema consiste en calcular P(
A
2
/
A
2
), donde A1 es el evento de elegir la caja 1 y
A
2

es la obtencin
de una bola roja. El rbol correspondiente a este experimento
de dos etapas aparece en la siguiente figura con las probabili-
dades asignadas a las ramas y a los cuatro puntos del espacio
de muestreo.
Ahora la rama superior corresponde al evento compuesto A
1
y
A
2
;
por tanto, P(
A
1
y A
2
)=(
1/
2
)(
2/
3
). Adems, se concluye, por la
172
6
Probabilidad


definicin de evento compuesto que P(
A
2
)=(
1/
2
)(
2/
3
) + (
1/
2
)(
2/
4
)
,
porque el evento

A
2

consiste en los dos puntos del espacio de
muestreo asociados con la palabra roja. As, por la frmula
de Bayes tenemos:
La tcnica es, como se ve ahora, la siguiente. Despus de cons-
truir El rbol, eljase la rama terminada que corresponde a la
ocurrencia de A
1

y A
2
.
Divida entonces la probabilidad asociada
con esa rama terminal por la suma de las probabilidades de
todas las ramas terminales asociadas con el evento A
2
.
{ }
{ } 7



=
+

=
A
A A
A A
La aplicacin de la tcnica del rbol al segundo ejemplo aso-
ciado con la frmula de Bayes, es la siguiente:
Para obtener P{C1/E1} basta dividir, ahora, la probabilidad (.01)
(.97) asociada con la rama terminal superior por la suma de las
probabilidades de las ramas terminales asociadas con la letra
E1. As:
{ } 1
1 1
1
1 1
=
+ +
= E
ANLISIS COMBINATORIO.
Permutaciones a partir de n
elementos distintos.
Definimos una permutacin como un reaco-
modo de objetos.
Para determinar el nmero de permutacio-
nes, partimos de una coleccin de n objetos
diferentes. De ellos se van a seleccionar r (r
puede ser igual o menor que n) y el orden
en que queden acomodados es importante.
Esto quiere decir que dos acomodos en or-
den distinto son contados como distintos.
El nmero de estas permutaciones lo deno-
tamos con nPr y se calcula as:
)

=
173
Estadistica 1
cuando r es igual a n (es decir, cuando se
trata de permutar todos los n objetos) la fr-
mula se reduce a: nPn = n! ya que 0! = 1
El paradigma de las permutaciones es la cola
para las reinscripciones de inicio de semes-
tre. Del total de n alumnos (distintos) se for-
man los que van a reinscribirse, el orden en
que quedan es muy importante, de ah de-
pende que se pueda formar el horario con
los profesores que uno quiere (o quiz elu-
dir a los que uno no quiere?)
Ejemplo. Tres estudiantes aspiran a los dos
primeros puestos del semestre, para tener
derecho a la matrcula de honor. De cuantas
formas se pueden ocupar estos puestos?
6


2
=

= P
Ejemplo. Hay que colocar a 5 hombres y 4
mujeres en una fila de modo que las muje-
res ocupen los lugares pares. De cuntas
maneras puede hacerce?
Los hombres se pueden colocar de
5
P
5
ma-
neras y las mujeres de
4
P
4

maneras; cada
colocacin de ellos se puede asociar con una
de ellas, luego el nmero pedido es
5
P
5
.
4
P
4
=5!4!=(120)(24)=2880.
Combinaciones.
Una situacin parecida a la de las permuta-
ciones la presentan lo que llamamos com-
binaciones. La situacin es inicialmente igual,
deseamos tomar de una coleccin de n ob-
jetos distintos una subcoleccin de tamao
)

r r

=
r. La diferencia est en que ahora no es importante el orden en
que se obtengan.
La frmula que da el nmero de combinaciones de r objetos
tomados de una coleccin de n es:
Note que siempre este nmero va a ser menor que nPr ya que,
como no interesa el orden, va a haber menos combinaciones,
ya que muchas nos van a resultar iguales.
El paradigma ahora es un comit en que todos tienen voz y
voto. Aqu no importa el orden en que fueron seleccionados
los integrantes.
Ejemplo. De tres personas que aspiran a ocupar dos cargos de
iguales caractersticas, de cuantas formas se pueden escoger
las dos personas que ocuparan los cargos. El nmero de com-
binaciones de las tres personas tomadas de a dos nos propor-
ciona el resultado:
3

3
2
=


= C
Vamos a comprobarlo: {AB, AC, BC}
174
6
Probabilidad
PROBLEMAS PROPUESTOS
1. En una caja hay 8 bombillos de los cuales 3
estn fundidos. Se van a sacar los bombillos de uno en
uno, hasta encontrar los tres fundidos. Si nos fijamos
en el nmero de bombillos que se quedan en la caja
cul es el espacio muestral?
2. En el experimento de los cara y sellos mencio-
nado arriba. Si nos fijamos en el nmero de sellos que
salieron, describa en sus propias palabras, cul es el
evento {0, 1, 2}. Si los resultados fueron CCSCCSCCC
Por qu se detuvo el experimento? Se realiz el even-
to?
3. Jntese con un compaero de este curso y
entre los dos discutan y encuentren un ejemplo de un
experimento aleatorio relacionado con las personas que
estn en la biblioteca despus de las 10 de la noche.
Expliquen cul es el espacio muestral. Expliquen qu
informacin necesitaran para asignar probabilidades.
4. Con su mismo compaero, encuentren un
ejemplo de un experimento aleatorio referente a las ins-
cripciones. Detallen el espacio muestral. Propongan un
evento. Den un ejemplo de un resultado que implique
que el evento no se realiz y otro resultado donde el
evento s se haya realizado.
5. Haga una lista con diez conjuntos de eventos
que sean excluyentes entre s.
6. Invente un juego con dos dados. Como ejem-
plos, tirar dos dados y el resultado no es la suma de los
dados sino la multiplicacin; tirar dos dados y el resul-
tado es 1000 si la suma de los dos es par y 5000 si la
suma es nn. Escriban el espacio muestral y, teniendo
en cuenta que las 36 parejas de posibles resultados con
dos dados: { (1,1), (1,2), (1,3), . . . } son igualmente
probables, encuentre la funcin de probabilidad para el
juego que invent.
7. Se van a tirar 5 monedas y el resul-
tado va a ser el nmero de caras menos el
nmero de sellos. Escriba el espacio mues-
tral equiprobable para este experimento.
(Debe tener 32 resultados).
8. Siguiendo con el ejercicio anterior,
me van a dar una cantidad de pesos igual a
la resta: [nmero de caras] MENOS [nmero
de sellos]. Si sale negativo quiere decir que
yo pago! Cul es la probabilidad de que gane
ms de dos pesos?
9. Si un dado se construye de modo
que un 1 o un 2 ocurran dos veces ms fre-
cuentemente que un 5, mismo que se pre-
senta tres veces ms seguido que un 3 o un
4 o un 6. Cul es la probabilidad de que el
nmero que se obtiene sea par? Cul la de
que sea un cuadrado perfecto? Cul la de
que sea mayor que 4? 4.Cmo haran Uds.
para construir un dado como el que se pro-
pone en el ejercicio anterior?
10. En el ejemplo de los robots se cal-
cul con detalle P(C|d). Calcule Ud. las otras
probabilidades mencionadas: P(B|d) =
0.7343 y P(A|d) = 0.1259 P(A|no d) =
0.1802, P(B|no d) = 0.4191 y P(C|no d) =
0.4007 en el ejemplo de las monedas, se
calcul P(I|Au) =
2/
3
y se mencion que
P(II|Ag) =
2/
3
, verifquelo.
11. Haga una lista de todos los posi-
bles resultados si se lanza al aire una mone-
da cuatro veces. Qu probabilidades asig-
nara usted a los puntos de espacio de
muestreo construidos?
175
Estadistica 1
12. Una caja contiene una bola roja,
una negra y una verde. Se extraen dos bo-
las de la caja, sin reemplazar la primera bola
obtenida antes de extraer la segunda. Cons-
truya, para este experimento, un espacio de
muestreo. Qu probabilidades asignara
usted a los puntos del espacio de muestreo?
En qu forma las habra usted asignado si
la primera bola se hubiera regresado a la caja
antes de efectuar la segunda extraccin?
13. Una caja contiene dos bolas negras
y una blanca. Se extraen dos bolas de esta
caja. Construya un espacio de muestreo para
este experimento (a) empleando 6 puntos,
(b) empleando 3 puntos. Qu probabilida-
des asignara usted a los puntos de los dos
espacios de muestreo?
14. Sean E
1
, E
2
y E
3
l
os eventos de ob-
tener un dgito menor que 4, de obtener un
dgito entre 4 y 6, inclusive, y de obtener un
dgito mayor que 6, respectivamente, al se-
leccionar un dgito de la tabla de nmeros
aleatorios. a) Construya un espacio de mues-
treo para este experimento asignando pro-
babilidades a cada punto de l. b) Efecte
200 veces el experimento y calcule las fre-
cuencias relativas experimentales de los tres
eventos para comprobar si el modelo cons-
truido por usted corresponde a la realidad.
15. Asignar probabilidades a los pun-
tos del espacio de muestreo que consta de
4 puntos y representa los resultados posi-
bles al sacar dos canicas de una caja que
contiene 2 canicas negras y 2 blancas.
16. Un dado tiene la cara de 6 puntos
cambiada a una de 3 puntos. AI tirar este
dado, cul es la probabilidad de obtener 4 o ms pun-
tos?
17. Una caja contiene 4 bolas rojas, 3 negras, 2
verdes y una blanca. Se extrae una bola de la caja, re-
gresndola inmediatamente. Cul es la probabilidad de
que la bola extrada sea (a) roja, (b) roja o negra? Luego,
simule el experimento anterior mediante nmeros alea-
torios haciendo corresponder al rojo los dgitos 0, 1, 2,
3; al negro los dgitos 4, 5 y 6; al verde, los dgitos 7 y 8;
y al blanco, el dgito 9; y efectuando 400 veces el expe-
rimento de seleccionar un dgito de la tabla de nmeros
aleatorios. Sean A
1

y A
2

los eventos descritos en los inci-
sos (a) y (b), respectivamente. Registre, de acuerdo con
lo anterior, el nmero de veces en que A
1

y A
2

ocurren.
Observe si el modelo matemtico aqu expuesto parece
ser realista.
18. Se lanza 4 veces al aire una moneda bien ba-
lanceada. Empleando el modelo correspondiente a los
problemas 11 y 13, calcule la probabilidad de obtener
(a) 4 caras, (b) 3 caras y 1 sello, (c) al menos 2 caras.
19. Para el experimento de tirar 2 dados legtimos,
calclese la probabilidad de que (a) la suma de los n-
meros no sea 11, (b) no aparezca 1 ni 2, (c) cada dado
muestre 3 o ms puntos (d) los nmeros en uno y otro
dado no sean el mismo, (e) exactamente un dado mues-
tre menos de 3 puntos.
20. Un departamento Ilena rdenes que varan, da
a da, entre 0 y 10, con las siguientes probabilidades
0.02, 0.07, 0.15, 0.20, 0.19, 0.16, 0.10, 0.06, 0.03,
0.01 y 0.01. a) Cul es la probabilidad de Ilenar menos
de 4 rdenes? b) Cul es la probabilidad de Ilenar al
menos una orden? c) Cul es la probabilidad de Ilenar
de 3 a 5 (inclusive) rdenes?
176
6
Probabilidad
21. Los siguientes datos muestran el promedio de
vida comercial de abarroteros al mayoreo en una rea
metropolitana: a) Durante el periodo estudiado, cul
es la probabilidad de que alguien que se inicia en ese
negocio quiebre en 10 aos? b) Cul es la probabilidad
de que contine al menos 25 aos? c) Cuntos aos
tendra que sobrevivir alguno para encontrarse en el
10% de los sobrevivientes mayores?
22. Se van a extraer dos bolas de una urna que
contiene dos bolas blancas y tres negras. (a) Cul es la
probabilidad de que la primera bola sea blanca y la se-
gunda negra? (b) Cul es la probabilidad si antes de
efectuar la segunda extraccin se restituye la primera
bola extrada?
23. Supngase que marcamos dos dados de tal
manera que las caras de 1 y 2 puntos sean blancas, y
que las caras de 3, 4, 5 y 6 sean negras. Si se tiran
ambos dados juntos, cul es la probabilidad de que al
menos uno de los dos dados muestre una cara negra?
24. Se van a extraer dos bolas de una urna que
contiene 2 bolas blancas, 3 negras y 4 verdes. (a) Cul
es la probabilidad de que ambas bolas sean verdes? (b)
Cul es la probabilidad si se restituye la primera bola
extrada antes de efectuar la segunda extraccin? (c)
Cul es la probabilidad de que ambas bolas sean del
mismo color?
25. Una caja contiene 4 monedas, siendo norma-
les tres de ellas y la cuarta con caras en ambos lados.
Si seleccionamos una moneda de la caja y luego la lan-
zamos dos veces al aire, cul es la probabi-
lidad de obtener dos caras?
26. Si la probabilidad es p = 0.1 de que
una persona de 30 aos de edad muera an-
tes del ao, hallar la probabilidad de que de
un grupo de 10 individuos tales, (a) ningu-
no, (b) 1 exactamente, (c) no ms de 1, (d)
ms de uno, (e) cuando menos 1 muera en
el ao que empieza la fecha.
27. En cierta rea el 20% de las casas
tienen un televisor y 40% una lavadora au-
tomtica. Se selecciona una casa al azar.
Cree usted que sea legtimo calcular la pro-
babilidad de obtener una casa que tenga
televisor y lavadora automtica, mediante (a)
multipicacin de .20 por .40, (b) suma de
.20 y .40. Explicar.
28. Se Ileva a cabo una encuesta para
medir el nmero de lectores de las revistas
A y B. Se encuentra que de las familias en-
trevistadas 25% compran A y 40% compran
177
Estadistica 1
B. (a) Los eventos de comprar A y de com-
prar B son independientes? (b) Si los even-
tos se suponen independientes. Cul es la
probabilidad de que una familia compre al
menos una de las revistas? (c) Cul ser la
probabilidad en (b) si los dos eventos mu-
tuamente se excluyen?
29. Un aparato electrnico funcionar
correctamente slo si todas sus partes com-
ponentes lo hacen. Hay 5 componentes en
cada aparato. Sea p la probabilidad de que
una sola componente funcione correctamen-
te y supngase que esta probabilidad es la
misma para todas las componentes. Si cada
componente opera independiente de las de-
ms, qu tan grande debe ser p de modo
que la probabilidad de que funcione el apa-
rato sea no menor que .9?
Los siguientes nmeros se obtuvieron de una
tabla de mortalidad basada en 100 000 indi-
viduos:
30. Si estos nmeros se usan para de-
finir las probabilidades de muerte para el gru-
po de edad correspondiente y si A, B y C
indican individuos con edades de 17, 19 y
21, respectivamente, calcular la probabilidad
de que durante el ao (a) A muera y B viva,
(b) A y B mueran ambos, (c) A y B vivan am-
bos, (d) por lo menos uno de A y B muera,
(e) por lo menos uno de A, B y C muera.
31. Una organizacin de pruebas desea calificar una
marca particular de radios de mesa. Se seleccionan al
azar 5 aparatos de la existencia y se juzga que la marca
es satisfactoria si no se encuentra nada malo en nin-
guno de los 5 radios. (a) Cul es la probabilidad de que
la marca sea satisfactoria si 10% de los radios estn en
realidad, defectuosos? (b) Cul es la probabilidad si hay
20% defectuosos?
32. Se extraen tres cartas de un juego ordinario
de 52 naipes (a) Cul es la probabilidad de que las 3
sean espadas? (b) Cul es la probabilidad de que las 3
sean del mismo palo? (c) Cul es la probabilidad de que
ninguna de las 3 cartas sea espada?
33. Suponga que la proporcin de nios varones
es de 112, encuentre la probabilidad de que en una fa-
milia de 6 hijos, (a) todos los hijos sean del mismo sexo,
(b) los 4 mayores sean nios y los menores sean nias,
(c) 5 de los hijos sean nios y uno sea nia.
178
6
Probabilidad
34. Suponga que la probabilidad de que el tiempo
(sol brillante o da Iluvioso) sea el mismo un da que el
anterior es igual a p. Suponga que hoy tenemos un da
Iluvioso, qu probabilidad hay de que pasado maana
tengamos un da Iluvioso? Aydese construyendo un
rbol.
35. Para que funcione adecuadamente, un apara-
to electrnico debe tener las dos componentes conec-
tadas que aparecen en el dibujo en correcto fun-
cionamiento. El diagrama muestra que A debe funcionar
y lo mismo alguno de los dos B. Supongamos que las
componentes B funcionan independientemente de A e
independientemente una de otra. y que la confiabilidad
(probabilidad de que funcione) de A es 0.9 y la de B
1

y B
2
es 0.8. a) Hgase una conjetura de la confiabilidad del
aparato. b) Calclese la confiabilidad del aparato. Con
ayuda de la figura, mostrar que la regla de adicin para
dos eventos A
1
y A
2

que no son mutuamente exclusivos
est dada por la frmula




P{A1 o A2}=P{A1} + P{A2} P{A1 y A2}
36. Suponer que en una escuela secundaria hay el
mismo nmero de estudiantes de cada sexo y que la
probabilidad de que un estudiante de sexo masculino
sea estudiante de ciencias es de
1/
5

y que la probabilidad
de que una mujer sea estudiante de ciencias es
1/
20
.
Cul
es la probabilidad de que (a) un estudiante selecciona-
do al azar sea hombre y estudiante de ciencias, (b) un
estudiante tomado al azar estudie ciencias, (c) un
estudiante de ciencias elegido aleatoriamente sea de
sexo masculino?
37. Supongamos que el 10% de los pro-
pietarios de automvil que tengan accidente
habrn tenido cuando menos uno ms en el
ao anterior. Supngase tambin que una
prueba de manejo en simulador hace fraca-
sar al 70% de tales conductores, pero slo
fracasarn en ese examen 20% de los con-
ductores que slo han tenido un accidente.
Si un propietario de automvil elegido alea-
toriamente entre los que se han accidenta-
do toma el examen y falla. Cul es la proba-
bilidad de que tuviera otros accidentes en el
ao anterior?
38. Supngase que se ha aplicado una
prueba al nivel de secundaria para verificar
si los estudiantes son o no aptos para estu-
diar los aos superiores del bachillerato y que
se ha obtenido la siguiente experiencia. De
los estudiantes que cursaron satisfactoria-
mente el primer ao del bachillerato el 80%
179
Estadistica 1
de ellos aprob el examen. De los estudian-
tes que no hicieron buenos estudios duran-
te su primer ao de bachillerato el 40% de
ellos aprob el examen. Se supone que el
examen no se us como prueba de admi-
sin. Si se sabe que slo el 70% de los alum-
nos de primer ao de bachillerato estudian
satisfactoriamente, cul es la probabilidad
de que un estudiante que pas la prueba sea
un estudiante satisfactorio?
39. Supongamos que el 70% de un gru-
po de individuos est a favor de la ponencia
A. Supongamos adems que slo el 80% de
los que verdaderamente estn a favor res-
pondan estoy a favor en una entrevista. El
otro 20% miente y responde no. De las
personas que en realidad se oponen tan slo
el 60% responde con un no veraz, y los
dems mienten contestando s. a) Si se eli-
ge un individuo al azar, cul es la probabili-
dad de que responda con si? b) Si un indi-
viduo elegido aleatoriamente contesta con
si. Cul es la probabilidad de que est ver-
daderamente en esa categora?
40. Para auxiliar en la adecuada selec-
cin de empleados para un puesto particular,
cierto departamento de personal hace a los
aspirantes una prueba de aptitud. Para pro-
bar la efectividad del examen se contrat una
muestra de aspirantes que haban fracasado
en el examen y se les observ en el puesto
por algn tiempo. As se encontr que el 30%
de los que pasaron el examen un 80% des-
empe el puesto satisfactoriamente y de los
que no pasaron el examen slo se desempe-
aron exitosamente el 10%. Cul es la pro-
babilidad de que un aspirante elegido al azar
demuestre un desempeo satisfactorio en el trabajo?
Use un rbol.
41. Cierta corporacin se interesa en conocer las
actitudes de sus empleados acerca de una poltica bas-
tante delicada que est considerando aplicar. Firma un
contrato con la compaa B-Attitude Research Associa-
tes para saber qu es lo que los empleados realmente
piensan del asunto. La compaa B-Attitude examina a
los empleados mediante entrevistas personales. Supon-
gamos que 70% de los empleados se declaran a favor y
30% son contrarios. Supngase tambin que 90% de
los que favorecen la poltica estn dispuestos a decla-
rarlo en la entrevista en tanto que los dems se decla-
ran contrarios; y los que en realidad repudian la polti-
ca, la mitad estn dispuestos a admitirlo y la otra mitad
declaran estar a favor. Usar un rbol de probabilidad
para contestar las siguientes preguntas. (a) Cuando la
compaa investigadora entrega su reporte, cul es la
proporcin de empleados que dicen favorecer la polti-
ca? (b) De los empleados que dicen estar a favor de la
poltica, cul es la proporcin de los que realmente estn
a favor?
42. La placa de circulacin para automvil en el
estado de California consta de 3 nmeros enteros dgi-
tos y 3 letras a continuacin. Supongamos que s e
usan las 26 letras del alfabeto y los dgitos (de 0 a 9). (a)
Cuntas placas pueden obtenerse en esta forma. (b)
Cul es el incremento relativo del nmero de placas
que se obtiene al poner letras en vez de nmeros?
(c) Supongamos que una de las palabras formadas por
las letras se considera inadecuada y, por tanto, se omi-
te. Cuntas placas se eliminan?
43. Un agente de ventas de casas tiene 8 diseos
bsicos. En una calle determinada posee 5 lotes. (a)
Supongamos que la comunidad no permite casas que
se parezcan en una misma calle. De cuntas maneras
180
6
Probabilidad
diferentes puede el agente utilizar sus diseos bsicos
restringindose a lo estipulado por la comunidad? (b) Si
no hay restricciones, cuntos arreglos son posibles?
44. Un distribuidor de automviles quiere almace-
nar uno de cada modelo, color y potencia. Si hay 5
modelos, 7 colores y 2 caballajes. Cuntos autos se
van a necesitar?
45. AI preparar las listas para las elecciones se
acostumbra evitar el orden alfabtico de los candidatos.
Se supone en general que es muy ventajoso aparecer en
el primer lugar de la lista. Cuntas listas diferentes pue-
den hacerse si hay 5 candidatos?
46. En una lista de 20 donadores voluntarios de
sangre hay 15 del tipo de sangre B. Si 3 individuos son
elegidos al azar en la lista, cul es la probabilidad de
que los 3 sean de tipo B?
47. Un comprador acepta un lote de 100 artculos
si una muestra de 5 artculos escogidos al azar no tiene
defectos. Cul es la probabilidad de que acepte el lote
si se sabe que ste contiene 10 artculos defectuosos?
48. Si una caja contiene 40 fusibles en buen estado y 10
defectuosos y si se seleccionan 10 fusibles, cul es la
probabilidad de que todos estn en buenas condicio-
nes? Use smbolos de combinacin.
48. Un artculo manufacturado, intil si tiene de-
fectos, se hace pasar por 2 inspecciones antes de recibir
el visto bueno para el empaque. Por experiencia se sabe
que el primer inspector deja pasar el 5% de los artculos
defectuosos en tanto que el segundo no ve 4% de ellos.
Los artculos satisfactorios siempre pasan las dos ins-
pecciones. (a) Cul es la probabilidad de que los 2 ins-
pectores fallen en detectar un artculo defectuoso? (b)
Cul es la probabilidad de que un artculo defectuoso
pase el primer inspector, pero sea retenido por el segun-
do? (c) Si el 10% de los artculos que salen del proceso
de manufactura son defectuosos, qu por-
centaje de los artculos producidos que pa-
san ambos inspectores sern defectuosos?
49. Invente tres casos relacionados con
la administracin pblica, referentes a los
principales temas de esta unidad y resulva-
los. Demuestre todo su potencial creativo.
181
Estadistica 1
PROBLEMAS RESUELTOS
1. Encontrar el espacio muestral del experimento
de sacar 3 manzanas de un recipiente en el que hay 8
buenas y 2 daadas.
Solucin.
Si en una caja hay 10 manzanas y 2 estn echadas
a perder (al menos en este momento!), al extraer
tres manzanas y ver cuantas son buenas podemos
obtener 1, 2 o 3 buenas (0 buenas es imposible!).
De modo que en este ejemplo el espacio muestral
es: { 1, 2, 3 }.
2. Encontrar el espacio muestral de un juego con-
siste en tirar todos los cara y sellos que hagan falta hasta
obtener tres caras seguidas o hasta que sean 15 cara y
sellos.
Solucin.
Si nos fijamos en el nmero de cara y sellos reque-
ridos, el espacio muestral es: { 3, 4, 5, . . . , 15 }.
Pero si nos fijramos en el nmero de soles que re-
sultan, entonces el espacio muestral es: { 0, 1, 2, .
. . , 15 }.
Es claro que para determinar el espacio muestral
en un experimento aleatorio es necesario entender
perfectamente: Qu se va a hacer y qu se va a
observar o contar.
3. Presentar un evento compuesto para el experi-
mento del ejercicio anterior.
Solucin.
En el caso de contar cuantos cara y sellos hacen
falta para conseguir tres caras seguidas o tirar 15
cara y sellos; el espacio muestral son los nmeros:
3, 4, 5, . . . , 15. Un evento podra ser { 3, 5, 7, . . .
, 15}. Este evento corresponde a que el nmero de
tiros necesario sea nn. Si al hacer los cara y sellos
los resultados fueran:
CCSCCSSSCCC (aqu nos detenemos porque han
cado ya, tres caras seguidas), el evento si se realiz
porque el nmero necesario fue 11 y es nn.
SSSCCC (aqu paramos porque ya hay tres caras),
el evento no se realiz.
Podemos pensar que cada experimento al azar es
un juego y que un evento es una lista de los resul-
tados que hacen que YO gane.
4. Para el experimento de comprar llantas nuevas
para un auto, encontrar un espacio muestral de eventos
simples y explicar a partir de este ejercicio y los anteriores
que tipos de eventos pueden ocurrir en un experimento.
Solucin.
Al comprar llantas para mi auto, puede ser que
manifiesten un defecto de fabricacin dentro del
perodo de garanta total y que el fabricante deba
reponerlas. Tambin puede pasar que el defecto se
manifieste en el perodo de garanta parcial y que el
fabricante bonifique slo un porcentaje o que el
defecto se manifieste despus de vencido el pero-
do de garanta en cuyo caso el fabricante no paga
nada. Tambin puede pasar que las llantas no ten-
gan defecto de fabricacin aparente y que no haya
garanta que reclamar. Como se puede considerar
que las llantas que me vendieron se escogieron al
azar de entre toda la produccin, tenemos un ex-
perimento aleatorio.
El espacio muestral en este experimento es:
S = {T, P
1
, P
2
, P
3
, N, Ok}. Con la siguiente
notacin
T: pago total,
P
1
pago del 50%,
P
2
: pago del 30%,
P
3
: pago del 10%,
N: nada de pago,
182
6
Probabilidad
Ok: llantas sin defecto. El evento {Ok} slo se rea-
liza cuando las llantas no tienen defecto.
En este ltimo ejercicio se tiene un evento simple
porque consta de un solo punto del espacio mues-
tral. Ser compuesto cuando tiene varios puntos
del espacio muestral. Se llama evento imposible al
que no puede ocurrir; ste evento corresponde al
conjunto vaco. Otro evento extremo es el espacio
muestral mismo que, puesto que siempre ocurre,
se llama evento seguro.
5. Explique para el experimento de lanzar un dado,
la asignacin de probabilidades a los elementos del campo
muestral. Halle la probabilidad de que el resultado sea
mayor que 4 y describa una forma de evidenciarla.
Solucin.
Pensemos en un dado perfectamente balanceado
de modo que ninguno de los seis lados es favoreci-
do. El espacio muestral es {1, 2, 3, 4, 5, 6}. La
funcin de probabilidad le asigna a cada uno de los
elementos del espacio muestral el valor
1/
6
. Esta asig-
nacin la hacemos porque el dado est balancea-
do.
Decimos que la probabilidad de un evento es el
nmero de resultados favorables al evento entre el
nmero de resultados posibles. Entonces, la pro-
babilidad de que el resultado sea mayor que 4 es
2 / 6, porque hay 2 resultados favorables entre los
6 resultados posibles. Formalmente, el evento es A
= {5, 6} y P[A] = 2/6.
La probabilidad que resulta de esta manera, tiene
una interpretacin emprica; si hacemos una serie
larga de lanzamientos del dado, y observamos la
frecuencia de resultados favorables al evento A, esta
frecuencia tiende a ser
2/
6
.
6. Se tiene una urna con 50 papelitos numerados
de los cuales se escoge uno para que tenga un premio.
Determine el espacio muestral y la probabilidad de que
uno de los apostadores al comprar tres nmeros gane.
Solucin.
El espacio muestral es {1, 2, 3,... 50}. La asigna-
cin de probabilidades es de
1/
50
para cada resulta-
do. Si el jugador compr los nmeros 1, 14 y 18; el
evento de que gane es {1, 14, 18} y la probabili-
dad de que gane es
3/
50
.
7. Se extraen dos naipes de una baraja ordinaria
de 52 cartas, sustituyendo el primer naipe antes de sacar
el segundo. Cul es la probabilidad de que las dos cartas
sean espadas?
Solucin.
Sea A
1

el evento de obtener una espada en la pri-
mera toma y A
2

el evento de obtener una espada
en la segunda. Puesto que la primera carta se sus-
tituye, la probabilidad de obtener una espada en la
segunda no debe depender de que se haya obteni-
do o no una espada en la primera; por lo tanto, se
puede suponer que A
2

es independiente de A
1
, usa-
mos entonces la regla de la multiplicacin para
eventos independientes as:
{ }
1
1

1

1
2
= = A A
8. Cul es la probabilidad de que las cartas sean
o bien el dos de espadas o bien el dos de corazones? Sea B
1
el evento de obtener el dos de espadas y B
2

el evento de
obtener el dos de corazones. Entonces, el resultado prece-
dente, se sigue que
P{B
1
}=P{
B
2
}=1/16
Puesto que los eventos B
1

y B
2

son mutuamente
excluyentes y el problema es calcular la probabili-
dad de que ocurran B
1
o B
2
; luego,
{ }
8

2
= + = B B
183
Estadistica 1
9. Como antes, supngase que se extraen dos car-
tas de la baraja pero esta vez no se sustituye la primera.
Cul es la probabilidad de que ambos naipes sean espa-
das?
Solucin.
Ahora A
2
no es independiente de A
1
, porque si se
ha obtenido una espada en la primera extraccin,
la probabilidad de obtener otra en la segunda ser
menor que si se hubiera obtenido un naipe distinto
a espadas en la primera.
{ }
1
1
1
1

1
2
= = A A
El segundo factor es
12/
51
, debido a que slo se tie-
nen 51 naipes despus de la primera extraccin,
cuya probabilidad se supone que es igual y so-
lamente quedan 12 espadas.
10. Como ilustracin final que no involucra juegos
de azar y que involucra ms de dos eventos independientes
considrese el siguiente problema. Suponiendo que la ra-
zn de nios varones es
1/
2

(esto es aproximadamente ver-
dadero) hallar la probabilidad de que en una familia de 6
hijos (a) todos sean de un mismo sexo, (b) 5 sean varones
y una, mujer.
Solucin.
(a) Sea A
1

el evento de que todos los hijos sean
varones y A
2

el evento en que todas sean mujeres.
Como A
1

y A
2
son mutuamente excluyentes
P{A1 o A2}=P{A1} + P{A2}
Dado que los 6 nacimientos puede suponerse que
son 6 eventos independientes respecto al sexo se
sigue, utilizando la versin ms general de la fr-
mula de multiplicacin, que
{ } { }
6

2


= = A A
{ }
3

6 6

=


= A A o
b) Sea A
1
e
l evento de que el mayor de los hijos sea
mujer y los restantes varones, A
2

el evento de que
el segundo sea mujer y los dems varones, enten-
diendo lo semejante para los eventos A
3
,
A
4
,
A
5
,
A
6
.
Como el evento de tener 5 varones y una nia ocu-
rrir si y solamente si tiene lugar uno

de los 6 even-
tos

mutuamente exclusivos A
1
,...,A
6

se sigue a par-
tir de la definicin de evento compuesto que
P{5 varones y 1 mujer}=P{A
1
}+...+P{A
6
}
Pero,
{ } { }
6
6
2


= = A A
Luego,
{ }
1

1
1
6
=


= m
Aun cuando las reglas precedentes de probabili-
dad se han derivado de la hiptesis de que todos
los resultados posibles del experimento en cues-
tin se espera que ocurran con la misma frecuen-
cia relativa, las reglas son vlidas para experimen-
tos ms generales. Pueden, incluso, aplicarse a
eventos relacionados con experimentos en los que
el nmero de resultados posibles es infinito.
11. Una caja que contiene dos bolas rojas y una
blanca y otra caja que contiene dos bolas rojas y dos blan-
cas. Se selecciona una caja al azar y se extrae una bola
de ella. Si la bola extrada es roja cul es la probabili-
dad de la primera caja?
Solucin.
Sea A el evento de escoger la primera caja y sea A
el evento de extraer una bola roja. Entonces el pro-
blema es calcular la probabilidad condicional
P{A
1
|A
2
}. Ya que la frase al azar quiere decir que
ambas cajas tienen la misma probabilidad de ser
escogidas, se sigue que la probabilidad de escoger
la primera caja es
1/
2
, y que la de escoger la segun-
da caja es igual. Usaremos la siguiente frmula
184
6
Probabilidad
Puede efectuarse el clculo del numerador as
{ }
{ }
2
2
2
A
A A
A A

=
El denominador, P{A
2
}, puede calcularse conside-
rando las dos maneras mutuamente excluyentes
en que A
2

puede ocurrir, esto es, escoger la primera
caja y luego una bola roja; o bien, escoger la segun-
da caja y luego una bola roja. P{A
2
} estar dado
por la suma de las probabilidades de los dos casos
mutuamente excluyentes; entonces,
{ } { }
3

2 2
= = = A A A A
{ }
1

1
2
= + = A
{ }
7

1
= =
A
A A
12. Para detectar cierta enfermedad rara se ha
perfeccionado una prueba a tal grado que mediante esta es
posible descubrir dicho mal en el 97% del total de indivi-
duos afectados. Supongamos, adems, que cuando se aplica
a individuos sanos, en el 5% de ellos se diagnostica de
manera errnea en el sentido de afirmar que han contra-
do el mal. Finalmente, supongamos que cuando se ensaya
en individuos que padecen alguna otra enfermedad ms
benigna, en el 10% de ellos se diagnostica incorrectamen-
te. Se sabe que los individuos de los tres tipos aqu consi-
derados se presentan en una poblacin suficientemente
grande, en cantidades que equivalen al 1 %, 96% y 3%,
respectivamente. El problema es calcular la probabilidad
de que un individuo de dicha poblacin, escogido al azar y
al cual se le aplique la prueba, en realidad tenga la enfer-
medad rara cuando la prueba as lo indique.
Solucin.
Aqu, en la primera etapa, hay tres eventos e
1
,
e
2

y
e
3

correspondientes a los tres tipos de individuos
que forman la poblacin. Sus probabilidades co-
rrespondientes son P{e
1
}=0.01, P{e
2
}=0.96 y
P{e
3
}=0.03. En la segunda etapa hay dos even-
tos, O
1

y O
2
, correspondientes al resultado de la
prueba respecto de si el individuo est o no enfer-
mo. Las probabilidades condicionales estn dadas
por P{O
1
|e
1
}=0.97, P{O
1
|e
2
}=0.05, y
P{O
1
|e
3
}=0.10. En trminos de esta notacin, el
problema es calcular P{e
1
/0
1
}. Sustituyendo estas
probabilidades directamente en la frmula de Ba-
yes, se obtiene la siguiente respuesta:
{ } 1
1 1
1
1 1
=
+ +
= O
Este resultado es bastante sorprendente, ya que
demuestra que solamente el 16% de los individuos,
para los cuales la prueba indic que estaban afec-
tados por la enfermedad, realmente estaban en-
fermos, siempre y cuando la prueba se haya apli-
cado a una poblacin muy grande. El restante 84%
de los individuos, a los cuales se les diagnostic
incorrectamente, habr sufrido durante cierto tiem-
po una angustia mental debida a la creencia de
tener la enfermedad, hasta que otras pruebas
revelaron el error del diagnstico. Tambin pudie-
ron mostrarse resentidos ante la necesidad de su-
jetarse a ms pruebas que en realidad no eran ne-
cesarias. Por consiguiente, un clculo como el
anterior podra indicar a las autoridades locales la
necesidad de pensarlo bien antes de ordenar di-
cha prueba masiva.
13. Supngase que se sabe que el 10% de los obre-
ros de una fbrica estn clasificados como propensos a
sufrir accidentes y que 0.6 es la probabilidad de que un
obrero de ese grupo sufra al menos un accidente durante
un periodo de un ao, en tanto que la probabilidad de que
un obrero que no pertenece a ese grupo sufra un accidente
es de 0.3. Basndose en esa informacin, cul es la pro-
babilidad de que un obrero que ha sufrido al menos un
accidente en dos aos consecutivos sea clasificado dentro
del grupo de obreros propensos a sufrir accidentes?
185
Estadistica 1
Solucin.
El rbol del problema es el siguiente, donde A y N
denotan, respectivamente, el haber sufrido y el no
haber sufrido algn accidente durante ese ao:

Si A
1

representa el ser propenso a accidentes y A
2
representa el haber sufrido accidentes en dos aos
consecutivos, entonces el problema es evaluar
P{A
1
A
2
}, Aqu P{A
1

y

A
2
}=(0.1)(0.6)(0.6) y
P{A2}=(0.1)(0.6)(0.6)+(0.9)(0.3)(0.3); de ah que
{ } 3
3

3 3

2
= =
+
= A A
De este resultado se desprende que no se puede
adoptar esta clasificacin de obreros propensos a
sufrir accidentes, ya que slo 1/3 de los obreros que
han sufrido al menos un accidente en dos aos con-
secutivos, pertenecen al grupo propenso.
14. Suponga que en una oficina de 50 empleados se
debe escoger a diez para clasificarlos como ejecutivos. Se
darn tres premios en una fiesta al final del ao. Cul es
la probabilidad de que cuando ms un solo ejecutivo gane
premio? Esto sera deseable por razones de ndole moral.
Solucin.
De la regla de adicin se sigue que la probabilidad
deseada estar dada por la suma de la probabilidad
de 0 premios en el grupo de los ejecutivos y 1 pre-
mio en el mismo grupo. El nmero total de formas
de dar tres premios a cincuenta individuos es igual
al nmero de comits de tres personas que puede
seleccionarse entre cincuenta

individuos, que est
dado por

50
C
3
.
Este es, por lo tanto, el nmero total
de puntos de muestra en el espacio de muestreo. El
nmero de estos puntos de muestra que corres-
ponde al evento de 0 premios en el grupo de los
ejecutivos es igual al nmero de maneras de otor-
gar tres premios a cuarenta individuos (no ejecuti-
vos), que est dado por

40
C
3
.
As,
{}
3
3
0
C
C
=
Ahora bien el nmero de maneras en que se pue-
den dar un premio al grupo ejecutivo y 2 premios a
los otros puede calcularse como a continuacin.
Dado que slo un ejecutivo de entre los 10 disponi-
bles ha de recibir un premio, existen

10
C
1

maneras
de elegir ese ejecutivo. Dado que 2 de los 40 indivi-
duos no ejecutivos deben recibir premios, hay 40
maneras de seleccionar esos dos individuos. Pero
por el principio fundamental de conteo, el nmero
total de maneras de efectuar estas dos elecciones
est dado al multiplicar el nmero de maneras de
efectuar las selecciones separadas de este experi-
mento

de seleccin en dos etapas. Por tanto, el n-
mero total de maneras que hay de otorgar un pre-
mio al grupo ejecutivo y 2 premios al no ejecutivo
est dado por
(
10
C
1
)(
40
C
2
)
Este es el nmero total de puntos de muestra que
corresponden a la ocurrencia del evento deseado;
as pues, la probabilidad de que exactamente un
premio caiga en el grupo ejecutivo y dos premios
en el no ejecutivo est dada por
{}
3

1
C
C C


=
186
6
Probabilidad
La probabilidad deseada est dada, luego, por
{} {} 9



9

9



9

3
3
= =

+


=
+
= +
C
C C

Por tanto, es bastante probable que el grupo de los
no ejecutivos gane al menos dos de los premios. En
vista de la probabilidad, cabra dudar de la honesti-
dad del sorteo si los ejecutivos ganaran ms de un
premio.
15. Se han alterado dos dados sustituyndoles la cara
que tiene un punto por una cara que tiene dos puntos. De
manera que cada uno de los dados tiene dos caras de dos
puntos, pero no tiene cara de un punto. Se tiran una vez
ambos dados. Suponiendo que pueden distinguirse entre s,
resuelva los siguientes problemas: (a) Construya un espa-
cio de muestreo para el experimento. (b) Asigne probabili-
dades a los puntos del espacio de muestreo. (c) Empleando
la definicin de evento compuesto, calcule la probabilidad
(i) de obtener un total de 6 puntos en los dos dados; (ii) de
que por lo menos uno de los dados muestre un dos; y (iii) de
que por lo menos uno de los dados muestre un dos, sabien-
do que en el otro dado no se obtuvo un nmero mayor de 4.
Solucin.
a) Un espacio de muestreo adecuado es el de los
siguientes 25 puntos marcados con el resultado de
cada uno de los dos dados:
22 32 42 52 62
23 33 43 53 63
24 34 44 54 64
25 35 45 55 65
26 36 46 56 66
b) Puesto que se supone que los dos dados se com-
portan de la misma manera que dos dados norma-
les, para los cuales se construy el espacio de mues-
treo ilustrado en la Tabla 6.1., en donde a cada punto
se le haba asignado la probabilidad de
1/
36
, las pro-
babilidades asignadas aqu deben estar de acuerdo
con aqullas. Esto es, como aqu el evento 22
corresponde al evento compuesto que consiste de
los eventos simples 11 , 12, 21 y 22 de la Tabla
6.1., en el presente espacio de muestreo al punto
22 debe asignrsele

una probabilidad de
4/
36
.
A cada
uno de los restantes puntos de este espacio que
tengan la cifra 2 en su marca debe asignrseles la
probabilidad
2/
36

porque ellos estn compuestos de
dos eventos simples tomados de la Tabla 1. A to-
dos los dems puntos debe asignrseles la proba-
bilidad
1/
36

porque no difieren de los puntos corres-
pondientes en la Tabla 6.1.
c) Si A representa el evento de obtener un total de
6, observando el espacio de muestreo puede verse
en (a) que A est compuesto de los tres puntos 24,
33 y 42; por consiguiente, aplicando la definicin
de evento compuesto y empleando las probabili-
dades asignadas en (b) a dichos puntos, se infiere
que
{ }
3

= + + = A
ii) Si B denota el evento de obtener cuando me-
nos un 2 se observa que B consiste de los eventos
simples 22, 23, 24, 25, 26, 32, 42, 52 y 62. Segn
el inciso (b), al punto 2 se le haba asignado la pro-
babilidad
4/
36
y el resto de dichos puntos la proba-
bilidad de
2/
36
;
por consiguiente, como stos son
ocho, se tiene
{ }
9

= + = B
iii) Si C denota el evento de obtener al menos un
2, y D el evento de obtener un nmero no mayor
que 4, se ve que D consiste en los eventos sim-
ples 22, 23, 24, 32, 33, 34, 42, 43 y 44. De estos
puntos, solamente 22, 23, 24, 32 y 42 corres-
187
Estadistica 1
ponden tambin a C; as, pues, de acuerdo con la
asignacin de probabilidades en (b) se infiere que
{ }
9

= + + = D
{ }
3

= + = D
{ }
4

= = D
16. Un departamento de investigacin de merca-
dotecnia estudia la lealtad a la marca de los consumido-
res de su producto, la marca B. Los estudios indican que
los consumidores como grupo tienen un patrn de com-
portamiento ms bien fijo respecto a la eleccin de mar-
ca alternativa en compras repetidas. Supongamos que el
60% de los compradores de la marca (A) vuelven a com-
prar la marca A en la siguiente ocasin y que el 70% de
los compradores de B vuelven a comprar la marca B en
su siguiente compra. Supongamos que cada uno de ellos
compra A o bien B y que la frecuencia de compra es la
misma en ambos casos. Cul es la probabilidad de que
un cliente elegido al azar comprara A en su siguiente
compra si inicialmente las marcas A y B dividan el
mercado en partes iguales?
Solucin.
Hay dos tipos de compradores de la marca A: un
comprador de A que vuelve a comprar A y un
comprador de B que cambia a la marca A. S los
subndices 1 y 2 representan el primer momento
y el segundo en la compra, entonces
P{A
2
}= P{A
1
} P{A
2
|A
1
} + P{B
1

} P{A
2
|B
1
}
=(0.50)(0.60)+(0.50)(0.30) = 0.45
17. Una caja contiene las siguientes cinco cartas:
el as de espadas, el as de bastos, el dos de corazones, el
dos de diamantes y el tres de espadas. El as se considera
como un uno. Las espadas y los bastos son negros, mien-
tras que los corazones y los diamantes son rojos. De esta
caja se extraen dos cartas sin reemplazar la primera carta
antes de la segunda extraccin. Empleando las frmulas
de adicin y multiplicacin calcule la probabilidad de que
(a) 4 ambas cartas sean rojas, (b) la primera carta sea un
as y la segunda un dos, (c) ambas cartas sean del mismo
color, (d) una carta sea de espadas y la otra sea de bastos,
(e) se obtenga un total de 4 puntos entre las dos cartas, (f)
5 se obtenga exactamente un as, sabiendo que las dos car-
tas son negras.
Solucin.

a) Aplicando la frmula bsica de la multiplicacin
de probabilidades y considerando el experimento
en dos etapas, P{RR}=
2/
5
.1/
4
=
1/
10
b) Aplicando la misma frmula, P{A
2
}=
2/
5
.2/
4
=1/5
c) Los dos eventos, RR y NN, constituyen las dos
maneras mutuamente excluyentes en que el even-
to deseado puede ocurrir; entonces, aplicando la
regla de la adicin, se ve que la probabilidad est
dada por
{ } { } { }
5

= + = + = NN NN
d) Los eventos EB y BE satisfacen la condicin pe-
dida; entonces,
5

= + = + =
e) Se obtiene un total de 4 si ambas cartas son dos
o si una carta es tres y la otra uno. Empleando
subndices para indicar los nmeros que tengan las
cartas, podemos representar de la siguiente mane-
ra a los eventos que satisfacen la condicin reque-
rida. C
2
D
2
,
D
2
C
2
,
E
3
E
1
,
E
1
E
3
,
E
3
B
1
,
B
1
E
3
.
Como stas
son las maneras mutuamente exclusivas en que
puede ocurrir el evento deseado y como cada una
de ellas posee la misma probabilidad, esto es,
1/
5
. 1/
4
=
1/
20
,
se infiere que
P{ un total de 4 } =
6/
20
=
3/
10
188
6
Probabilidad

f) Sea A
1

el evento de que ambas cartas sean ne-
gras y A
2

el evento de obtener exactamente un as.
Entonces P{A
2
|A
1
} es la probabilidad requerida
para resolver el problema. Segn la frmula de la
probabilidad condicional, para esto necesitamos
calcular P{A
1
} y P{A
1
y A
2
}.
Primero P{A
1
} =
3/
5
.2/
4

=
3/
10
.
Ahora bien, ocurren
tanto A
1

como A2 si ocurre alguno de los siguientes
eventos mutuamente excluyentes: E
1
E
3
,
E
3
E
1
,
B
1
E
3
,
E
3
B
1
.
Como cada uno de estos cuatro eventos tiene
una probabilidad de
1/
5
. 1/
4
=1/
20
,
se sigue que P{A
1
y
A
2
} =
4/
20
=
1/
5
.
Entonces,
{ }
3

2
= = A A

18. Dos jugadores se enfrentan en un playoff en
donde el que primero gane dos juegos es declarado vence-
dor. Supongamos que los jugadores A y B tienen la misma
oportunidad de ganar un juego cualquiera. (a) Trazar un
rbol que muestre los resultados posibles. (b) Calcular la
probabilidad para cada uno de estos resultados. (c) Si A
gana el primer juego, cul es la probabilidad de que B
an gane el playoff?
b) Las probabilidades asociadas con los puntos de
muestra empezando con el de arriba son
1/
4
, 1/
8
, 1/
18
,
1/
8
, 1/
18
, 1/
4.
c) El espacio de muestreo condicional que aqu se
necesita consiste en la parte superior del rbol
empezando en la primera ramificacin de la rama A
principal. La probabilidad de BB est dada por
.
1/
2
=
1/
4
19. Suponga que el 80% de los compradores de
autos usados son dignos de crdito. Suponga adems que
la probabilidad de que un comprador digno de crdito ten-
ga cuenta bancaria es de 0.7 pero que esta probabilidad
es de 0.4 para uno no digno de crdito. (a) Construya un
rbol de probabilidad para este problema. (b ) selo para
calcular la probabilidad de que un individuo con una cuenta
bancaria. (c) No sea digno de crdito (b). (c) Use este rbol
para calcular la probabilidad de que un solicitante de cr-
dito que no tiene cuenta bancaria (n) sea digno de crdito
(G).
Solucin.
b)
c)
20. Una caja de 15 repuestos para un cierto tipo de
mquina contiene 10 en buen estado y 5 defectuosos. Si de
la caja se escogen 3 al azar, cul es la probabilidad de
que (a) todos estn en buen estado, (b) todos sean defectuo-
sos, (c) de que dos estn en buen estado y uno defectuoso y
(d) de que al menos dos estn en buen estado? Las solucio-
nes se expresarn en trminos de smbolos de combinacin
y despus se evaluarn.
{ }
8

8

=
+
= C
{ }
3

3
3
=
+
= N
189
Estadistica 1
a)
b)
c)
d)
9


9




3
3
=


= =
C
C
9





3
3
=


=
C
C
9


9






3

=

= =
C
C C
9
9
9

9

= +
191
Estadistica 1
Unidad 7
Introduccin
a las Distribuciones
de Probabilidad
192
7
Introduccin a las Distribuciones de Probabilidad
193
Estadistica 1
OBJETIVOS
INTRODUCCIN
* Identificar la distribucin de probabilidad normal
como una funcin y adquirir habilidad en su mani
pulacin ayudados por la tabla de distribucin, la
calculadora o el software estadstico.
Este captulo relaciona la probabilidad y las distribuciones
de frecuencia al analizar las distribuciones de probabilidad.
Slo se estudiar en este curso la distribucin normal ya
que es una de las que ms nos sirven para determinar si-
tuaciones, y por que nos sirve especialmente para abordar
el estudio de las funciones de probabilidad. Para abordar este
captulo productivamente es indispensable haber superado
los anteriores, y a la vez es prerrequisito para el prximo
captulo.
Una distribucin de probabilidad la podemos concebir como
una distribucin terica de frecuencia, es decir, es una distri-
bucin que describe como se espera que varen los resulta-
dos. Dado que esta clase de distribuciones se ocupan de las
expectativas son modelos de gran utilidad para hacer infe-
rencias y tomar decisiones en condiciones de incertidum-
bre.
Para desarrollar este captulo es necesaria la calculadora o
el computador, su objeto es bsicamente procedimental, sin
embargo requiere del bagaje conceptual de los captulos
anteriores. Se debe lograr calcular el rea bajo la curva nor-
mal (o porcentaje de probabilidad) a partir de la distancia en
unidades estndar desde la media, o a la inversa, lograr de-
terminar la desviacin desde la media dentro de la cual se
espera un determinado porcentaje o rea. Lo anterior para
luego determinar si una hiptesis logra ubicarse dentro o fuera
de un porcentaje de certeza.
194
7
Introduccin a las Distribuciones de Probabilidad
195
Estadistica 1
Distribuciones de Probabilidad
Las distribuciones de probabilidad estn re-
lacionadas con las distribuciones de frecuen-
cias. Una distribucin de frecuencias terica
es una distribucin de probabilidades que
describe la forma en que se espera que va-
ren los resultados. Debido a que estas dis-
tribuciones tratan sobre expectativas de que
algo suceda, resultan ser modelos tiles para
hacer inferencias y para tomar decisiones en
condiciones de incertidumbre.
Una distribucin de frecuencias es un lista-
do de las frecuencias observadas de todos
los resultados de un experimento que se
presentaron realmente cuando se efectu el
experimento, mientras que una distribucin
de probabilidad es un listado de las probabi-
lidades de todos los posibles resultados que
podran obtenerse si el experimento se lleva
a cabo.
Las distribuciones de probabilidad pueden
basarse en consideraciones tericas o en una
estimacin subjetiva de la posibilidad. Se
pueden basar tambin en la experiencia.
Tipos de distribuciones de probabilidad.
Las distribuciones de probabilidad se clasifican como continuas
y discretas. En la distribucin de probabilidad discreta est per-
mitido tomar slo un nmero limitado de valores.
En una distribucin de probabilidad continua, la variable que
se est considerando puede tomar cualquier valor dentro de
un intervalo dado.
Las distribuciones continuas son una forma conveniente de
presentar distribuciones discretas que tienen muchos resulta-
dos posibles, todos muy cercanos entre s.
Variable aleatoria.
Frecuentemente el resultado de un experimento aleatorio se
denota con un nmero:
el resultado de lanzar un dado, el nmero de unidades defec-
tuosas entre 10 unidades seleccionadas, el tiempo que hay que
esperar para que se presente una falla en un circuito, el nme-
ro de estaciones de una red de computadoras que requieren la
atencin del servidor de la red en un momento dado, el nme-
ro de personas en una comunidad que requieren atencin
mdica en un da especificado, el peso sumado de las personas
que estn en un elevador en un momento determinado del
da, la cantidad en dinero de lo transportado en un camin
antes de que sufra una descompostura, etc.
196
7
Introduccin a las Distribuciones de Probabilidad
?
A un nmero tal, le llamamos variable aleatoria. Ponga aten-
cin al hecho de que una variable aleatoria no es una variable
en el sentido usual. Las variables que estamos acostumbrados
a manejar son, por ejemplo: el peso de un cohete que va que-
mando el combustible que lo impulsa, la distancia del piso a un
objeto que cae hacia l, la concentracin de una solucin den-
tro de un tanque conforme pasa el tiempo, etc. En los ejem-
plos anteriores el valor de la variable puede cambiar con el
tiempo, pero es predecible a partir de las leyes de la mecnica,
la qumica, la hidrulica o alguna otra ciencia. Con una variable
aleatoria la situacin es enteramente diferente. El valor de una
variable aleatoria no se puede conocer con exactitud de ante-
mano a la realizacin del experimento. Qu otros ejemplos de
variables aleatorias se le ocurren adems de los mencionados arriba? Al
contestar esta pregunta tenga en cuenta que el azar debe jugar
algn papel en la medicin de la variable y que su valor no
debe ser predecible.
Una variable aleatoria presenta dos caractersticas importan-
tes:
1. Una coleccin (conjunto) de valores posibles al que llamamos
imagen de la variable aleatoria (antes lo llambamos espacio mues-
tral).
2. Una probabilidad asociada a los posibles resultados la cual
queda expresada mediante una funcin de probabilidad.
Las variables aleatorias que tienen un conjunto de posibles va-
lores discreto, se llaman discretas. Estas variables son el resul-
tado de contar.
El hecho de que una variable aleatoria nos
interesa cuando an no tiene un valor espe-
cfico, nos obliga a utilizar una notacin ex-
traa al referirnos a ella. Denotamos con le-
tras maysculas a las variables aleatorias y
con minsculas a los valores que contem-
plamos para ellas.
Resumiendo entonces, tenemos que una
variable es aleatoria si toma diferentes valo-
res como resultado de un experimento alea-
torio. Puede ser discreta o continua. Si pue-
de tomar slo un nmero limitado de valores,
entonces es una variable aleatoria discreta.
En el otro extremo, si puede tomar cualquier
valor dentro de un intervalo dado, entonces
se trata de una variable aleatoria continua.
Se puede pensar en una variable aleatoria
como un valor o una magnitud que cambia
de una presentacin a otra, sin seguir una
secuencia predecible. Los valores de una
variable aleatoria son los valores numricos
correspondientes a cada posible resultado
de un experimento aleatorio.
La distribucin de probabilidad de una va-
riable aleatoria proporciona una probabili-
dad para cada valor posible, y estas proba-
bilidades deben sumar 1.
Cules de las variables aleatorias mencionadas arriba
son discretas? Ciertamente el peso de las personas en el eleva-
dor no es discreto, pero entre las otras cules son discretas?
Por otra parte, las variables aleatorias cuyos valores posibles se
encuentran en cualquier parte de un intervalo, se llaman conti-
nuas. Estas variables son el resultado de medir.
197
Estadistica 1
Valor esperado de una variable
aleatoria.
El valor esperado es una idea fundamental
en el estudio de las distribuciones de proba-
bilidad.
Para obtener el valor esperado de una varia-
ble aleatoria discreta, se multiplica cada va-
lor que la variable puede tomar por la pro-
babilidad de presentacin de ese valor y
luego se suman esos productos. Es un pro-
medio pesado de los resultados que se es-
peran en el futuro. El valor esperado pesa
cada resultado posible con respecto a la fre-
cuencia con que se espera se que presente.
En consecuencia, las presentaciones ms
comunes tienen asignadas un peso mayor
que las menos comunes.
El valor esperado tambin puede ser obte-
nido a partir de estimaciones subjetivas. En
ese caso, el valor esperado no es ms que la
representacin de las convicciones persona-
les acerca del resultado posible.
En muchas situaciones, encontraremos que
es ms conveniente, en trminos de los cl-
culos que se deben hacer, representar la dis-
tribucin de probabilidad de una variable
aleatoria de una manera algebraica. Al ha-
cer esto, podemos llevar a cabo clculos de
probabilidad mediante la sustitucin de va-
lores numricos directamente en una frmu-
la algebraica.
El valor esperado de una variable aleatoria
discreta es un promedio pesado del valor de
cada resultado posible multiplicado por la
probabilidad de dicho resultado. Aunque
existen muchos valores diferentes posibles
que la variable aleatoria puede tomar, el valor esperado es slo
un nmero.
Si tomamos como variable aleatoria el resultado (suma) de lan-
zar dos dados, desde el punto de vista de la probabilidad, el
nmero resultante nos interesa antes de que realicemos el ex-
perimento. Conocido el resultado, ya no es interesante (al me-
nos, no para la probabilidad). La imagen de esta variable alea-
toria es S = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}. Llamando X al
resultado del experimento, podemos contemplar el evento de
que X sea igual a x, donde x es cualquier elemento de S. Claro
que nos resultar muy interesante saber cosas como P(X = x)
para los diferentes valores de x en S; por ejemplo,
P(X = 6) =
5
/
36
[esto se lee: la probabilidad de que X sea igual
a seis es un sexto]. Puede Ud. mostrar que P(X = 8) =
5
/
36
?
Siguiendo con el ejemplo de los dos dados, el lanzar dados
para ver que nmero cae no es muy apasionante que digamos,
acompaemos los dados con un tablero de oca o de serpien-
tes y escaleras o de turista o de backgamon o algn otro juego
interesante. Ya puestos a jugar turista o monopolio, es natural
que nos interesen otro tipo de eventos. Podramos estar inte-
resados en saber si el resultado es menor que 8:P(X < 8) =
21
/
36
Puede Ud. ver por qu?; que el resultado sea desde 4 hasta
menos que 9: P(3 < X < 9) =
23
/
36
Por qu?; tambin pode-
mos estar interesados en que X sea distinta de 7: P(X distinto
de 7) = 1 - P(X = 7) = 1 -
1
/
6
=
5
/
6
.
198
7
Introduccin a las Distribuciones de Probabilidad
Naturalmente esta notacin se extiende de manera natural a
todo tipo de intervalos y desigualdades. Regresando a donde
estbamos, a la funcin: f(x) = P(X = x) se le llama funcin de
probabilidad de X.
Esta funcin es una funcin ordinaria de las que estudiamos en
los cursos de matemticas; no tiene nada de aleatorio. Dicho
de otra forma, una vez determinados los valores de las proba-
bilidades, la funcin de probabilidad es una funcin comn y
corriente, tiene su dominio, su codominio, su grfica, puede
ser inyectiva, etc.
Hay algunos hechos importantes respecto a esta funcin:
1. Para una variable aleatoria discreta los valores posi-
bles son los nicos para los cuales esta probabilidad es diferen-
te de cero. Dicho de otra forma, no nos hace dao ampliar el
dominio de la funcin de probabilidad a todos los reales, pero
va a valer cero casi siempre excepto en un conjunto discreto
de puntos.
2. El valor de la funcin de probabilidad depende esen-
cialmente de la variable aleatoria a la que nos referimos, cuan-
do no sea claro a cul variable nos referimos, es conveniente
poner el smbolo de la variable como subndice para la funcin:
f
X
(x).
Esta costumbre puede causar estragos en la comprensin de
los novatos, est Ud. prevenido. Qu querr decir f
Y
(w)?
Regresando al ejemplo de los dados, cambiemos el turista por
otro juego. En este juego Ud. gana si el resultado es par y pier-
de si es nn; la cantidad que pierde o gana ser el doble del
resultado. Aqu, su ganancia (positiva si Ud. gana, negativa si
pierde) es una variable aleatoria Y, su imagen es
S = {-22, -18, -14, -10, -6, 4, 8, 12, 16, 20, 24}
Puede Ud. terminar la tabla de la funcin de probabi-
lidad de Y?: Y -22 -18 -14 -10 -6 4 8 12 16 20 24 f(y)
Una vez que haya llenado la tabla anterior,
calcule la probabilidad de que gane Ud. ms
de 8 pesos; la probabilidad de que pierda
ms de 10 pesos; la probabilidad de que su
ganancia est entre -10 y +16 inclusive; la
probabilidad de que su ganancia o prdida
exceda a 9 pesos.
Una funcin de probabilidad de una variable
aleatoria discreta, para ser correcta, debe
satisfacer dos propiedades: f(x) debe ser
siempre mayor o igual a 0, y la suma de f(x)
para todos los valores de x debe dar 1.
Funcin de distribucin.
Cuando la imagen de una variable aleatoria
es un intervalo real decimos, segn haba-
mos quedado, que la variable es continua.
La matemtica que utilizamos para las va-
riables continuas es diferente a la de las dis-
cretas Por eso empezamos nuestro estudio
con las discretas. An no acabamos con las
199
Estadistica 1
variables discretas, todava nos faltan por
discutir temas muy importantes. Pero antes,
hablaremos de una nocin que es comn a
las discretas y a las continuas.
Una funcin muy til en el clculo de proba-
bilidades de una variable aleatoria es la fun-
cin de distribucin. Esta funcin se define
de igual forma para continuas y discretas:
F (x) = P(X = x) Para no confundirnos con la
notacin, suele escribirse tambin as:
F (t) = P(X = t)
La funcin de distribucin tiene las siguien-
tes propiedades:
1. F(en menos infinito) = 0 ; F(en ms
infinito) = 1
2. F es una funcin no decreciente.
3. F sirve para calcular probabilidades
as P( a < X b ) = F(b) - F(a)
Para que esta ltima propiedad nos sea de utilidad deberamos
tener la distribucin ya calculada. Para muchas variables alea-
torias de uso comn, las distribuciones ya estn calculadas y
tabuladas (una hoja de clculo, como EXCEL ya incluye prcti-
camente todas las distribuciones que veremos en nuestros
cursos de estadstica para Administradores Pblicos)
Para las variables aleatorias discretas hay que tener cuidado
con el hecho de que la primera desigualdad es estricta y la
segunda n. Por ejemplo si la imagen de X son todos los ente-
ros, P(2<X=5) se puede calcular haciendo la resta F(5)-F(2).
Pero la probabilidad P(2<X< 5) se obtiene restando F(5)- F(1)
(Por qu?). Cmo calcula Ud. P(2 X<5)?
Las 4 propiedades que se sealaron arriba definen a una fun-
cin de distribucin, de modo que para saber si una funcin es
una distribucin o n, basta ver que las cumpla.
Considere el siguiente ejemplo. para x > 0
Se trata de una variable aleatoria continua, cuya imagen son
los nmeros positivos(Por qu?). Lo que Ud. tiene que hacer
es:
Mostrar que es una distribucin y usarla para calcular
P(X=1.0), P(0.7<X<1.0), P(X<0.7), P(X>1.0 X=0.4).
Variables aleatorias continuas.
Las variables aleatorias que hemos estudiado hasta ahora tie-
nen la propiedad de que son el resultado de contar; sus valores
posibles varan en forma discreta (a saltos). Hay otro tipo de
variables aleatorias, las que son el resultado de un proceso de
medir; sus valores posibles cubren todo un intervalo en los
reales. Cuando la imagen de una variable aleatoria es un inter-
valo real decimos que la variable es continua. La matemtica
que utilizamos para las variables continuas es diferente a la de
las discretas aunque los conceptos probabilsticos sean los mis-
mos de manera que en nuestro estudio de las continuas utili-
zaremos este paralelo con las discretas.
200
7
Introduccin a las Distribuciones de Probabilidad
Densidad de una variable aleatoria continua.
El primer hecho de importancia es que una v. a. (variable alea-
toria) continua tiene probabilidad cero de tomar un valor espe-
cfico, slo tiene valores positivos para intervalos:
P( X = a ) = 0 para cualquier valor de a.
Para calcular la probabilidad de que X est en un intervalo (a,b)
o (a,b] o [a,b) o [a,b] debemos hacer uso de una funcin aso-
ciada a la variable aleatoria, la funcin de densidad de X. Las
variables aleatorias discretas tienen la funcin de probabilidad,
las continuas tienen funcin de densidad.
Esta funcin de densidad tiene las siguientes caractersticas:
S (x) = 0 la integral de (x) vale 1
La integral a la que nos referimos es la integral definida sobre
toda la imagen de la variable aleatoria.
Note que estas caractersticas son el anlogo continuo de las
de la funcin de probabilidad de una v. a. discreta. Es decir la
probabilidad nunca es negativa y la suma de todas las probabi-
lidades es uno. Por este motivo, es frecuente utilizar el nombre
de densidad tanto para esta funcin como para la funcin de
probabilidad de una v. a. discreta. Adems, como en el caso
discreto, la funcin de densidad est ligada a la v. a. X de modo
que cuando sea necesario aclarar a cul densidad nos referi-
mos podemos usar la notacin
X
(x), ponindole el subndice X
a la .
Clculo de probabilidades con la densidad.
Para obtener la probabilidad de un intervalo, hacemos la inte-
gral de la densidad sobre el intervalo del que queremos calcu-
lar la probabilidad. De nuevo, la integral a la que nos referimos
es una integral definida cuyos extremos son los del intervalo.
Para escribir la integral que da la probabilidad de que X est
entre 3 y 44.2 usamos la siguiente notacin:
Escriba en forma de integra-
les las siguientes: P(a < X < a + h),
P(2.2 < X 5), P(X>8), P(X 15),
P(X < 2 X > 3)
Considere un par de ejercicios que le
servirn para apreciar las implicaciones
de lo anterior. Como primer ejemplo
tome el siguiente.
Sea X una v. a. continua cuya
densidad es: f(x) = ax, para x en [3, 7];
a es una constante necesaria para que
la integral de f(x) definida de 3 a 7, sea
igual a uno. Muestre que
a =
1
/
20
= 0.05, adems muestre que
P(3 < X <= 5) = 0.40
Otro ejercicio ms es el si-
guiente. La densidad es: f(x)=0.025x
para x en (3,7) k x2 si x est en [7,10) 0
en cualquier otra parte muestre que k
= 1/438 y muestre tambin que
P(6 X 8) = 0.3155
En los dos ejemplos anterio-
res calcule las funciones de distribucin
correspondientes.
Considere el siguiente ejem-
plo. F (x) = 1- e
(-0.7x)
; para x > 0, mues-
tre que es una distribucin y sela para
calcular P(x =1.0), P(0.7 < X < 1.0),
P(X < 0.7), P(X>1.0 X=0.4).
( ) x
x

201
Estadistica 1
?
Intentemos racionalizar la nocin de dis-
tribucin de una forma ms elemental.
Consideremos los siguientes problemas:
1. De los municipios de Colombia,
que porcentaje tiene un volumen de ingre-
sos propios per cpita inferiores al de su
municipio?
2. Cul es el nivel de ingreso men-
sual mximo que debe tener un hogar para
entrar en un programa social del gobierno,
si se requiere que quienes conformen este
grupo correspondern al 10% de familias
con el ingreso ms bajo?
Si usted quiere responder al pro-
blema 1, qu informacin necesita cono-
cer? Y si tuviera toda la informacin nece-
saria, qu pasos debe seguir para resolver
el problema?
Ahora, si usted quiere responder
al problema 2, qu informacin necesita
conocer? Y si tuviera toda la informacin
necesaria, qu pasos debe seguir para re-
solver el problema?
Si esta leyendo este prrafo, ya debe haber respondido los
dos tems anteriores. En la respuesta que dio referente a la
solucin del problema 1, posiblemente su respuesta se aproxi-
me mucho a lo siguiente: necesita los datos siguientes,
- Cual es el nivel de ingreso promedio per-cpita de
su municipio.
- Cual es el nivel de ingreso promedio per-cpita de
los municipios del pas.
- El nmero total de municipios del pas.
Teniendo esa informacin, seguira los siguientes pasos para
llegar a la solucin del problema planteado,
- Ordenar los promedios ponderados (en orden as-
cendente o descendente).
- En esa distribucin de los datos, identificar el valor
particular del promedio ponderado que est haciendo de re-
ferencia, (el promedio de su municipio).
- Contar cuantos promedios son menores que la re-
ferencia.
- Establecer que porcentaje respecto del total de
municipios representa el nmero encontrado anteriormente.
202
7
Introduccin a las Distribuciones de Probabilidad
Intentmoslo con cifras, para verificar que tan complejo resul-
ta, aunque vamos a limitarnos a una muestra de 50 munici-
pios. Supongamos que el promedio de ingresos anuales pro-
pios de su municipio es de 850 millones de pesos y los siguientes
datos expresan en cientos de millones de pesos, los ingresos
de los 50 municipios:
Elabore una tabla de distribucin de frecuencias con
estos promedios.
Muestre que el 28% de los municipios tiene un ingre-
so per-cpita superior al tomado como referencia.
En la respuesta correspondiente a la solucin del problema 2,
en forma similar al anterior usted debi encontrar que los da-
tos requeridos son,
- El ingreso mensual de todas las familias del territorio
en estudio.
- El nmero total de tales familias.
Adems, debi llegar a definir como pasos para la solucin del
problema los siguientes:
- Ordenar los ingresos de menor a mayor
- Determinar contando cuantas de las familias consti-
tuyen el 10% con menores recursos.
- Identificar el valor del ingreso de la familia que divide
al grupo en dos uno del 90% y otro del 10%. El valor
de esa estatura nos proporciona la solucin al proble-
ma planteado.
Es de notar que si trabajamos con un grupo relativamente pe-
queo de datos la tarea resulta ser sencilla, no encierra una
dificultad significativa, sin embargo, el muchos casos requeri-
mos tratar con poblaciones muy numero-
sas (infinitas o que se pueden considerar
como infinitas) y esto precisamente justifica
la existencia de la estadstica, cuando tene-
mos una gran cantidad de informacin es a
veces imposible conocerla toda y aunque se
conozca, resulta muy dispendioso intentar
un procedimiento como el que se pens para
los ejemplos.
Otro aspecto a considerar es que los pro-
blemas que necesitamos abordar ya no son
artificiales, los casos de la realidad resultan
mucho ms complejos de trabajar que los
simulados, por lo que se requiere de algn
mtodo que permita abordarlos de manera
eficiente. Existir entonces un comporta-
miento generalizado que permita generar un
modelo adecuado que se pueda aplicar al
estudio de muchos casos?
203
Estadistica 1
Qu variables conoce usted que
tengan un comportamiento similar en
cuanto a la forma de tendencia hacia las
medidas centrales, o en cuanto a la dis-
persin? ?
Busquemos a partir de un ejemplo cual pue-
de ser el modelo que buscamos. Un ejemplo
muy tpico es el de la temperatura de un lu-
gar. Se pretenda determinar la temperatura
promedio de la ciudad de Medelln, las ob-
servaciones recolectadas medidas en C (gra-
dos centgrados) fueron:
Qu tipo de variable estamos tratando?
Cul es el intervalo de datos que toma la variable?
Elabore una tabla de distribucin de frecuencias y
diga Alrededor de cual valor parece agruparse la mayora
de las observaciones?
Cul es la temperatura promedio?
Qu ocurre con los valores de la temperatura a
medida que estos se alejan del valor de la temperatura pro-
medio?
Construya un polgono de frecuencia y diga si pre-
senta algn tipo de simetra.
Observe el rea bajo la curva y diga si el rea a la
derecha de la media es tan grande como la que esta a la
derecha, a partir de ello haga una suposicin acerca del por-
centaje de poblacin de datos inferior a la temperatura pro-
medio. Qu porcentaje es? Y cual es el porcentaje superior
a la temperatura promedio?
?
204
7
Introduccin a las Distribuciones de Probabilidad
Qu relacin de orden existe entre la temperatu-
ra promedio, la temperatura moda y la temperatura media-
na?. Explique la respuesta.
Cul es la medida mas adecuada para medir la
dispersin de los datos en este caso? Cul es la magnitud
de la dispersin?
Cul es el rango de la temperatura y especule
cuantas veces puede caber la desviacin estndar en este?
Lleve los datos a una hoja de clculo (ver anexo
No. 1) y genere de nuevo las estadsticas (Histograma, me-
dia, mediana, moda, desviacin estndar, varianza), si su
hoja de clculo es Microsoft Excel puede usar la opcin [He-
rramientas]/[Anlisis de datos]. Si usa otra hoja de clculo,
necesita consultar el manual correspondiente.
?
Recolecte informacin de las siguientes variables y con ellas
construya los grficos respectivos de las distribuciones de fre-
cuencia correspondientes
- Las estaturas de los estudiantes de su semestre.
- Edad de las madres al momento del parto.
- Edad de ingreso a la universidad de un grupo de 50
estudiantes.
Compare estas y la anterior y diga si existen diferen-
cias significativas en la forma de la grfica.
Lo ms posible es que usted haya encontrado similitudes en la
forma de las grficas de los ejercicios anteriores. Agudice su
observacin de la forma de la distribucin de la variable en los
siguientes ejemplos en los que aumentaremos la cantidad de
observaciones (estas observaciones no incluyen ninguna de las
de la muestra anterior):
205
Estadistica 1
Use la hoja electrnica para lo siguiente: Acumule la
informacin de esta muestra a la de la primera muestra, con el
fin de obtener una de tamao 80. Lleve estos datos a la hoja
de clculo y usando la opcin [Herramientas]/[Anlisis de da-
tos]/[Estadstica descriptiva] e [Histograma] y preferiblemente
imprima los datos y el grfico obtenido para compararlo con el
resultado obtenido anteriormente.
Atencin. Si no dispone en este momento de la hoja de clcu-
lo, no contine por que no se le puede asegurar la compren-
sin del tema. Logre al acceso a una computadora y lleve a
cabo el ejercicio antes de continuar.
La siguiente es una muestra de tamao 120, que tampoco in-
cluye los datos de las dos muestras anteriores.
Acumule esta muestra con las dos anteriores y haga la correspondiente tabla de
distribucin de frecuencias. Con la hoja de clculo usando la opcin [Herramientas]/[Anli-
sis de datos]/[Estadstica descriptiva] e [Histograma] y preferiblemente imprima los datos y
el grfico obtenido para compararlo con los resultados obtenidos anteriormente.
Tome los tres histogramas impresos, una con una lnea los puntos medios del
extremo superior de los rectngulos hasta formar los polgonos de frecuencia correspon-
dientes.
Compare las grficas de las tres distribuciones, que ha generado en Excel, a medi-
da que aumenta la cantidad de informacin, fijndose en la forma de la curva. Disminuye
el nmero de picos? Si se le dificulta la comparacin intente hacer los ejercicios de nuevo
usando el mismo nmero de intervalos de clase, (por ejemplo 10).
206
7
Introduccin a las Distribuciones de Probabilidad
Alrededor de cual temperatura se agrupa el mayor nmero de ob-
servaciones.
Compare la mitad de la curva, de la media hacia la derecha con la
de la media hacia la izquierda. Existe simetra en la curva?
Qu pasa con los valores de las frecuencias mas alejados de la
temperatura promedio?
Aunque ya tenemos 200 datos todava no
tenemos la totalidad de los datos, y nunca
la tendremos, por que estamos tratando
con una poblacin infinita de datos. Supon-
gamos ahora que tenemos todos los datos
posibles y que estos son 4000, es decir es-
tamos suponiendo que la poblacin es fini-
ta. La siguiente ser entonces la tabla de
frecuencias:
El siguiente grfico nos muestra el comportamiento de la varia-
ble temperatura para la poblacin:
Figura 7.1. Histograma para una
poblacin de 4000 mediciones
de temperatura.
207
Estadistica 1
Debemos tener en cuenta que al analizar las diferencias de
forma de las cuatro distribuciones (tres de muestra y una de
poblacin) encontraremos la frecuencia en distintas escalas y
nos puede traer dificultades de interpretacin ya que esta-
mos trabajando con poblaciones distintas: 40, 80, 200 y 4000,
por lo que hubiera sido mejor elaborar la grfica usando no
las frecuencias absolutas sino las relativas. Sin embargo como
tenemos clara la diferencia podemos aprovechar la facilidad
que nos brind la hoja de clculo. De todas maneras se reco-
mienda que de ser posible, por ejemplo si disponemos del
software estadstico adecuado, es mejor generarlas basados
en las frecuencias relativas para estos efectos comparativos.
Si analizamos los datos sobre una tabla se
hace an ms necesario usar las frecuencias relativas
para hacer la comparacin. Observe la siguiente ta-
bla comparativa y diga como se obtuvo dicha tabla.
Compare en la tabla anterior las tres mues-
tras respecto de la poblacin, y diga cual se compor-
ta de manera ms similar a la poblacin y cual me-
nos.
A partir del punto anterior, describa una re-
gla que permita determinar como influye el tamao
de la muestra en su aproximacin al comportamien-
to de la poblacin, es decir que dadas dos o ms
muestras podamos establecer cual de ellas se aproxi-
ma ms al comportamiento de la poblacin.
A partir del ejercicio anterior se espera que usted
haya detectado que:
Los polgonos de frecuencia que usted
dibuj sobre los histogramas se tornan cada vez
ms suaves a medida que aumenta el tamao
de la muestra.
Los valores de la temperatura se van
agrupando alrededor del valor 19,3 C y esta
medida se ubica en el centro del rango de valo-
res de la temperatura.
La frecuencia de los valores de la tem-
peratura tiende a disminuir a medida que se ale-
jan de la temperatura promedio.
La curva tiende a presentar una sime-
tra con respecto a la vertical que pasa por la
temperatura promedio.
La forma de la curva se acerca a la de
una campana que tiene como dimetro el rango
de los datos y la parte alta de esta se ubica exac-
tamente arriba de la temperatura media.
Es fcil aceptar que otras variables
como la estatura de las personas, la presin ar-
terial y el peso; tienen un comportamiento simi-
lar al de la temperatura. Por lo tanto es fcil sos-
pechar la existencia de un modelo con estas
caractersticas.
208
7
Introduccin a las Distribuciones de Probabilidad
Hay una curva que representa la distribucin de estas variables
en poblaciones hipotticamente grandes, esta curva tiene for-
ma de campana y es similar a la siguiente:
Figura 7.2. Grfica de la Distribucin Normal
Esta curva nos brinda informacin sobre las proporciones es-
pecficas de la poblacin, esto es que el rea bajo la curva nos
informa de la probabilidad de ocurrencia de un evento dentro
del intervalo que se mide tal rea. Para determinar la probabili-
dad de que un experimento de cmo resultado de la variable
un evento ubicado entre a y b, determinaremos el rea bajo la
curva que hay desde a hasta b. Vemoslo grficamente:
Figura 7.3. rea bajo la curva normal entre dos puntos.
La distribucin de que estamos hablando ha sido llamada dis-
tribucin normal, por ser la mas usada y a la que asimilan la
mayor parte de las situaciones, tambin es llamada distribu-
cin gaussiana en honor a Gauss, famoso matemtico que la
investig extensamente. Es una distribucin bastante simtri-
ca, muere con bastante rapidez en las orillas y posee una for-
ma similar a la de una campana. Su aplicabilidad se da predo-
minantemente para casos de variable continua y poblaciones
grandes.
La curva de la distribucin normal puede ser generada usando
una complicada frmula que mostraremos solo para satisfacer
posibles curiosidades, por que los valores ms usados ya han
sido calculados y organizados en una tabla para facilitar el tra-
bajo cuando se hace de forma manual (cuan-
do se hace con el software estadstico no
requiere ni la frmula ni la tabla). Ver Anexo
3.
Distribucin Normal
El valor de e es aproximadamente 2.718 y
es la base para los logaritmos naturales.
209
Estadistica 1
Caractersticas de la curva normal.
* El rea total bajo la curva normal el igual
a 1, esto concuerda con la suma de las probabili-
dades de los eventos mutuamente excluyentes de
un espacio muestral que tambin suma 1.
* Por la simetra de la curva tenemos que
el rea situada a la derecha de la media mide 0.5
es decir corresponde al 50% de probabilidad, en
consecuencia el rea de la izquierda es de igual
magnitud.
* En la curva, a lado y lado del promedio,
hay dos puntos especiales llamados puntos de
cambio de concavidad o puntos de inflexin. Es-
tos puntos son los que se asocian a los valores de
la variable cuya distancia al promedio es 1 desvia-
cin estndar.
* El rea bajo la curva normal ubicada en-
tre (-1) y 1 desviacin estndar, es decir entre una
desviacin estndar a la izquierda del centro de la
campana y una desviacin estndar a la derecha
corresponde al 68.27%. Dicho de otra forma, en
un experimento con una variable aleatoria conti-
nua esperamos que el 68.27% de las observacio-
nes se ubiquen en el intervalo que va desde una des-
viacin estndar menos que la media hasta una des-
viacin estndar ms la media.
* Entre (-2) y 2 desviaciones estndar se en-
contrarn el 95.45% de las observaciones.
* Entre (-3) y 3 desviaciones estndar se en-
contrarn el 99.73% de las observaciones.
* Los tres tems anteriores nos permiten con-
cluir que no toda curva acampanada sirve para este
modelo, slo sirve un tipo de curva que se llama cam-
pana de gauss.
* Las anteriores caractersticas se conservan
an cuando se presentes desviaciones estndar dife-
rentes, las cuales slo cambiarn el ancho y el apun-
talamiento de la campana, y no las proporciones del
rea bajo la curva. La curva normal depende de la
media y de la desviacin estndar, as, si tenemos dos
variables se distribuyen normalmente, con la misma
media y diferentes desviaciones estndar, existirn dos
curvas normales, una para cada desviacin estndar.
Figura 7.4. Areas bajo la curva normal dependiendo de las des-
viaciones estndar.
210
7
Introduccin a las Distribuciones de Probabilidad
La medida de la distancia entre el centro de la campana y un
punto determinado a lo largo del eje horizontal nos indica en
trminos de desviaciones estndar cuan alejados estamos de
la media, la variable que toma estas medidas es continua y se
llama variable normalizada o de unidades estndar. Aplique-
mos esto al ejemplo anterior. La distribucin de frecuencias
para las temperaturas promedio de la ciudad de Medelln, ana-
lizada con la opcin [Herramientas]/[Anlisis de datos]/[Esta-
dstica descriptiva] de Excel nos dio los siguientes valores:
Qu conclusiones podemos sacar al observar estos
datos, respecto de la simetra de la distribucin, su dispersin
y su comportamiento normal?
Revisando las caractersticas que describimos para la media,
tendramos que:
* En el intervalo (-, +) que corresponde a (19.30
1.54, 19.30 + 1.54) = (17.16, 20.04) debe haber un 68.27%
del nmero total de observaciones. Es decir 2731 observacio-
nes corresponden a valores que oscilan entre 17.16 C
y 20.04 C.
* En el intervalo (-2, +2) que es (16.22, 22.38)
debe haber un 95.45% de las observaciones. Es decir 3818
mediciones de la temperatura se encontraron entre 16.22 C y
22.38 C.
* En el intervalo (-3, +3) que
corresponde a (14.68, 23.94) debe ha-
ber un 99.73% de las observaciones. Es
decir 3989 de las observaciones deben
ser valores que oscilan entre 14.68 C y
23.94 C.
211
Estadistica 1
Lo anterior no quiere decir que los valores de 1, 2, 3
desviaciones estndar sean los nicos usados o que se puedan
usar, igual podemos buscar que tantas unidades de desviacin
estndar necesitamos entendernos al rededor de la media para
cubrir un porcentaje de la poblacin diferente, por ejemplo 90%,
95%, 99% o cualquier otro que sea necesario. Por lo anterior
tenemos que la variable normalizada es una variable continua.
Para determinar el valor de la variable normalizada para un valor de X dado es igual a:
Una conclusin...
No toda curva acampanada representa una distribucin normal. Las curvas que se asimilen a la
forma de la campana de gauss si sirven para representar distribuciones normales de probabilidad
o de frecuencia. Las distribuciones de rea bajo las curvas de distribucin normal siempre son las
mismas, por eso la tabla con los valores de las distribuciones siempre ser la misma, pero podrn
existir muchas curvas normales dependiendo de los valores de la desviacin estndar y de la
media, as:
* Si la media es mayor la campana se desplaza hacia la derecha conservando su forma y su anchura.
* Estas curvas sern ms o menos altas y por tanto menos o ms anchas dependiendo del
valor de la desviacin estndar. A mayor desviacin estndar la campana se hace ms alta y
menos ancha.
* Por lo anterior solamente necesitamos la tabla
del Anexo 3 para determinar la proporcin del rea bajo
la curva, y esta nos ahorra el tener que recurrir a la inte-
gral definida de la complicada frmula que define la distri-
bucin normal. Con esta tabla se pueden hacer clculos
para cualquier curva normal.
212
7
Introduccin a las Distribuciones de Probabilidad
Al igual que utilizamos la desviacin estndar de la poblacin
para derivar los resultados estndar de la misma, podemos tam-
bin usar la desviacin estndar de la muestra para calcular los
resultados estndar de la muestra. Estos resultados indican a
cuntas desviaciones estndar se halla una observacin en
particular por arriba o por debajo de la media de la muestra.
Resultado estndar de la muestra (z) =
Existe una correspondencia biunvoca entre los valores de la
variable de estudio y los valores de la variable normalizada.
Cada valor de la variable de estudio hay un valor de la variable
normalizada, por ejemplo el valor de la media de la variable de
estudio corresponde al valor cero (0) de la variable normaliza-
da.
La anterior correspondencia quedara clara al resolver algunos
ejercicios que algunos han llamado estandarizacin y deses-
tandarizacin. Un ejercicio consiste en encontrar el valor de z
asociado a un valor x
i
de la variable en estudio y a partir de l
poder determinar por ejemplo el rea entre cero desviaciones
estndar y z, lo cual nos dar como resultado la probabilidad
de que la variable tome un valor entre la media y x
i
.
Ejemplo 7.1. Los estudios del Ministerio de Transporte han
determinado que el consumo medio de gasolina de los carros
medianos se distribuye normalmente, con un consumo pro-
medio de 26 kilmetros por galn y una desviacin estndar
de 4 kilmetros por galn. Si en un experimento se van a mo-
nitorear 500 autos medianos, determinando el nmero de ki-
lmetros que cada uno de estos recorri mientras consumi
un galn. Cuantos autos, se espera que recorran 34 kilme-
tros o ms con un galn?
En este tipo de ejercicio y todos los que tengan que ver con la
distribucin normal es primordial para facilitar la comprensin
del problema, esbozar un grfico en que se sombree el rea
que se relacione con el ejercicio. No necesita ser muy precisa y
de puede hacer a pulso. Veamos como sera la grfica de este
ejercicio:
Por qu se ha sombreado el
rea del extremo derecho y no otra?
?
213
Estadistica 1
Como sabemos el valor del consumo pro-
medio de gasolina que es 26 Km./galn y
esperamos estimar cuantas observaciones
obtendremos mayores o iguales a 34 Km./
galn entonces sabemos tambin que 34 se
ubica a la derecha de 26 y los mayores que
34 estarn situados a la derecha del mismo.
No se debe buscar una regla o truco para
saber que zona sombrear, slo debe con-
centrarse en el ejercicio e interpretarlo.
Ahora debemos encontrar el valor de z que
corresponde al valor 34 de nuestra variable.
Habiendo encontrado el valor z = 2 nos remitimos a la tabla de
reas bajo la curva normal (Anexo 3). La tabla nos permite en-
contrar el rea buscando en la primera columna a la izquierda,
el valor de z correspondiente hasta con una cifra decimal, la
segunda cifra decimal de z la encontramos en la primera fila de
la parte superior. Cruzamos columna con fila y all estar el
valor del rea buscada. En consecuencia, para z = 2 buscamos
2.0 en la primera columna y 0.00 en la primera fila, cruzamos
fila con columna y encontramos el valor 0.4772.
El valor 0.4772 nos indica el rea bajo la curva entre 0 y 2
desviaciones estndar, pero la medida que nos interesa es la de
la derecha de z = 2 es decir el rea sombreada. Como el rea
total a la derecha de z = 0 es 0.5 entonces tendremos que
calcular la diferencia: 0.5 - 0.4772 = 0.0228
5000.0228 = 11.4 es decir se esperan tener 11 casos de
autos que recorran 34 o ms kilmetros con un galn.
Vuelva al inicio del ejercicio y revise el procedimiento para ase-
gurarse de que domina el procedimiento.
Ejemplo 7.2. Verifiquemos ahora cuantas observaciones ten-
dran un valor entre 28 y 34 Km./galn?
Recordemos que primero el grfico para reconocer con clari-
dad el ejercicio.
Por qu esta la zona sombreada a la derecha de
la campana?
Del desarrollo para la pregunta anterior ya habamos en-
contrado que el valor de z
2
correspondiente a 34 Km./ga-
ln es 2 y que hasta este valor hay un rea bajo la curva de
0.4772. Sin embargo, solo una parte de esta rea es la que
?
214
7
Introduccin a las Distribuciones de Probabilidad
nos interesa en esta ocasin, debemos restar entonces la parte
que va desde z = 0 hasta el z
1
que corresponda a 28 Km./
galn.
Buscamos en la tabla del anexo 3 el valor correspondiente y
encontramos 0.1915 luego el rea que buscamos es 0.4772
0.1915 = 0.2857
Luego el nmero de observaciones que esperamos encontrar
con valores entre 28 y 34 Km./galn es: 0.2857 500 = 142.85
143.
Ejemplo 7.3. Encontremos ahora el posible nmero de veh-
culos que recorren ente 23 y 28 kilmetros usando 1 galn de
gasolina. A diferencia de los dos ejemplos anteriores en este
tenemos datos a lado y lado de la media, por lo que debemos
encontrar las respectivas reas a lado y lado del valor z = 0.
Ya en el ejemplo anterior habamos encontrado que
desde z = 0 hasta el valor de z
1
= 0.5 que corres-
ponde a 28 Km./galn, tenamos un rea de
A
1
= 0.1915. Nos hace falta solamente hallar
el rea a la derecha de z = 0.
Ubique en el diagrama los valores de z = 0.5 y de z = 0.75.
Buscamos ahora en la tabla del anexo 3. El valor del rea que nos falta por averiguar, tengamos en
cuenta que como la distribucin es simtrica entonces el valor del rea bajo la curva normal desde z =
0 hasta z = - 0.75 equivale en la tabla al valor hasta z = 0.75, recuerde que el valor de cualquier rea
siempre es positivo. En la tabla buscamos en la primera columna el valor 0.7 y en la primera fila el valor
0.05, cruzamos fila con columna y encontramos el valor A
2
= 0.2734.
El rea buscada es la suma de las dos reas obtenidas as:
A = A
1
+ A
2
=0.1915 + 0.2734 = 0.4649
Hemos llegado a que 5000.4649 = 232.45 233 vehculos recorreran entre 23 y 28 Km./galn.
215
Estadistica 1
Ejemplo 7.4. Cuantos vehculos habrn recorrido menos de
23 kilmetros con un galn de gasolina?
Ya en el ejemplo anterior habamos encontrado el valor de z = -
0.75 que corresponde a 32 Km./galn, hasta donde se cubre un
rea de 0.2734 pero lo que nos interesa es el valor del rea res-
tante que obtenemos al restar 0.5 0.2734 = 0.2266 lo cual
implica una cantidad de 500 0.2266 = 113.3
113 observaciones.
Justifique si es el rea sombreada la que corresponde
a este ejercicio.
Tendramos entonces 113 vehculos que recorrern menos de
23 Km, usando un galn de gasolina.
El otro ejercicio que nos interesa es el de desestandarizacin, en
este partimos de una informacin en la que se conoce la medida
de las desviaciones estndar de un dato respecto de la media de
su poblacin y pretendemos encontrar el valor de dicho dato.
Aunque esa necesidad se presenta con menor frecuencia, si nos
permite ahondar en el manejo y comprensin de las distribucio-
nes.
Ejemplo 7.5. Si la calificacin en un concurso de mritos es una
variable que se distribuye normalmente, y nos dicen que se in-
cluirn en la lista de elegibles a quienes tengan puntajes que
inferiores a z = 0.85 desviaciones estndar por debajo de la
media. Cul ha sido la mnima calificacin aprobatoria si
la media fue de 725 puntos con una desvia-
cin estndar de 90 puntos?
Primero representamos grficamente la situacin, ubicamos la
media en el punto de cero (0) desviaciones estndar y el valor z
= - 0.85 un poco hacia la izquierda teniendo en cuenta que el
puntaje aprobatorio del concurso es inferior a la media.
En la distribucin normal estndar, el valor de z ( - 0.85) dista de
la media (0) tanto como, en la distribucin de la variable, el valor
que buscamos dista de la correspondiente media (725). Por tan-
216
7
Introduccin a las Distribuciones de Probabilidad
to, se concluye que la distancia que debe haber entre el valor
buscado de la variable y la correspondiente media (725) medida
en unidades de desviacin estndar es 0.85 veces la desviacin
estndar (90).
Como la distribucin estndar de la variable es 90, entonces, la
distancia entre la media de dicha distribucin y el valor buscado
es igual a 0.85 90 = 76.5
Si la distancia de la media al valor buscado es de 76.5 y adems el
valor buscado es menor que la media, entonces para encontrar
dicho valor debemos restar al valor de la media el valor de la dis-
tancia, as: 725 76.5 = 648.5 puntaje que corresponde al mni-
mo aprobatorio del concurso.
Un tercer tipo de ejercicio y de mucha utilidad para efectos prc-
ticos, es aquel en que para una variable que se comporta normal-
mente buscamos determinar cuantos casos corresponden a un
porcentaje ya definido. Estamos entonces no buscando un rea
bajo la curva que corresponda a un intervalo de valores de la va-
riable de estudio, sino que ya conocemos dicha rea en la distri-
bucin normal y pretendemos identificar los correspondientes
eventos que se encuentran dentro del intervalo correspondiente
a la variable de estudio.
Ejemplo 7.6. Se pretende premiar a los alcaldes con el mejor
indicador medio ponderado de gestin en el pas. Se decide que
se va a premiar al 10 % de los alcaldes con el mejor desempeo,
mientras que se iniciara una investigacin al 15% de menor des-
empeo a fin de identificar si su baja gestin se debe a ineptitud
o a situaciones fortuitas. Al recoger todos los resultados se
encontr que estos se haban distribuido normalmente con
una media de 61/100 y una desviacin estndar de 18/
100. Cuntos de los 1030 alcaldes sern pre-
miados y cuantos sern investigados? Cul
es el puntaje mnimo con que se premiar a
un alcalde y cual es el puntaje mximo con el que se le abrir
investigacin?
Ubique la informacin bsica sobre la grfica, indicando cual rea corresponde a los premiados y
cual a los investigados.
Calcule usted mismo la respuesta a la primera pregunta, sacando el 10% y el 15% de los 1030
alcaldes.
217
Estadistica 1
Primero debemos encontrar el valor de z a partir del cual se
ubica el 10% mayor del rea. Recordemos que cada mitad de
la campana que resulta de dividir esta con una perpendicular al
valor z = 0, cubre un rea correspondiente al 50% y en trmi-
nos de probabilidad al 0.5, entonces el 10% mayor estar ubi-
cado a partir del primer 40% ubicado a la derecha de la per-
pendicular a z = 0. Por lo anterior, ser errneo buscar en la
tabla el valor 10% o 90%, tenemos que buscar el 40% es decir
0.4.
Al buscar dentro de la tabla de las reas bajo la curva normal
(anexo 3) el valor ms aproximado a 0.4 es 0.3997, que ubica-
mos en la columna 10 con la fila 14, cuyos encabezados nos
indican un valor de z = 1.28
Tenemos entonces que el mnimo puntaje con el que un alcal-
de ser premiado est ubicado a 1.28 desviaciones estndar
por encima de la media, esto es
1.28 18 = 23.04 por encima de la media (61) es decir 61 +
23.04 = 84.04.
Los alcaldes premiados tendrn puntajes iguales o superiores a
84.04.
Para determinar ahora el mximo puntaje de los alcaldes que
sern investigados, el procedimiento es similar, solo que traba-
jaremos con un rea situada a la izquierda de la curva normal.
Como la parte izquierda del rea de la campana tambin mide
0.5 entonces nos interesa conocer el valor de z para un rea de
0.35 en la tabla del anexo 3.
Por qu sera incorrecto pretender buscar en la
tabla el rea 0.15 que corresponde a 15% o el rea 0.85 que
corresponde a los 85% restantes?
?
Al buscar en la tabla el valor ms aproximado a 0.35 es 0.3508 que corresponde a un valor z = 1.04, lo que
nos indica que el puntaje que buscamos est ubicado a 1.04 desviaciones estndar por debajo de la media,
esto es 61 (1.04) 18 = 42.28
En conclusin, los alcaldes que tengan puntajes iguales o inferiores a 42.28 puntos sern investigados.
218
7
Introduccin a las Distribuciones de Probabilidad
Otras distribuciones de probabilidad.
Aunque harn parte del prximo curso, hacemos referencia aqu
a otras distribuciones usadas en la estadstica, slo para tener en
cuenta que la distribucin normal no es la nica ni la ms adecua-
da para algunos casos.
219
Estadistica 1
EJERCICIOS PROPUESTOS
1. Si x se encuentra distribuida normalmente con promedio 10 y des-
viacin estndar 2, usar la tabla del anexo 3, para calcular la probabilidad de
que (a) x > 12, (b), x > 11, (c) x < 9, d) x < 9.5, (e) 9 < x < 12.
2. Una manera para obtener predicciones econmicas es utilizar un
enfoque de consenso. Se obtiene una prediccin de cada uno de un gran
nmero de analistas; el promedio de estos pronsticos es la prediccin de
consenso. Supngase que las predicciones individuales acerca de la tasa prin-
cipal de inters en enero de 1985 de todos los analistas econmicos, tienen
una distribucin aproximadamente normal, con una media de 14% y una des-
viacin estndar de 2.6%. Se selecciona al azar un solo analista de ese grupo.
A) Cul es la probabilidad de que la tasa principal de este analista sea mayor
que el 18%?. B) Cul es la probabilidad de que la prediccin de la tasa princi-
pal de inters sea menor de 16%?
3. Suponiendo que la estatura (x) de varones en un colegio se encuen-
tra distribuida normalmente con una media de 1.75 m y desviacin estndar
de 7.6 cm, usar la tabla del anexo 3, para calcular la probabilidad de que (a) x
< 1.65 m, (b) 1.65 m < x < 1.75 m.
4. Suponiendo que su calificacin en un examen en unidades estndar
(z) es 0.8 y que las calificaciones estn distribuidas normalmente, qu porcen-
taje de estudiantes se espera que tendrn una calificacin ms alta que usted?
5. Suponga que tiene que establecer la restriccin del mximo nmero
de personas que pueden subir a un ascensor. Un estudio del uso de elevadores
indica que si 8 personas ocupan el ascensor, la distribucin de probabilidad del
peso total de las 8 personas tiene una media igual a 1200 libras y una varianza
igual a 9800 libras
2
. Cul es la probabilidad de que el peso total de ocho
personas exceda de 1300 libras?1500 libras?
6. El coeficiente de inteligencia (CI) est casi normalmente distribuido
con una media de 100 y una desviacin estndar de 16. Cul es la probabili-
dad de que un individuo seleccionado al azar tenga un CI (a) menor que 80, (b)
mayor que 140, (c) entre 95 y 105? d) Qu valores centrales incluirn aproxi-
madamente al 50% de los individuos?
7. La contralora General de la Repblica, decide el porcentaje de con-
tratos u operaciones que debe investigar por entidad vigilada. Supngase que
lo hace seleccionando al azar 50 casos de una distribucin normal con una
220
7
Introduccin a las Distribuciones de Probabilidad
media de 1.55% de documentos por entidad y una desviacin estndar de
0.45%. Cul es la probabilidad de que en un departamento en particular se
revisen ms del 2.5% de los contratos? Cul es la probabilidad de que en un
departamento en particular se revisen menos del 1% de los contratos?
8. Un procesador de alimento afirma en las etiquetas de su producto
que el peso neto es al menos de 16 onzas. La mquina que Ilena las latas no
puede medir exactamente y se encontr que en un Ilenado la desviacin
estndar fue de 0.2 onzas. Si el procesador fija un aumento del 3% sobre la
cantidad garantizada, qu fraccin de su produccin no est de acuerdo
con su afirmacin? Suponga que las cantidades de alimento se distribuyen
normalmente alrededor del valor aumentado.
9. Problemas con el nuevo sistema computarizado de una compaa
telefnica, ocasionaron un enorme retraso en el proceso de recepcin, solu-
cin y respuesta a reclamos de los clientes. Desde hace 10 meses que se
implement el cambio tecnolgico, el 53% de las peticiones no han sido con-
testadas 45 das despus de haberlas recibido, generndose tambin una alta
tasa de silencios administrativos. Supngase que la distribucin del tiempo
requerido por el departamento de peticiones quejas y recursos de esta com-
paa est distribuido normalmente con una desviacin estndar de 10 das.
Calcule el tiempo promedio para contestar una peticin? Determine la pro-
babilidad de que el tiempo necesario para contestar una peticin sea de 60
das o ms? (Suponer que es legalmente viable)
10. Un profesor de gimnasia de secundaria anuncia que califica los even-
tos atlticos individuales por resultados relativos a todas sus clases. Si da
20% de As y si la experiencia ha demostrado que el promedio es de 1.42 m y
que la desviacin estndar es de 10 cm para el salto de altura, qu tan alto
debe prepararse a saltar un estudiante si pretende obtener A?
11. Sea x el peso, en libras de un salmn rey atrapado en la desemboca-
dura de un ro y supngase que x posee una distribucin normal con media
30 y desviacin estndar 6. Calcular la probabilidad de que si un pescador
atrapa un salmn rey su peso sea de (a) al menos 41 libras (b) entre 20 y 40
libras inclusive.
12. Si un conjunto de mediciones se encuentra normalmente distribui-
do, qu porcentaje de las mediciones diferirn de la media (a) por ms de una
desviacin estndar (b) por menos de tres cuartos de una desviacin estn-
dar?
221
Estadistica 1
13. Suponer que el tamao (dimetro) de la cabeza de un hombre est
aproximadamente distribuido en forma normal con media de 7 pulgadas y
desviacin estndar de 1 pulgada. Supongamos que usted administra una
tienda de sombreros al menudeo y almacenar los sombreros en proporcin
al tamao probable de la cabeza de los clientes, aproximadamente, qu por-
centaje de sus clientes tendrn entre 8 y 9 pulgadas de dimetro craneal?
14. Se dijo que de mil jvenes de 13 aos de edad, 390 tienen estaturas
que distan menos de 1.4 pulgadas de la estatura media, que es 57.3 pulgadas.
Hallar el valor de Q, aqu, sobre la hiptesis de distribucin normal de es-
taturas.
15. El tiempo de espera que las personas esperan en la fila de cierta
entidad pblica, tiene una distribucin normal con media de 16 minutos y
desviacin estndar de dos minutos. Encuentre el porcentaje de personas
que esperan mas de 12 minutos.
16. El ingreso promedio anual de las mujeres adultas en Ccuta es de
$385.200 con una desviacin estndar de $56.000. Se toma una muestra
aleatoria de 100 mujeres de Ccuta y se obtiene el ingreso promedio. Encuen-
tre la probabilidad de que el ingreso promedio de esa muestra sea mayor de
$2393.000.
17. Plantee 3 problemas relacionados con la carrera y que toquen los
temas ms relevantes de esta unidad y resulvalos. (Se seleccionarn los tres
mejores del curso.)
18. Use el paquete estadstico que este disponible en la universidad o al
que usted tenga acceso (si usa el EVIEWS puede apoyarse en la referencia
rpida del anexo 2) y desarrolle los ejercicios en este y verifique sus respues-
tas. Verifique tambin las respuestas de los ejercicios resueltos de esta unidad.
222
7
Introduccin a las Distribuciones de Probabilidad
EJERCICIOS RESUELTOS
1. Obtenga P(0 z 1.63). (entindase como la pro-
babilidad de encontrar un valor entre o desviaciones es-
tndar y 1.63 desviaciones estndar) Esta probabilidad
corresponde al rea entre la media (z=0) y un punto z=1.63
desviaciones estndar a la derecha de la media.
Solucin.
El rea es la sombreada en la figura. Ya que la tabla del
anexo 3 nos indica las reas bajo la curva normal a la de-
recha de la media, solamente necesitamos encontrar el valor
tabulado correspondiente a z=1.63. Se baja por la colum-
na de la izquierda de la tabla hasta el rengln correspon-
diente a z=1.6 y se va luego por el rengln superior hasta
la columna marcada con 0.03. La interseccin de esta com-
binacin de rengln y columna da el rea de A=0.4484.
2. Calcular P(-0.5 z 1.0). Esta probabilidad
corresponde al rea entre z=-0.5 y z=1.0.
Solucin.
El rea requerida es igual a la suma de A
1
y A
2
, mostrada
en la figura. De la tabla del anexo 3 obtenemos A
2
= 0.3413.
El rea A
1
es igual al rea correspondiente entre z = 0 y z
= 0.5, o bien
A
1
= 0.1915. Por lo tanto el rea total es
A
1
+ A
2
= 0.1915 + 0.3413 = 0.5328
3. El dimetro medio del interior de una muestra de
200 tubos producidos por una mquina es 0.502 pulga-
das y la desviacin tpica es 0.0005 pulgadas. El uso de los
tubos permitir una tolerancia en el dametro de 0.496 a
0.508 pulgadas; de otro modo, se considerarn defectuo-
sos. Determinar el porcentaje de tubos defectuosos, su-
puesto que los tubos producidos por esa mquina estn
normalmente distribuidos.
223
Estadistica 1
Solucin.
En unidades estndar,
Proporcin de tubos defectuosos = (rea bajo la curva
normal entre z = -1.2 y z = 1.2)
=(doble del rea entre z = 0 y z = 1.2) = 2 (0.3849) =
0.7698 77%
Luego el porcentaje de tubos defectuosos es 100% - 77%
= 23%.
4. Hallar los valores de z, por ejemplo z
o
, tales que
exactamente (hasta cuatro cifras decimales) 0.95 del rea
quede dentro de z
o
desviaciones estndar de la media.
Solucin.
La mitad del rea de 0.95 se encontrar a la izquierda de la
medida y la otra mitad a la derecha, por que la distribu-
cin normal es simtrica. Por lo tanto, se desea encontrar
el valor z
o
que corresponde a un rea igual a 0.475 (la som-
breada). Al referirnos a la tabla del anexo 3 se ve que el
rea 0.475 est en el rengln correspondiente a z = 1.9 y
en la columna 0.06. Por lo tanto z
o
= 1.96. Ntese que el
resultado est muy cerca del valor aproximado z = 2, que
se utiliza en la regla emprica.
5. Sea x una variable aleatoria distribuida normal-
mente, con una media igual a 10 y una desviacin estn-
dar igual a 2. Encuentre la probabilidad de que x est en-
tre 11 y 13.6.
Solucin.
Como primer paso, tenemos que calcular los valores de z,
correspondientes a x = 11 y x = 13.6. Por lo tanto,
Estos valores de z se localizan bajo la curva normal como
se muestra en la figura. La probabilidad deseada, P, es, por
consiguiente el rea entre estos dos valores de z, z
1
=0.5 y
z
2
=1.80. Las reas entre z=0 y z
1
, A
1
=0.1915, y entre
224
7
Introduccin a las Distribuciones de Probabilidad
z=0 y z
2
, A
2
=0.4641, valores que se han obtenido de la
tabla del anexo 3. La probabilidad P es igual a la diferencia
entre las dos reas A
1
y A
2
; es decir,
P = A
2
A
1
= 0.4641 0.1915 = 0.2726
6. Ciertos estudios muestran que el rendimiento de
la gasolina para automviles pequeos (de gama baja) en
Estados Unidos, tiene una distribucin normal, con un ren-
dimiento medio de 30.5 millas por galn y una desviacin
estndar de 4.5 millas por galn. Si un fabricante desea
disear un auto de gama baja ms econmico que el 95%
de los automviles compactos vendidos en Estados Uni-
dos, Cul debe ser el rendimiento mnimo del auto nue-
vo?
Solucin.
Sea x una variable aleatoria distribuida normalmente con
una media de 30.5 y una desviacin estndar de 4.5. Se
desea encontrar el valor x
o
, tal que P(x<x
o
) = 0.95
Como un primer paso, encontramos el valor de z
o
, que
corresponde a x
o
; es decir, el valor de z
o
tal que el rea a su
izquierda sea igual a 0.95. Puesto que el rea a la izquierda
de z = 0 es 0.5, z
o
ser el valor de z en la tabla del anexo 3
que corresponde a un rea igual a 0.45. Este valor es z
o
=
1.645. Verifiqumoslo en la figura.
El paso final es encontrar el valor x
o
correspondiente a z
o
= 1.645. Se obtiene utilizando la ecuacin que relaciona x
y z, a saber,
Donde = 30.5 y r = 4.5. Al sustituir los valores de , r y
z
o
en esta ecuacin, y despejando x
o
resulta
x
o
= (4.5)(1.645) + 30.5 = 37.9
Por tanto el nuevo auto pequeo del fabricante debe de-
sarrollar un rendimiento de 37.9 millas por galn, para ser
mejor que el 95% de los coches pequeos que actualmen-
te se venden en Estados Unidos.
225
Estadistica 1
BIBLIOGRAFIA
Las posibilidades para explorar e indagar mu-
cho ms en busca de la ampliacin de su
universo de conocimientos no se deben res-
tringir a la bibliografa recomendada o a la
que fue de alguna manera insumo para el
texto estudiado. A veces resulta ms valio-
so complementar con otras visiones diferen-
tes.
Los textos que fueron consultados para la
elaboracin de esta unidad fueron:
CHOW, Ya-Lun. Anlisis Estadstico. Traducido al espaol
por Vicente Agut Armer. Editorial Mc Graw Hill. 2da
Edicin. Mxico, 1992.
FERNNDEZ, Felipe; MONROY, Olga L.; RODRGUEZ,
Liliana. Diseo, desarrollo y evaluacin de situaciones proble-
mticas en estadstica. Universidad de los Andes: una
Empresa Docente. Bogot D.C., 1998.
HOEL, Paul G. Y JESSEN, Raymond J. Estadstica Bsica
para Negocios y Economa. Compaa Edutirial Continen-
tal S.A. 2da Edicin. Mexico, 1985.
MENDENHALL, William. Estadstica para Administradores.
Traducido por Dirk Valckx Verbeeck. Grupo Editorial Ibe-
roamrica. Mxico, 1990.
PERRY, Patricia Ins; MESA, Vilma Mara; FERNNDEZ,
Felipe; GMEZ, Pedro. Matemticas, Azar y Sociedad. Con-
ceptos bsicos de estadstica. Universidad de los Andes: Una
Empresa Docente, Bogot D.C., 1998.
SPIEGEL, Murray R. Estadstica. Traducido por Rafael
Hernndez Heredero. Editorial Mc Graw Hill. 2da Edi-
cin. Madrid, 1998.
227
Estadistica 1
Unidad 8
Error y Prueba
de Hiptesis
228
8
Error y Prueba de Hiptesis
229
Estadistica 1
OBJETIVOS
INTRODUCCIN
* Determinar e identificar los tipos de error estadsti-
co que se presentan en los anlisis y estimaciones.
* El estudiante estar en capacidad de explicar el con-
cepto de prueba de hiptesis estadstica y de apli-
carlo a la verificacin o negacin de unas hiptesis
dadas.
El captulo anterior se ve justificado en este, por que llega-
mos a desarrollar la nocin de prueba de hiptesis. En dicha
prueba est justificada la existencia de la estadstica, aun-
que la estadstica se dedica a muchos campos ms, diga-
mos que el bsico es este: cuantificar la certeza de una afir-
macin o hiptesis. A partir de ello se puede decir si al
expresarnos estamos aportando o especulando.
El captulo inicia con la presentacin de los cuatro tipos de
error, contina con una representacin prctica de lo que es
la prueba de hiptesis. El objeto es dejar el campo abonado
para el estudio de pruebas de hiptesis que se ajustan a
otras distribuciones de probabilidad adems de la distribu-
cin normal.
A esta altura del mdulo se espera que el estudiante este en
capacidad de identificar un problema social, encontrar las
variables, establecer una hiptesis, determinar la poblacin
y muestra para el estudio de la hiptesis, a partir de medi-
ciones de la variable de trabajo realizar una distribucin de
frecuencias, usar la distribucin normal para validar la hip-
tesis y generar una conclusin basado en la prueba de di-
cha hiptesis.
230
8
Error y Prueba de Hiptesis
231
Estadistica 1
Estimacin de parmetros
En unidades anteriores ya habamos tocado el
tema de los estadsticos o estimadores de pa-
rmetro y los parmetros.
Matemticamente, podemos describir muestras
y poblaciones al emplear mediciones como la
media, la mediana, la moda y la desviacin es-
tndar. Cuando estos trminos describen las
caractersticas de una poblacin, se llaman pa-
rmetros. Cuando describen las caractersticas
de la muestra, se llaman estadsticos. Una esta-
dstica es una caracterstica de una muestra y
un parmetro es una caracterstica de la pobla-
cin.
Una poblacin queda caracterizada a travs de
ciertos valores denominados parmetros, que
describen las principales propiedades del con-
junto.
Un parmetro es un valor fijo (no aleatorio) que
caracteriza a una poblacin en particular. En
general, una parmetro es una cantidad desco-
nocida y rara vez se puede determinar exacta-
mente su valor, por la dificultad prctica de
observar todas las unidades de una poblacin.
Por este motivo, tratamos de estimar el valor
de los parmetros desconocidos a travs del
empleo de muestras. Las cantidades usadas para
describir una muestra se denominan estimado-
res o estadsticos muestrales.
Ahora bien, es razonable pensar que si toma-
mos diferentes muestras de la misma poblacin
y calculamos los diferentes estadsticos de cada
una, esos valores van a diferir de muestra a
muestra. Por lo tanto, un estadstico no es un
valor fijo, sino que presenta las siguientes ca-
ractersticas:
* Puede tener varios resultados posibles.
* No se puede predecir de antemano su valor.
Estas son las condiciones que definen a una variable alea-
toria. Un estadstico, entonces, es una variable aleatoria,
funcin de las observaciones muestrales.
A los estadsticos muestrales se los designa con las letras
latinas (x, s
2
). Si un estadstico es una variable aleatoria,
entonces es posible determinar su distribucin de pro-
babilidades y calcular sus principales propiedades.
Si tomamos varias muestras de una poblacin, las esta-
dsticas que calcularamos para cada muestra no nece-
sariamente seran iguales, y lo ms probable es que va-
riaran de una muestra a otra.
Una distribucin de probabilidad de todas las medias
posibles de las muestras es una distribucin de las me-
dias de las muestras. Los estadsticos la conocen como
distribucin de muestreo de la media.
Tambin podramos tener una distribucin de muestreo
de una porcin. Si trazamos una distribucin de proba-
bilidad de porciones posibles de un evento en todas las
muestras, obtendramos una distribucin de las porcio-
nes de las muestras. A esto se lo conoce como distribu-
cin de la porcin.
232
8
Error y Prueba de Hiptesis
Cualquier distribucin de probabilidad (y, por tanto, cualquier
distribucin de muestreo) puede ser descripta parcialmente por
su media y su desviacin estndar.
Concepto de error estndar.
En vez de decir la desviacin estndar de la distribucin de las
medias de la muestra para describir una distribucin de me-
dias de la muestra, los estadsticos se refieren al error estndar
de la media. De manera similar, la desviacin estndar de la
distribucin de las proporciones de la muestra se abrevia como
error estndar de la proporcin. El trmino error estndar se
utiliza porque da a entender un significado especfico. La varia-
bilidad en las estadsticas de muestras proviene de un error de
muestreo debido al azar; es decir, hay diferencias entre cada
muestra y la poblacin, y entre las diversas muestras, debido
nicamente a los elementos que decidimos escoger para las
muestras.
La desviacin estndar de la distribucin de las medias de las
muestras mide el grado hasta el que esperamos que varen las
medias de las diferentes muestras debido a este error fortuito
cometido en el proceso de muestreo. Por tanto, la desviacin
estndar de la distribucin de una estadstica de muestra se
conoce como el error estndar de la estadstica.
El error estndar indica no slo el tamao del error de azar que
se ha cometido, sino tambin la probable precisin que obten-
dremos si utilizamos una estadstica de muestra para estimar
un parmetro de poblacin. Una distribucin de medias de
muestra que est menos extendida (y que tiene un error estn-
dar pequeo) es un mejor estimador de la media de la pobla-
cin que una distribucin de medias de muestra que est am-
pliamente dispersa y que tiene un error estndar ms grande.
Siempre que usamos pruebas, tenemos que tratar con el error
estndar. Especficamente, necesitamos cierta medicin de la
precisin del instrumento de prueba, generalmente represen-
tado por el error estndar.
Cuando una poblacin est distribuida nor-
malmente, la distribucin de muestreo de la
media tambin es normal. Incluso en el caso
en el que una poblacin no est normalmen-
te distribuida, la media de la distribucin de
muestreo, sigue siendo igual a la media de la
poblacin: . Es decir, la distribucin de
muestreo de la media se acerca a la norma-
lidad, sin importar la forma de la distribu-
cin de la poblacin.
El teorema del lmite central.
La media de la distribucin de muestreo de
la media ser igual a la media de la pobla-
cin. Al incrementarse el tamao de la mues-
tra, la distribucin de muestreo de la media
se acercar a la normalidad, sin importar la
forma de la distribucin de la poblacin.
Esta relacin entre la forma de la distribu-
cin de la poblacin y la forma de la distri-
bucin de muestreo se denomina teorema
del lmite central, que es tal vez el ms im-
portante de toda la inferencia estadstica. Nos
asegura que la distribucin de muestreo de
la media se aproxima a la normal al incre-
mentarse el tamao de la muestra. Hay si-
233
Estadistica 1
tuaciones tericas en las que el teorema del
lmite central no se cumple, pero casi nunca
se encuentran en la toma de decisiones prc-
tica. Una muestra no tiene que ser muy gran-
de para que la distribucin de muestreo de
la media se acerque a la normal. Los esta-
dsticos utilizan la distribucin normal como
una aproximacin a la distribucin de mues-
treo siempre que el tamao de la muestra
sea al menos de 30, pero la distribucin de
muestreo de la media puede ser casi normal
con muestras incluso de la mitad de ese ta-
mao. La importancia del teorema del lmite
central es que nos permite usar estadsticas
de muestra para hacer inferencias con res-
pecto a los parmetros de poblacin sin sa-
ber nada sobre la forma de la distribucin
de frecuencias de esa poblacin ms que lo
que podamos obtener de la muestra.
El teorema del lmite central nos permite
utilizar las propiedades de la distribucin
normal en muchos casos en los que los da-
tos subyacentes no estn normalmente dis-
tribuidos. El hecho de que la distribucin de
muestreo sea aproximadamente normal es
la base de una amplia variedad de pruebas
estadsticas diferentes.
Tipos de estimacin.
Podemos hacer dos tipos de estimaciones concernientes a una
poblacin:
Una estimacin puntual: es slo u nmero que se utiliza
para estimar un parmetro de poblacin desconocido. Una
estimacin puntual a menudo resulta insuficiente, debido a que
slo tiene dos opciones: es correcta o est equivocada. Una
estimacin puntual es mucho ms til si viene acompaada
por una estimacin del error que podra estar implicado.
Una estimacin de intervalo: es un intervalo de valores que
se utiliza para estimar un parmetro de poblacin. Esta estima-
cin indica el error de dos maneras: por la extensin del inter-
valo y por la probabilidad de obtener el verdadero parmetro
de la poblacin que se encuentra dentro del intervalo.
Estimador y estimaciones.
Un estimador es una estadstica de muestra utilizada para esti-
mar un parmetro de poblacin. La media de la muestra puede
ser un estimador de la media de la poblacin, y la porcin de la
muestra se puede utilizar como estimador de la porcin de la
poblacin. Tambin podemos utilizar el alcance de la muestra
como un estimador del alcance de la poblacin.
Cuando hemos observado un valor numrico especfico de
nuestro estimador, nos referimos a ese valor como una estima-
cin. Una estimacin es un valor especfico observado de una
estadstica. Hacemos una estimacin si tomamos una muestra
y calculamos el valor que toma nuestro estimador en esa mues-
tra.
Criterios para seleccionar un buen estimador.
1. Imparcialidad. Se refiere al hecho de que una media de
muestra es un estimador no sesgado de una media de pobla-
cin, porque la media de distribucin de muestreo de las me-
dias de muestras tomadas de la misma poblacin es igual a la
234
8
Error y Prueba de Hiptesis
media de la poblacin misma. Podemos decir que una estads-
tica es un estimador imparcial (o no sesgado) si, en promedio,
tiende a tomar valores que estn por encima del parmetro de
la poblacin y la misma extensin con la que tiende a asumir
valores por debajo del parmetro de poblacin que se est es-
timando.
2. Eficiencia. Se refiere al tamao del error estndar de la
estadstica. Si comparamos dos estadsticas de una muestra
del mismo tamao y tratamos de decidir cul de ellas es un
estimador ms eficiente, escogeramos la estadstica que tuvie-
ra el menor error estndar o la menor desviacin estndar de
la distribucin de muestreo. Tiene sentido pensar que un esti-
mador con un error estndar menor (con menos desviacin)
tendr una mayor oportunidad de producir una estimacin ms
cercana al parmetro de poblacin que se est considerando.
3. Coherencia. Una estadstica es un estimador coherente de
un parmetro de poblacin si al aumentar el tamao de la
muestra, se tiene casi la certeza de que el valor de la estadstica
se aproxima bastante al valor del parmetro de la poblacin. Si
un estimador es coherente, se vuelve ms confiable si tenemos
tamaos de muestras ms grandes.
4. Suficiencia. Un estimador es suficiente si utiliza una canti-
dad de la informacin contenida en la muestra que ningn otro
estimador podra extraer informacin adicional de la muestra
sobre el parmetro de la poblacin.
Un estadstico de muestra dada no siempre es el mejor estima-
dor de su parmetro de poblacin correspondiente. Considere
una poblacin distribuida simtricamente, en la que los valores
de la mediana y de la media coinciden. En este caso, la media
de la muestra sera un estimador imparcial de la mediana de la
poblacin debido a que asumira valores que en promedio se-
ran iguales a la mediana de la poblacin. Tambin, la media de
la muestra sera un estimador consistente de la mediana de la
poblacin, puesto que, conforme aumenta el tamao de la
muestra, el valor de la media de la muestra tender a acercarse
bastante a la mediana de la poblacin. Y la media de la muestra
sera un estimador ms eficiente de la me-
diana de la poblacin que la mediana mis-
ma, ya que en muestras grandes, la media
de la muestra tiene una desviacin estndar
menor que la mediana de la muestra. Al mis-
mo tiempo, la mediana de la muestra de una
distribucin distribuida simtricamente se-
ra un estimador imparcial y consistente de
la media de la poblacin, pero no el ms efi-
ciente estimador, porque en muestras gran-
des su error estndar es mayor que el de la
media de la muestra.
Estimaciones puntuales.
La media de la muestra es el mejor estima-
dor de la media de la poblacin. Es impar-
cial, coherente, el estimador ms eficiente y,
siempre y cuando la muestra sea la suficien-
temente grande, su distribucin de mues-
treo puede ser aproximada por la distribu-
cin normal.
Si conocemos la distribucin de muestreo
de la media, podemos llegar a conclusiones
con respecto a cualquier estimacin que
podamos hacer a partir de la informacin
de muestreo.
235
Estadistica 1
Estimacin puntual de la porcin de la
poblacin.
La porcin de unidades de una poblacin
dada que posee una caracterstica particu-
lar se representa mediante el smbolo p. Si
conocemos la porcin de unidades de una
muestra que tiene la misma caracterstica,
podemos utilizar esa p como estimador de
p. Se puede mostrar que p tiene todas las
caractersticas deseables: es imparcial (no
sesgado), coherente, eficiente y suficiente.
Incluso cuando estamos utilizando el mejor
estimador de un parmetro de poblacin,
aceptamos que puede estar implicado algo
de error. Afirmamos que la estimacin pun-
tual y la medida de la varianza proporcionan
informacin til para las decisiones.
Estimaciones de intervalo.
El propsito de tomar muestras es para co-
nocer ms acerca de una poblacin. Pode-
mos calcular esa informacin a partir de las
muestras como estimaciones puntuales, o
como estimaciones de intervalo. Una esti-
macin de intervalo describe un intervalo de
valores dentro del cual es posible que est un parmetro de
poblacin.
Si seleccionamos y representamos grficamente un gran n-
mero de medias de muestras de una poblacin, la distribucin
de tales medias se aproximar a la curva normal. Adems, la
media de las medias de muestra ser la misma media de la
poblacin.
Probabilidad de que el verdadero parmetro de la po-
blacin est dentro de la estimacin de intervalo. En lo
que concierne a cualquier intervalo particular, ste contiene a
la media de la poblacin o no la contiene, pues la media de la
poblacin es un parmetro fijo, y no vara.
Cuando las organizaciones informan la precisin de encuestas
de opinin como estos resultados son precisos en ms menos
tres puntos, por lo general no establecen el nivel de confianza
que estn utilizando para hacer la estimacin de intervalo. Una
afirmacin ms completa tendra la forma. existe un 95% de
probabilidad de que la verdadera opinin de la poblacin caiga
dentro del intervalo comprendido entre... y ...
Estimaciones de intervalo e intervalos de confianza.
La probabilidad que asociamos con una estimacin de interva-
lo se conoce como nivel de confianza. Esta probabilidad indica
qu tanta confianza tenemos de que la estimacin de intervalo
incluya al parmetro de poblacin. Una probabilidad ms alta
indica ms confianza.
El intervalo de confianza es el alcance de la estimacin que
estamos haciendo. Expresaremos el intervalo de confianza en
trminos de errores estndar, ms que con valores numricos.
Los lmites de confianza son los lmites superior e inferior del
intervalo de confianza
Podra pensarse que deberamos utilizar un nivel alto de con-
fianza en todos los problemas sobre estimaciones. En la prcti-
ca, sin embargo, altos niveles de confianza producen interva-
236
8
Error y Prueba de Hiptesis
los de confianza grandes, y stos no son precisos, dan estima-
ciones bastante imprecisas.
Uso del muestreo y de la estimacin de intervalos de
confianza.
A menudo resulta difcil o caro tomar ms de una muestra de
una poblacin. Basados en solamente una muestra estimamos
el parmetro de poblacin.
El intervalo de confianza quiere decir que si seleccionamos
muchas muestras aleatorias del mismo tamao y si calculamos
un intervalo de confianza para cada una de las muestras, ten-
dremos un porcentaje de confianza determinado que en todos
los casos la media de la poblacin caer dentro del intervalo.
Por otro lado, existe un cierto equilibrio entre la certidumbre
de la estimacin y el ancho de un intervalo de confianza.
Para el clculo de estimaciones de intervalo de la media a partir
de muestras grandes, se calcula el error estndar de la media
para una poblacin infinita:
Posteriormente, se establecen los lmites de confianza superior
e inferior, considerando el porcentaje de confianza requerido.
La frmula para derivar el error estndar de la media de pobla-
ciones finitas es:
En conclusin cuando tenemos muestras grandes, utilizamos el Teore-
ma del Lmite Central, nuestro conocimiento de la curva normal y nuestra
habilidad para hacer correcciones para poblaciones finitas.
237
Estadistica 1
PRUEBAS DE HIPTESIS.
Una hiptesis es una afirmacin acerca de
algo. En estadstica, puede ser una suposi-
cin acerca del valor de un parmetro des-
conocido.
A continuacin se presenta el juicio contra
Tauro
6
. En este juicio Tahuro es acusado de
jugar con una moneda que est cargada. Se
parte entonces del supuesto de que Tahuro
es inocente y la fiscal (Ana Liza) debe allegar
informacin para demostrar la culpabilidad
de nuestro amigo; y la defensa (Stadi Shka)
tratar de defender a Tahuro; el profesor ju-
gar un papel neutral en el caso: ser el juez.
El juicio contra Tahuro se presenta en tres
partes: en la primera se describe la acusa-
cin contra el joven; en la segunda, se bus-
ca un criterio para juzgarlo; y por ultimo, en
la tercera se emite el veredicto.
Motivacin: Juicio contra Tahuro
Vamos a comenzar el estudio de una de las
herramientas ms conocidas de la inferen-
cia estadstica: la prueba de hiptesis.
7
La for-
ma en que sta se utiliza tiene gran similitud
con lo que se plantea en un juicio contra un
acusado. En los juicios se parte de un prin-
cipio: la inocencia del acusado y se procede
de tal manera que un personaje, conocido
como el fiscal, intenta recoger informacin
para demostrar la culpabilidad del acusado.
Similarmente, en las investigaciones donde
se utilizan pruebas de hiptesis, se parte de
un supuesto bsico: la hiptesis nula y el in-
vestigador trata entonces de recoger
informacin, con base en una muestra alea-
6
Caso tomado del texto Matemticas, Azar, Socie-
dad luego de autorizacin expresa de Pedro G-
mez y con el conocimiento de los dems autores.
Algunos autores prefieren utilizar la palabra verifi-
cacin o docimasia en vez de la palabra prueba,
pues el sentido en que se emplea esta palabra en
estadstica es bien diferente de lo que se entiende
en matemticas como prueba o demostracin for-
mal.
7
toria, para poder decidir si rechaza o no la mencionada hipte-
sis. En caso de rechazarla, se acoge a otra hiptesis conocida
como la hiptesis alternativa.
El principio de inocencia
(El fiscal dirigi su mirada hacia el jurado)
El fiscal: Las pruebas que recaen en contra del acusado permi-
ten concluir que ste es culpable.
El defensor: Protesto, seores del Jurado. Quiero recordarles
que la ley dice que hasta que no se demuestre lo contrario, el
acusado debe considerarse como inocente y las pruebas que
presenta el fiscal aunque permiten sospechar del acusado, no
me parecen suficientes para declararlo culpable.
238
8
Error y Prueba de Hiptesis
El fiscal: La defensa alega que faltan pruebas para declarar al
acusado como culpable y que por tanto debe considerrsele
como inocente. Entonces, reunir ms pruebas hasta lograr
demostrar que el acusado s es culpable. Estas pruebas sern
tan contundentes que la misma defensa no tendr mas reme-
dio que aceptar la culpabilidad.
El defensor: Entonces, seores del Jurado, esperemos a que el
fiscal pueda conseguir esas pruebas, pues de lo contrario, y
aunque el acusado fuera realmente culpable, no se le puede
declarar culpable.
El juez: Por hoy, se cierra la sesin.
Tahuro es acusado: primera parte del juicio
Juez: Se inicia la sesin. Seor Tahuro, por favor, pngase de
pie. (Tahuro se levanta del puesto de los acusados.) Se le acusa
a usted de estar jugando por los corredores de la universidad,
con una moneda que est cargada. Cmo se declara usted
ante esa acusacin?
Tahuro: Inocente, seor juez.
Juez: Tiene usted la palabra seorita fiscal.
Ana Liza: El seor Tahuro nunca va a clase de Probabilidad y
Estadstica. En vez de ello se pasa la vida jugando con una
monedita por los corredores de la universidad y varios testigos
pueden confirmar lo que digo. En todo caso, no se le acusa de
que falte a clase o de que juegue con su mo-
nedita, sino de que deja a sus compaeros
sin dinero para almorzar.
Stadi Shka: Protesto su seora. S, es cier-
to que Tahuro falta con frecuencia a clase,
pero no es cierto que ande robando el dine-
ro a sus compaeros. El obtiene por medio
de un juego limpio y legal sus ganancias, con
las cuales paga parte de su matrcula.
Juez: Ha lugar, seorita fiscal, explique ms
detalladamente por qu usted acusa al se-
or Tahuro de robarle dinero a sus compa-
eros.
Ana Liza: Su seora, el seor Tahuro roba
a sus compaeros utilizando una moneda
que est cargada; mejor dicho, usa una
moneda para la cual la probabilidad de ob-
tener cara no es igual a la de obtener se-
llo.
Stadi Shka: Protesto, su seora. La fiscal
acusa a Tahuro de usar una moneda carga-
da, sin tener pruebas; y hasta que no se de-
muestre lo contrario, debemos suponer que
la moneda no est cargada y que por consi-
guiente la probabilidad de obtener cara o
sello es igual a (Aqu la defensa est
usando el principio de inocencia)
Juez: Seorita fiscal, tiene usted pruebas de
que la moneda est cargada?
Ana Liza: No. Pero, puedo demostrarles que
la moneda est cargada, utilizando probabi-
lidades y estadstica. Slo necesito que su
Seora me permita repetir varias veces un
experimento aleatorio consistente en Ianzar
la moneda y observar el resultado que se
239
Estadistica 1
obtiene en cada ocasin. (Aqu la fiscal ase-
gura que va a conseguir las pruebas para
demostrar la culpabilidad de Tahuro).
Juez: Seorita fiscal, aqu tiene la moneda.
(El juez entrega la moneda a Ana Liza)
Ana Liza: Seor juez, lanzar esta moneda
cien veces y alguno de ustedes contara el
nmero de veces que se obtiene cara.
Stadi Shka: Protesto su seora. El azar pue-
de jugarnos una mala pasada. Por ejemplo,
podra ocurrir que por puro azar, todas las
veces se obtuviera cara.
Ana Liza: Lo que alega la defensa es cierto;
pero yo les advert que mi argumento har
uso de la estadstica y de la probabilidad. Si
la moneda no esta cargada y se lanza, por
ejemplo, cien veces, la probabilidad de que
siempre Caiga en Cara es de:
()
100
=0.000...0007886 (Huy! Van 30 ceros
despus de la coma.)
Tal cifra indica que es muy, muy remoto que
eso ocurra. Entonces, si se supone la ino-
cencia de Tahuro, es decir, si creemos la hi-
ptesis de que en su moneda, las probabili-
dades de cara y sello son iguales a y
realizamos el experimento de lanzar cien
veces la moneda, la ocurrencia de una
proporcin exagerada de sellos contra ca-
ras o viceversa da lugar a pensar que la
moneda s esta cargada.
Stadi Shka: El argumento del fiscal es muy
interesante, pero de ninguna manera nos
permite demostrar rotundamente la culpa-
bilidad de Tahuro en caso de que ocurra una
proporcin exagerada de sellos contra caras o viceversa,
por las siguientes razones:
- Primero, no se ha dicho a partir de qu punto la ma-
yor ocurrencia de caras o de sellos se considera como exa-
gerada.
- Segundo, si asumimos la hiptesis de que la moneda
no est cargada, y que al lanzar la moneda cien veces, siempre
se obtiene cara, tendremos que, aunque es un resultado muy,
muy improbable, s puede ocurrir por un alocado azar.
Juez: Yo como juez, debo ser imparcial. Realmente pienso que
ambos argumentos, tanto el de la defensa como el de la fiscala
son vlidos. En todo caso, propongo que la fiscal lleve a cabo
su experimento, pero fijando de antemano el criterio que usa-
remos para considerar como muy exagerado el desequilibrio
entre la proporcin de caras y sellos.
Stadi Shka: Pero insisto seor juez en que si existe un desequi-
librio muy exagerado en la proporcin de caras y sellos,
podemos en todo caso incurrir en un error que aunque muy
poco probable, nos llevara a la garrafal equivocacin de decla-
rar como culpable a una persona que realmente es inocente.
Ana Liza: Seor juez, tambin existe la posibilidad de que Ta-
huro sea realmente culpable y que por puro azar no se le de-
clare culpable.
240
8
Error y Prueba de Hiptesis
Stadi Shka: Protesto su seora! La fiscal est tratando de...
(Ana Liza no deja terminar a Stadi Shka.)
Ana Liza: De ninguna manera. La defensa es la que est tra-
tando de...(Mientras tanto Stadi Shka contina hablando, entonces
el juez toma su borrador (martillo) y da varios golpes contra la mesa.)
Juez: Orden en la sala! En este juicio, usando probabilidad y
estadstica, nunca podremos estar completamente seguros de
nuestra decisin: nos podemos equivocar de dos maneras di-
ferentes, a saber:
- Declarar culpable a Tahuro, siendo realmente
inocente.
- No declarar culpable a Tahuro, siendo culpable.
En todo caso, vamos a continuar con este juicio y trataremos
de determinar a partir de qu punto se va a considerar como
exagerado el desequilibrio en las proporciones de caras y se-
llos.
Stadi Shka: Est bien, estoy de acuerdo su seora, pero re-
cordemos que tenemos que admitir la posibilidad de obtener
cien caras en cien lanzamientos de una moneda legal slo
por pura casualidad.
Ana Liza: Pero entonces, puedan ocurrir, por ejemplo, 65
caras o mas sin que se considere necesariamente que Tahu-
ro es tramposo? En todo caso, debemos re-
conocer que la probabilidad de que salgan
cien caras es tan pequea e insignificante
que cualquier persona estara dispuesta a
afirmar con mucha seguridad que este re-
sultado nos indica que la moneda est car-
gada.
Juez: Creo que estamos llegando a un acuer-
do. Pero, por hoy vamos a cerrar la sesin.
Para la prxima sesin queda abierto el pro-
blema de:
Determinar un criterio para estable-
cer a partir de que punto la mone-
da de Tahuro puede considerarse
como ilegal. Es decir, determinar el
nmero mnimo y el mximo de ca-
ras que pueden ocurrir, a partir de
los cuales se considerar que la
moneda est cargada.
Bsqueda del criterio y final del juicio
Las siguientes preguntas se proponen con
la intencin de guiar de manera general la
reflexin acerca de lo que es el criterio para
tomar la decisin en el juicio y las caracte-
rsticas que debe tener.
a. Cree usted que si en los cien lan-
zamientos de la moneda se obtienen 53 ca-
ras, eso representa evidencia de que la
moneda est cargada? Y, si se obtienen 5(a
caras? Y, si se obtienen 58 cara s? Y, si se
obtienen 75 caras? Y, si se obtienen 43 ca-
ras? Y, si se obtienen 41 caras? Y, si se ob-
tienen 25 caras?
241
Estadistica 1
b. Proponga un criterio para decidir
sobre la legalidad de la moneda de Tahuro.
Explique detalladamente su respuesta (qu
razones tiene para proponer ese criterio, por
qu lo enuncia as, comentarios adicionales).
c. Considere los siguientes dos crite-
rios para juzgar la legalidad de la moneda de
Tahuro:
Criterio 1: Si salen menos de 40 caras, o, si
salen mas de 60 caras, entonces la moneda
de Tahuro esta cargada.
Criterio 2: Si salen menos de 35 caras, o, si
salen ms de 65 caras, entonces la moneda
de Tahuro est cargada.
Cul es la diferencia entre los dos criterios?
Con cual de los dos criterios preferir Ta-
huro que se le juzgue? Por qu?
d. Considere los siguientes dos crite-
rios para juzgar la legalidad de la moneda de
Tahuro:
Criterio 2: Si salen menos de 35 caras, o, si
salen ms de 65 caras, entonces la moneda
de Tahuro est cargada.
Criterio 3: Si salen ms de 64 caras, enton-
ces la moneda de Tahuro est cargada.
Cul es la diferencia entre los dos criterios?
Si la acusacin que se ha hecho sobre la
moneda de Tahuro es: la moneda est car-
gada, cul de los dos criterios es ms ade-
cuado para decidir en el juicio? Explique su
respuesta . De qu estilo debera ser la acu-
sacin contra la moneda de Tahuro para que
el criterio 3 resultara adecuado?
e. Suponga que ya se ha adoptado un criterio para juz-
gar la legalidad de la moneda de Tahuro. Se lleva a cabo la
experiencia que Ana Liza propuso, es decir, se lanza la moneda
cien veces y se cuenta el nmero de caras obtenidas. Adems,
se aplica el criterio establecido previamente. Qu opinin le
merece a usted el hecho cae repetir la experiencia, para volver
a aplicar el criterio? Explique su posicin.
f. A partir de las respuestas dadas a las preguntas ante-
riores haga una lista de caractersticas que debe tener el crite-
rio que se adopte para tomar la decisin en el juicio contra la
moneda de Tahuro.
Desde el punto de vista tcnico, si una moneda corriente se
lanza cien veces, se espera obtener 50 caras y 50 sellos. Sin
embargo, si en la prctica se obtuvieran, por ejemplo, 53 caras
y 47 sellos, seguramente este hecho no dara pie para sospe-
char que la moneda est cargada. En este caso, podramos
aceptar la diferencia entre lo terico y lo experimental como
una consecuencia cae la presencia del azar en al experimento
que se est realizando. De manera similar, no se pensara que
la moneda est cargada si se obtuvieran 47 caras y 53 sellos. Y,
podramos seguir dando casos particulares en los que al lanzar
cien veces la moneda no se obtienen 50 caras y 50 sellos y no
por eso se sospecha de la legalidad de la moneda. Surge en-
tonces la pregunta: can qu casos, tiene sentido sospechar
de la legalidad de la moneda? La respuesta expresada de ma-
nera muy vaga sera: en casos en los que el nmero de caras (y,
242
8
Error y Prueba de Hiptesis
por tanto, tambin el nmero de sellos) sea muy diferente de
50.
Antes de llegar a determinar con precisin el criterio que esta-
mos buscando vamos a ponernos de acuer-
do en el tipo de criterio adecuado para la si-
tuacin en la cual se va a emplear. Puesto
que la sospecha que se tiene slo se refiere a
que la moneda puede estar cargada y no a
que la moneda puede estar cargada a favor
de un determinado resultado, entonces ese
hecho debe reflejarse en la norma que vamos a usar. As, pues,
el criterio deber expresar que en cualquiera de los siguientes
casos se rechazar el supuesto de que la moneda es legal:
- si se obtienen menos de a caras
- si se obtienen ms de b caras
siendo que 0<n<50 y 50<b<100
Ahora bien. Los valores a y b no son nicos. Ellos dependen de
qu tan rgido se quiere que sea el criterio. Entre ms prximos
estn a y b a 50, ms estricto es el criterio con el que se juzga
el resultado y hay ms probabilidad de rechazar el supuesto de
que la moneda no est cargada; por tanto, hay ms probabili-
dad de acoger la hiptesis de que la moneda s est cargada,
cuando en realidad podra ser una moneda corriente. Recpro-
camente, entre ms razonablemente aleja-
dos estn a y b de 50, el criterio con el que
se juzga el resultado cae los cien lanzamien-
tos es ms amplio, puesto que incluye re-
sultados diferentes a 50, que pueden suce-
der por azar y no necesariamente porque la
moneda est cargada. La idea es que a y b
estn separados de 50 lo necesario para in-
cluir entre ellos una buena proporcin del
total de los resultados posibles y no incluir
una baja proporcin de resultados, que son
los que se pueden considerar como atpi-
cos. El esquema siguiente puede aclarar lo
dicho anteriormente.
A continuacin procederemos a precisar el
criterio. Para ello vamos a imaginar que el
experimento consiste en lanzar una mone-
da corriente cien veces consecutivas y re-
gistrar el nmero de caras obtenidas. Ese
experimento se repite una gran cantidad de
veces. La repeticin del experimento produ-
ce una distribucin con las siguientes carac-
tersticas:
- La variable, el nmero de caras,
toma valores desde 0 hasta 100
- La media de la distribucin es 50
caras
- La desviacin estndar de la distri-
bucin es 5 caras
243
Estadistica 1
- La distribucin sigue el modelo
normal
Y, entonces sabemos por ejemplo que a 2
desviaciones estndar alrededor de la me-
dia se encuentra el 95,44%, del total de las
observaciones. Es decir, en el intervalo [50 -
2 * 5, 50 + 2 * 5] = [40, 60] se incluyen
95,44% de los resultados posibles. El crite-
rio, podra ser el siguiente:
Si se obtienen menos de 40 caras
ms de 60 caras en cien lanzamien-
tos consecutivos de la moneda, se
considera que la moneda es ilegal y
por tanto deber declararse culpable
a Tahuro.
La representacin grfica del criterio con el
cual se va a juzgar la legalidad de la moneda
de Tahuro se presenta a continuacin:
Decisin: veredicto
Juez: Se inicia la sesin. Seor Tahuro, por favor, pngase de
pie. (Tahuro se levanta del puesto de los acusados.) Se le acusa
a usted de estar jugando por los corredores de la universidad,
con una moneda que est cargada. Cmo se declara usted
ante esa acusacin?
Tahuro: Inocente, seor juez.
Juez: Tiene usted la palabra seorita fiscal.
Ana Liza: Tal como el seor juez lo propuso he determinado
un criterio para decidir hasta qu punto una moneda
puede considerarse como ilegal. El criterio dice: Si
salen ms cae 60 caras o menos de 40 caras en cien
lanzamientos consecutivos debemos considerar que
la moneda es ilegal.
Juez: El criterio propuesto por la fis-
cal, coincide con mi criterio. Por
tanto, creo que lleg la hora de rea-
lizar el experimento.
Stadi Shka: Su seora, propongo
que el experimento sea realizado
por un testigo neutral; sugiero que
sea Chiripa quien haga los lanza-
244
8
Error y Prueba de Hiptesis
mientos. (El nunca ha sido perjudicado con el asunto de los almuer-
zos)
Juez: Se acepta la mocin. Seor Chiripa, pase al banquillo de
los testigos.
(Chiripa pasa al banquillo, toma la moneda de Tahuro y realiza los
cien lanzamientos, obteniendo 62 caras . )
Ana Liza: Seor juez, se han obtenido 62 caras. Este resultado
o uno en el que se obtengan ms de 60 caras, slo ocurre
con probabilidad menor de 0,025, por tanto creo que debe
declararse a Tahuro como culpable, pues el resultado obtenido
no apoya la hiptesis de que la moneda sea normal.
Stadi Shka: Protesto, su seora! Deberamos repetir el experi-
mento pues 62 caras se pueden obtener por puro azar an si la
moneda es legal. Entonces me parece que si se vuelve a repetir
el experimento, un resultado muy similar al anterior indicara
que...
Ana Liza: No es necesario que siga justificando la defensa. Que
se repita el experimento.
(Chiripa vuelve a lanzar la moneda cien veces, y ahora se obtienen 66
caras)
Juez: Han ocurrido 66 caras. Tiene la palabra la defensa.
Stadi Shka: Sin comentarios, su seora. (Se
le aguaron los ojos)
Juez: La seorita fiscal desea decir algo ms?
Ana Liza: No, seora. (Sonriente como nunca)
Juez: No habiendo lugar a ms discusin, se
levanta la sesin temporalmente y mientras
tanto, el jurado entra a deliberar para admi-
tir el fallo.
(despus de cinco minutos para deliberar, aparece
el seor juez con la decisin del jurado)
Juez: Por favor, pngase de pie el acusado.
(Tahuro se levanta.) El jurado ha decidido
declarar como culpable al acusado. Se le
condena a pagar una multa de 32 almuer-
zos y entra en prueba disciplinaria. (No puedo
creerlo; deben estar cometiendo un error)
a. Son las pruebas contra Tahuro
contundentes? Explique su respuesta.
b. Qu tipo de errores podra come-
ter el jurado al tomar una decisin sobre la
acusacin que recae sobre Tahuro? Consi-
dere ambos casos: cuando es declarado cul-
pable, y, cuando se declara que no se en-
contr evidencia de que sea culpable.
c. Si usted obtuviera 60 caras en
un experimento como el que se realiz en el
juicio contra Tahuro, qu dira: la moneda
est cargada o la moneda es legal? Expli-
que su respuesta en trminos probabilsti-
cos.
d. Explique por que la probabilidad de
obtener 40 menos caras, , 60 mas
caras, suponiendo que la moneda es le-
gal, al lanzar una moneda cien veces es de
0,05.
245
Estadistica 1
e. La fiscal Ana Liza dice: la probabi-
lidad de obtener 60 ms caras en 100 lan-
zamientos de la moneda, si sta es legal, es
de 0,025. Es correcta esa afirmacin? Ex-
plique.
f. Suponga que la moneda de Tahu-
ro realmente est cargada y que se obienen
55 Caras en el experimento de Ana Liza.
Qu decisin tomara usted como jurado?
Sera justa su decisin?
g. En la subseccin titulada Bsque-
da del criterio y final del juicio usted propu-
so un criterio para juzgar la legalidad de la
moneda de Tahuro. Determine cual habra
sido el veredicto, aplicando la norma que
usted dio. Explique su respuesta. Determi-
ne qu tan amplia es su norma, en trminos
de probabilidad.
h. Si la norma acogida hubiera sido:
Si salen menos de 35 caras, o, si salen mas
de 65 caras, entonces la moneda de Tahuro
est cargada, cul habra sido el veredicto?
Qu probabilidad hay en ese caso de de-
clarar culpable a Tahuro, no sindolo?
i. Sabiendo que se obtuvieron 62
caras al lanzar la moneda cien veces conse-
cutivas, construya un intervalo de confian-
za del 95% que le permita decidir acerca de
la culpabilidad de Tahuro.
j. Suponga que la sospecha hubiera
sido: La moneda de Tahuro esta cargada a
favor de cara. En ese caso, no tendra sen-
tido que la norma contemplara la posibili-
dad de condenar a Tahuro si salieran menos
de a caras. Suponga entonces que el crite-
rio fuera: si salen ms de b caras, donde 50
< b < 100, Entonces, la moneda es ilegal.
Se quiere que este criterio excluya slo un
5% del total c1e los resultados posibles,
cual debe ser el valor de b? Explique su res-
puesta.
En realidad lo que se realiz en el ejemplo anterior fue una
prueba de hiptesis, herramienta de gran valor en la estadsti-
ca para la labor del cientfico social. Ya vimos la realidad, ahora
veamos la teora.
Pasos en la prueba de hiptesis:
1. Definir la hiptesis nula: suponer una hiptesis acer
ca de una poblacin.
2. Formular una hiptesis alternativa: es una contra-hi-
ptesis.
3. Definir un criterio de decisin para rechazar o no la
hiptesis nula.
4. Recabar datos de la muestra.
5. Calcular una estadstica de muestra.
6. Utilizar la estadstica de muestra para evaluar la hip-
tesis.
Generalmente, se habla de no rechazar una hiptesis en lu-
gar de aceptar, ya que las pruebas no son concluyentes.
La prueba de hiptesis comienza con una suposicin, llamada
hiptesis, que hacemos con respecto a un parmetro de po-
blacin. Despus recolectamos datos de muestra, producimos
estadsticas de muestra y usamos esta informacin para deci-
dir qu tan probable es que sea correcto nuestro parmetro de
poblacin acerca del cual hicimos la hiptesis.
246
8
Error y Prueba de Hiptesis
Debemos establecer el valor supuesto o hipotetizado del par-
metro de poblacin antes de comenzar a tomar la muestra. La
suposicin que deseamos probar se conoce como hiptesis
nula, y se simboliza H
0
.
Siempre que rechazamos la hiptesis, la conclusin que s acep-
tamos se llama hiptesis alternativa y se simboliza H
a
.
Interpretacin del nivel de significancia.
El propsito de la prueba de hiptesis no es cuestionar el valor
calculado de la estadstica de muestra, sino hacer un juicio res-
pecto a la diferencia entre esa estadstica de muestra y un pa-
rmetro de poblacin hipotetizado. El siguiente paso despus
de establecer la hiptesis nula alternativa consiste en decidir
qu criterio utilizar para decidir si aceptar o rechazar la hipte-
sis nula.
Si suponemos que la hiptesis es correcta, entonces el nivel de
significancia indicar el porcentaje de medias de muestra que
est fuera de ciertos lmites.
Siempre que afirmemos que aceptamos la hiptesis nula, en
realidad lo que queremos decir es que no hay suficiente evi-
dencia estadstica para rechazarla. El empleo del trmino acep-
tar, en lugar de rechazar, se ha vuelto de uso comn. Significa
simplemente que cuando los datos de la muestra n hacen que
rechacemos una hiptesis nula, nos comportamos como si fuera
cierta.
Seleccin del nivel de significacin.
Nuestra eleccin del estndar mnimo para
una probabilidad aceptable, o el nivel de sig-
nificancia, es tambin el riesgo que asumi-
mos al rechazar una hiptesis nula cuando
es cierta. Mientras ms alto sea el nivel de
significacin que utilizamos para probar una
hiptesis, mayor ser la probabilidad de re-
chazar una hiptesis nula cuando es cierta.
Errores tipo I y tipo II.
El rechazo de una hiptesis nula cuando es
cierta se denomina error de tipo I, y su pro-
babilidad (que es tambin el nivel de signifi-
cancia) se simboliza como a. El hecho de
aceptar una hiptesis nula cuando es falsa
se denomina error de tipo II, y su probabili-
dad se simboliza como b. La probabilidad
de cometer un tipo de error puede reducir-
se slo si deseamos incrementar la probabi-
lidad de cometer el otro tipo de error. Con
el propsito de obtener una b baja, tendre-
mos que tolerar una a alta. Los responsa-
bles de la toma de decisiones deciden el ni-
vel de significacin adecuado, al examinar
los costos o desventajas vinculadas con
ambos tipos de errores.
Figura 8.1. Prueba de hiptesis de dos
extremos o de dos colas.
247
Estadistica 1
Pruebas de hiptesis de dos extremos
y de un extremo.
Una prueba de dos extremos de una hipte-
sis, rechazar la hiptesis nula si la media de
muestra es significativamente mayor o me-
nor que la media de la poblacin hipotetiza-
da. Existen dos regiones de rechazo.
Figura 8.2. Prueba de Hiptesis de extremo
derecho o cola a la derecha.
Hay situaciones en las que no es apropiada
una prueba de dos extremos, por lo que
debemos usar una prueba de un extremo,
que pueden ser de extremo izquierdo (o in-
ferior) o extremo derecho (o superior).
Figura 8.3. Prueba de Hiptesis de extremo
izquierdo o cola a la izquierda.
La nica forma de probar una hiptesis nula
es conociendo el parmetro de poblacin,
y eso no es posible al tomar una muestra.
Por consiguiente, aceptamos la hiptesis
nula y nos comportamos como si fuera cier-
ta, simplemente porque no podemos encontrar evidencia para
rechazarla.
Medicin de la potencia de una prueba de hiptesis.
Idealmente, tanto para a como b las probabilidades de los erro-
res tipo I y II deben ser pequeas. Una vez que decidimos el
nivel de significancia, no hay nada que podamos hacer con
respecto a a.
Cuando la hiptesis nula es falsa, (la media de la poblacin
cierta) no es igual a la media hipotetizada.
Puesto que rechazar una hiptesis nula cuando es falsa es exac-
tamente lo que debe hacer una buena prueba, un valor alto de
1 - b significa que la prueba est trabajando bastante bien, est
rechazando la hiptesis nula cuando es falsa. Puesto que 1 - b
es la medida de qu tan bien trabaja la prueba, se la conoce
como la potencia de la prueba. Si representamos grficamente
los valores 1 - b por cada valor de m para el que la hiptesis
alternativa es cierta, la curva resultante se conoce como curva
de potencia.
Conviene plantear la hiptesis nula siempre por la igualdad.
Adapte la contra hiptesis de acuerdo con el objetivo del pro-
blema. Formule la hiptesis basndose en los objetivos del es-
tudio, pero siempre antes de extraer la muestra y calcular el
estimador puntual del parmetro desconocido, para no verse
248
8
Error y Prueba de Hiptesis
influenciado por este resultado. Tenga en cuenta que si bien la
hiptesis nula es la que se pone bajo prueba, eso no significa
que deba ser siempre la suposicin que el experimentador de-
sea que se compruebe. Como en todo proceso de inferencia,
existe algn grado de subjetividad en la realizacin de una prue-
ba, particularmente en la eleccin del nivel de significancia y
del tamao de la muestra. Trate de que la eleccin de estos
valores responda a un anlisis cuidadoso del problema en cues-
tin.
Una vez fijadas las condiciones de la prueba, el resultado de la
misma es totalmente objetivo. Para fijar el nivel de significacin
de la prueba, hay que tener en cuenta que cuando la probabi-
lidad del error tipo I aumenta, la del error tipo II disminuye. La
forma de minimizar el error tipo II independientemente del ni-
vel de significacin, es aumentando el tamao de la muestra.
Como las probabilidades de los errores tipo I y II estn relacio-
nadas entre s, pero el experimentador puede fijar la primera,
antes de elegir el nivel de significancia hay que ver cul de los
dos tipos de errores resulta ms crtico.
Prueba de extremo superior: prueba de hiptesis de un extre-
mo en la que un valor de muestra significativamente superior al
valor de poblacin hipotetizado nos llevar a rechazar la hip-
tesis nula.
249
Estadistica 1
PROBLEMAS PROPUESTOS
1. El fabricante de la nevera de ba-
teras para cervezas marca Borrachn Hel-
per indica que esa nevera mantiene una
temperatura promedio de 44 grados F. El
gerente de la cervecera India, velando por
la calidad de su producto, el cual se debe
ingerir a una temperatura muy precisa de
44 grados F, no est de acuerdo con el fa-
bricante de la nevera y dice que puede
probar que la temperatura promedio de la
nevera es incorrecta. Indica las hiptesis
nula y alterna para este problema.
2. Un envasador de jugos dice que
la cantidad promedio de jugo en sus bote-
llas con capacidad de 16 onzas es de 16.1
onzas. Un grupo de consumidores lleva a
cabo una prueba de hiptesis para ver si
la cantidad promedio es realmente menor
de lo que reclama el envasador. Las hip-
tesis son: Ho: = 16.1 Ha:< 16.1. Ex-
plica el significado de error tipo I. (Escoge
la mejor respuesta y justifquela)
a. Concluir que < 1 6.1 cuando en reali-
dad = 1 6.1 onzas.
b. No rechazar la hiptesis de que = 1
6.1 onzas cuando realmente < 16.1.
c. No rechazar la hiptesis de que = 16.1
onzas cuando realmente = 1 6.1 .
d. Concluir que <16.1 cuando en reali-
dad <16.1
3. Se lleva a cabo una prueba de
hiptesis para Ho: = 1 6.1 Ha: < 16.1
al nivel de significancia del 5%. El valor de
la estadstica prueba es z = - 1 .87. En-
cuentra el valor p de la prueba.
4. Se lleva a cabo una prueba de hiptesis para Ho:
= 1 6.1 Ha: < 1 6.1 al nivel de significancia del 5%. El
valor de la estadstica prueba es z = - 1 .87. Indica la deci-
sin que se debe tomar.
5. Se desea conocer si el tiempo promedio de espera
en una fila en el supermercado ha aumentado de 8.8 minu-
tos. Se conoce que s = 3.8 minutos. Se toma una muestra
de 37 personas y se anota el tiempo de espera de cada una.
El tiempo promedio de espera de esta muestra es de 10 mi-
nutos. Efecta esta prueba de hiptesis al nivel de signifi-
cancia del 5%. Determine Hiptesis Ho, Ha, valor de la esta-
dstica prueba, valor crtico, decisin:
6. Se seleccionan muestras independientes de 14
mujeres y 17 hombres y se les pregunta el nmero de horas
que vieron televisin durante la semana pasada. Se obtie-
nen los siguientes resultados:
Encuentra un intervalo de confianza del 95% para la diferen-
cia de la cantidad promedio de tiempo que los hombres y
mujeres invierten viendo televisin.
7. Un productor de programas de radio cree que el
nuevo formato propuesto ser preferido por menos del 25%
de sus radioescuchas actuales. Una muestra de 100 de es-
tos radioescuchas refleja que el 22% favorecieron el nuevo
formato. Prueba la hiptesis del productor: Ho: p = .25 Ha:
p < .25 al nivel de significancia del 1 %.
250
8
Error y Prueba de Hiptesis
8. Cierto fabricante de papel hace sus envos de pulpa
de acuerdo con la produccin de su propio digester de
madera basndose en ciertas propiedades del papel fabrica-
do con la misma pulpa de madera. Una propiedad importan-
te del papel es su resistencia a la tensin; la prueba se realiza
en un laboratorio en el que se fabrica el papel con la
pulpa investigada. Supngase que una muestra de 4 dio
una media de 25 unidades y que se sabe por la historia
de dichas pruebas que la desviacin estndar es de 5.
para ese producto. Si se supone normalidad en los re-
sultados, cules son los lmites de confianza al 95%,
para , para esta muestra?
9. Se llev a cabo un estudio para explorar la relacin
entre el salario y calidad del producto de su trabajo. Se se-
leccionaron cincuenta personas y se les pidi uno a uno que
limpiaran un automvil. A la mitad de las personas se les pa-
garan veinte dlares por trabajo y a la otra mitad se les pidi
que hicieran el trabajo como voluntarios, sin paga. El estudio
revel que las personas a quienes se les pag por su trabajo
limpiaron mejor el automvil que las que hicieron el trabajo
como voluntarios.
a. Identifica los elementos de un buen diseo experimental
presentes en este estudio.
b. Describe concretamente la forma en que asignaras las per-
sonas a cada una de las condiciones experimentales.
En cada uno de las situaciones que siguen, establece las hi-
ptesis nula y alterna. Adems describe en trminos del pro-
blema lo que constituye error tipo I y error tipo II.
a. Ests interesado en saber si la media verdadera l de todas
las puntuaciones en una prueba estandarizada difiere de 445.
b. Una mosca puede producir hijos con ojos azules o con ojos
negros. Un bilogo quiere determinar si ms de la mitad de las
moscas heredan ojos azules.
c. Un comerciante desea expandir su ne-
gocio de venta de ropa. Entiende que si
expande su negocio podr vender ms de
$500.000 adicionales al da. El comerciante
desea verificar esa aseveracin.
10. El tiempo requerido para reali-
zar cierto trabajo de oficina fue observa-
do en cada una de 25 personas. La me-
dia result ser 50 minutos y la desviacin
estndar, 15 minutos. La direccin desea
una estimacin de la verdadera media,
aproximada a 3 minutos y con probabili-
dad de error de no ms de un centsimo.
Suponiendo a la poblacin aproximada-
mente normal y suponiendo a las 25 per-
sonas como una muestra aleatoria de ofi-
cinistas potenciales, qu tan grande debe
ser la muestra que cumpla los requisitos
de la estimacin?
11. Un grupo de 50 animales expe-
rimentales recibe cierta una clase de ra-
ciones por un periodo de 2 semanas. Sus
aumentos de peso arrojan los valores X
= 420 g y s = 50 g. (a) Qu tan preciso
es 420 como estimacin de media de
poblacin? (b) Qu tan grande debe to-
marse la muestra si se desea que X difiera
de por menos de 10 g, con 0.95 de pro-
babilidad de estar correcto? (c) Encontrar
el lmite de confianza a 95% para E.
12. En una auditoria de muestra
aleatoria de pequeas transacciones he-
251
Estadistica 1
cha cuidadosamente sobre una muestra
de 50 transacciones se obtuvo un error
medio de -150 pesos con una desviacin
estndar de -60 pesos. Calcule los lmites
de confianza al 95% para , verdadero
error medio, de la totalidad de las peque-
as transacciones, suponiendo normalidad
aproximada para X.
13. Una compaa farmacutica con-
sidera cierta nueva enzima para determi-
nar si es capaz de acelerar uno de los pro-
cesos. El rendimiento para un lote se
considera igual al rendimiento real, dividi-
do por un rendimiento terico basado en
la experiencia anterior. La nueva enzima
fue probada en 50 lotes y se encontr un
rendimiento promedio de 1.24, con des-
viacin estndar de .20.
(a) Calcule un intervalo de 95% de
confianza para el rendimiento
real.
(b) Basado en el experimento, pue
de usted estar seguro de que el
rendimiento verdadero sea supe-
rior a 1.00? Explique.
14. La U.S. Public Land Survey (Ofi-
cina de Deslindes de los Estados Unidos
traza mapas de los estados en unidades
de rea de 14 de milla cuadrada. Uno de
los estados agrcolas contiene 219,176
unidades. Hace varios aos, se tom una
muestra de 908 unidades y se cont el
nmero de granjas cuya sede se encon-
traba en cada una de esas unidades de
rea. El nmero medio de granjas por uni-
dad fue 0.8722 y la desviacin estndar
0.6629. Calcular lmites de confianza del 95% aproximados
para el nmero total de granjas en ese estado en aquel en-
tonces.
15. Plantee 3 problemas relacionados con la carrera y
que toquen los temas ms relevantes de esta unidad y re-
sulvalos. (Se seleccionarn los tres mejores del curso.)
16. Use el paquete estadstico que este disponible en la
universidad o al que usted tenga acceso (si usa el EVIEWS
puede apoyarse en la referencia rpida del anexo 2) y desa-
rrolle los ejercicios en este y verifique sus respuestas. Verifi-
que tambin las respuestas de los ejercicios resueltos de esta
unidad.
17. En un artculo de la revista SEMANA se habla acer-
ca de los ndices de violencia en Colombia. Dicho artculo
presenta la siguiente informacin:
Nmero de acciones violentas en los departamentos ms afec-
tados segn los casos registrados en 1994.
Algunos investigadores que trabajan el tema de la violencia
infantil afirman que:
Los casos de extorsin con respecto a todos los casos de
violencia registrados en el departamento de Antioquia no
superan el 26%.
Con base en los datos suministrados por la revista, analice la
afirmacin anterior. Para ello, resuelva los siguientes puntos:
a) Formule la hiptesis nula y la hiptesis alternativa
correspondiente.
b) Encuentre el p-valor y represntelo grficamente.
c) Determine un nivel de significacin tal que se re-
chace Ho.
252
8
Error y Prueba de Hiptesis
d) Determine un nivel de significacin tal que no
se rechace Ho.
e) Qu decisin tomara con respecto a la afirma-
cin? Explique claramente su respuesta.
18. El Gobierno Nacional ha destinado un presu-
puesto de 500 millones de pesos para el departamento
de Antiquia. El presupuesto slo se puede invertir en
educacin o en seguridad, pero no en ambos. La inver-
sin se puede hacer en equipos y entrenamiento de per-
sonal para reforzar al grupo Gaula (grupo policivo espe-
cializado en antiterrorismo) o en colegios pblicos, para
materiales y capacitacin de profesores que favorezcan
el desarrollo de los PEIs (Proyectos Educativos Institu-
cionales) de mayor calidad. Suponga que la decisin so-
bre en que rea (educacin o salud) se debe invertir el
presupuesto, depende de si han aumentado o no los ni-
veles de violencia. Analice segn el contexto, cul sera la
incidencia de los errores de tipo I y tipo II.
253
Estadistica 1
PROBLEMAS RESUELTOS
1. Plantear dos ejemplos de formu-
lacin de hiptesis estadsticas para una
poblacin.
Solucin.
Ejemplo 1. Se inspecciona una muestra de
pulgones de cierta regin y se mide la lon-
gitud de cornculo. Por datos obtenidos en
otra regin, se sabe que la longitud pro-
medio del cornculo es de 0.10 mm.
La hiptesis nula se expresa como: Ho
= 0.10, la hiptesis alternativa: Ha: g 0.10
mm. En otras palabras, se prueba si la
muestra proviene de una poblacin con
media 0.1 mm, la hiptesis alternativa es
que la media es distinta.
Ejemplo 2. Se inspecciona una muestra de
plantas de frijol, se cuenta el nmero de
picudos del ejote por vaina. Se desea sa-
ber que tipo de distribucin probabilistica
representa los conteos de insectos.
2. Plantear dos ejemplos de estads-
ticas con dos poblaciones.
Solucin.
Ejemplo 1. Se realiza el siguiente experi-
mento. Se pretende probar si cierto tipo
de trampa captura adultos de salivazos
igualmente del lado norte y del lado sur.
Aqu la hiptesis es
1
-
2
, contra Ha:

1
g
2
.

1
es la media poblacional (nmero de in-
sectos capturados) en el lado sur, y
2
es
la media poblacional en el lado norte.
Ejemplo 2. Se postula que existe una relacin lineal entre el
nmero de chinches del sorgo y el rendimiento del sorgo.
El modelo estadstico ms simple es que el rendimiento (Y)
es una funcin lineal del nmero de chinches (X): Y
i
- B
O
+
B
1
X + ei. Si este modelo es cierto, entonces B
1
<> 0, de
otra manera no existe relacin entre X y Y y el modelo se
colapsa a: Y
i
- B
O
+ e
i
.
B
O
representa la media general y B
1
la pendiente de una
recta. La hiptesis que se desea probar es:
Ho : B
1
- 0 vs B
1
<> 0.
3. Supongamos que las alturas de 100 estudiantes
varones de la universidad representan una muestra aleato-
ria de los 1546 estudiantes de la institucin. Si =67.45 in
y r = 2.93 in, hallar los intervalos de confianza (a) 95% y (b)
99% para estimar la altura media de los estudiantes.
Solucin.
(a) Supondremos que la poblacin es infinita o tan
grande que se puede considerar como muestreo con re-
posicin. Los lmites de confianza 95% son:
El 1.96 es el valor z de las unidades estndar hasta donde se
cubre en la distribucin normal el 95% del rea bajo la curva.
(Verifique en la tabla del anexo 3 que para z=1.96 el rea
correspondiente es 0.475 es decir la mitad del 0.95 o 95%)
Reemplazando los valores correspondientes tenemos
[67.45-1.962.93/ 100, 67.45-1.962.93/ 100] = [67.45-
0.57, 67.45+0.57] =[66.88, 68.02]
Es decir tenemos el 95% de confianza de que la media de la
poblacin se encuentra entre 66.88 y 68.02.
(b) Los lmites de confianza 99% son:
254
8
Error y Prueba de Hiptesis
= [67.450.76]
Luego el intervalo de confianza 99% para la media de la po-
blacin es 66.69 a 68.21 in, que se denota por 66.99 <
< 68.21.
4. La vida media de una muestra de 100 tubos fluo-
rescentes producidos por la empresa es de 1570 h con una
desviacin tpica de 120 h. S i es la vida media de todos los
productos en esa empresa, contrastar la hiptesis de que
= 1600 h contra la hiptesis alternativa y 1600 h, usando
nivel de significacin de (a) 0.05 y (b) 0.01
Solucin.
Debemos decidir entre dos hiptesis, para decidir cual es la
hiptesis nula y cual la alternativa debemos tener en cuenta
el siguiente truco: la hiptesis nula se establece como cuan-
do no pasa nada, en este caso aunque ya nos han dado las
hiptesis, pero podemos verificar como se describe la hip-
tesis nula como el que la media tome un valor determinado y
la hiptesis alterna como el que puede tomar cualquier otro
valor.
Ho: = 1600 h
Ho: 1600 h
Puesto que 1600 incluye valores mayores y menores que
1600, usaremos un contraste de dos extremos o dos colas.
(a) Para un contraste de dos colas al nivel de significa-
cin de 0.05, tenemos la siguiente regla de decisin:
Rechazar Ho si el z de la media muestral est fuera del rango
1.96 a 1.96.
Aceptar Ho en el caso contrario.
El estadstico bajo consideracin es la media muestral. Bajo
la hiptesis Ho, tenemos = 1600 y
usando la desviacin tpica muestral
como estimacin de r. Veamos cual es el
valor de z correspondiente a la media
muestral,
-2.50 est fuera del rango, es decir no est
dentro del intervalo de confianza 1.96 a
1.96, por lo que rechazamos Ho al nivel
de significacin 0.05.
(b) Si el nivel de significacin es 0.01, el
rango pasa a ser 2.58 a 2.58. As pues,
como el valor 2.50 cae dentro de ese
rango, aceptamos Ho (o rehusamos to-
mar decisin al nivel de significacin 0.01)
5. En el ejercicio anterior, contras-
tar la hiptesis = 1600 h frente a la
hiptesis alternativa < 1600 h con ni-
vel de significacin (a) 0.05 y (b) 0.01.
Solucin.
Tenemos que decidir entre las hiptesis:
Ho: = 1600 h, y Ha: < 1600 h.
Habr que usar un contraste de una cola,
por que la correspondiente figura tiene la
regin crtica o de rechazo ubicada a la
derecha.
(a) Si el nivel de significacin es 0.05,
el rea sombreada de la figura es 0.05, y
hallamos que Z
1
= -1.645. Por lo tanto,
adoptamos como regla de decisin:
255
Estadistica 1
Rechazar Ho si z es menor que 1.645.
Aceptarla en caso contrario (o declinar
cualquier decisin).
Ya que z = -2.50 segn se calcul en el
ejercicio anterior, es menor que 1.645,
rechazamos Ho al nivel de significacin
0.05. Ntese que esta decisin es idnti-
ca a la alcanzada en el problema anterior
por medio del contraste de dos colas.
(b) Si el nivel de significacin es
0.01, el valor Z
1
en la figura es 2.33.
(Corresponde al rea de 0.49, la cual su-
mada a la otra mitad de la campana 0.5
nos da un rea de 0.99 o 99% de con-
fianza) rechazamos Ho al nivel de signifi-
cacin 0.01. Ntese que esta decisin no
es la alcanzada en el problema anterior
por medio del contraste de las dos co-
las.
Se deduce que las decisiones relativas a
una cierta hiptesis Ho que estn basa-
das en contrastes de una o dos colas no
siempre concuerdan. Lo cual era de es-
perar, naturalmente, pues estamos con-
trastando Ho frente a alternativas dife-
rentes segn el caso.
6. Las tensiones de ruptura de los
cables fabricados por una empresa tie-
nen una media = 1800 libras con una
desviacin tpica = 100 libras. Se de-
sea comprobar si un nuevo proceso de
fabricacin aumenta dicha tensin me-
dia. Para ello se toma una muestra de 50
cables y se encuentra que su tensin
media de ruptura es de 1850 lb. se pue-
de afirmar la mejora del nuevo proceso al nivel de signifi-
cacin 0.01?
Solucin.
Tenemos que plantear las hiptesis entre las cuales vamos
a decidir. La hiptesis nula establece que no pasa nada;
en este caso el no pasa nada se debe interpretar como:
no hay realmente un cambio en la tensin de ruptura, es
decir la media sigue siendo la misma. Las hiptesis quedan
as:
Ho: = 1800 lb, y no hay realmente cambio en la tensin
de ruptura.
Ha: > 1800 lb, y hay realmente cambio en la tensin de
ruptura.
Hay que usar un contraste de una cola a la derecha. Al
nivel de significacin 0.01, la regla de decisin es:
Si el z observado es mayor que 2.33, el resultado significa-
tivo al nivel 0.01 y rechazamos Ho. En caso contrario, se
acepta Ho (o se aplaza la decisin).
Como no tenemos la desviacin de la muestra, entonces la
calculamos como s=/ N, bajo la hiptesis de que Ho es
verdadera, vemos que
Como este valor de z es mayor que 2.33. As que el resulta-
do es altamente significativo y la afirmacin puede mante-
nerse.
256
8
Error y Prueba de Hiptesis
BIBLIOGRAFIA
Recuerde que cuando se tomo la decisin en la universidad de
producir este texto, se consider que los textos existentes no
proporcionaban los elementos suficientes que el estudiante de
administracin pblica requiere. Claro que el estudiante no
puede prescindir del estudio de otros textos, y no lo debe ha-
cer, sin embargo, debe hacerlo con beneficio de inventario,
reconociendo que si bien en estos hay rela-
cionado un compendio de conocimientos, las
bondades pedaggicas son cuestionables.
Los textos que fueron consultados para la
elaboracin de esta unidad fueron:
CHOW, Ya-Lun. Anlisis Estadstico. Traducido al es-
paol por Vicente Agut Armer. Editorial Mc Graw
Hill. 2da Edicin. Mxico, 1992.
FERNANDEZ, Felipe; MONROY, Olga L.; RODRI-
GUEZ, Liliana. Diseo, desarrollo y evaluacin de situa-
ciones problemticas en estadstica. Universidad de los
Andes: una Empresa Docente. Bogot D.C., 1998.
HOEL, Paul G. Y JESSEN, Raymond J. Estadstica B-
sica para Negocios y Economa. Compaa Edutirial
Continental S.A. 2da Edicin. Mxico, 1985.
MENDENHALL, William. Estadstica para Administra-
dores. Traducido por Dirk Valckx Verbeeck. Grupo
Editorial Iberoamrica. Mxico, 1990.
PERRY, Patricia Ins; MESA, Vilma Mara; FERNAN-
DEZ, Felipe; GOMEZ, Pedro. Matemticas, Azar y
Sociedad. Conceptos bsicos de estadstica. Universidad
de los Andes: Una Empresa Docente, Bogot D.C.,
1998.
SPIEGEL, Murray R. Estadstica. Traducido por Ra-
fael Hernndez Heredero. Editorial Mc Graw Hill. 2da
Edicin. Madrid, 1998.
257
Estadistica 1
Anexos
258
A
Anexos
259
Estadistica 1
ANEXO 1.
FORMAS PARA ANALIZAR ESTADSTICAS CON EXCEL
Microsoft Excel proporciona un conjunto de herramientas para
el anlisis de los datos (denominado Herramientas para anli-
sis) que podr utilizar para ahorrar pasos en el desarrollo de
anlisis estadsticos o tcnicos complejos. Cuando utilice una
de estas herramientas, deber proporcionar los datos y par-
metros para cada anlisis; la herramienta utilizar las funcio-
nes de macros estadsticas o tcnicas correspondientes y, a
continuacin, mostrar los resultados en una tabla de resulta-
dos. Algunas herramientas generan grficos adems de tablas
de resultados.
Para ver una lista de las herramientas de anlisis disponibles,
elija Anlisis de datos en el men Herramientas. Si este co-
mando Anlisis de datos no est en el men Herramientas,
ejecute el programa de instalacin para instalar Herramientas
para anlisis. Una vez instalado Herramientas para anlisis,
deber seleccionarlo y activarlo en el Administrador de com-
plementos o macros automticas. Para usar estas herramien-
tas, es necesario estar familiarizado con el rea de estadsticas
o el rea tcnica en que desee desarrollar anlisis.
Instalar y usar Herramientas para
anlisis
Para utilizar una herramienta de an-
lisis, deber organizar los datos que
desee analizar en columnas o filas en
la hoja de clculo. Este es el rango
de entrada.
Si el comando Anlisis de datos no
est en el men Herramientas, ser
necesario instalar Herramientas para
anlisis en Microsoft Excel.
Instalar Herramientas para anlisis
1 En el men Herramientas, elija Complementos.
260
A
Anexos
Si Herramientas para anlisis no aparece en la lista del cuadro
de dilogo Complementos, haga clic en Examinar y localice la
unidad, la carpeta y el nombre de archivo de Herramientas
para anlisis que normalmente estar ubicado en la carpeta
Library\Analysis; o bien, ejecute el programa de instalacin si
no estuviera instalado.
2 Active la casilla de verificacin Herramientas para an-
lisis.
Usar Herramientas para anlisis
1 En el men Herramientas, elija Anlisis de datos.
2 En el cuadro Herramientas para anlisis, haga clic en la herramienta
que desee utilizar.
261
Estadistica 1
3 Introduzca el rango de entrada, el rango de salida y, a
continuacin, seleccione las opciones que desee.
Nota Los complementos o macros automticas que seleccione en el cuadro
de dilogo Complementos, permanecern activas hasta que las desactive.
262
A
Anexos
ANEXO 2.
REFERENCIA RAPIDA DEL EVIEWS
BACK TO ECONOMETRIC ESTIMATION
QUESTIONS
1. How can I enter my statistical data ?
2. How can I generate a new data serie from one or se-
veral other data series?
3. How can I draw a graph?
4. How can I modify the sample range ?
5. How can I estimate my model with the ordinary least
squares estimation method?
6. How can I estimate my model with the generalized
least squares estimation method?
7. How can I get residuals correlograms ?
8. How can I get statistical tests?
9. How can I smooth a time serie or adjust it for seaso-
nal variations?
10. How can I do forecasting?
11. How can I handle with a simultaneous equations sys-
tem?
12. How can I do pooling?
13. What are the main Eviews commands?
ANSWERS
1. - Enter your statistical data
Select File New Workfile and choose a name for your workfile
using the dialog box. After clicking OK, another dialog box co-
mes to screen. Choose the frequency of your data series and
specify your sample range. When you use a quarterly frequen-
cy, you have to write the quarter number too. For instance,
you will type 1980:1 to 1999:4. You get a workfile in which you
can enter your data. But first of all you have to create the data
series. Therefore click on Object New and select Serie giving it
a name. Repeat this stage to create every serie. The series will
appear on your workfile. Last but not least you will enter your
data into each serie. Click on the serie icon and on the button
263
Estadistica 1
Edit +/- of the new window. Then type your data. Before clo-
sing the window, click again on Edit +/-.
Notice : if you work with cross section data instead of time
series, choose the undated frequency and give a number to
each country (if we are talking about countries) or industry or
whatever it is.
2. Generate a new serie
After opening your workfile with File Open Workfile name, use
the Genr command by writing an expression in the command
line just below the main menu. For instance, you will type Genr
NewSerie=(Serie1*Serie2)/Serie3. To deflate a nominal GDP
serie with a price index, you could write : Genr
RealGDP=NomGDP/Price. The operators of expressions are the
classical +, -, *, / and a few more described in the help of the
software. The new serie will appear next to the others on the
workfile.
3. Draw a graph
Open your workfile by selecting File Open Workfile Name and
type Plot in the command line. You have to specify the name of
the serie to plot. For instance, Plot RealGDP. The graph comes
to screen in a reduced window. Select the window on the who-
le screen.
Click on the Options button of the graph menu and choose
the graph options with the new dialog box. After closing the
graph window you can save your graph by choosing a name in
the dialog box that appears at screen. Your graph will appear as
a graphic object next to the others series objects in your wor-
kfile.
4. Change the sample range
After opening your workfile, type Smpl first period last period
in the command line just below the main menu. For instance, if
you have a sample between 1950 and 1995, you could type
Smpl 1970 1990 to change the sample range.
264
A
Anexos
5. Estimate your model with the ordinary least
squares method
After opening your workfile, type in the command line just be-
low the main menu :
LS Dependent Variable Name C Independent Variables Names
separated by a space between the names. For instance, if we
regress consumption on yield after creating the consumption
and yield series, we have to write the following instruction : LS
Consumption C Yield. The following table is supplied to you by
the software :
LS // Dependent Variable is CONSUMPTION
Sample: 1948 1994
Included observations: 47
Excluded observations: 0 after adjusting endpoints
As you can see, this table give you the main statistical values
you need to analyse your regression. The menu of the equa-
tion window enable you to get others interesting views of your
regression. For instance, if you click on the Resids button then
you get a residuals graph.
265
Estadistica 1
6. Estimate your model with the generalized least
squares method 3 different cases :
you are doing a pooling : Eviews directly apply the GLS me-
thod; you can convert the GLS case into an OLS case. For
instance, if you have a serial correlation problem you can apply
a Cochrane - Orcutt procedure by writing the following com-
mand : LS CONSUMPTION C YIELD AR(1), where AR(1) is used
to apply this procedure;
you proceed in the same way as you estimate an equation with
the OLS method, but you click on the estimate button of the
equation window to choose the right estimation methods and
their options. Please be cautious and choose the right estima-
tion methods and parameters after checking them in the eco-
nometric literature. You are not just doing press-buttons eco-
nometrics.
7. Get residuals correlograms
After getting your regression, click on the view button of the
equation window. Then select Residuals Tests Correlogram. Plea-
se indicate the maximal self correlation order you want. If you
choose 3, for instance, you get first order, second order and
third order self correlation of residuals. To come back to re-
gression results click on the stats button.
8. Compute statistical tests
After computing your regression, the t, F and Durbin-Watson
test are directly available in the equation window. If you want
to compute other statistical tests, click on the view button of
the equation window and select either Coefficient Tests or Re-
siduals Tests or Stability Tests. To come back to regression re-
sults click on the stats button.
9. Smooth a time serie or adjust it for seasonal
variation
Type seas or smooth in the command line placed just below
the main menu. Indicate the name of the serie into the dialog
box.
266
A
Anexos
Another dialog box comes to screen and you choose the right
methods and parameters to smooth the time serie or to adjust
it for seasonal variations.
10. Forecasting
After getting your regression results, click on the forecast bu-
tton of the menu in the equation window. Apply the best me-
thod to your case. So you have to think to that very well...
Look at our econometric bibliography if you have some doubt.
11. Work with a simultaneous equations system
After opening your workfile, click on Object New System and
give it a name. A new window comes to screen. Write in it your
system using its structural form. The system parameters as the
constants and coefficients are written C(1) C(2) C(3) ... C(n).
For instance, you could type the following system with five
parameters to estimate :
CONSUMPTION = C(1) + C(2)*YIELD
INVESTMENT = C(3) + C(4)*YIELD + C(5)*YIELD(-1)
YIELD = CONSUMPTION + INVESTMENT + GOVERNMEN-
TEXPENSES
Notice : YIELD(-1) means the yield at the former period.
After writing your model, you can estimate it. Only click on the
estimate button of the system window. A dialog box will ask
you to choose the right method of estimation. Apply the me-
thod that suits well to your case. For further tips, type system
in the search engine of the software help and choose system
estimation. Advice : have a look to our econometric bibliogra-
phy too.
12. Pooling
Sometimes cross-section and time-series data are merged or
pooled. The result could be interpreted as a cross section of
time series or a time series of cross sections. After opening
your workfile, select Objects New Object and choose Pool gi-
ving it a name. Identify the elements which differentiate the
countries or years in the new window you can view on the
267
Estadistica 1
screen. For instance, if you got variables for 24 countries and
for the years 95 and 96, type 95 and 96 as identifiers. But be
careful ! You should have created the series before doing your
pooling. The names of the series have to contain the identifier.
In our case, you should have written the yield series in the
following way: YIELD95 and YIELD96. After that click on the
sheet button of the pool window and type the series names
replacing the identifier by a question mark?. For instance, YIELD?
PRICE? DEMAND?. Another window comes to screen with the
data. Click on the estimate button and write the variables na-
mes with a? instead of the identifier part. For instance, DE-
MAND? In Dependent Variable and YIELD? PRICE? in Common
coefficients. Choose the right methods and parameters. Per-
haps you need to check in the econometric literature or in the
software help.
13. Main Eviews commands
The most used commands are in bold. Most of these are avai-
lable through different software menus. The software help ex-
plains clearly every command (very well done). If you work with
EViews 3.1., dont forget to check Object Reference, Function
Reference, Matrix & String
268
A
Anexos
Reference and Programming Reference
in the help menu.
ADD Test addition of variables
ADF Unit root test
AR Autoregressive error specification
ARCH Test
ASSIGN Assign name to series in model
AUTO Serial correlation LM test
BAR Bar graph of series
CAUSE Granger causality test
CCOPY Copy series from CITIBASE to data bank
CFETCH Fetch a series from CITIBASE into RAM
CHDIR Change subdirectory
CHOW Chow test for stability
CLABEL Read a CITIBASE series description
CLOSE: Close object or file COEF Declare coefficient vector
COINT Cointegration test
COR Correlation matrix
COV Covariance matrix
CREATE Create a new workfile
CROSS Cross correlations
D Delete objects from workfile
DATA Enter data from keyboard
EQUATION Define equation
EXIT Exit from EViews
EXPAND Lengthen workfile
FETCH Fetch objects from disk into the workfile
FIT Calculate fitted values
FOR For loop
FORECAST Compute a forecast
FREEZE Create a view object from a view GENR Generate a
new series from a formula
GROUP Create a group
HIST Histogram and normality test
IDENT Time series identification of residuals
IF statement
IDENT Identify a time series process
LOAD Load a workfile
LOGIT Estimate logit model
269
Estadistica 1
LS Least squares estimation
MA Moving average error specification
MATRIX Declare MATRIX object
MODEL Declare a model
NA Not available code
NEXT End of FOR loop
NRND Random number generator
PARAM Set parameters PDL Polynomial distributed lag
PIE Pie chart
PLOT Line graph
PRINT Print objects
PROBIT Estimate probit model
PROGRAM Declare a program
R Rename object
READ Read data from a foreign disk file
RESET test
ROWVECTOR Declare a ROWVECTOR object
RUN Run a program
SAMPLE Declare a sample
SCALAR Declare a SCALAR
SAR Seasonal autoregressive term
SAVE Save the current workfile on disk
SCALAR Declare scalar SCAT Scatter diagram of two series
SEAS Seasonal adjustment
SERIES Create a new series from a formula
SETCELL Insert contents into cell of table
SETCOLWIDTH Set width of cell of table
SETLINE Place a horizontal line in a table
SHOW Display objects
SMA Seasonal moving average term
SMOOTH Exponential smoothing
SMPL Specify the sample for series
SORT Sort the work file
STATS Descriptive statistics
STEP Step size in FOR loop
STOP Break out of loop STORE Store objects on disk
SYM Declare a SYM object
SYSTEM Declare system of equations
TEST Specification and diagnostic tests
TO Upper limit of FOR loop
270
A
Anexos
TSLS Two stage least squares
UROOT Unit root test
VAR Define a Vector Autoregression
VECTOR Declare a VECTOR object
WALD Wald test
WEND End of WHILE clause
WHILE Control statement
WHITE Whites test for heteroskedasticity
WORKFILE Create or change workfile
WRITE Write a file with multiple series
271
Estadistica 1
ANEXO 3.
TABLA DE LA DISTRIBUCION NORMAL
Nota: Estos datos han sido calculados con la ecuacin que se encuentra
en la parte superior derecha. Tenga en cuenta que se ha calculado sola-
mente el rea desde el centro 0 hacia la derecha hasta el punto z
i
respec-
tivo. Los valores hacia la izquierda se encuentran por simetra.

You might also like