You are on page 1of 8

HUBERT M. BLALOCK, JR.

,
ESTADISTICA
SOCIAL
1'

j]i)
60 ANIVERSARIO

FONDO DE CULTURA ECONMICA


M~XICO
.l
~
p

'\,
,

LA DISTRIBUCiN NORMAL 105


el nmero de casos se ha aumentado asimismo. En tal caso,
como en la figura VII.lb, ser posible servirse de un mayor n-
VII. LA DISTRIBUCIN NORMAL ) mero de intervalos ms angostos, cada uno de los cuales tenga
un nmero suficiente de casos para mantener la regularidad. Si
LA NOCIN de la distribucin de frecuencia es ya familiar. El pre- el nmero de casos sigue aumentando, pueden emplearse todava
sente captulo se ocupa de un tipo muy importante de distribu- ms rectngulos, conservando, con todo, el tipo regular (fig.
cin de frecuencia: la curva normal. Esta distribucin es muy
til, no slo porque un gran nmero de distribuciones empricas
se encuentran ser aproximadamente normales, sino debido tam-
bin a su significado terico en la estadstica inductiva. En este
momento, el lector no debe preocuparse por las aplicaciones en
las que se emplea la curva normal, En efecto, el objeto del pre-
sente captulo est en indicar las propiedades de la curva en
cuestin y en familiarizar al lector con el . emple de cuadros
basados en la misma. Esta distribucin se examina en la esta- (a)
dstica descriptiva ms que en la inductiva por dos razones prin-
cipales. Primero, la curva normal puede emplearse para propor-
cionar una interpretacin de la desviacin estndar. Y en segundo
lugar, sern tiles al lector para familiarizarse con la distribucin
normal algunos captulos antes de exponerse a pruebas estads-
ticas que requieren facilidad en la manipulacin de la misma.
Por lo tanto, cuanto mejor se comprenda la materia expuesta en
este captulo, tanto menos dificultad se experimentar ms ade-
lante.
(b)
I
VII.1. Distribuciones de frecuencias finitas versus infinitas
Las distribuciones de frecuencia hasta aqu examinadas compor-
taban un nmero finito de casos. De hecho, por supuesto, todas
las distribuciones empricas comportan necesariamente un n-
mero finit~ de casos, aunque tal vez muy grande. Sin embargo,
los matemticos consideran ventajoso a menudo pensar en tr-
minos de distribuciones basadas en un nmero de casos infinita-
mente grande. Ms bien que tratar con distribuciones empricas
de aspecto anguloso, como las que ejemplifican el histograma te>
o el polgono de frecuencia, resulta posible concebir curvas lisas
basadas en un nmero indefinidamente grande de casos y sus- FIG. VII.L Comparaciones de curvas lisas con _ histogramas de
ceptibles de ser expresadas en trminos de ecuaciones matem- amplitudes diferentes de intervalo
ticas relativamente sencillas. La distribucin normal es una de
tales curvas. Antes de examinar esta distribucin especfica, con- VII.le). Las curvas lisas se han trazado por .los puntos medios
vendr estudiar la naturaleza del proceso a travs del cual se l\ del lado superior de cada rectngulo. Resulta claro que los rec-
desarrolla una curva lisa semejante. tngulos van formando aproximaciones cada vez mejores a la
Empecemos con un histograma que comprende cinco intervalos curva lisa a medida que el nmero de los mismos aumenta,
(figura VII.la). Con fines de simplicidad supondremos que la esto es, a medida que disminuye el ancho de cada intervalo.
distribucin de frecuencia es simtrica. Y a vimos que si el n- Imaginemos ahora un nmero de casos en aumento incesante,
mero de intervalos aumentaba sin cambiar N, la forma del his- con intervalos cada vez ms angostos, hasta que los rectngulos
tograma tiende a hacerse irregular. Supngase, sin embargo, que se aproximen tan ntimamente a la curva lisa que ya no podamos
104
106 ESTAD1STICA DESCRIPTIVA UNIVARIADA LA DISTRIBUCiN NORMAL 107
aprecia~ diferencia alguna entre aqullos y sta. Designamos Ja
curva lisa a la que se van acercando incesantemente los rectn- VII.2. Forma general de la curva normal
gulos cada vez ms angostos como limite de la distribucin de La curva normal es un tipo especial de curva lisa simtrica.
frecuencia- Pese a que no podamos imaginarnos un nmero infi- Como quiera que la curva normal es lisa, perfectamente simtrica
nito de casos, podemos, sin embargo, concebir un nmero tan y se basa en un nmero indefinidamente grande de casos, slo es
grande de ellos, que los rectngulos se acerquen a la curva lisa posible aproximarse a la misma mediante distribuciones de fre-
con el grado de exactitud deseado. cuencia que comportan datos efectivos. Tiene forma de campana
Se recordar que el rea de cada rectngulo puede utilizarse
para representar la proporcin de casos comprendidos en el in-

rea bajo la curva


pero no en el rectngulo
rea en el
rectngulo
pero no bajo
la curva FIG. VII.3. Forma general de la curva normal

y posee cierto nmero de propiedades matemticas notables, al-


gunas de las cuales se sealarn brevemente. Como quiera que es
simtrica y unimodal, su media, mediana y modo coinciden. La
forma general de la distribucin normal se indica en la fi-
gura VII.3.
* La ecuacin matemtica de la curva normal es relativamente
FIG. VU.2. Comparacion de las reas debajo de la curva y debajo sencilla en las normas de los matemticos. Aunque el lector no
del rectngulo habr de emplear nunca dicha frmula, ya que se han confeccio-
nado cuadros con tal objeto, ser til, sin embargo, que la vea,
tervalo. Como ya se indic en el captulo IV, el rea total de to- para sealar y verificar algunas de las propiedades de esta dis-
~os los rectngulos se suele hacer igual a la unidad. As, pues, tribucin terica. La frmula es como sigue:
si la proporcin de los, casos del primer intervalo es .10 enton-
ces dicho mismo nmero representa el rea real del 'primer y= __ 1__ e-(X-X)j2s
rect?gulo. Observamo~ ahora que el rea del rectngulo corres-
pendiente puede aproximarse al rea que queda debajo de la sv'2:n:
~u1;1a Iisa . al mterior de cua!quier intervalo dado. Es lo. que
mdica la figuya VII.2. A medida que el nmero de rectngulos en donde Y es la altura de la curva para un valor determinado
aumenta, el area total de los rectngulos se convierte en una de X. Como quiera que tanto :n: como e son constantes (iguales
~proximacin cada vez mejor al rea que queda bajo la curva respectivamente a 3.14 y 2.72), la frmula slo comporta dos me-
lisa. Esto puede verse observando que las reas achuradas se didas de resumen, la media X y la desviacin estndar s.2 Por
van haciendo cada vez ms pequeas. En el lmite pues el rea lo tanto, la forma exacta de la curva normal ser conocida si se
debajo de la curva lisa puede obtenerse sumand~ las reas de nos dan los valores de dichas medidas. En otros trminos: hay
un nmero indefini~ente grande de rectngulos. Y comp quie- muchas curvas normales, una para cada combinacin de la media
ra que el rea debajo de los rectngulos es la unidad el rea y de la desviacin estndar.
debajo de la curva lisa ser asimismo igual a la unidad. El pro- * Recordando que una cantidad afectada de un exponente ne-
ceso que acabamos de describir es exactamente la clase de proce- gativo puede escribirse como la recproca de dicha cantidad ele-
so que se halla en la rama de las matemticas designada como
clculo. 2 Cuando- lleguemos a la estadstica inductiva se introducir otra nota-
cin para la media y la desviacin estndar. La frmula de la curva nor-
mal suele escribirse en trminos de una media de . y una desviacin es-
1 La nocin de lmite se examina tambin en la seccin IX.1. tndar de a.
108 ESTAD1STICA DESCRIPTIVA UNIVARIADA LA DISTRIBUCiN NORMAL 109
vada a la potencia positiva, podemos escribir la frmula como Habra que sealar que no todas las curvas simtricas en for-
sigue: ma de campana son normales. Aunque las curvas de la figura
VII.5 difieran en cuanto a las cspides, esto se debe nicamente
Y= 1 ( 1 ) a diferencias en sus desviaciones normales. Todas ellas son nor-
s y 2 :re 2.72<Z-X)'l'a males en cuanto a la forma. Por regla general, las curvas sim-
tricas unimodales pueden ser ms o menos puntiagudas o apla-
en la que e ha sido sustituida por su valor numrico. Suponga-
mos que el valor de s es fijo, y busquemos el valor de X para el

FIG. VII.4. Comparacin de curvas normales de igual desviacin FIG. VII.5.Comparacin de dos curvas normales de medias
estndar pero de medias diferentes iguales pero con desviaciones estndar diferentes
nadas que la curva normal, aun siendo sus desviaciones estn-
cual Y ser un mximo. Es obvio que Y ser mxima cuando dar las mismas. Algunas de estas curvas pueden verse en la
el denominador incluido en los parntesis sea mnimo. Pero dicho figura VII.6. Las que son ms puntiagudas que la normal se de-
denominador consta de un nmero positivo mayor que la unidad
el~vado a una potencia que no puede ser negativa, ya que un
numero 7e~ cuadrado no puede ser nunca menor que cero.
Por consrguiente, el denominador alcanzar su mnimo cuando
el e~ponente sea cero. Y esto ocurrir cuando X adopte el valor
de X, ya que tendremos X - X= O. Esto muestra que el modo
(y, por consiguiente, la media y la mediana) es realmente X he-
cho que ya se haba sealado, pero sin demostrarlo. Podernos
ver, asimismo, que la ecuacin da una curva que es simtrica
alrededor de X. Como quiera que la cantidad X - X est al cua-
drado Y no puede, por consiguiente, ser negativa, las desvacones
FIG.VII.6. Comparacin de una curva normal con curvas de su
r~specto de X en una u otra direccin producirn valores idn- misma desviacin estndar pero distintas en cuanto a las cimas
ticos de Y.
La ecuacin especfica para toda curva normal particular pue- signan como leptocrticas y las ms planas que aqulla como
de obtenerse empleando los valores propios de X y s. En la fi- platicrticas. A diferencia de la curva normal, las ecuaciones de
gura VII.4 pueden verse curvas normales de la misma desviacin las curvas leptocrticas y platicrticas tienden a comportar me-
estnda_r, pero de ;11edias.d~stintas. . Por otra parte, las curvas didas de resumen, adems de la media y la desviacin estndar.
de de:v1~c1onesestandar d~st11;1tas variarn en la configuracin de
las cspides, tal como se ndica en la figura VII.5. Cuanto me-
nor sea la desviacin normal, tanto ms puntiaguda resultar Vf.3. A.reas bajo la curva normal
la curva. Con frecuencia es necesario determinar la proporcin de casos
110 ESTAD1STICA DESCRIPTIVA UNIVARIADA LA DISTRIBUCiN NORMAL 111
que quedan al interior de un intervalo dado. Afortunadamente, de la desviacin normal y un mtodo para representar en forma
la curva normal posee una propiedad importante que hace que visual el significado de esta medida de dispersin. Cierto nmero
dicha tarea resulte relativamente sencilla. En efecto resulta de distribuciones empricas de frecuencia son lo bastante seme-
que independientemente de la media o. de la desvia~in nor- jantes para que estas relaciones entre las reas y la desviacin
mal que una curva ostente, habr un rea constante (o propor- normal se verifiquen razonablemente bien. Inclusive en el caso
cin de casos) entre la media y una ordenada, que es una distan- de distribuciones de ingresos, que propenden a distorsionarse en
la direccin de los ingresos elevados, encontramos normalmente
95.46% dos tercios de los casos en el interior de una desviacin estndar
de la media. Hay que tener presente, con todo, que aunque la
60.26111. I curva normal proporciona una interpretacin de la desviacin
estndar, esta propiedad no puede emplearse para definir lo
1 que se entiende por desviacin estndar. La definicin se hace
en trminos de la frmula. La propiedad en cuestin slo se
verifica en el caso, de distribuciones normales o aproximada-
mente tales.
Resulta posible tomar cualquier curva normal y transformar
sus valores numricos de tal forma que pueda utilizarse un sim-
x-2s x-s x x+s x+2s ple cuadro para evaluar la proporcin de casos al interior de
FIG. VII.7. Areas debajo de la curva normal cualquier intervalo deseado. Vamos a ilustrar este proceso por
medio de un ejemplo numrico. Supongamos que tenemos una
cia determinada a partir de la media en trminos de unidades curva normal con una media de 50 y una desviacin estndar
de desviacion estndar. La figura VII.7 ayuda a ilustrar el sen- de 10. Busquemos la proporcin de los casos en el intervalo de
tido de esta afirmacin. 50 a 65. Empezamos por determinar a cuntas desviaciones es-
As, pues, si vamos en una desviacin estndar a la derecha tndar se halla 65 de la media 50. Para ello tomamos la diferencia
de la media, encontraremos siempre .3413 del rea incluida entre entre estos dos valores, esto es, 15, y dividimos entre la magnitud
la media y la ordenada en dicho punto. Por consiguiente, dos de la desviacin estndar. En el presente caso el resultado es
veces dicha rea, o .6826 estarn incluidas entre las dos ordena- 1.5. De modo general podemos servirnos de la frmula:
das situadas a una desviacin estndar a ambos lados de la media.
En otros trminos : un poco ms de dos tercios de los casos se X-X
encontrarn siempre en el interior de una desviacin estndar Z=----
de la media. Y en forma anloga, el rea comprendida entre la s
media y la ordenada a dos desviaciones estndar de aqulla sera 65-50
siempre .4773 y, por lo tanto, un poco ms del 95 por ciento del ---=1.5
rea estar comprendido entre la pareja de ordenadas a dos des- 10
viaciones estndar a ambos lados de la media. Prcticamente en donde X es el valor de la ordenada y Z representa la desvia-
todos los casos estarn comprendidos en el interior de tre~ cin con respecto a la media en unidades de desviacin estndar.
desviaciones estndar de la media, aunque la curva normal se * Antes de examinar cmo puede utilizarse el valor numrico
extienda tericamente al infinito en ambas direcciones. Por su- de Z para determinar la proporcin de los casos entre la media
puesto, las distancias de la media no necesitan ser siempre ml- y la ordenada correspondiente a Z, permtasenos dar una inter-
tiplos exactos de la desviacin estndar. Mediante un procedi- pretacin alternativa de sta. Podemos pensar en trminos de
miento que vamos a describir en breve, es posible determinar las una transformacin efectiva de la variable X en la variable Z.
reas entre dos ordenadas cualesquiera. Por ejemplo, si nos En tanto que la distribucin de la variable X es normal con una
apartamos en 1.96 desviaciones estndar a ambos lados de la
media, comprenderemos casi exactamente el 95 por ciento del media de X y una desviacin estndar. de s, la nueva variable,
rea, en tanto que entre las ordenadas a 2.58 desviaciones nor- en cambio, es normal con una media de cero y una desviacin
males de la media quedar incluido el 99 por ciento del rea. estndar de uno.s Esta desviacin con una media cero y una
Esta propiedad de la curva normal brinda una interpretacin 3 La verificacin de este hecho se deja como ejercicio (vase ejercicio 3).
112 ESTADtsTICA DESCRIPTIVA UNIVARIADA LA DISTRIBUClN NORMAL 113

desviacin ~stndar de uno se designa como forma estndar, y VII.4. Ilustraciones suplementarias del empleo de la tabla normal
la Z se designa a menudo como la marca. La transformacin de
variables se ilustra en la figura VU.8. Sustraemos de cada X la Supongamos que queremos hallar el rea achurada de la curva
normal indicada en la figura VII.9. En este caso el valor de Z es :
constante X. Al sustraer este valor constante ( aqu 50) de cada
X, hemos corrido cada marca original en 50 unidades a la izquier- 143-'- 168 -25
da y, por lo tanto, hemos desplazado efectivamente la curva Z= =-=-2.08
12 12

El hecho de que Z sea negativa indica simplemente que el rea


achurada se sita a la izquierda de la media. Al utilizar la tabla

i=16s
s= 12

o z
168
F'IG. VII.8. Comparacin de las formas estndar y general de la
curva normal FIG. VII.9. Curva normal, con porciori acharada representando
el rea en una sola cola
norma~ original a una posicin directamente sobre el origen.
Esto tiene en cuenta el numerador en la expresin de z. Divi- normal, el signo de Z puede ignorarse, ya que la curva es per-
dimos ahora cada diferencia X - X entre la magnitud de la des- fectamente simtrica. Del cuadro vemos que el rea compren-
viacin estndar. Al hacerlo, o estrechamos la curva o la ensan- dida entre la media y una Z de 2.08 es .4812. Como quiera que
cham?s, segn que su desviacin estndar sea o no mayor que el rea total es la unidad, el rea a la izquierda de la media ha
la umdad. Podemos, pues, pensar que hemos desplazado prime- de ser .5 (por simetra). Por consiguiente, el rea achurada puede
ro la. posicin de la curva normal original y que luego hemos obtenerse restando el rea comprendida entre la media y la
cambiado la magnitud de la desviacin estndar, de modo que ordenada del rea total a la izquierda de la media. As, pues :
quede sobre la forma estndar. Al dividir entre la desviacin es-
tndar de 10, hemos cambiado esencialmente las unidades a lo (Proporcin de casos s; 143) = .5000 - .4812 = .0188
largo del eje horizontal, de modo que una distancia de 10 sobre
el eje de X corresponde a la distancia de 1 sobre el eje de Z. Por lo tanto, menos del 2 por ciento de los casos tienen marcas
Independientemente de la interpretacin que se d, un valor inferiores o iguales a 143.4 El tipo de problema ilustrado en este
=
de Z 1.5 indica que la ordenada se encuentra a 1.5 desviaciones ejemplo es muy corriente, debido al hecho de que las compro-
baciones de hiptesis casi siempre comprenden las colas de una
estndar de la media. En el caso de la forma estndar, esto sig-
nifica, por supuesto, que la ordenada misma coincide con el va- distribucin de frecuencia. Si hubiramos querido hallar el rea
lor 1.5 de la escala Z. Se han construido tablas que muestran 4 En una distribucin continua, la proporcin de los casos que sean exac-
reas exactas para la forma estndar de la curva normal. El tamente 143.0 ser cero. Esto puede verse si imaginamos dos ordenadas
cuadro C del Apndice 2 es una de ellas. Los valores de Z se dan extremadamente prximas una de otra. La proporcin de casos entre estas
dos ordenadas ser tambin muy pequea. Y si a continuacin dejamos
de arriba abajo en el margen izquierdo, y horizontalmente arriba. que las dos ordenadas se vayan aproximando indefinidamente, la propor-
Los dos dgitos de Z se obtienen leyendo de arriba abajo, y el cin de les casos se har infinitamente pequea. Recurdese que la lnea
tercero leyendo horizontalmente. Las cifras del cuerpo del cua- matemtica no tiene grueso. En la prctica podr haber algunos casos con
dro indican la proporcin del rea entre la media ( o sea cero) marcas de 143.0, debido a defectos de medicin. Sin embargo, como quiera
que estamos tratando de una distribucin terica, no importa que la ordt;
y la ordenada correspondiente a Z. En el ejemplo anterior, ve- nada ella inisma se incluya o no en el intervalo. En adelante, nos refer-
mos que se hallan contenidas en dichos lmites las .4332 del rea. remos simplemente al rea entre dos ordenadas ( pero sin comprender a
Si Z hubiera sido 1.52, el rea correspondiente habra sido .4357. - stas), o rea inferior a un valor dado.
114 ESTADtSTICA DESCRIPTIVA UNIVARIADA LA DISTRIBUCiN NORMAL 115
total fuera de la regin ~efinida por 168 25 ( como la indican las GLOSARIO
reas achuradas de la figura VII.10), habramos doblado simple-
Leptocrtico
mehntedel resultado antenormente obtenido, ya que las dos reas Distribucin de frecuencia lmite
ac ura as son exactamente del mismo tamao Curva normal
Para tomar otro ej~m.I?lo,supongamos que necesitamos obte- Platicrtico
ner el rea achurada indicada en la figura VH.11. Esta rea se Marca estndar

EJERCICIOS

l. Ya se calcularon la media y la desviacin estndar de los datos del


X=168 ejercicio 1, captulo IV. Cul fue la proporcin de los casos dentro
s= 12 de una desviacin estndar de la media? Al interior de dos desviacio-
nes estndar? De tres desviaciones estndar? Con cunta aproxima-
cin corresponden dichas cifras a las que encontraramos si la dstr-
bucin fuese exactamente normal? Contstese a las mismas preguntas
168 193 en relacin con el ejercicio 2, captulo IV. Comprense y explquense
las diferencias entre los resultados de los dos grupos de datos.
Frc, VII.10. Curva nor~al, con porciones achuradas presentando 2. Si la media de una distribucin normal es de 80 y su desviacin
areas en ambas colas estndar de 12,

a) Qu proporcin de casos se halla entre 80 y 93? Respuesta, 3606.


icalcula hallando primero la proporcin de casos entre la media
la tenada B y sustrayendo luego la proporcin de casos entre
a me ~a Y la ordenada A. Las Z correspondientes a B y A son
b) Qu proporcin de casos se halla entre 90 y 105? Entre 70 y 105?
Respuesta, .1838.
respectivamente 2.0 y 1.2. Tenemos, pues: e) Qu proporcin de casos es inferior a 68?
d) Cuntas desviaciones estndar se necesitaran a ambos lados de
la media para obtener dos colas que comprendan cada una el 2
Proporcin entre B y la media .4773 por ciento exactamente del rea total? El 10 por ciento del rea
Proporcin entre A y la media . 3849 total? Respuesta, 2.054.
e) Cul marca tiene por encima de ella el 4 por ciento de los casos?
Proporcin entre A y B . 0924 ( en otros trminos, sitese la percentil 96 ) .

Por consiguiente, ligeramente ms del 9 por ciento de los casos * 3. Verifqueseque la forma estndar de la curva normal tiene una
quedan entre .42 Y .46. Obsrvese que si se hubiera deseado obte- media de cero y una desviacin estndar igual a la unidad. (Indica-
cin: vuelva a escribirse la frmula de la curva normal en trminos
de Z, aprovechando el hecho de que Z = (X -X)/s.)
4. Las calificaciones primarias de diversas pruebas de aptitud y
xs=0.05
=0.36
actitud son tratadas a menudo por los psiclogos como escalas de
intervalo. Dichas calificaciones suelen a menudo convertise luego
en calificaciones estndar con medias y desviaciones estndar conve-
nientes. Supngase que la calificacin media primaria en un examen
de admisin en la universidad es de 117 con una desviacinestndar de
0.36 28.5. Supngase, adems, que esas calificaciones primarias estn dis-
0.46 tribuidas normalmente.
FIG. VU.11. Curva normal con porcin achurada representando
el rea entre dos ordenadas ' a) Cul es la proporcin de calificacionespor encima de 131? I)e.
bajo de 79?
b) Cules son las calificaciones primarias correspondientes a los
ner el rea entre ordenadas a ambos lados de la medi . 1 cuartiles primero, segundo y tercero?
tado se h abna, obt eruido ms fcilmente por adici a, e resuj.
sustraccin. . . n que por *e) En los exmenes de la universidad, las calificaciones primarias
se normalizan de modo que la media de la distribucin normal
(


116 ESTADfSTICA DESCRIPTIVA UNIVARIADA

sea exactamente de 500 y la desviacin estndar de 100. Concre-


tamente, cmo se normalizarn los grupos de datos anteriores
para obtener una media de 500 y una desviacin estndar de 100?
(Indicacin: cmo se normalizara para obtener una media TERCERA PARTE
igual a cero y una desviacin estndar igual a la unidad?)
ESTAD1STICA INDUCTIVA
BIBLIOGRAFA

1. Downie, N. M., y R. W. Heath: Basic Statistical Methods, 2~ ed.,


Harper and Row, Publishers, lncorporated, Nueva York, 1965, cap. 6.
2. Hagood, M. J., y D. O. Price: Statistics far Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 14.
3. Mueller, J. H., K. Schuessler y H. L. Costner: Statistical Reasoning
in Sociology, 2, ed., Houghton Mifflin Company, Boston, 1970,
cap. 6.
4. Weinberg, G. H., y J. A. Schumaker: Statistics: An Intuitive Appro-
ach, Wadsworth Publishing Company, Inc., Belmont, Cal., 1962,
cap. 8.
5. Weiss, R. S.: Statistics in Social Research, John Wiley & Sons, Inc.,
Nueva York, 1968, pp. 147-156.

You might also like