You are on page 1of 150

PROCESAMIENTO DE INFORMACIN ESTADSTICA

PROCESAMIENTO DE
INFORMACIN ESTADSTICA

Lic. Ren Bazalda!

UNIDAD 1

ESTADSTICA

1.1 IMPORTANCIA DEL ESTUDIO DE LA ESTADSTICA


La estadstica se ha convertido en el lenguaje universal de
las ciencias. Como potencial usuario de ella, necesitas
dominar tanto la ciencia como el arte de usar
correctamente la metodologa estadstica. El uso cuidadoso
de los mtodos estadsticos nos permitir obtener
informacin precisa a partir de los datos. Dichos mtodos
incluyen:!
1. Definir cuidadosamente la
situacin!
2. Recolectar datos!
3. Resumir con precisin los datos !
4. Derivar y comunicar conclusiones
significativas.!

La palabra estadstica tiene diferentes significados para


personas de varios antecedentes e intereses. Para algunas
personas es un campo de trucos mgicos donde una
persona trata de abrumar a otros con informacin y
conclusiones incorrectas. Para otros es una forma de
recolectar y mostrar informacin. Y para otros ms es una
manera de tomar decisiones ante la incertidumbre. En la
perspectiva apropiada, cada uno de dichos puntos de vista
es correcto.!
ACCIDENTES
AUTOMOVILSTICOS

El campo de la estadstica puede subdividirse en dos reas: !


1. La estadstica descriptiva, la cual es en lo que piensa la
mayora de las personas cuando escuchan la palabra
estadstica. En ella se incluye la recoleccin,
presentacin y descripcin de datos mustrales. !
2. La estadstica inferencial,
la cual se refiere a la
tcnica de interpretar los
valores que resultan a
partir de las tcnicas
descriptivas, tomar
decisiones y extraer
conclusiones acerca de
la poblacin.!

Los usos de la estadstica son ilimitados. Es mucho ms difcil


mencionar un campo donde no se use la estadstica que
mencionar uno en el que la estadstica tenga una parte integral;
entre los ms relevantes se encuentran:!
!En educacin,
frecuentemente se usa la
estadstica descriptiva para
presentar resultados de
exmenes.!
!En ciencias, deben
recolectarse y analizarse los
datos resultantes de los
experimentos.!
!En el gobierno, todo el
tiempo se recolectan muchos
tipos de datos estadsticos.!

Terminologa
La poblacin es la coleccin ms completa de individuos u
objetos que son de inters para el recolector de la muestra.
La poblacin a estudiar debe definirse cuidadosamente y
se considera completamente definida slo cuando se
especifica su lista de elementos miembros.!
Existen dos tipos de
poblaciones: finita e infinita.
Cuando la membresa de una
poblacin puede (o pudiera)
mencionarse fsicamente, se
dice que la poblacin es
finita. Cuando la membresa
es ilimitada, la poblacin es
infinita. !

!La muestra: consiste en los individuos, objetos o


mediciones seleccionados de la poblacin en una
determinada investigacin. Sus principales
caractersticas son:!
" Representativa!
" Adecuada y vlida!
!Datos: El conjunto de
valores recolectados
de la variable para
cada uno de los
elementos que
pertenecen a la
muestra. !

!Variable: (o variable de respuesta) Una caracterstica


de inters acerca de cada elemento individual de una
poblacin o muestra. Las muestras pueden dividirse
en los siguientes tipos:!
Cualita,va o
atributo

Nominal
Ordinal

Variable
Cuan,ta,va o
numrica

Discreta
Con,nua

!Variables cualitativas:!
" Variable nominal: Variable cualitativa que caracteriza
(describe o nombra) un elemento de una poblacin. !
" Variable ordinal: Variable cualitativa que incorpora
una posicin ordenada o clasificacin. !
!Variables cuantitativas:!
" Variable discreta: Variable
cuantitativa que puede
asumir un nmero contable
de valores. !
" Variable continua: Variable
cuantitativa que puede
asumir un nmero
incontable de valores. !

!Valor de datos: El valor de la variable asociado con un


elemento de una poblacin o muestra. Este valor puede
ser un nmero, una palabra o un smbolo. !
!Parmetro: Valor numrico que resume todos los datos de
una poblacin entera. !
!Experimento Actividad planificada cuyos resultados
producen un conjunto de datos. !

1.2 TABLAS DE DISTRIBUCIN DE FRECUENCIAS


Y REPRESENTACIONES GRFICAS.
La estadstica se considera un mtodo utilizado para recoger,
organizar, concentrar, reducir, presentar, analizar, generalizar
y contrastar los resultados numricos (datos) de
observaciones directas o indirectas de fenmenos reales, as
como de la informacin obtenida a partir de la!
experimentacin, para estar en
condiciones de llevar a cabo tanto
evaluaciones como conclusiones
adecuadas, y tomar decisiones
acertadas y confiables.!
Dicho anlisis puede verse reflejado en
tablas o de una manera ms
significativa, que es mediante grficas.!

1.2.1 ASPECTOS BSICOS DE EXCEL


Qu es Excel?!
MICROSOFT EXCEL (MS Excel) es una planilla de clculo,
de gran capacidad y facilidad de uso. Las planillas de
clculo son un tipo de herramienta orientado a manejar
informacin numrica preferentemente, permitiendo realizar
sobre ella clculos y grficos de diversa complejidad.!

Elementos:!
Un Libro de Trabajo es un archivo de trabajo y
almacenamiento de datos. Un Libro de Trabajo
puede contener una o varias hojas de distintos
tipos (hojas de clculo, hojas de grfico).!
La hoja de clculo es la principal base de
almacenamiento y manipulacin de datos de un
Libro de Trabajo. Una hoja de clculo se divide
en filas y columnas, que forma una gran
cuadrcula compuesta por un sinnmero de
pequeas celdas donde se almacenan los
datos. Una hoja de calcul siempre formar
parte de un Libro de Trabajo. !

CELDA

CELDA
SELECCIONADA

FUNCIN

ALTURA
COLUMNA

FILAS
HOJAS

HOJA
NUEVA

COLUMNAS

ANCHURA
COLUMNA

Una lista es una ordenacin de datos similares (registros),


por ejemplo, un listado de alumnos y sus respectivas
calificaciones de examen. Un Libro MS EXCEL puede
contener una lista como una base de datos y
proporcionar herramientas estndares para ordenar,
filtrar, agregar, eliminar y resumir datos de una lista.!

A partir de dichas listas, se pueden representar


grficamente un conjunto de datos almacenados en una
hoja de clculo y con la posibilidad de elegir entre
mltiples y diferentes formatos y tipos; que se agrupan
bsicamente en los siguientes:!

Grfica de Barras. Se Utiliza regularmente para la


comparacin de una serie de datos. Como por ejemplo
los resultados de exmenes de algunos alumnos. !

Grfica Circular. Partiendo de un total, se usa para


conocer la distribucin de distintos elementos. Como por
ejemplo en un convivio, la cantidad de alumnos que
deciden por un tipo de comida.!

Grfica Lineal. Partiendo de un conjunto de dos datos de


una misma clasificacin, se usa para compararlos. Por
ejemplo el promedio bimestral en dos momentos
distintos.!

ACTIVIDAD 1.3
1. Un maestro de Quinto Grado clasific a sus alumnos de
acuerdo al promedio de evaluaciones que obtuvieron en el
Tercer Bimestre.!
9 a 10

8a9

7a8

6a7

5a6

2. En el Cuarto Bimestre obtuvo los siguientes promedios de


calificaciones de sus alumnos.!
ESP.

MAT.

8.1

8.1

CIENCIAS HISTORIA

8.3

7.8

GEOG.

7.8

CVICA ARTSTICA ED. FSICA

8.9

8.7

9.2

3. En el Quinto Bimestre obtuvo los siguientes resultados; pero


desea compararlos con los resultados del Cuarto Bimestre. !
ESP.

MAT.

8.3

7.8

CIENCIAS HISTORIA

8.1

8.0

GEOG.

7.7

CVICA ARTSTICA ED. FSICA

9.2

9.1

9.5

Despus de elaborar las grficas se pasar a elaborar el


resumen de resultados en documento de trabajo (Word) con
el siguiente formato:!

ACTIVIDAD 1.3
1. Un maestro de Quinto Grado de Primaria obtuvo los siguientes
promedios de calificaciones de sus alumnos correspondientes al
Cuarto Bimestre. Elabora una GRFICA DE BARRAS.!
ESP.

MAT.

8.1

8.1

CIENCIAS HISTORIA

8.3

7.8

GEOG.

7.8

CVICA ARTSTICA ED. FSICA

8.9

8.7

9.2

2. Elabora una GRFICA CIRCULAR para la siguiente


distribucin de promedios de los alumnos:!
9 a 10

8a9

7a8

6a7

5a6

3. Elabora una GRFICA DE LINEAL para comparar los


promedios del Quinto Bimestre con los del bimestre anterior:!
ESP.

MAT.

8.3

7.8

CIENCIAS HISTORIA

8.1

8.0

GEOG.

7.7

CVICA ARTSTICA ED. FSICA

9.2

9.1

9.5

1.3 MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central son valores numricos
que ubican, en cierto sentido, el centro de un conjunto de
datos. Con frecuencia, el trmino promedio se asocia con
todas las medidas de tendencia central.!

A. Media (media aritmtica) !


La media muestral se representa con ("x barra" o "media
muestral"). La media se encuentra al sumar todos los
valores de la variable x y dividir la suma entre el nmero de
dichos valores, n (el "tamao muestral"). Esto se expresa en
forma de frmula como:!
x !

x barra = ! suma de todas las x!


nmero de x!

x!
n!

=x !

EJEMPLO: Un maestro de 3 grado registr las evaluaciones de sus


alumnos y quiere obtener la media aritmtica para saber el promedio
del grupo:!

5 ADAMARIS
6 JOSUE ALBERTO
7 MOISES ALBERTO
8 ARTURO JEANCARLO
9 MELENY
10 KEVIN EDUARDO
11 AXEL MANUEL
12 CINTHIA GABRIELA
13 JUAN DE DIOS
14 ANGELA ABIGAIL
15 KENIA PAMELA

8.6+8.2+6.5+8.9+8.3+
9.2+9.5+9.1+8.6+9.0+
7.7+7.7+7.1+7.8+8.1!

15!
124.4!
15!

=x !

4 ALEJANDRA ELI

x!
n!

=x !

3 KEVIN URIEL

=x !

2 JORGE HERON

8.6
8.2
6.5
8.9
8.3
9.2
9.5
9.1
8.6
9.0
7.7
7.7
7.1
7.8
8.2

=x !

1 MELISA DENISS

8.29333!

B. Mediana.!
Valor de los datos que ocupan la posicin media cuando los
datos se clasifican en orden de acuerdo con su tamao. Para
ello, se tendr que obtener la mediana muestral ( x ).!
1. Clasifica los datos.!
2. Determina la profundidad de la mediana. La profundidad o
posicin (nmero de posiciones desde cualquier extremo),
de la mediana se determina con la frmula!

Tamao muestral + 1!
2!
n+1!
x= !
2!

Mediana muestral

= !

La profundidad (o posicin) de la mediana se encuentra al


sumar los nmeros de posicin de los datos ms pequeos
(1) y los datos ms grandes (n) y dividir la suma entre 2 (n es
el nmero de piezas de datos).!

3. Determina el valor de la mediana. Cuenta los datos


clasificados, ubica los datos en la ( x )sima posicin. La
mediana ser la misma sin importar desde cul extremo
de los datos clasificados (alto o bajo) contaste. De
hecho, contar desde ambos extremos servir como una
excelente comprobacin.!
4. En el caso de medias pares el resultado ser con punto
decimal (0.5) lo que implicar la divisin entre los
nmeros enteros subsiguientes; por ejemplo si x = 2.5
en una sucesin de 3,4,5,6 la divisin sera entre el 4 y el
5 reultando el valor de la mediana 4.5. !

EJEMPLO: Un maestro de una escuela de ingls elabor el


listado de edades de sus alumnos, obteniendo los siguientes
resultados: !
6, 6, 6, 7, 7, 8, 8, 8, 9, 9!
1 CARLOS
2 PERLA
3 ANA
4 CARMEN
5 ANDRS
6 ALBERTO
7 MAYRA
8 SOFA
9 AXEL
10 MIRIAM

6
9
7
8
6
8
7
6
8
9

n+1!
x= !
2!
x= !

10+1!

2!

11!
x= !
2!
x = ! 5.5!
Mediana = ! 7.5!

C. Moda.!
En una distribucin de datos determinada, es el dato que
ms se repite.!
EJEMPLO: !
En un registro de fechas de nacimiento se encontraron los
siguientes datos en relacin al ao de nacimiento: 1992,
1993, 1994, 1994, 1995, 1996, 1997, 1997, 1998, 1998,
1998 y 1999. !
En este caso, la moda sera el nmero 1998, ya que se
repite ms veces (3).!
En el caso hipottico en el que el 1998 se repitiera slo
dos veces se establecera que esa situacin no existira la
moda.!

D. Medio Rango.!
Nmero exactamente a la mitad entre un dato de valor ms bajo,
(L) y un dato de valor ms alto (H). Se encuentra al promediar los
valores bajo y alto:!
Valor bajo + valor alto!

medio rango = !

medio rango = !

2!
L + H!

2!
EJEMPLO: !
Un maestro registr el nmero de participaciones de un
alumno durante 5 semanas consecutivas, obteniendo el
L + H!
siguiente dato: 3, 3, 5, 6 y 8.!
medio rango = !

medio rango = !

3 + 8!

2!
medio rango = 5.5 !

2!

E. Aplicaciones de las Medidas de Tendencia Central.!


Lgicamente como toda ecuacin matemtica estadstica, las
Medidas de Tendencia Central tienen su aplicacin prctica. !
En lo que corresponde a la media, su uso se ha generalizado
debido a que es la que nos arroja el dato ms cercano a un
promedio. Sin embargo, al usarla debemos de considerar que la
serie de datos con la que vamos a trabajar sea lo ms
homognea posible, y que su distribucin sea lo ms equitativa
posible.!
La elaboracin de
promedios en evaluaciones
educativas utiliza por default
este tipo de medida, ya que
los datos no varan mucho
entre s y por lo regular son
muy homogneos.!

En lo que se refiera a la mediana y a la moda su utilidad se


acenta cuando la serie de datos no es muy homognea y/o
los datos no estn bien distribuidos. !
Imaginemos que en grupo de diez personas, nueve de ellas
son de escasos recursos econmicos que perciben $3 000
al mes, y uno de ellos es un adinerado que gana $600,000
al mes. El promedio de ingreso del grupo sera de $62 700,
cifra que no representara lo que la mayora gana. !
En este mismo caso, la
mediana y la moda seran de
$3 000, lo cual reflejara an
ms el ingreso general de
cada uno de los miembros
de dicho grupo.!

Cosa inversa ocurre cuando tenemos una situacin en


donde por ejemplo de tenemos un grupo de diez personas
en donde tres de sus integrantes tienen 3 aos y que es el
valor que ms se repite (moda), pero los 7 restantes tienen
edades que oscilan entre los 14 y 18 aos
(3,3,3,14,14,15,16, 17, 17,18). La moda aqu no reflejara la
edad que la mayora del grupo posee. !
O un alumno que obtuvo
las siguientes
calificaciones:
6,6,6,6,9,10,10. En este
caso la mediana sera de
6, pero no sera
representativa de todas
sus evaluaciones. !

En s, cada una estas medidas tiene un punto bueno y un


punto ciego; lo importante o interesante aqu, es que a
final de cuentas se complementan, y cuando realmente
se desea conocer un dato con mayor certeza el uso de
las tres (o 4) medidas de tendencia centra ser mejor,
que usar slo una, ya que nos arrojar con mayor
precisin el dato ms cercano a la situacin real. !

media me
diana

1.3.1 Uso de frmulas en Excel


La carta fuerte del Excel definitivamente es el uso de
frmulas, ya que nos da una gran variedad de operaciones
matemticas para los datos que introducimos en el mismo. !
Se puede usar Excel para calcular los totales de una
columna o una fila de nmeros, pero tambin puede
calcular el pago de una hipoteca, resolver problemas
matemticos o de ingeniera, o dar con la hiptesis ms
optimista en funcin de las variables que introduzca.!

Excel realiza estas operaciones usando frmulas en las


celdas. Una frmula realiza clculos u otras acciones con
los datos de su hoja de clculo. Una frmula siempre
empieza con un signo igual (=), seguido de nmeros,
operadores matemticos (como los signos de ms y menos)
y funciones, que pueden ampliar el poder de una frmula.!
Por ejemplo, la siguiente
frmula multiplica 2 por
3 y, despus, suma 5 al
resultado para dar con
la respuesta, 11.!
=2*3+5!

As mismo se puede hacer operaciones en el que se incluya


informacin que se ha ingresado en una o ms celdas. !
Por ejemplo supongamos que queremos multiplicar lo que
contiene la celda A1 por lo que contiene la celda A2 y
dividirlo entre lo que tiene la celda A3, la frmula sera la
siguiente: =(A1*A2)/A3. !

Estas son algunas de los tipos de frmulas que se pueden


escribir en una hoja de clculo.!
=A1+A2+A3Suma los valores de las celdas A1, A2 y
A3.!
=RAIZ(A1)Usa la funcin RAIZ para devolver la raz
cuadrada del valor contenido en A1.!
=HOY()Devuelve la fecha actual.!
=MAYUSC("hola")Convierte el texto "hola" en "HOLA"
mediante la funcin MAYUSC.!
=SI(A1>0)Comprueba si la celda A1 contiene un valor
mayor que 0.!

Medidas de Tendencia Central en Excel!


Para obtener la Media, en Excel debemos de seleccionar
los datos (de los que queremos obtenerla) y poner la
siguiente frmula. !
=PROMEDIO(A1,A2,A3,A4,A,5,A6,A7,A8,A9,A10) !
=PROMEDIO(A1:A10) !
Para esta frmula se
puede anotar esta
informacin en la celda
correspondiente o ir
seleccionado
directamente las celdas
que se desean incluir. !

En relacin a la Mediana y a la Moda, las frmulas seran:!


=MEDIANA(datos).!
=MODA (datos).!
En el caso del Medio Rango,
no existe una frmula
especfica, por lo que se
tendr que especificar en la
celda lo que se desea realizar.
Por ejemplo si el dato mayor
corresponde a la celda A1 y el
Mayor a la celda A10, su
frmula quedara as !
=(A1+A10)/2!

ACTIVIDAD 1.5
1. Obtn la Media Aritmtica de cada uno de los 5
Bimestres y de cada una de las Asignaturas. Y un promedio
final de todo ello:!

2. Obtn la Mediana y
la Moda de cada una
de las asignaturas
para compararlos con
sus respectivos
promedios (Media
Aritmtica). !

3. Obtn el Medio Rango de las siguientes


calificaciones. reneb@cmt.edu.mx!

1.4 MEDIDAS DE POSICIN


Las medidas de posicin se usan para describir la
posicin que un valor de datos especfico posee en
relacin con el resto de los datos cuando estn en
orden clasificado. Cuartiles y percentiles son dos de las
medidas de posicin ms populares.!

A. Percentiles!
Son los valores de una variable que dividen al conjunto
de datos ordenados en 100 subconjuntos; cada
conjunto de datos tiene 99 percentiles. El k-esimo
percentil, Pk, es un valor tal que cuando mucho (100-k)
% de los datos es mayor. Esto se muestra en el
siguiente esquema:!

1% 1% 1% 1%
Min.

P1 P2 P3 P4 P5 P6

As hasta!

1% 1% 1%

P97 P98 P99

Max

B. Cuartiles!
Son los valores de una variable que dividen en cuartos
a los datos ordenados; Cada conjunto de datos posee
tres cuartiles. El primer cuartil, Q1, es el nmero tal que
cuando mucho el 25% de los datos es menor que el
valor de Q1. El segundo cuartil es la mediana. El tercer
cuartil, Q3, es un numero tal que cuando mucho el 75%
de los datos es menor que Q3. Esto se muestra en el
siguiente esquema:!
25%

Min.

25%

Q1

25%

Q2

25%

Q3

Max

El primer cuartil y el 25avo percentil son iguales; es


decir, Q1=P25. Tambien, Q3=P75.!
La mediana, el segundo cuartil Q2, y el 50avo percentil
son iguales, Mediana = Q2 = P50 , as cuando se pida
encontrar Q2 o P50, aplique el procedimiento para
encontrar la mediana.!
P 10 P 20 P 30 P 40 P 50 P 60 P 70 P 80 P 90
Q 1

Q 2
MEDIANA

Q 3

Cuartiles y Percentiles para datos no agrupados.!


El procedimiento para determinar el valor de los cuartiles es
el mismo que para los percentiles y se muestran a
continuacin:!
1. Ordenar los datos del menor al mayor.!
nk!
2. Calcular
, donde n es el tamao de la muestra y k la
100!
medida de posicin buscada (cuartil o percentil). !
nk!
3. a). Si el resultado del clculo anterior (
) es un nmero
100!
entero, se le deber sumar 0.5.!
nk!
b). Si el resultado del clculo anterior (
) no es un
100!
nmero entero, este se deber tomar como el siguiente
entero ms grande. !
4. Con la posicin encontrada en el paso anterior, remitirse
a los datos ordenados verificar a que valor de nuestros
datos le corresponde la posicin buscada.!

Los siguientes datos corresponden al nmero de autos que


llegan a diario al taller de la empresa Dodge para su
reparacin, durante los meses de marzo y abril (40 das), de
lunes a viernes.!
Determinar:!
a) El 45 percentil P45.!
b) Primer cuartil Q1!
c) Tercer cuartil Q3!
10 17 10 11 12 11 22 18 14 25 19 17 22 10 24 18 15 20 24 21
24 15 21 19 15 20 22 14 25 18 20 13 11 19 20 10 19 17 16 12!
Paso 1!
Ordenar los datos de menor a mayor.!
10 10 10 10 11 11 11 12 12 13 14 14 15 15 15 16 17 17 17 18
18 18 19 19 19 19 20 20 20 20 21 21 22 22 22 24 24 24 25 25!

Percentil P45.!
Paso 2 .!
n= 40 datos, k=45!

P45 = ! nk!
100!

= !1800! = ! 18!
P45 = 40(45)!
!
100!
100!

Paso 3!
nk!
Como
= el 18 es un nmero entero, por lo que se
100!
deber de agregar 0.5, entonces el P45 se encuentra en la
posicin 18.5, entonces est entre 18 y 19avo dato.!
Paso 4 !
P45 en este caso est entre 17 y 17 autos, P45= 17;
34!
17+17!
P45=
= 2! = 17 !
2!

P45=17 autos.!

Cuartil Q1.!
Paso 2 .!
n= 40 datos, k=25, ya que Q1= P25 (primer cuartil es igual
al 25 percentil)!

Q1 = ! nk!
100!

= !1000! = ! 10!
Q1 = 40(25)!
!
100!
100!

Paso 3!
nk!
Como
= el 10 es un nmero entero, por lo que se
100!
deber de agregar 0.5, entonces el Q1 se encuentra en la
posicin 10.5, entonces est entre 10 y 11avo dato.!
Paso 4 !
Q1 en este caso est entre 13 y 14 autos, Q1= 13.5;
27!
13+14!
Q1=
= 2! = 13.5 !
2!

Q1=13.5 autos.!

Cuartil Q3.!
Paso 2 .!
n= 40 datos, k=75, ya que Q3= P75 (primer cuartil es igual
al 75 percentil)!

Q3 = ! nk!
100!

= !3000! = ! 30!
Q3 = 40(75)!
!
100!
100!

Paso 3!
nk!
Como
= el 30 es un nmero entero, por lo que se
100!
deber de agregar 0.5, entonces el Q3 se encuentra en la
posicin 30.5, entonces est entre 30 y 31avo dato.!
Paso 4 !
Q3 en este caso est entre 20 y 21 autos, Q3= 20.5;
41!
20+21!
Q3=
= 2! = 20.5 !
2!

Q3=20.5 autos.!

C. Aplicaciones de las Medidas de posicin.!


En estadstica descriptiva, las medidas de posicin no central
permiten conocer otros puntos caractersticos de la distribucin
que no son los valores centrales. Entre las ms importantes estn
los cuantiles y percentiles que son aquellos valores de la
variable, que ordenados de menor a mayor, dividen a la
distribucin en partes, de tal manera que cada una de ellas
contiene el mismo nmero de frecuencias; pero tambin existen
los deciles y los quintiles.!

Por ejemplo, en una encuesta acerca del uso de algn


aparato electrnico en una semana a 48 personas se
obtuvieron las siguientes respuestas:!
20
14
32
23
45
24

21
15
45
24
38
35

22
18
60
28
42
56

18
43
22
32
19
32

32
32
34
45
23
28

44
45
25
52
45
28

54
21
39
28
34
34

21
42
27
35
24
56

Segn esa informacin encontramos que por ejemplo:!


Mediana= 32!
Percentil 80 = 44.5!
1 Cuartil = 23!
Esto quiere decir que por lo
menos por lo menos la mitad (14
personas) las entrevistadas le
dedican 32 horas a la semana.!
Por lo menos el ochenta porciento
de las entrevistadas le dedican
menos de 44 horas a la semana.!
Por lo menos el 25 por ciento de
las personas entrevistadas le
dedican menos de 23 horas a la
semana. !

Medidas de Posicin en Excel!

La obtencin de Cuartiles y Percentiles en Excel es muy


similar a la obtencin del Promedio, Mediana y Moda. En el
caso de los Cuartiles, se tendr que ingresar el signo de
igual (=) seguido de la palabra cuartil despus de abre
parntesis y se selecciona la muestra a elegir, seguido de
un coma, y el nmero de cuartil a obtener, cerrando as el
parntesis). =CUARTIL(A1:G6,1)!

En el caso de los percentiles la dinmica es muy similar a la


de los cuartiles, slo con la diferencia de que el nmero de
percentil que se desea obtener se deber de escribir con
punto decimal, por ejemplo si se desea obtener el percentil
75, se deber de poner 0.75.!
=PERCENTIL(A1:G6,0.75)!

ACTIVIDAD 1.7
1. En una encuesta a 60 jvenes universitarios acerca de
las horas de sueo al da se obtuvieron los siguientes
datos:!

8
4
7
8
4
8

7
5
5
9
5
7

4
6
5
5
6
9

5
8
6
6
7
6

7
6
9
7
8
8

8
7
7
8
9
4

6
8
5
5
7
5

7
6
5
4
6
6

8
5
6
7
7
7

7
6
5
7
8
9

Ordena los datos de menor a mayor y obtn el


Cuartil 3.!

2. En una medicin a 32 nios de 8 aos en un kinder se


obtuvieron los siguientes pesos: !

15.8 14.3 13.2 18.5 15.5 16.8 14.5 13.3


12.5 14.5 16.2 15.3 18.2 17.7 13.4 14.5
12.9 13.1 17.5 15.4 16.3 15.8 16.2 12.8
13.3 14.5 18.3 16.2 17.5 17.2 18.3 18.1
Ordena los datos de menor a mayor y obtn el
Percentil 60.!

1.5 MEDIDAS DE DISPERCIN


Una vez localizado el centro o algn punto en particular
de la distribucin de un conjunto de datos lo que
procede es buscar una medida de dispersin de los
datos.!
La dispersin o variacin es una caracterstica
importante de un conjunto de datos porque intenta dar
una idea de cun esparcidos se encuentran stos.!

Existen diversas medidas de dispersin, algunas de ellas


son:!
1. Rango. Es la diferencia en valor entre los datos con valor
ms alto (H) y los datos con valor ms bajo, (L). Su frmula
es:!
r= H - L!
Por ejemplo, la siguiente muestra (3, 3, 5, 6, 8) tendra un
rango de: H-L= 8 3= 5. Es decir, r= 5. !
3

rango
L

2. Desviacin de la media. Mide la desviacin promedio de


valores con respecto a la media del grupo, sin tomar en
cuenta el signo de la desviacin.!
C
! ada valor individual de x se desva de la media por una
cantidad igual a (x - ). Esta desviacin (x - ) es cero
cuando x es igual a la media, . La desviacin (x - ) es
positiva cuando x es ms grande que y negativa cuando x
es menor que .!
Esto se expresa: x - , que es la diferencia entre el valor de
x y la media, La frmula para obtener la Desviacin de la
media (D ) es:!
x !

x !

x !

x !

x !

x !

x !

x !

i=1

(xi - )!
x !

n!

=x !

Considera la muestra 6, 3, 8, 5, 3. Con la frmula de la


x!
media(
), encuentras que la media es 5. Cada
n!
desviacin, (x - ), se encuentra entonces al restar 5 de
n
cada valor x:!
!
=x !

x !

=x !

x !

x !

=x !

=x !

=x !

x !

(x1- )! +! (x2- )! +! (x3- )! +! (x4- )! +! (x5- )!


x !

n!

x !

(xi - )!
x !

i=1

n!

(6 - 5)! +! (3 - 5)!+! (8 - 5)!+! (5 - 5)! +! (3 - 5)!


5!

8!
5!

1.6!

=x !

3. Varianza muestral. La varianza muestral, s,2 es la media


de las desviaciones al cuadrado, calculada con n - 1 como
el divisor. Su frmula es:! ! n
2

S =

i=1

(xi - )!
x !

n!

En el ejemplo anterior (6, 3, 8, 5, 3); tenemos que la media


es igual a 5, por lo tanto: !
2

(x1- )! +! (x2- )! +! (x3- )! +! (x4- )! +! (x5- )!


S =
x !

x !

x !

x !

x !

n!

S =
2

S =
2

(6 - 5)! +! (3 - 5)!+! (8 - 5)!+! (5 - 5)! +! (3 - 5)!


2

18!
5!

S = 3.6!

5!

4. Desviacin estndar. La desviacin estndar de una


muestra, S, es la raz cuadrada positiva de la varianza:!

S = S!

En el ejemplo del ejercicio anterior, teniendo el dato de que


la varianza (S 2 ) es igual a 3.6: !

S = 3.6!
S = 1.89

Aplicaciones de las Medidas de dispercin.!


En estadstica descriptiva, las medidas de dispercin nos
ayudan entender mejor la distribucin de los datos en relacin a
sus medidas centrales. Por ejemplo, los siguientes datos hacen
referencia a las esturas que poseen distintas personas que
integran dos grupos diferentes de 12 personas cada uno: !
ESTATURAS EN CENTMETROS DE LAS PERSONAS

x !

x !

GPO.
A

150

145

179

150

185

145

185

185

149

152

168

190 165.25

16.75

164

163

165

162

165

169

162

165

168

164

169

167 165.25

2.0

Aunque ambos grupos poseen una media de 165.25, la


desviacin de la Media es muy distinta entre ellos; lo que quiere
decir que en el grupo A los datos estn muy dispersos, mientras
que el el grupo B los datos estn muy cercanos.!

Medidas de Dispersin en Excel!


En primer lugar, Excel no tiene un frmula
especfica de Rango, por lo que tenemos que
ordenar primeramente los datos con la opcin: !
!Despus nos posicionamos en
una celda en blanco, ponemos el
signo de igual (=), abrimos
parntesis y despus
seleccionamos la celda de
mayor valor (A5), seguida del
signo de menos (-) y
seleccionamos la celda de
menor valor (A1) y presionamos
ENTER. La frmula quedara:!

=(A5-A1)!

En el caso de Desviacin de la Media, Varianza y Deviacin


Estndar, Excel tiene una frmula especfica para cada una.!
Para obtener la Desviacin de la Media se necesita anotar el
signo de igual (=) seguido de la palabra: DESVPROM; despus
se abre parntesis y se elige la serie de datos que se desea
obtener; enseguida se cierra parntesis y se presiona ENTER. LA
frmula quedara as: !

=DESVPROM(A1:A5)!

Para obtener la Varianza y la Desviacin Estndar se sigue el


mismo procedimiento anterior; slo cambia la frase que se anota
despus del signo de igual.!
La frmula de Varianza quedara:!

=VAR.P(A1:A5)!
La frmula de Desviacin Estndar quedara:!

=DESVEST(A1:A5)!

ACTIVIDAD 1.9

reneb@cmt.edu.mx

Obtn lo que se te pide de las siguientes tablas numricas:!


!
RANGO

Desviacin de
la Media

Varianza

Desviacin
Estndar
12 82 55 47

2.1

7.5

4.1 10.5 8.4

1.0 2.0 1.2

3.4

4.5

4.8 12.5 5.3

1.8 1.5 0.5

1.5

8.5

1.5 9.5 7.7

1.5 1.2 1.5

4.9

2.3

4.9 4.3 5.0

2.0 0.9 1.3

1.9

9.1

5.9 9.2 11.5

1.9 1.3 1.2

5.5

3.2

7.5 4.2 10.0

1.5 2.1 1.7

4.5

7.2

5.5 9.2 8.4

1.5 0.7 1.2

27 29 79 53
54 75 17 15
34 45 42 85
10 32 39 92
95 44 33 70

1.6 ESTUDIO DE POBLACIONES CON DATOS BIVARIADOS


Los datos bivariados son valores de dos diferentes
variables que se obtienen a partir del mismo elemento
de poblacin.!
Cada una de las dos variables pueden ser cualitativas o
cuantitativas. Como resultado, los datos bivariados
pueden formar tres combinaciones de tipos de variable:!
a. Ambas variables son cualitativas (ambos atributos).!
b. Ambas variables son cuantitativas (ambas
numricas).!
c. Una variable es cualitativa (atributo) y la otra es
cuantitativa (numrica).!

a. Dos variables cualitativas!


Cuando los datos bivariados resultan de dos variables
cualitativas (atributo o categrica), con frecuencia los
datos se ordenan en una tabla cruzada o de
contingencia. !
Ejemplo:!
30 estudiantes fueron
identificados al azar y
clasificados de acuerdo con
dos variables: gnero (M/F) y
especializacin: Humanidades
(LA), administracin de
empresas (BA) y tecnologa (T). !

Sujeto Gnero Especialidad Sujeto Gnero Especialidad Sujeto

Gnero

Especialidad

LA

11

21

BA

BA

12

LA

22

BA

LA

13

LA

23

LA

14

24

LA

15

25

BA

16

BA

26

BA

LA

17

LA

27

LA

18

BA

28

BA

19

LA

29

BA

10

BA

20

30

LA

Esos 30 datos bivariados pueden resumirse en una tabla


cruzada 2 x 3:!
Especializacin
Gnero

LA

BA

TOTAL

18

12

TOTAL

11

10

30

Las frecuencias pueden convertirse fcilmente a porcentajes del


gran total al dividir cada frecuencia por el gran total y multiplicar
el resultado por cien:! ( 6! ) x 100 = 20.
30!
Especializacin
Gnero

LA

BA

TOTAL

17%

20%

23%

60%

20%

13%

7%

40%

TOTAL

37%

33%

30%

100%

25%

20%

15%

10%

5%
0%

LA

BA

Las frecuencias en la misma tabla de contingencia, tabla 3.3,


pueden expresarse como porcentajes de los totales de fila (o
gnero) al dividir cada entrada de fila por el total de dicha fila y
multiplicar los resultados por 100.!
Especializacin
Gnero

LA

BA

TOTAL

28%

33%

39%

100%

50%

33%

17%

100%

TOTAL

37%

33%

30%

100%

90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

LA
BA
T

Las frecuencias tambin pueden expresarse como porcentajes


de los totales de columna (o especializacin) al dividir cada
entrada de columna por el total de dicha columna y multiplicar el
resultado por 100. !
Especializacin
Gnero

LA

BA

TOTAL

45%

60%

78%

60%

55%

40%

22%

40%

TOTAL

100%

100%

100%

100%

90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

M
F

LA

BA

Cuando los datos bivariados son resultado de dos


variables cuantitativas, se acostumbra expresar los
datos de manera matemtica como pares ordenados
(x, y), donde x es la variable de entrada (en ocasiones
llamada variable independiente) y y es la variable de
salida (en ocasiones llamada variable dependiente). Se
dice que los datos son ordenados porque un valor, x,
siempre se escribe primero. Se llaman emparejados
porque, para cada valor x, existe un valor y
correspondiente de la misma fuente. !
La variable de entrada, x, se mide o controla con la
finalidad de predecir la variable de salida y. !

Una situacin en la que se trabaja con datos bivariados


cuantitativos es medir el grado de correlacin que stos poseen,
para ello, se debe de obtener la r de correlacin de Pearson,
en la que:!
a. Si r = 1, existe una correlacin positiva perfecta. El ndice
indica una dependencia total entre las dos variables
denominada relacin directa: cuando una de ellas aumenta,
la otra tambin lo hace en proporcin constante.!
b. Si 0 < r < 1, existe una correlacin positiva.!
c. Si r = 0, no existe relacin lineal. Pero esto no necesariamente
implica que las variables son independientes. !
d. Si -1 < r < 0, existe una correlacin negativa.!
e. Si r = -1, existe una correlacin negativa perfecta. El ndice
indica una dependencia total entre las dos variables llamada
relacin inversa: cuando una de ellas aumenta, la otra
disminuye en proporcin constante.!

TALLA (X)
72
76
59
68
60
58
70
65
54
83
64
66
61
66
57
81
59
71
62
75
66.35

PESO (Y)
9
10
6
8
10
5
8
7
4
11
7
7
6
8
5
11
5
9
6
10
7.6

X - X
5.65
9.65
-7.35
1.65
-6.35
-8.35
3.65
-1.35
-12.35
16.65
-2.35
-0.35
-5.35
-0.35
-9.35
14.65
-7.35
4.65
-4.35
8.65

Y - Y
1.4
2.4
-1.6
0.4
2.4
-2.6
0.4
-0.6
-3.6
3.4
-0.6
-0.6
-1.6
0.4
-2.6
3.4
-2.6
1.4
-1.6
2.4

(X X) * (Y Y)
7.91
23.16
11.76
0.66
-15.24
21.71
1.46
0.81
44.46
56.61
1.41
0.21
8.56
-0.14
24.31
49.81
19.11
6.51
6.96
20.76
290.8

Para medir el grado de correlacin se debe desglosar la


siguiente frmula:!

r=
covarianza=

covarianza=

covarianza!
Sx* Sy!

(X - X) (Y Y)!
n - 1!

(290)!

19!
covarianza= 15.30

r=

15.30!
8.087* 2.137!

r = 0.885

Esto nos indica que el grado de correlacin es positiva y por la


relacin existente entre estos dos datos es significativa.!

c. Una variable cualitativa y una cuantitativa !

Cuando los datos bivariados resultan de una variable cualitativa


y una cuantitativa, los valores cuantitativos se ven como
muestras separadas y cada conjunto se identifica mediante
etiquetas de la variable cualitativa.!
Supongamos que deseamos buscar la relacin existente entre la
edad de un sujeto y el tipo de sociabilidad (relaciones que tiene
con otras personas). La edad es un dato meramente cuantitativo,
pero la sociabilidad es cualitativo. En este caso lo que se
buscar es convertir el dato cualitativo en cuantitativo. !

En investigacin esto se hace por lo regular recurriendo a


escalas; en las que se sita una caracterstica cualitativa de los
individuos en una serie de parmetros que nos arrojarn datos
cuantitativos.!
Una de las ms usadas es la escala tipo Likert, ya que esta
permite al individuo situar si situacin cualitativa en una serie de
opciones preestablecidas.!
Por ejemplo:!
!
23. Prefiero salir con mis amigos un da por la noche a
quedarme en casa a ver televisin!
!
a. Totalmente en desacuerdo!
b. En desacuerdo!
c. Ni de acuerdo ni en desacuerdo!
d. De acuerdo!
e. Totalmente de acuerdo!

EJEMPLO:!
Para conocer el tipo de sociabilizacin de los individuos con su
respectiva edad se aplic una escala Likert a 30 personas de
edades de entre 15 y 70 aos y se obtuvieron los siguientes
resultados. !
SUJETO

EDAD

NIVEL

SUJETO

EDAD

NIVEL

SUJETO

EDAD

NIVEL

15

3.5

11

32

3.7

21

48

2.7

15

4.7

12

33

4.2

22

53

1.9

17

4.5

13

33

4.5

23

54

2.3

18

4.8

14

35

3.2

24

58

2.1

18

3.8

15

37

3.5

25

58

2.0

22

4.5

16

38

2.8

26

62

2.2

23

4.2

17

39

3.2

27

64

1.9

27

3.6

18

39

2.9

28

65

1.7

25

3.5

19

45

3.0

29

68

1.5

10

28

3.9

20

47

2.9

30

70

1.6

Si intentamos graficar con los datos anteriores obtendramos una


grfica que no nos mostrara con claridad el tipo de
diferenciacin:!
80
70
60
50
EDAD

40

NIVEL

30
20
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Por lo tanto, para poder hacer una comparativa ms efectiva es


conveniente convertir los valores en porcentajes para lograr
graficar bajo una misma premisa. Por ejemplo: !
REAL
15

EDAD
PORCENTUAL
21.4

NIVEL
REAL
4.1

PORCENTUAL
82

15

21.4

4.7

94

17

24.3

4.5

90

18

25.7

4.8

96

18

25.7

3.8

76

22

31.4

4.5

90

23

32.9

4.2

84

27

38.6

3.6

72

25

35.7

3.5

70

28

40.0

3.9

78

De esta forma podemos graficar y observar la discrepancia de


ambos datos:!
120.0

100.0

80.0

EDAD

60.0

NIVEL
40.0

20.0

0.0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Obtencin de Porcentajes!
Para obtener el porcentaje de
cierta cantidad, ser suficiente
con hacer la multiplicacin por
el porcentaje que deseamos
obtener. Por ejemplo, si en la
celda A2 tenemos el valor 200
y deseamos obtener el 75%
de dicho valor, entonces ser
suficiente con hacer la
multiplicacin de ambos de la
siguiente manera:!

=A2*B2!

Si se desea obtener el
porcentaje en relacin a un
nmero en especfico; por
ejemplo, si quiero saber qu
porcentaje representa el 24 de
60, partiendo de que el 60
representa el 100%. La frmula
sera la siguiente:!

=(100*A1)/60!
Esto es basndose en el
esquema de la regla de tres
simples, para obtencin de
porcentajes.!

60
24

100

r de Pearson!
Al igual que otras frmulas que Excel simplifica, la correlacin r
de Pearson tambin posee una frmula en especfico, la cual
funciona siempre y cuando poseeamos dos series de datos a
comparar (correlacionar); !
En este ejemplo, se
uso una variacin
proporcional (de 3) en
el que por
consiguiente el
resultado es 1,
haciendo referencia a
una correlacin
positiva perfecta:!

=PEARSON(A1:A10,B1:B10)!

ACTIVIDAD FINAL
!

1. Obtn el porcentaje de cada uno los siguientes datos, en


donde el dato mayor representa el 100%!
4.1

10.5

8.4

5.5

4.8

12.5

5.3

3.8

4.5

9.5

7.7

10.2

4.9

4.3

5.0

4.7

9.9

9.2

11.5

12.3

11.5

4.2

10.0

8.4

2.4

3.5

2.3

2.6

2.3

8.9

8.9

3.1

8.9

7.7

9.8

4.5

5.5

9.2

8.4

3.2

reneb@cmt.edu.mx

2. Obtn el coeficiente r de correlacin:!


! EDAD
NIVEL
EDAD
NIVEL

15
15
17
18
18
22
23
27
25
28

3.5
4.7
4.5
4.8
3.8
4.5
4.2
3.6
3.5
3.9

32
33
33
35
37
38
39
39
45
47

3.7
4.2
4.5
3.2
3.5
2.8
3.2
2.9
3.0
2.9

EDAD

NIVEL

48
53
54
58
58
62
64
65
68
70

2.7
1.9
2.3
2.1
2.0
2.2
1.9
1.7
1.5
1.6

PROBABILIDAD Y MUESTREO
UNIDAD 2

2.1 PRINCIPIOS DE PROBABILIDAD CLSICA


Con origen en el latn probabiltas, probabilidad es una
palabra que permite resaltar la caracterstica de probable
(es decir, de que algo pueda ocurrir o resultar verosmil). Se
encarga de evaluar y permitir la medicin de la frecuencia
con la que es posible obtener un cierto resultado en el
marco de un procedimiento de carcter aleatorio.!
La probabilidad, por lo
tanto, puede definirse
como la razn entre la
cantidad de casos
prsperos y la
cantidad de
cuestiones posibles. !

La gran aliada de la probabilidad es la llamada teora de la


probabilidad, ya que gracias a lo que esta postula y
sostiene, es que los seres humanos podemos anticiparnos a
que algunos sucesos potenciales ocurran finalmente. La
mencionada teora es muy utilizada y consultada por
disciplinas como pueden ser la estadstica, la filosofa, las
matemticas y la ciencia, para sacar conclusiones respecto
de los sucesos potenciales que las ocupan.!

La teora de la probabilidad es un
modelo matemtico que se ocupa de
analizar los fenmenos aleatorios; esto
implica la contraposicin respecto de
los fenmenos ya determinados, que son
aqullos en los cuales el resultado del
experimento que se realiza, atendiendo a
determinadas condiciones, produce un
resultado nico y previsible, que se
repetir la cantidad de veces que ste
vuelva a hacerse, siempre y cuando se
respeten las mismas condiciones.!
El estadista Karl Pearson lanz una
moneda 24000 veces y obtuvo 12012
guilas.!

Se podra decir que la mayora de los gobiernos, alguna


vez, han echado mano de los mtodos probabilsticos, para
atender a un futuro escenario en el cual el bienestar de su
poblacin puede entrar en serio riesgo. As mismo es
tambin muy aplicada por distintas ciencias, de igualar la
idea de probabilidad con el concepto de riesgo. Esto nos
puede parecer tremendista,
pero resulta ser un fenmeno
de utilizacin muy comn
en la medicina.!

En investigacin tambin la estadstica juega un papel


trascendental. En la regin de San Luis, en Venezuela, la
prevalencia de la enfermedad de Huntington es 700 veces
mayor que en Estados Unidos. En una poblacin de 3000
personas aproximadamente, alrededor de 150 individuos la
padecen y 1500 ms presentan un riesgo elevado de
desarrollarla. Esto se debe a que San Luis es el hogar de unas
cuantas familias con muchos miembros afectados. !
Por mucho, la ms extensa de estas
familias es la familia Soto, que tiene la
mayor concentracin que se conoce de
la enfermedad de Huntington de
cualquier familia en el mundo. Esta
incidencia tan alta de la enfermedad en
una familia ofrece a los cientficos una
oportunidad poco comn de estudiar
este raro trastorno!

La probabilidad es la base sobre la que se construyen los


mtodos importantes de la estadstica inferencial; y la cual
se apoya en un simple principio denominado: regla del
suceso infrecuente para la estadstica inferencial, la cual
establece lo siguiente:!
Si, bajo un supuesto dado
(como un juego de lotera
justo), la probabilidad!
de un suceso particular
observado (como ganar cinco
veces consecutivas)!
es extremadamente pequea,
concluimos que el supuesto
probablemente es!
incorrecto.!

Fundamentos...
Al considerar la probabilidad, tratamos con procedimientos
(como tirar un dado, contestar una pregunta de opcin
mltiple en un examen, jugar lotera, etc.) que producen
resultados, para lo cual es importante entender:!
! Suceso: cualquier conjunto de resultados o consecuencias
de un procedimiento.!
! Un suceso simple es un resultado o un suceso que ya no
puede desglosarse en componentes ms simples.!
! El espacio muestral de un
procedimiento se compone
de todos los sucesos simples
posibles. Es decir, el espacio
muestral se forma con todos
los resultados que ya no es
posible desglosar ms.!

Hay diferentes formas para definir la probabilidad de un


suceso. Podemos encontrar por lo menos tres
enfoques, para los cuales es importante entender
algunas notaciones bsicas:!
!
!
!

P denota una
probabilidad.!
A, B y C denotan
sucesos especficos.!
P(A) denota la
probabilidad de que
ocurra el suceso A.!

Regla 1: Aproximacin de la probabilidad por


frecuencias relativas
Realice (u observe) un procedimiento un gran nmero
de veces y cuente las ocasiones que el suceso A
ocurre en realidad. Con base en estos resultados
reales, P(A) se estima de la siguiente forma:!
Nmero de veces que ocurre A!

P(A)= !

Nmero de veces que se repiti el ensayo!

Por ejemplo: Saber la probabilidad que en un dado


caiga el nmero 6. Si se lanza 40 veces un dado de las
cuales cae 7 veces el nmero 6 podemos aplicar:!
P(A)= !

7!
40!
P(A)= ! 0.175!

Regla 2: Mtodo clsico de la probabilidad


(requiere resultados igualmente probables)
Suponga que un procedimiento dado tiene n sucesos
simples distintos, cada uno de los cuales tienen la
misma posibilidad de ocurrir. Si el suceso A puede!
ocurrir en s de estas n formas, entonces:!
P(A)= ! Nmero de formas en que puede ocurrir A!
Nmero de sucesos simples diferentes!

= ! s!
n!

Por ejemplo: Saber la probabilidad que en un dado


caiga el nmero 3. !
P(A)= !

1!
6!
P(A)= ! 0.166!

Regla 3: Probabilidades subjetivas


P(A), la probabilidad del suceso A, se obtiene
simplemente suponiendo o estimando su valor con
base en el conocimiento de las circunstancias
relevantes.!
Por ejemplo: Al lanzar una
moneda todos suponemos
que tenemos la misma
probabilidad de que caiga
cara de que caiga guila.!

De los tres mtodos mencionados, la regla 2 resulta ser


el mtodo ms prctico, cuyos resultados se manejan
de manera sencilla y efectiva. !
La probabilidad de ganar en
la lotera, de ser elegido para
exponer clase, resultar
ganador en un sorteo, sacar
un chocolate rojo de una bolsa
de m&ms, son ejemplos
claros en donde la regla 2 es
muy til para pronosticar un
evento en particular. !

Es muy importante notar que el mtodo clsico (regla 2)


requiere resultados igualmente probables. Si los resultados
no son igualmente probables, debemos usar el estimado de
frecuencias relativas o confiar en nuestro conocimiento de
las circunstancias para hacer una conjetura entrenada. !
Al calcular probabilidades con el mtodo de frecuencias
relativas (regla 1), obtenemos un estimado en lugar de un
valor exacto. Conforme el nmero total de observaciones se
incrementa, los estimados correspondientes tienden a
acercarse a la probabilidad real. Tal propiedad se enuncia
en forma de teorema, al que se conoce comnmente como
la ley de los grandes nmeros.!

Ley de los grandes nmeros


Conforme un procedimiento se repite una y otra vez, la
probabilidad de frecuencias relativas (regla 1) de un suceso,
tiende a aproximarse a la probabilidad real.!
Esta ley refleja una simple nocin fundamentada en el sentido
comn: un estimado de probabilidad basado en slo unos
cuantos ensayos puede desviarse en cantidades sustanciales;
pero, con un nmero muy grande de ensayos, el estimado
tiende a ser mucho ms preciso. !
Por ejemplo, es muy fcil que
una encuesta de opinin entre
slo una docena de personas
seleccionadas al azar resulte
errnea en gran medida, pero
si se aplica a miles de personas
seleccionadas al azar, puede
acercarse bastante a los
valores reales de la poblacin.!

En s, aunque el mtodo de la regla 2 suele ser ms


prctico y preciso, la regla 2 se acopla ms a posibilidades
ms realistas, en las que es muy difcil partir de resultados
igualmente probables para saber el resultado. !
Por ejemplo, en una carrera de
automviles, en donde
participan 10 vehculos. Segn la
regla 2, si se apuesta a un auto
en particular, se tiene una
probabilidad de 0.1 de ganar.
Sin embargo la realidad
frecuentemente alejada a este
nmero, ya que no todos los
autos parten de las mismas
condiciones. !

Ahora, existen tambin muchas situaciones en las que ni la


regla 1, ni la regla 2 nos resultan de mucha utilidad, ya que
ambas se alejan de lo real. Por ejemplo, imaginemos que al
inicio del torneo mexicano de ftbol y apostamos de que los
Tigres sern campeones.!
Si nos basamos en la Regla 2 encontramos que la
probabilidad de que el equipo gane es 1/18 0.055 (la
misma que cada uno del resto de los equipos).!
Si consideramos la Regla 1, encontramos
que tiene una probabilidad muy similar, que
es de 6/40 0.666 (ya que slo ha ganado 4
de los casi 60).!
Es aqu donde la Regla 3 cobra
relevancia, ya que el anlisis inferencial
nos da una probabilidad ms cercana a
la realidad.!

Redondeo de probabilidades
Cuando se expresa el valor de una probabilidad, hay que dar
la fraccin o el nmero decimal exactos, o redondear los
resultados decimales finales a tres cifras significativas.
(Sugerencia: Cuando una probabilidad no sea una fraccin
simple como 2/3 o 1/5, exprsela como decimal para que el
nmero resulte ms claro).!
Ejemplos!
La probabilidad de 0.021491 tiene cinco dgitos relevantes
(21491), por lo cual puede redondearse a 0.0215, con tres
dgitos relevantes.!
La probabilidad de 1/3 puede permanecer como fraccin o
redondearse a 0.333. No redondee a 0.3.!
La probabilidad de caras en un lanzamiento de una moneda
puede expresarse como 0.5; ya que 0.5 es exacto, no hay
necesidad de expresarlo como 0.500. !
La fraccin 432/7842 es exacta, pero su valor no es evidente.
Exprsela como el decimal 0.0551.!

Sucesos complementarios
Algunas veces necesitamos calcular la probabilidad de que
un suceso A no ocurra, para ello encontramos los sucesos
complementarios:!
Complemento de un suceso A, denotado por consiste en
todos los resultados en los cuales el suceso A no ocurre.!
Por ejemplo: En un grupo tpico, hay 205 bebs recin
nacidos y 105 de ellos son nios. Si un beb del grupo es
seleccionado al azar, cul es la probabilidad de que el
beb no sea un nio? La deduccin es la siguiente:!
P()= !

100!
205!

P()= 0.488!

Posibilidades
Las probabilidades pueden y se expresan en muchas
formas; muchas de ellas se ven y escuchan en las noticias
casi todos los das (la mayora de las veces, son
probabilidades subjetivas). Las posibilidades son una forma
de expresar las probabilidades al especificar el nmero de
formas en que un evento puede ocurrir, comparado con el
nmero de formas en que no puede ocurrir. !
El enunciado hay cuatro veces ms
probabilidades de que maana llueva
(R) de que no llueva (NR) es un
enunciado de probabilidad que puede
expresarse como posibilidades; las
posibilidades son 4 a 1 en favor de
lluvia maana (tambin se escribe 4:1)!

La relacin entre posibilidades y probabilidad se muestra a


continuacin;!

Si las posibilidades en favor de un evento A son a a b


( a:b), entonces: !
1. Las posibilidades en contra del evento A son b a a
( b:a).!
a!
2. La probabilidad del evento A es P(A) =! a + b!
3. La probabilidad de que el evento A no ocurrir es
b!
P()=!
a + b!
Para ilustrar esta relacin, considera el enunciado las
posibilidades en favor de lluvia maana son 4 a 1 (4:1). Con la
notacin precedente, a = 4 y b = 1. Por tanto, la probabilidad de
4!
4!
lluvia maana es

= 0.8. Las posibilidades en contra


4+1!
5!
de lluvia maana son 1 a 4 (1:4) y la probabilidad de que no
1!
habr lluvia maana es
1! = 0.8.!
4+1!
5!

Para la obtencin de las posibilidades reales en contra de que


ocurra un suceso A son el cociente de P()/P(A).!
Ejemplo. Una ruleta tiene 38 ranuras distintas y slo una
corresponde al nmero 13. La ruleta se dise de manera que
las 38 ranuras sean igualmente probables de resultar. Si alguien
apuesta a un nmero 13, tiene una probabilidad de ganar de
0.342 (segn la regla 2). Ahora, la posibilidad de ganar sera la
podemos desglosar de la siguiente manera:!

Posibilidad (A)=!

P()
P(A)!

=!

37/38!
1/38!

=!

37!
1!

! 37:1!

Comparacin de probabilidad y estadstica


Son dos campos de la matemtica, separados pero
relacionados. Se ha dicho que la probabilidad es el
vehculo de la estadstica. Esto es: si no fuera por las
leyes de la probabilidad, la teora de la estadstica no
sera posible.!
6

Ejemplo: Se sabe que el bote de probabilidad contiene cinco


fichas de pquer azules, cinco rojas y cinco blancas. La
probabilidad trata de responder preguntas como: si una ficha se
saca al azar de esta caja, cul es la posibilidad de que ser
azul?. Por otra parte, en el bote de estadstica no se sabe cul
es la combinacin de fichas. Se extrae una muestra y, con base
en los hallazgos en la muestra, se hacen conjeturas acerca de lo
que se cree hay en la caja. La estadstica, por otra parte, te pide
extraer una muestra, describir la muestra (estadstica descriptiva)
y despus hacer inferencias acerca de la poblacin con base en
la informacin encontrada en la muestra (estadstica inferencial).!

2.2 PRINCIPIO FUNDAMENTAL DEL CONTEO


La regla fundamental de conteo se extiende fcilmente
a situaciones que impliquen ms de dos eventos, y se
explica de la siguiente manera:!
Para una secuencia de dos sucesos en la que el primer
suceso puede ocurrir de m formas y el segundo suceso
puede ocurrir de n formas, los sucesos juntos pueden
ocurrir un total de m * n formas.!

Ejemplo: Los sistemas comunes de alarma para casas tienen un


cdigo que consta de cuatro dgitos. Los dgitos (0 hasta 9)
pueden estar repetidos, aunque deben ingresarse en el orden
correcto. Suponga que usted planea tener acceso intentando
cdigos hasta encontrar el correcto. Cuntos cdigos diferentes
son posibles?!
Hay 10 valores posibles para cada
uno de los cuatro dgitos; entonces,
el nmero de cdigos posibles
distintos es de 10 * 10 * 10 * 10 =
10,000. Aunque los 10,000 cdigos
pueden intentarse en alrededor de
11 horas, los sistemas de alarma
normalmente se disearon para que
el sistema rechace intentos
subsecuentes despus de unas
cuantas entradas incorrectas!

Ahora, cuando hacemos este tipo de combinaciones


tambin es importante considerar si el orden con el que
se hacen es importante o no. De acuerdo a ello
podemos tener dos tipos de situaciones:!
1. Combinaciones. Aqu el
orden no importa. Por
ejemplo: "Mi ensalada de
frutas es una combinacin
de pia, fresa, meln, kiwi,
pltano y mango.!
2. Permutaciones. Aqu el
orden s importa. Por
ejemplo: "La combinacin
de la cerradura es 472"" !

Hay dos tipos de permutaciones:!


a. Se permite repetir: como la clave
de la cerradura de de un
portafolio que podra ser "333".!
b. Sin repeticin: como los tres
primeros en una carrera. No puedes
quedar primero y segundo a la vez..
Y dos tipos de combinaciones:!
a. Donde los nmeros se pueden
repetir: como monedas en tu
bolsillo (5,5,5,10,10)!
b. Donde no existe la posibilidad
de repeticin: como nmeros
de lotera (2,14,15,27,30,33)!

a. Permutaciones con repeticin


Si se tienen n cosas para elegir y eliges r de ellas, las
permutaciones posibles son:!
n * n * n ... (r veces) = nr!
Esto se explica porque hay n posibilidades para la primera
eleccin, despus hay n posibilidades para la segunda
eleccin, y as sucesivamente !
Por ejemplo En el caso de la cerradura del portafolio, hay 10
nmeros para elegir (0,1,...,9) y eliges 3 de ellos:!
10 * 10 * 10 (3 veces) = 10 3 = 1000 permutaciones!
As que la frmula es simplemente:!

n r!
Donde n es el nmero de cosas que
puedes elegir, y eliges r de ellas (Se
puede repetir, el orden importa) !

b. Permutaciones sin repeticin


En
caso, caso,
se reduce
el nreduce
mero de opciones
Eneste
este
se
el nmero
en cada paso.

de opciones en cada
paso. Por ejemplo, cmo podras ordenar 16 bolas de
billar? Despus de elegir por ejemplo la "14" no puedes
elegirla otra vez. As que la primera eleccin tiene 16
posibilidades, y la siguiente eleccin tiene 15 posibilidades,
despus 14, 13, etc. Y el total de permutaciones sera:!

16 x 15 x 14 x 13 ... = 20,922,789,888,000!

La funcin factorial (smbolo: !)


significa que se multiplican nmeros
descendentes. Ejemplos:!
4! = 4 3 2 1 = 24!
7! = 7 6 5 4 3 2 1 = 5040!
1! = 1
!
As que si quieres elegir todas las
bolas de billar las permutaciones
seran:!
16 x 15 x 14 x 13 x 12 x 11!
16! = 20,922,789,888,000!
En Excel la frmula sera:!
!

=FACT(VALOR)!
LIC. REN BAZALDA

c. Combinaciones sin repeticin


Para construir las combinaciones sin repeticin, partimos del
conjunto A={1,2,3,4} y vamos a construir todas las
combinaciones sin repeticin posibles:!
! Los grupos (1,2,3) y (1,2,4) son distintos porque tienen un
elemento distinto. !
! Los grupos (1,2,3) y (3,2,1) son iguales porque tienen los
mismos elementos aunque estn colocados en distinto orden.!
! El grupo (1,1,2) no es vlido porque tiene elementos repetidos.
!
Permutaciones
Combinaciones
123
132
213
231
312
321

123

T=6

T=1

Para la obtencin de combinaciones usamos la frmula


de permutaciones para reducir por las maneras de
ordenar los objetos elegidos (porque no nos interesa
ordenarlos):!
n!
r!(n-r)!

16!
3!(16-3)!

16!
6 X 13!
= 560

20,922,789,888,000
6 x 6,227,020,800

d. Combinaciones con repeticin


Combinaciones con repeticin de n elementos tomados de r en r
son los distintos grupos de n elementos iguales o distintos que
se pueden hacer con los n elementos que tenemos, de forma
que dos grupos se diferencian en algn elemento y no en el
orden de colocacin. !
Un grupo de nios est jugando a hacer banderas tricolores con
5 colores distintos (Azul, verde, amarillo, blanco y rojo). Cuntas
banderas diferentes pueden hacerse?!

(n + r - 1) !
r!(n-1)!

(5 + 3 - 1) !
3!(5-1)!

(7) !
3!(4)!

5040
6 (24)

= 35

5040
144

FRMULAS
Permutacin sin repeticin!

n!
(n-r)!

Permutacin con repeticin!


!

Combinacin sin repeticin!


!

Combinacin con repeticin!


!

n!
(n1! n 2 ! nk !
n!
r!(n-r)!
(n + r - 1) !
r!(n-1)!

2.3 TEORA DEL MUESTREO


El principal objetivo del muestreo es estimar
caractersticas de la poblacin usando los datos de una
muestra.!
Por ejemplo, las encuestas por
muestreo a grandes escalas,
cuando se realizan de la manera
apropiada con un diseo muestral
satisfactorio, pueden proporcionar,
rpidamente y a un menor costo,
informacin con suficiente precisin
para fines prcticos y con la
posibilidad de evaluar el margen de
incertidumbre con una base
objetiva.!

Para un mayor entendimiento del muestreo


consideremos los siguientes aspectos:!
! Muestra. Es una parte de una poblacin de inters

previamente delimitada, es decir, un subconjunto de


sta.!
! Poblacin de

inters. Es un
conjunto finito de
objetos (elementos)
identificables con
ubicacin en
tiempo y espacio.!

Muestra

! Objetivos del muestreo. Las tcnicas del muestreo

se utilizan para conocer las caractersticas generales


de la poblacin de inters, al estudiar solo una parte
de sta.!
! Campos de aplicacin.!
Encuestas de opinin!
Ratings de televisin!
Industria. Control de
calidad!
Encuestas INEGI!
Laboratorios. Estudios
en sangre!
Encuestas electorales!
Estudios de mercado!

! Ventajas del muestreo. La rapidez (tiempo) y los

costos de inversin en su realizacin, hacen que el


muestreo sea una tcnica muy utilizada por
gobiernos, empresas e investigadores.!
! Objetivo del muestreo.
Seleccionar buenas
muestras (representativas
de la poblacin) de un
tamao apropiado,
considerando la
informacin que tenemos
de la poblacin que
estamos estudiando y el
presupuesto con que
contamos.!

! Tamao apropiado de la muestra. No existe un

determinado porcentaje exacto que deban tener,


como regla forma general, todas las muestras; sin
embargo hay parmetros que ayudan a dterminar su
tamao: !
La variabilidad de la caracterstica que queremos
estudiar !
La precisin con que queremos hacer la
inferencia!
El presupuesto que tengamos!
El tamao de la poblacin !
Es importante entender que
entre mayor sea la muestra en
relacin a la poblacin, mayor
exactitud tendr su inferencia.!

! Poblacin Objetivo. Conjunto de elementos

identificables con ubicacin en tiempo y espacio. La


poblacin se define al especificar qu elementos son
(a veces tambin cules no son) y qu
caractersticas deben tener.!
Por ejemplo: nios y
nias de 5 y 6 aos
que vivan en el
territorio nacional.!
! Elementos del muestreo.
Pueden ser personas,
escuelas, organizaciones,
productos, ciudades,
elementos qumicos, etc.!

! Tipos de muestra. Bsicamente existen dos formas

de tomar una muestra:!


1. No probabilstica.!
A juicio. Se usa la
experiencia del investigador.!
Cuotas.!
Puede resultar una muestra
sesgada !
No hay forma de estimar el
error!

2. Probabilstica. Todos los elementos de la


poblacin tienen una probabilidad conocida y
mayor que cero de ser seleccionados.!
Se tiene apoyo de herramientas de
probabilidad.!
Hay forma de estimar el error.!

2.3 TCNICAS DEL MUESTREO


Existen diferentes criterios de clasificacin de los
diferentes tipos de muestreo, aunque en general
pueden dividirse en dos grandes grupos: mtodos de
muestreo probabilsticos y mtodos de muestreo no
probabilsticos.!
A. MTODOS PROBABILTICOS
Los mtodos de muestreo
probabilsticos nos aseguran la
representatividad de la muestra
extrada y son, por tanto, los ms!
recomendables. Dentro de los
mtodos de muestreo probabilsticos
encontramos los siguientes tipos:!

1. Muestreo aleatorio simple


El procedimiento empleado es el siguiente: !
1. Se asigna un nmero a cada individuo de la poblacin.!
2. A travs de algn medio mecnico (bolas dentro de una
bolsa, tablas de nmeros aleatorios, nmeros aleatorios
generados con una calculadora u ordenador, etc.) se eligen
tantos sujetos como sea necesario para completar el tamao
de muestra requerido.!

2. Muestreo aleatorio sistematico


Este procedimiento exige, como el anterior, numerar todos los
elementos de la poblacin, pero en lugar de extraer n nmeros
aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i,
que es un nmero elegido al azar, y los elementos que integran
la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+
(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamao de la poblacin entre el tamao de
la muestra: k= N/n. El nmero i que empleamos como punto de
partida ser un nmero al azar entre 1 y k.!

El riesgo este tipo de muestreo est en los casos en que se


dan periodicidades en la poblacin ya que al elegir a los
miembros de la muestra con una periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la
poblacin. !
Por ejemplo, imaginemos que
estamos seleccionando una
muestra sobre listas de 10
individuos en los que los 5
primeros son varones y los 5
ltimos mujeres, si empleamos un
muestreo aleatorio sistemtico con
k=10 siempre seleccionaramos o
slo hombres o slo mujeres, no
podra haber una representacin
de los dos sexos.!

3. Muestreo aleatorio estratificado


Trata de obviar las dificultades que presentan los anteriores ya
que simplifican los procesos y suelen reducir el error muestral
para un tamao dado de la muestra. Consiste en considerar
categoras tpicas diferentes entre s (estratos) que poseen
gran homogeneidad respecto a alguna caracterstica (se
puede estratificar, por ejemplo, segn la profesin, el
municipio de residencia, el sexo, el estado civil, etc.). !

Lo que se pretende con este tipo de muestreo es


asegurarse de que todos los estratos de inters estarn
representados adecuadamente en la muestra. Cada estrato
funciona independientemente, pudiendo aplicarse dentro
de ellos el muestreo aleatorio simple o el estratificado para
elegir los elementos concretos que formarn parte de la
muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado
de la poblacin. (Tamao geogrfico, sexos, edades,...).!

4. Muestreo aleatorio por conglomerados


Los tres mtodos anteriores estn pensados para seleccionar
directamente los elementos de la poblacin, es decir, que las
unidades muestrales son los elementos de la poblacin. En el
muestreo por conglomerados la unidad muestral es un grupo de
elementos de la poblacin que forman una unidad, a la que
llamamos conglomerado. Las unidades hospitalarias, los
departamentos universitarios, una caja de determinado producto,
etc., son conglomerados naturales. !

B. MTODOS NO PROBABILTICOS
A veces, el muestreo probabilstico resulta excesivamente
costoso y se acude a mtodos no probabilsticos, aun
siendo conscientes de que no sirven para realizar
generalizaciones (estimaciones inferenciales sobre la
poblacin), pues no se tiene certeza de que la muestra
extrada sea representativa, ya que no todos los sujetos de
la poblacin tienen la misma probabilidad de se elegidos. !
Entre los mtodos de
muestreo no
probabilsticos ms
utilizados en
investigacin
encontramos los
siguientes:!

1. Muestreo por coutas


En este tipo de muestreo se fijan unas "cuotas" que consisten en
un nmero de individuos que renen unas determinadas
condiciones. Por ejemplo: 20 individuos de 25 a 40 aos, de
sexo femenino y residentes en Guadalajara. Una vez
determinada la cuota se eligen los primeros que se encuentren
que cumplan esas caractersticas. Este mtodo se utiliza mucho
en las encuestas de opinin.!

2. Muestreo intencional o de conveniencia


Este tipo de muestreo se caracteriza por un esfuerzo
deliberado de obtener muestras "representativas" mediante la
inclusin en la muestra de grupos supuestamente tpicos. El
caso ms frecuente de este procedimiento el utilizar como
muestra los individuos a los que se tiene fcil acceso como un
maestro que utiliza a sus alumnos en cierta investigacin!

3. Bola de nieve
Se localiza a algunos individuos, los cuales conducen a
otros, y estos a otros, y as hasta conseguir una
muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.!

4. Muestreo Discrecional
A criterio del investigador los elementos son elegidos
sobre lo que l cree que pueden aportar al estudio.!

You might also like