You are on page 1of 29

PROBABILIDAD Y ESTADSTICA

FMS 175-8
2010

Profesora: Cecilia Larran R.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 2

Introduccin
Qu es la Estadstica? La Estadstica es la Ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de muestras y de la realizacin de inferencias sobre las poblaciones de las que stas proceden. Por qu hay que estudiar Estadstica? Si se revisan las mallas curriculares de las distintas carreras profesionales, veremos que en la mayora existe por lo menos una asignatura de Estadstica. Bsicamente los contenidos de un primer curso de Estadstica en diferentes carreras son los mimos, la mayor diferencia radica en los ejemplos utilizados. La principal razn es que el rol ms destacado de la Estadstica es la recopilacin, presentacin, anlisis de un conjunto de datos, a partir de los cuales se obtienen conclusiones y se toman decisiones.

Saber Estadstica es de gran utilidad en cualquier rea del conocimiento y en particular en Ingeniera. Ejemplos: - Diseo y desarrollo y mejora en los proceso productivos como control de calidad, control de la variabilidad del proceso, Estudios de materiales en cuanto a duracin, dureza, elasticidad, . Control de inventarios, con la estadstica se analiza la tendencia de flujo de ciertos materiales y ciertos productos.

La mayor contribucin de la Estadstica en la resolucin de problemas en ingeniera es su utilizacin como herramienta de aprendizaje. El aprendizaje que se obtiene mediante la estadstica forma parte del denominado Mtodo Cientfico El mtodo cientfico es la estrategia de la investigacin cientfica: afecta a todo ciclo completo de investigacin y es independiente del tema en estudio. Al ser la Ingeniera la aplicacin del conocimiento cientfico, todo proyecto en ingeniera debe contener los rasgos del mtodo cientfico.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 3

ROL DE LA ESTADSTICA EN LA INVESTIGACIN CIENTFICA


(Revista: Contribuciones Cientficas y Tecnolgicas, Junio 1985 pg. 7 9, USACH)

1.1.

PLANTEAMIENTO GENERAL El hombre busca constantemente una explicacin racional para los fenmenos que lo rodena. EL MTODO CIENTFICO le ayuda a organizar adecuadamente la observacin de los hechos y a determinar las leyes que los rigen. En la gran mayora de las situaciones reales la determinacin de tales leyes se complica por la multicasualidad del fenmeno estudiado.

1.2.

MTODO CIENTFICO El mtodo cientfico es un procedimiento que se aplica al ciclo completo de una investigacin, desde el enunciado del problema hasta la evaluacin de los resultados obtenidos. En forma esquemtica podemos distinguir las siguientes etapas en la aplicacin del mtodo cientfico.

1.2.a.

Deteccin y Enunciado del Problema Consiste en la descripcin de una situacin problema o en el planteamiento de una pregunta.

1.2.b. Formulacin de una hiptesis Es una posible explicacin al problema planteado, de acuerdo al conocimiento cientfico existente. 1.2.c. Deduccin de una consecuencia verificable Debido a que la hiptesis es una explicacin general puede, en algunos casos, no ser posible investigar directamente su veracidad. Se procede en estos casos a deducir, en forma lgica, consecuencias particulares de la hiptesis. 1.2.d. Verificacin de la consecuencia En ciencias exactas se puede hacer mediante demostraciones tericas basadas en relaciones aceptadas en el estado actual del conocimiento; en ciencias no exactas (biolgicas, sociales, etc.) la verificacin se hace a travs de recoleccin de la informacin, o de la observacin de los fenmenos, lo cual hace necesario la aplicacin de una serie procedimientos estadsticos. 1.2.e. Conclusin Puede consistir en una aceptacin, modificacin o rechazo de la hiptesis

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 4

ROL DE LA ESTADSTICA EN LA INVESTIGACIN CIENTFICA


(Revista: Contribuciones Cientficas y Tecnolgicas, Junio 1985 pg. 7 9, USACH)

1.3.

MTODO ESTADSTICO Al aplicar el mtodo cientfico nos proponemos verificar la hiptesis inicial, investigando si las consecuencias deducidas de ella se comprueban o no al recoger, en forma sistemtica, nuevas observaciones. Es el mtodo estadstico el que nos proporciona las tcnicas necesarias para recolectar y analizar la informacin requerida. Podramos distinguir una fase de planificacin y otra de ejecucin.

1.3.a. Planificacin En esta fase debemos considerar a.1. Definicin de los objetivos Corresponde formalmente a la descripcin del problema que da origen a la investigacin. Se debe sealar detalladamente lo que se pretende investigar, el qu, donde, cundo y por qu. a.2. Definicin del universo Se debe definir el grupo del cual se extraer la informacin y al cual se generalizarn las conclusiones que se obtengan en la investigacin y al cual se generalizarn las conclusiones que se obtengan en la investigacin. a.3. Diseo de la muestra La teora de Muestreo o de Diseo de Experimentos pueden garantizarnos que la informacin que generamos nos permitir proyecciones vlidas al universo de inters. a.4. Definicin de las unidades de observacin, escalas de clasificacin y unidades de
medidas

En una misma investigacin puede haber varios objetivos parciales que requieren estudiar unidades de observacin diferentes. La eleccin de unidades de medida es crucial ya que una equivocacin puede resultar en un exceso de informacin o en una perdida irrecuperable de ella. a.5. Preparacin del plan de tabulacin y anlisis El cuidado puesto en este aspecto nunca podra considerarse excesivo, debera llegarse, tal vez, hasta considerar alternativas de anlisis adecuadas para compensar algunas alteraciones accidentales del plan de trabajo.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 5

ROL DE LA ESTADSTICA EN LA INVESTIGACIN CIENTFICA


(Revista: Contribuciones Cientficas y Tecnolgicas, Junio 1985 pg. 7 9, USACH)

1.3.b. Ejecucin En esta fase podemos reconocer: b.1. Recoleccin de la informacin. b.2. Elaboracin de la informacin. b.3. Anlisis de lo resultados Un esquema til en la aplicacin de mtodo cientfico y que destaca un paralelismo con el mtodo estadstico se resume en el diagrama siguiente:

Diagrama del mtodo cientfico y del mtodo estadstico

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 6

La estadstica se puede clasificar como:

Estadstica descriptiva

Probabilidad

Tiene como objetivo caracterizar, describir y extraer conclusiones sobre una muestra de datos o de la poblacin de inters. Mide la incertidumbre, deduce las leyes que rigen a los fenmenos que se investigan. Es la herramienta a partir de la que se desarrolla la inferencia estadstica Implica realizar inferencias acerca de la de la poblacin a partir de datos muestrales y requiere clculo de probabilidades.

Estadstica Inferencial

TRMINOS BSICOS Poblacin y Muestra Poblacin es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. (Tamao poblacin: N) Censo: estudio completo de la poblacin A las medidas de resmenes poblacionales como la media poblacional , desviacin estndar poblacional , , se les denominan parmetros. Muestra: subconjunto de la poblacin al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones). Debera ser representativo Est formado por miembros seleccionados de la poblacin (individuos, unidades experimentales). A las medidas de resmenes muestrales como la media de la muestra x , desviacin estndar de la muestra s, se les denomina estadsticos.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 7

Encuesta: Tcnica de investigacin para obtener informacin de grupos de personas mediante el uso de instrumentos como cuestionarios diseados en forma previa. Diseo de experimentos: Metodologa estadstica destinada a la planificacin y anlisis de un experimento. El objetivo del diseo de experimento es estudiar si utilizar un determinado tratamiento produce mejora en el proceso o no.

Variable: una variable es una caracterstica observable que vara entre los
diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables. En la poblacin de alumnos de Ingeniera de la UNAB, es variable: - El gnero: {Femenino, Masculino} var. cualitativa dicotmica - Especialidad :{Automatizacin y Robtica, Logstica y Transporte, } var. cualitativa
politmica - El nmero de asignatura aprobadas: {0,1,2,3,...} var. cuantitativa discreta

- Nivel de Educ. del padre: {Bsica, Media Superior} var. cualitativa ordinal - La altura (en cm.): {162 , 156, 170 ...} var. cuantitativa continua - Edad (aos):
. . .

{17, 18, 19, } var. cuantitativa continua

EL TIPO DE VARIABLE DETERMINA EL TRATAMIENTO ESTADSTICO DE LA MISMA

Obs. Se acostumbra denotar a las variables con letras maysculas. X, Y, Z

Dato: valor de la variable asociado a un elemento de la poblacin o muestra.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 8

Ejemplo: (archivo de datos) Sujeto 01 02 03


. . . . . .

Sexo M M F

Edad 21 22 31
. . .

Especialidad LT AR GI
. . .

observacin 1

La primera observacin indica que el sujeto es de sexo masculino, tiene 21 aos y estudia Ingeniera en Logstica y Trasporte. Cada una de estas tres mediciones es un dato para cada una de las variables medidas para el sujeto 1.

El alumno de Ingeniera es la unidad de observacin Datos primarios Son aquellos que el investigador obtiene directamente de la realidad, recolectndolos con sus propios instrumentos. Datos secundarios Son registros escritos que proceden tambin de un contacto con la prctica, pero que ya han sido elegidos y procesados por otros investigadores. Las fuentes son informacin de datos secundarios deben ser fidedignas. Los datos primarios y secundarios no son dos clases esencialmente diferentes de informacin, sino partes de una misma secuencia: todo dato secundario ha sido primario en sus orgenes, y todo dato primario, a partir del momento en que el investigador concluye su trabajo, se convierte en dato secundario para los dems.

Clasificacin de variables
Para realizar un anlisis de datos, es indispensable saber cmo es la variable que consideramos, pues ello determina el tipo de mtodo estadstico que se debe utilizar. Las variables se clasifican como:

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 9

Segn su naturaleza

Cualitativas o atributos
No toman valores y numricos describen

Cuantitativas
Sus valores son numricos (tiene sentido hacer operaciones

(modalidades)

cualidades. (no se pueden hacer operaciones algebraicas con ellos). Ejemplos: Estado Civil Profesin

algebraicas con ellos). Ejemplos: Estatura Nmero de errores

Segn tamao del recorrido

Dicotmicas
Toman uno de dos valores. Ejem.: Sexo

Discretas
Corresponden en general a contar el nmero de veces que ocurre un suceso.

Continuas
Entre dos valores, son posibles infinitos valores intermedios Ejemplos: Altura Edad

Tienen un recorrido contable Ejem.: Nmero de horas de estudio. Tamao de la familia.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 10

Segn el nivel de medicin:


La medicin es el proceso mediante el cual se les asignan valores numricos a objetos siguiendo unas determinadas reglas. Los instrumentos que se utilizan para llevar a cabo tal medicin se les denominan escalas de medicin. El criterio utilizado convencionalmente para clasificar las escalas de medida es el propuesto por Stevens (1946), quien establece cuatro tipos de escala: nominal, ordinal, de intervalo y de razn.

E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
SEXO: Masculino Femenino (1) (2)

nicamente permiten establecer relaciones de igualdad/desigualdad entre los objetos que se estn midiendo.
NO INDICA ORDEN O JERARQUA

PROFESIN: Ingeniero Profesor Mdico (1) (2) (3)

RAZN INTERVALAR ORDINAL N NO OM MIIN NA AL L

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 11

E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
Adems de permitir relaciones de igualdad /desigualdad, permite establecer relaciones de orden (mayor o menor que) entre los objetos que se estn midiendo.
EXISTE UN ORDEN O JERARQUA

NIVEL EDUCIONAL: Post Grado Universitaria Tcnica profesional Media Bsica (5) (4) (3) (2) (1)

RAZN INTERVALAR O OR RD DIIN NA AL L NOMINAL

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 12

E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
RAZN IIN NT TE ER RV VA AL LA AR R ORDINAL NOMINAL

Al igual que los dos tipos de escalas anteriores (nominal u ordinal), esta escala permite establecer relaciones de igualdad /desigualdad y de orden entre los objetos que se miden. Los intervalos entre los nmeros de la escala son iguales, por lo tanto se puede realizar las operaciones suma y resta. Este tipo de escala carece de un cero absoluto, por lo que no estn permitidas ni la multiplicacin ni la divisin entre los nmeros de la escala. Una escala de intervalo es, por ejemplo, la utilizada para medir la temperatura. Como los intervalos de la escala son iguales, se puede afirmar que la diferencia de temperatura que existe entre 25 y 28 grados es la misma que existe entre 30 y 33 grados. Sin embargo, dado que el punto 0 de la escala es arbitrario -no existe ausencia de temperatura- no se puede afirmar,

por ejemplo, que 20 grados es exactamente la mitad de 40 grados.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 13

E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
R RA AZ Z N N INTERVALAR ORDINAL NOMINAL
Es la escala que permite el nivel ms alto de medicin. Adems de las operaciones que permiten las escalas anteriores, en una escala de razn existe el cero (0) emprico, por lo cual se puede efectuar cualquier operacin aritmtica con los nmeros de la escala. El tiempo de reaccin, por ejemplo es una variable medida en escala de razn. No slo se puede afirmar que la diferencia entre 3 y 6 segundos es la misma que entre 6 y 9 segundos (afirmacin vlida tambin en la escala de intervalos), sino, adems, que 6 seg. es el doble de 3 seg. Afirmacin que es posible establecer gracias a que en la escala de tiempo de reaccin existe el cero absoluto: cero seg. significa ausencia de tiempo de reaccin.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 14

Clasificacin de variables segn su funcin

VI Independiente
Introduce o manipula el investigador

VD Dependiente
Se observa y se miden los cambios

Interviniente
Es la que puede mediar en la relacin entre VI y VD y que puede influir en los resultados

Ejemplo: Los hbitos de estudios influyen en el rendimiento acadmico de los Estudiantes VI = hbitos de estudio VD = Rendimiento acadmico V interv. = Aptitud personal Nivel nutricional .

Prctica n 1.1.
1. Determine en cada caso, si se trata o no de una variable. La edad mnima para poder votar por primera vez en Chile. Nmero de errores en un centro de cmputo. Tiempo (en aos) de experiencia laboral. Profesin de los clientes de un banco. Sueldo de Ingeniero.

2. El coeficiente intelectual (CI) promedio en la poblacin adulta chilena es 100 puntos. Un investigador educacional est interesado en probar que las

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 15

personas adultas que hablan ms de un idioma tienen un CI superior a la media poblacional. En una muestra de 250 personas que hablan ms de un idioma se obtuvo un promedio (CI medio) de 102. Complete:
Clasificacin de la variable Variable de inters (nombre) X

Naturaleza

Recorrido

Medicin

Promedio poblacional

Promedio muestral

Estadstica Descriptiva Univariada Organizacin de los datos


La estadstica descriptiva, entrega las tcnicas que permiten condensar grandes grupos de datos mediante el uso de tablas de frecuencias, grficos y medidas de resumen como media, desviacin estndar, correlacin. Resumir los datos es un procedimiento til y se puede realizar mediante tablas de frecuencias, grficos o valores numricos o medidas de resumen.

Datos en bruto o directos


Cuando la informacin es recolectada, sea de una muestra o de una poblacin, esta se organiza en la secuencia en que fue obtenida. Esta secuencia de datos registrados se encuentra desorganizada. Datos en bruto: Datos registrados en la secuencia en que fueron recolectados, antes de ser procesados u ordenados.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 16

Ejemplo 1 (ArmadoA12.xls): El reporte de la inspeccin final de defectos para la lnea de armado A12 se muestra en la tabla siguiente:
Producto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Defecto Rayado Abollado Astillado Astillado Otros Manchado Rayado Astillado Doblado Rayado Rayado Manchado Manchado Otros Abollado Manchado Rayado Manchado Otros Rayado Doblado Doblado Rayado Manchado Manchado Rayado Abollado Manchado Rayado Rayado Producto 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Defecto Manchado Rayado Rayado Manchado Manchado Doblado Manchado Manchado Manchado Rayado Astillado Rayado Otros Astillado Rayado Rayado Rayado Doblado Manchado Manchado Manchado Rayado Otros Rayado Doblado Manchado Rayado Rayado Doblado Rayado Producto 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 Defecto Manchado Astillado Rayado Astillado Astillado Manchado Rayado Rayado Manchado Manchado Manchado Manchado Manchado Otros Rayado Manchado Manchado Rayado Astillado Rayado Astillado Manchado Manchado Doblado Manchado Astillado Manchado Manchado Manchado Astillado Producto 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 Defecto Manchado Doblado Manchado Manchado Astillado Rayado Manchado Abollado Manchado Manchado Doblado Astillado Astillado Rayado Manchado Astillado Rayado Manchado Manchado Abollado Manchado Abollado Rayado Manchado Manchado Astillado Rayado Rayado Manchado Astillado Producto 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 Defecto Manchado Manchado Rayado Manchado Abollado Astillado Manchado Manchado Astillado Doblado Abollado Manchado Rayado Doblado Astillado Manchado Rayado Rayado Astillado Manchado Rayado Rayado Rayado Rayado Manchado Rayado Manchado Rayado Rayado Astillado

Ejemplo 2: : Datos sobre el nmeros de averas de 40 centrales elctricas


0 2 0 2 1 1 1 0 0 3 1 0 0 1 3 0 2 1 1 1 0 3 0 2 0 1 2 0 1 1 3 3 1 1 4 2 0 0 2 2

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 17

Ejemplo 3: Con el propsito de mejorar el tiempo de entrega desde una embotelladora de refrescos a mquinas vendedoras de una universidad, se ha obtenido 25 datos.
9,45 17,08 44,88 24,45 24,45 37,00 54,12 33,66 31,75 41,95 56,63 37,10 Tiempo de entrega en minutos 35,00 25,02 16,86 14,38 11,66 21,65 17,89 69,45 22,13 21,15 10,02 14,88 39,73 44,29 55,12 56,63 9,60 10,30 16,97 29,41 24,35 34,93 17,73 24,45 37,50 46,59 21,84 9,45

Descripcin estadstica de una variable cualitativa

Grficos

Sectorial Barras Separadas

Medida de resumen Moda: es el dato o modalidad de mayor frecuencia dato ms representativo

- Pictograma

Tabla o distribucin de frecuencias Es una tabla que constituye el resumen bsico de los datos

La presentacin grfica puede revelar de un vistazo las principales caractersticas

de un conjunto de datos

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 18

Ejemplo 1 : El reporte de la inspeccin final de defectos para la lnea de armado A12 se muestra en la tabla siguiente:
Defectos_Linea A12 Defectos del producto Abollado Astillado Doblado Manchado Rayado Otros Total Frecuencia absoluta ni (cantidad) 8 23 56 Frecuencia Relativa fi 0,05 0,15 Porcentaje % 5,33 15,33 37,33

150

1,00

100%

Complete la tabla de frecuencias

Grfico sectorial: Crculo dividido en porciones que representan las frecuencias relativas o porcentajes de una poblacin o muestra perteneciente a diferentes categoras.
Como sabemos, un crculo contiene 360 grados. Para construir un grfico sectorial, se multiplica por 360 la frecuencia relativa de cada categora, para obtener la medida del ngulo correspondiente

Otros 4,00% Rayado 30,00%

Abollado 5,33%

Astillado 15,33% Doblado 8,00%

Manchado 37,33%

Defectos del producto

Cul es Defecto ms frecuente?


Cunto mide el
de sector Defecto Manchado?

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 19

Grfico de Barras Separadas


60
56

50

45

40

Frecuencia

30

23

20

10
8

12

0 Abollado Astillado Doblado Manchado Rayado Otro

Defecto del producto

Diagrama de Pareto

Defecto Manchado Rayado Astillado Doblado Abollado Otros TOTAL

frecuencia 56 45 23 12 8 6 150

% 37,33 30,00 15,33 8,00 5,33 4,00 100,0%

frec. Acum. 56 101 124 136 144 100

% acumulado 37,33 67,33 82,67 90,67 96,00 100

Se calculan solamente para el diagrama Pareto (en este tipo de variable)

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 20

Descripcin estadstica de una variable cuantitativa


Si las observaciones en un conjunto de datos cuantitativos son discretos (contables) o si los valores de la variable asumen slo unos pocos valores distintos, puede ser apropiado armar tablas de frecuencia con valores nicos. La distribucin de frecuencias (tabla) - La distribucin de frecuencias para variables cuantitativas discretas es similar a la de variables cualitativas. Los valores que toma la variable se ordenan de de menor a mayor lo que permite registrar en la tabla las frecuencias acumuladas. La representacin grfica que se utiliza para este tipo de variables es barras separadas Ejemplo 2 : Datos sobre el nmeros de averas de 40 centrales elctricas se resumen en la tabla siguiente:
N de averas 0 1 2 3 4 Total
Frec. Absoluta ni Frec. Relativa fi Frec. Abs. Acumulada Ni Frec. Relat. Acumulada Fi

13 13 5 1 40

13 26

0,325

40 1,000

Cuntas centrales tienen menos de 2 averas? Qu porcentajes de centrales tienen 3 o menos averas? Qu porcentaje de centrales tienen ms de 3 averas? Interprete: n2 f3 N4 F4

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 21

GRFICO DE BARRAS SEPARADA

Cuando la variable es continua o el nmero de valores posibles de una variable discreta sea grande, para construir la tabla de frecuencias,

conviene agrupar los datos intervalos reales. stos agrupan todos aquellos casos contenidos entre dos valores, conocidos como el lmite superior e inferior.

Ejemplo: Se recolect informacin sobre la edad (en aos) de 50 estudiantes


seleccionados de una casa de estudio superior. El valor de los datos, en el orden en que fueron recolectados se presenta a continuacin. (Este es un ejemplo de datos cuantitativos en bruto)
21 18 25 22 25 19 20 19 28 23 24 19 31 21 18 25 22 19 20 36 29 19 23 22 27 34 19 18 22 23 26 25 23 21 21 27 22 19 20 25 36 25 23 19 21 33 23 26 21 24

N de centrales

12

13

13

10

1
0 0 1 2 3 4

N de averas

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 22

Construyendo tablas de frecuencias Al construir tablas de frecuencias es necesario tomar las siguientes 3 decisiones: i) Nmero de clases (intervalos)

Usualmente el nmero de intervalos de una distribucin de frecuencias vara entre 5 y 20, dependiendo principalmente del nmero de casos con los cuales se cuente. La decisin del nmero de clases es decidida arbitrariamente por quien organiza la informacin. Reglas que puede ayudar a decidir el nmero de clases o intervalos: - Nmero de intervalos =
n

; n = nmero de datos,

- Nmero de intervalos = [1 + 3,3 log n] (frmula de Sturge) ii) Aunque Amplitud de intervalo no es comn tener clases o intervalos de diferentes tamaos o

amplitud, la mayora del tiempo es preferible tener la misma amplitud de intervalo en todos ellos. Para determinar esta amplitud cuando las clases o intervalos tienen el mismo tamao, primero se debe encontrar la diferencia entre el mayor y el menor de los datos en los datos. Luego, la amplitud aproximada es obtenida dividiendo esta diferencia por el nmero deseado de clases o intervalos.
Amplitud del intervalo = valor mximo - valor mnimo nmero de intervalos

iii)

Lmite inferior de la primera clase o punto de partida

Cualquier nmero que sea igual o menor que el ms bajo de los valores del conjunto de datos ser conveniente para ser usado como el lmite inferior del primer intervalo.

En el ejemplo (Edad): n = 50 mx = 36

mn = 18

Si utilizamos nmero de intervalos = [1 + 3,3 log (50)] = 6

Amplitud =

36 18 =3 6

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 23

Se lee 6 alumnos con edades entre 18 y menos de 21 aos 17 alumnos con edades entre 21 y menos de 24 aos

4 alumnos con edades entre 33 y 36 aos

Edad 18 21 21 24 24 27 27 30 30 33 33 36

n de alumnos 14 17 10 4 1 4 Total = 50

Frecuencias relativas y porcentaje


Es posible calcular la frecuencia relativa y el porcentaje de las distribuciones cuantitativas del la misma forma que en las distribuciones cualitativas o discretas. Edad Marca de clase Frec. Absoluta Frec. Relativa Porcentaje

xi
18 21 21 24 24 27 27 30 30 33 33 36 19,5 22,5 25,5

ni
14 17 10

fi
0,28 0,34 0,20 28 34 20

Total = 50
Tambin se pueden registrar las frecuencias acumuladas

1,00

100%

2 Representacin grfica de distribuciones de frecuencias con datos en intervalos


Las representaciones grficas ms frecuentes de una tabla de frecuencias donde los datos han sido agrupados en intervalos son el histograma o el polgono de frecuencias.

marca de clase =

limite inferior +limite superior

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 24

Histograma

Donde cada rectngulo corresponde con una clase y la altura es proporcional a la frecuencia de dicha clase o intervalo.

Un histograma puede asumir diferentes formas. Las ms comunes son: simtricos, asimtricos y uniforme o rectangular.
Simtrico
10
10

N estudiantes
8 6 4 2 0 2.5

20

17

15

14

10

10

0 15 18 21 24 27 30 33 36 39

Edad

Formas de histogramas

Asimetra Positiva
10

Asimetra Negativa

Simtrica
8

7.5

12.5

17.5

22.5

27.5

32.5

2.5

7.5

12.5

17.5

22.5

27.5

32.5

0 2.5 7.5 12.5 17.5 22.5 27.5 32.5

Observacin: Describir datos utilizando grficos puede ayudar a iluminarnos acerca de las caractersticas principales de la informacin. Desafortunadamente, tambin pueden

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 25

ser utilizados, casual o intencionadamente, para distorsionar informacin y desorientar a quien la recibe. Las siguientes son dos formas de hacerlo: 1. Cambiar la escala en uno o en ambos ejes (esto es alargando o acortando los ejes) 2. Truncando las frecuencias, es decir, comenzando el eje en un nmero mayor que cero.

Polgono de frecuencias
Grfico alternativo al histograma Los polgonos de frecuencias se realizan trazando los puntos formados por las marcas de clase y las frecuencias, y unindolos mediante segmentos. Polgono de frecuencias
N alumnos
20

17

15
14

10

10

5
4 4

15,0 16,5 18,0 19,5 21,0 22,5 24,0 25,5 27,0 28,5 30,0 31,5 33,0 34,5 36,0 37,5 39,0

Edad

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 26

Grafico de tendencia
Consumo humano de leche de cabra en Espaa. (millones de litro)
Ao Consumo Ao Consumo 1990 62,5 1999 16,2 1991 29,9 2000 17,1 1992 31,3 2001 15,5 1993 25,2 2002 17,6 1994 20,8 2003 11,9 1995 16,1 2004 11,8 1996 15,8 2005 12,3 1997 15,9 2006 13,1 1998 16,6

- El consumo anual de leche de cabra en el ao 1991 disminuy en 52,16% con respecto al consumo del ao 1990 (variacin porcentual) - Determine la variacin porcentual entre los aos 2001 y 2002. Final Variacin porcentual = - 1 100 Inicial

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 27

Prctica 1.2.
En cada uno de los siguientes ejercicios debe indicar cul es la variable de inters y clasificarla segn naturaleza, T_recorrido y nivel de medicin

1. El Ingeniero a cargo del control de calidad del agua de una ciudad, es responsable del nivel de cloracin del agua. Dicho nivel debe acercarse bastante al que exige el Departamento de Sanidad. Para vigilar el cloro, sin necesidad de verificar cada galn de agua que sale de la planta, el Ingeniero muestrea diariamente algunos galones, mide el contenido de cloro y saca una conclusin sobre el nivel promedio de cloracin que tiene el agua tratada ese da. La tabla anexa exhibe las concentraciones de cloro correspondiente a 30 galones seleccionados como muestra de un da. A partir de esta muestra diaria el Ingeniero obtiene sus conclusiones respecto a la poblacin total a la que se le aplic la cloracin. Diagrama de tallo-hojas Tabla de Concentraciones de Cloro en partes por milln (ppm)
16.2 15.7 16.1 16.9 15.7 16.6 15.9 15.6 16.4 15.8 16.0 16.0 15.4 16.2 15.6 16.8 16.4 15.9 16.3 16.0 15.8 16.0 15.2 15.9 15.6 15.8 16.8 15.9 16.3 16.3
Stem-and-Leaf Plot Frequency ,00 1,00 1,00 5,00 7,00 5,00 5,00 2,00 1,00 3,00 Stem width: Each leaf: Stem & 15 15 15 15 15 16 16 16 16 16 . . . . . . . . . . Leaf 2 4 66677 8889999 00001 22333 44 6 889

(Utilice una amplitud de 0.3 ppm).

1,0 1 case(s)

Construya una tabla de distribucin de frecuencias y un grfico adecuado. 2. En un proceso de fabricacin de circuitos integrados las causas ms comunes de fallas son: la contaminacin (1), xido(2), metalizacin (3), la corrosin(4), doping (5) ,los defectos del silicio (6) y varios (7). En un proceso de control de calidad de estos circuitos las causas de falla de 31 de ellos han resultado las siguientes: corrosin, xido, contaminacin, xido, xido, varios, xido, contaminacin, metalizacin, xido, contaminacin, contaminacin, xido, contaminacin, contaminacin, contaminacin, corrosin, silicio, varios, contaminacin, contaminacin, contaminacin, varios, contaminacin, contaminacin, doping, xido, xido, metalizacin, contaminacin y contaminacin. Se pide: Construir una distribucin de frecuencias y confeccione dos grficos adecuados. 3. En un centro de computacin, el nmero de veces que el computador se detiene, por error de mquina, diariamente, fue recolectado por un perodo de 70 das. Los datos obtenidos fueron los siguientes.

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 28

0 1 0 2 0
-

0 8 3 2 1

2 5 1 0 6

N de detenciones del computador por da. 0 0 0 3 3 0 0 1 0 0 4 3 0 6 2 0 1 0 1 0 1 1 0 2 0 0 1 2 1 2 0 0 4 3 3 1 2 4 0 2

0 2 2 5 0

0 3 1 2 0

0 0 0 1 4

Tabule y grafique los datos adecuadamente. Cul es la proporcin de das en que ocurren ms de 3detenciones?

4. Se seleccionaron de un proceso de fabricacin, aleatoriamente 270 ladrillos y se llev a cabo una prueba para determinar la resistencia transversal de stos. Se obtuvieron los siguientes datos: Resistencia (MN/m2) X 1.5 3.5 3.5 4.5 4.5 5.5 5.5 6.5 6.5 7.5 7.5 8.5 8.5 9.5 9.5 10.5 10.5 11.5 11.5 14.5 Construya un grfico adecuado
El histograma es especialmente adecuado para representar tablas de frecuencias en el caso de variables de de nivel por lo menos intervalar (o discretas con un gran nmero de valores observados distintos). Este grfico consiste en una serie de barras adyacentes cuyas superficies son proporcionales a la frecuencia del intervalo sobre el cual se levantan. Si los intervalos son de igual amplitud, los rectngulos sern de altura proporcional a la frecuencia correspondiente. Es decir, si la amplitud del i-simo intervalo es ai y su frecuencia ni la barra deber tener una altura hi que satisfaga:

ni 2 4 24 81 78 51 18 9 2 1

ai hi = kni n hi = k i ai
donde k es cualquier constante, aunque la misma para cada intervalo. ni frecuencia absoluta del intervalo i: hi frecuencia absoluta corregida
Se corrige la frecuencia solamente para graficar el histograma, cuando existen intervalos de distinta amplitud (no es usual)

Determine el porcentaje de ladrillos con resistencia inferior a 8,5 MN/m2 Determine el porcentaje de ladrillos con resistencia superior a 5 MN/m2

PROBABILIDAD Y ESTADSTICA

PROFESORA: CECILIA LARRAN R.

Pgina 29

5. Los accidentes de los empleados en una planta de papas fritas se clasifican de acuerdo con la zona daada. D = dedos
D O D P D

O = ojos
D B D D O D D O D B

B = brazos
O D D D D D D O D D

P = piernas

Los datos obtenidos son los siguientes:

Realice un anlisis estadstico descriptivo (anlisis de datos), con la informacin dada.


(unidad de observacin variable de inters tabla de frecuencias grfico medida de resumen-interpretacin)

6. En un estudio sobre el nivel de ruido en un concierto de rock se toma una muestra de 60 valores, medidos en decibelios y en distintos momentos del concierto. Los datos obtenidos se encuentran el el diagrama tallo-hojas siguiente
NIVEL DE RUIDO Frequency 1,00 3,00 22,00 21,00 11,00 2,00 Stem & 8 8 9 9 10 10 . . . . . . Leaf 3 789 0000111123333334444444 555566677777777889999 00001122234 57

Encuentre: Valor mnimo Valor mximo El % de mediciones inferior a 91 db. El % de mediciones superior a 100 db. 7. Con el propsito de mejorar el tiempo de entrega desde una embotelladora de refrescos a mquinas vendedoras de una universidad, se ha obtenido 25 datos.
9,45 17,08 44,88 24,45 24,45 37,00 54,12 33,66 31,75 41,95 56,63 37,10 Tiempo de entrega en minutos 35,00 25,02 16,86 14,38 11,66 21,65 17,89 69,45 22,13 21,15 10,02 14,88 39,73 44,29 55,12 56,63 9,60 10,30 16,97 29,41 24,35 34,93 17,73 24,45 37,50 46,59 21,84 9,45

Organice los datos en una tabla de frecuencias con igual amplitud y confecciones un grfico adecuado

You might also like