You are on page 1of 78

5

UNIDAD I.-MUESTREO Y DISTRIBUCIN DE MUESTREO OBJETIVO GENERAL Al finalizar la unidad el estudiante ser capas de: determinar la magnitud de una muestra, el tipo de muestreo que debe realizar, basndose en las caractersticas de la poblacin. 1.-Muestreo y Distribuciones de Muestreo Es la tcnica o herramienta para seleccionar una muestra de una poblacin definida de elementos a estudio, con el objeto de estimar parmetros poblacionales, por ejemplo: medidas ( promedios, varianza y desviacin), para inferir sobre la poblacin a partir de una muestra. 1.1. Poblaciones y muestras.

En estadstica es comn y usual emplear la palabra poblacin cuando se hace referencia a elementos que han sido determinados para su estudio, mientras que la aplicacin de la palabra muestra, cuando se describen una porcin seleccionada de la poblacin. Cualquier tipo de negociacin o empresa tanto privada como pblica (dependencia), lucrativas y no lucrativas tienen la necesidad de conocer el estado que guardan en cuanto a su funcionamiento las entidades. Es decir, las variaciones, su crecimiento, sus finanzas, los volmenes de produccin, los mercados, el empleo, consumidores hogares, etc., situacin que desde un punto de vista primario para los dueos, socios, directores, gerentes es difcil dado que los elementos que integran dichas entidades, aunque son en nmero finitos stos son muy numerosos. Pero esta situacin implica la bsqueda de la tcnica para conocer la situacin la cual se mencionar un poco ms adelante Con base en lo descrito por muchos autores, es importante indicar algunos ejemplos que ensean claramente los apuros a los que los dueos de empresas, directores, gerentes, encargados, los consumidores, etc., se enfrentan para poder inferir sobre la poblacin (cuando se habla de poblacin se refiere al nmero de elementos que la conforman) y sobre todo si su campo de accin se encuentra diseminado en muchas partes del pas o del mundo. Como se puede observar y entender es basta la informacin que existe por lo que es necesario aplicar la teora del muestreo. Qu significa esto? . Significa en primer lugar estar seguros o tener la certeza de encontrar o calcular un parmetro, a travs de un estadistico derivado del estudio de una muestra de la poblacin. En segundo trmino estar seguro o confiar en que el tamao de la

muestra refleje una representatividad de la poblacin. A estas dos consideraciones que son importantes en la investigacin obligadamente aterriza en la decisin de disear o determinar la poblacin a estudio de la cual se har la seleccin de la muestra adecuada. En las grandes empresas o negocios pblicos o privados es importante inferir sobre indicadores o permetros despus de anlisis o examinar una parte de una poblacin del producto o servicios que ofrecen,o en forma peraonal Por ello es preciso establecer ciertos criterios para la toma de decisin. Siguiendo tal criterior se expone el planteramiento siguiente: As, se ofrece una muestra gratis de un nuevo producto alimenticio en un supermercado; se prueba un pedazo de pastel para saber si ya est fro; y un cocinero prueba la sopa para saber si necesita un poco ms de sazn. En forma semejante cuando se hojea un nuevo libro o revista, se mide un traje, sale con una persona por primera vez o ve un programa de televisin durante unos cuantos minutos antes de decidir a cambiar de canal, en realidad est muestreando WilliM j. Stevenson, Estadistica para Administracin y Economa, conceptos y aplicaciones, 2010, Mxico D.F. Alfaomega, p185

Llegamos a la conclusin que cuando aplicamos la tcnica del muestreo estadistico es comparable con los ejemplos mensionados en prrafo anterior, pero suponemos que para esta tcnica se emplean mtodos formales y con un grado ms de precisin.

Es muy usual tambin refirindonos a los compradores consumidores- que cuando desean adquirir algn bien tangible o intangible y sobre todo cuando ste es de naturaleza del primero, normalmente, para tomar una decisin necesita saber si es bueno o es perfecto. Lo anterior lo sita en un momento crtico ya que existe un gran universo de tales bienes -que en estadstica debe entenderse como poblacin-, por lo que ante ese dilema momento crtico-, tiene que hacer uso de una muestra para conocer las caractersticas de esa poblacin. Algunos ejemplos tan sencillos que le darn al estudiante idea clara son quiz cuando nos referimos a casos especficos que aqu se mencionan: cuando alguien va de compras al mercado normalmente si desea comprar un producto lo prueba primero para tomar una decisin y comprarlo. Por lo que determinan adquirirlo a partir de un pedazo del producto completo. Lo mismo hace un qumico cuando toma una muestra de sangre para la prueba de laboratorio, el catador de wisky de una barrica, determina

que es de grado 90 e infiere que todo el wisky de esa barrica es de ese grado. Ahora si el comprador del producto se lo termina todo que comprara y le hara un mal de salud, por su parte si el qumico extrajera toda la sangre del la persona y animal simplemente estos se moriran, de igual manera si el personaje se bebiera todo el wisky le hara mal y ya no tendra que vender examinara todo el wisky o los compradores probaran todo el queso, no quedara nada para vender. Por lo tanto se puede considerar que para conocer las caractersticas de un todo (poblacin), se debe aplicar la tcnica del muestreo. De lo anterior se puede comprender que para fines de un estudio especfico es necesario determinar claramente la poblacin a estudio, y sobre todo, determinar la o las caractersticas que de ese universo -poblacin- que se desea conocer y hacer inferencia sobre la misma. Es importante destacar en estas lneas que resulta bastante improductivo intentar analizar a todos los elementos de una poblacin, porque por ejemplo si se piensa en conocer una caracterstica de stos en su totalidad elementos de la poblacin, se perdera tiempo y se tendran costos muy elevados. Si lo anterior sucediera no tendra razn aplicar las tcnicas ni los mtodos para estimacin de un parmetro a travs de una muestra. De lo anterior y antes de proseguir con la identificacin de otros conceptos relacionados con las poblaciones y muestras, se puede establecer que se debe entender entonces por poblacin como: un conjunto de elementos que integran un universo a estudio -se menciona elementos ya que se trata tanto de cosas como de atributos personales- (edad, estado civil, entre otros), de igual manera la muestra se determinar para este caso: como una porcin o un subconjunto de los elementos de una poblacin y atravs de su anlisis poder hacer inferencias sobre sta ltima. Se establecen en este apartado dos tipos de poblacin: poblacin finita cuando se conoce el lmite, por ejemplo 1500 canicas, 500 viviendas etc., poblacin infinita cuando no se conoce su lmite o el nmero de elementos, por ejemplo, la arena de la playa poblacin en la que es tericamente imposible observar todos los elementos. Parece meritorio considerar que como ejercicio se puede poner en prctica la imaginacin y creatividad para poder determinar muchos casos en los que se tienen que jugar como determinar una poblacin y derivar una muestra fraccin, -porcin, subconjunto- de la misma, se puede agregar ms conceptos al conocimiento porque recordemos que slo practicando ejemplos y su relacin con las teoras es posible el dominio y su aplicacin 1.2 Parmetros y estadsticos

Partiendo de las siguientes concepciones de lo que es un parmetro y un estadstico al describir que: Parmetros son todos aquellos valores que indican las caractersticas de una poblacin determinada, mientras que los estadsticos, se les conoce a aquellos datos numricos que representan caractersticas de una muestrea. Considerar en este sentido a todos aqullos valores que de naturaleza cuantitativa se pueden derivar del anlisis de una poblacin a travs de su muestra; son la media poblacional que se simboliza por la varianza que se simboliza por 2 y desviacin estndar que se simboliza por . -parmetros de la poblacin-. De igual manera los estadsticos o estadsticas que son la media muestral que se simboliza por -se lee equis barra-, la varianza muestral que se simboliza por 2 , la desviacin muestral que se simboliza por . Matemticamente, podemos describir muestras y poblaciones al emplear mediciones como la media, la mediana, la moda y la desviacin estndarCuando stos trminos describen las caractersticas de una muestra, se denominan estadsticas. Cuando describen las caractersticas de una poblacin, se llaman parmetros Richard I. Levin Estadstica para Administracin y Economa Richard I. Levin 2010, Mxico, Pearson, p. 236

El siguiente ejemplo puede quiz ilustrar de forma ms clara sobre la identificacin de lo que es un estadstico y un parmetro que son de suma importancia en la tarea de la investigacin de cualquier persona interesada en la misma; ya que del conocimiento de estos conceptos estadstico y parmetro-, se tiene la mejor alternativa de elegir una decisin. Tambin dar una idea de la forma de que en un momento determinado un estadstico puede considerarse convertirse- en un parmetro poblacional. Vase lo siguiente: Por ejemplo se tiene inters en conocer el peso promedio de los estudiantes que ingresaron en el ao 2007 en una universidad de prestigio en el rea del Sureste de los Estados Unidos de Norteamrica, cuya poblacin universo- es de 1500, de los cuales fueron muestreados seleccionados 250-. La caracterstica de la poblacin estudiantil es el peso. En este proceso se obtuvo como resultado que el peso promedio muestral fue de =70.5 kg. Si este estadstico es convincente, entonces se puede considerar que la poblacin universo-, tiene como parmetro que el peso medio promedio- es de =70.5 kg. Generalmente para distinguir cuando se trabaja con parmetros y estadsticos, suelen usarse smbolos griegos y letras latinas minsculas, respectivamente. Como se ilustra a continuacin.

Tabla Diferencias entre poblaciones y muestras

Definicin

Poblacin Coleccin de elementos considerados Parmetros Tamao de la poblacin =N Media de la poblacin = Desviacin estndar de la poblacin =

Muestra Parte o porcin de la poblacin para su estudio Estadsticas Tamao de la muestra =n Media muestral = Desviacin estndar de la muestra =

Caractersticas Smbolos

(Richard I- Levin 1998) 1.3 Muestreo El muestreo es una tcnica utilizada para conocer ciertas caractersticas de una poblacin y consiste en seleccionar en forma aleatoria ciertos elementos de una poblacin o universo, y su importancia se puede resumir en las ventajas que se tienen al seleccionar en forma aletaroria al azar- algunos elementos muestra- de una poblacin. Las grandes empresas importantes presentan problemas de diferente ndole que conllevan contratiempos en su desarrollo desde la perspectiva del sistema de economa de mercado, en donde tienen que actuar dentro de estndares de la calidad y la competitividad. Este hecho representa un dilema para ser certeras en la toma de decisiones y que lo resuelven slo a travs de estudios, en donde juega un papel importante el muestreo.

10

En congruencia con lo anterior, se puede transcribir ejemplo real, de lo que seguramente se rescatarn ms ideas para comprender el papel tan importante que tiene el muestreo en la actividad industrial y de servicios Hblese de una poblacin cuyos elementos son familias; que se tiene que estudiar con el fin de introducir un producto en la misma. En ese sentido lo que interesa a la empresa es conocer el ingreso promedio mensual de esas familias (poblacin), es decir, conocer ese parmetro. Como la poblacin an cuando se puede decir que es finita, es imposible en trminos de tiempo y econma su estudio, por lo que es necesario seleccionar en forma aleatoria una muestra de esa poblacin. Por ejemplo si se tiene una poblacin de 1200 familias seleccionar el tamao de la muestra que se identifica con ene minscula (n) y esta es n=150. El resultado del anlisis de esa fraccin muestral ( =$15,000.00 mensuales), que se conoce como estadstico y que se constituye como un parmetro de la poblacin. Otra idea es, si se desea conocer por ejemplo el parmetro o promedio de errores ortogrficos por pgina que hay en un escrito de 600 pginas, lo cual hace necesario minimizar el tiempo y costos seleccionando 85 pginas, y su anlisis (=X/n), sea =6 errores en promedio por cada pgina del escrito. Esta tarea es posible su atencin, aplicando las siguientes frmulas que se utilizan con frecuencia: =Xj (media de la poblacin) N =(xj-)2 (desviacin poblacional) N

De esta forma se calcula la media poblacional y la desviacin estndar. La media y la desviacin de una muestra estn dadas por: = xn ( media muestral) s= ( x- )2n-1

Cuando se tiene que determinar una poblacin para muestrear, segn sean las caractersticas de inters, es importante que el responsable investigador- tenga idea clara de esas caractersticas que intrnsecamente tiene la poblacin, es decir, tener cierta experiencia en la materia. Lo cual le permitir determinar el tamao de la muestra para su anlisis 1.3.1 Razones que justifican el muestreo

11

Ya se ha sealado que para estudiar una poblacin determinada, es importante considerar el tiempo y los costos entre otros aspectos, por lo que se pueden argumentar muchas razones para justificar esta tcnica, sin embargo, parece recomendable sealar algunas de ellas. 1. Se puede asegurar que an cuando la poblacin a estudio sea finita, es imposible establecer el contacto con todos los elementos de esta (poblacin) de esta razn se pueden considerar muchos ejemplos cotidianos: Vase el siguiente ejemplo: Un candidato propuesto por un partido X quizs desea conocer el grado de popularidad y aceptacin en cierta regin del lugar, ante la imposibilidad de aplicar encuesta a todos los habitantes que son muchos para conocer el resultado de su objetivo, se considera necesario seleccionar aleatoriamente cierto nmero de los elementos (habitantes). Esta justificacin tiene relacin con lo que expone Con el mismo personal y los mismos entrevistadores, y laborando siete das a la semana, se requeriran 200 aos para ponerse en contacto con todavla poblacin en edad de votar Douglas A. Lind, William G. en Estadstica aplicada a los Negocios y la Economa 2007, China McGraw-Hill. P. 261. 2.- Los costos que implican el estudio de todos los elementos de una poblacin, resultaran muy elevados, por lo que esta situacin es otra de las justificaciones de las empresas y oficinas, tanto pblicas como privadas que toman en consideracin para sus estudios. Por eso si una empresa por ejemplo, tiene el inters de introducir en el mercado un producto o un servicio, despus de determinar su poblacin, con el objeto de minimizar sus costos de la investigacin tiene que muestrear dicha poblacin. Ejemplo: Se desea introducir una lavadora de lujo en el mercado. El procedimiento o proceso es, primero definir el tipo de poblacin en este caso (familias) y supone que la poblacin a estudio es de 500 familias, como le es muy costoso visitar a cada una de ellas, realiza una seleccin aleatoria de estas como una muestra representativa a la cual aplicar la encuesta. Otros casos podran referirse de la siguiente manera: Considrese ejemplos como: Las poblaciones de bacterias son demasiado grandes que para el qumico del laboratorio resultara imposible realizar el anlisis de cada una de ellas, por ello se toma una muestra de esa poblacin. Cierta cantidad del agua del mar se constituye en una poblacin infinita ( sin lmite), por ello se toma una porcin de la misma para su anlisis, como muestra de la poblacin. 3.-Es posible encontrarse con muestras destructivas, en donde todos los elementos de la misma se destruyen en la prueba (si es de resistencia por ejemplo). Lo cual quiere decir que si se prueba a toda la poblacin desaparecera esta y ya no se tendra que atender o vender en su caso. Ejemplificando esta situacin, en el rea de produccin de una industria; las placas de acero, cables y productos similares deben contar con una resistencia mnima al grado de tensin. Para cerciorarse de

12

que el producto satisface la norma mnima aleatoriamente se elige una muestra del producto. Dichas piezas se someten a tensin hasta que de rompen. 4.-Porque se sabe que si se selecciona adecuadamente una muestra, esta resulta representativa de la poblacin que se estudia. Este hecho se da en los estudios que se tienen que realizar, por ejemplo, en los productos de la canasta bsica (alimentos), en relacin al precio, si es el caso de una gran cadena de tiendas de autoservicio, para conocer el ndice de precios de estos productos, no es necesario analizar el 100% de tiendas, sino que se tomar una muestra en forma aleatoria de las tiendas. 1.3.2. Muestreo de juicio y probabilstico

13

TIPOS DE MUESTREO
1.-MUESTREO DE JUICIO U OPININ 2.-PROBABILISTICO 3.-ALEATORIO SIMPLE 4.-SISTEMATICO 5.-ESTRATIFICADO 6.-POR CONGLOMERADOS.

1.-DE JUICIO U OPININ

*No interviene la probabilidad, pero es indispensable la opinin del experto Ejem plos: *el caso los legisladores. Para conocer la situacin de una ley, basta con abordar para lainvestigacina un diputado o senador. *el caso del guardabosque *el caso de Control escolar.

14

PROBABILISTICO

* Tienen esta caracterstica los dem s m todos de m uestreo que se estudiaran:

*infiere la existencia de la probabilidad que existe de que todos los elementos sean seleccionados en una m uestra.

MUESTREO ALEATORIO SIMPLE

*Muestra seleccionada en la que cada elemento o individuo de la poblacin tenga la m ism a probabilidad de ser incluido. EJEMPLO: *De una poblacin de 845 empleados de una empresa X se va a elegir una muestra de 50 empleados. La form a se asegurar que todos los empleados tienen la m ism a posibilidad de ser elegidos consiste en escribir el nmero de plaza de cada empleado en papelitos y depositarlos todos en una caja, se van extayendo hasta completar los 50 que integran la m uestra decidida..indicar otros

15

ALEATORIO SISTEMTICO

*Seleccionar un punto aleatorio de partida o inicio, eligiendo posteriormente el valor de k que ser el inicio, es decir para determ inar la muestra la seleccin se hara cada ksim o elemento de la poblacipon. El procedim iento es que de una poblacin determ inada se determ ina primero la m uestra a estudio. Se divide la poblacin entre la muestra para obtener el valor de k del valor de esta se seleccionar al azar un elemento de K.

EJEMPLO: De una empresa X , de una poblacin de 2000, se desea seleccionar una muestra de 100. El valor de K es 20, es decir, 2000/100 = 20. se elige al azar un elemento del valor de K. Si ste llegara a ser el 18, a cada 18vo. Nmero se eligirn los elem entos. Plantear otros ejem plos

ALEATORIO ESTRATIFICADO

*La poblacin definida se divide en grupos o estratos, seleccionando aleatoriamente una muestra de cada estrato. En este sentido se considera que las caractersticas de la poblacin son relativam ente homogneas. EJEMPLO: *Suponiendo que los pacientes de un mdico se integran en grupos de acuerdo con su edad, el galeno desea averiguar cuantas horas duermen sus pacientes, para ello tom a una m uestra aleatoria de cada estrato. ()

16

MUESTREO POR CONGLOMERADOS

*La poblacin se divide en unidades prim arias, es decir, en conglomerados y se puede seleccionar una muestra de unidades y poner su atencin en todos los elementos de cada unidad, o si es el caso podr seleccionarse ciertos elementos de cada unidad elegida. Se considera que para este caso las caractersticas deben ser hom ogneas. EJEMPLO: *Se desea conocer la opinin de los residentes de algn estado con referencia a las polticas federales y estatales de proteccin am biental. Si se tienen 12 unidades se pueden seleccionar digamos 4, para atender a todos los residentes de las unidades

La teora puede proporcionar de hecho es su funcin- diferentes alternativas, para considerar la forma y el nmero de elementos al seleccionar una muestra, que represente significativamente las caractersticas de una poblacin, es decir, poder estar en condiciones de inferir sobre sta para la toma de decisiones. El determinar una muestra seguramente va a estar en funcin de la necesidad de la informacin que se busque de dicha poblacin se quiere decir que no es el mismo mtodo de muestreo aplicado para todos los casos-. Adems de lo dicho, el que va estar al frente de la responsabilidad del estudio, debe tener idea clara sobre la poblacin determinada. Tomando en cuenta lo anterior, se procede a tratar de desarrollar en primer lugar lo que es el muestreo de juicio y probabilstico. Por definicin el muestreo de juicio, puede ser interpretado por varios autores por su naturaleza y necesidad de ser considerado para la atencin de un problema a resolver de una poblacin determinada; sin embargo, a travs de una forma de definirlo aqu se plantea el comentario en razn de lo que significa de manera personal, este muestreo: es un mtodo que se puede utilizar en donde no interviene la probabilidad de que todos y cada uno de los elementos de una poblacin pueden ser seleccionados; sino que cuenta slo la opinin del responsable del estudio. Por ejemplo, en un gran bosque, el investigador tiene que determinar la tala de los arboles que ya estn en la etapa de ser derribados para la produccin. En este caso el investigador tendr que or y atender la opinin del guardabosque, para saber cuales sern los elementos arboles- que renen las condiciones para ser seleccionados. Como es de observarse no se puede seleccionar en forma aleatoria una muestra de la poblacin.

17

Este mtodo se considera una de las formas sencillas en el proceso de seleccin, por ejemplo de un grupo de individuos que se dedican a una misma funcin (los legisladores) diputados de los que se necesita conocer su opinin en relacin a un proyecto o ley, se pueden muestrear a dos o tres, y la opinin de estos sobre el asunto que se investiga es vlida ya que se pueden considerar como conocedores o expertos del proyecto, sin embargo, la veracidad o calidad del resultado de la muestra, estar reforzada con el juicio de los diputados seleccionados, porque despus de ello se tendr que hacer inferencias acerca de la poblacin. Sin embargo, la calidad de los resultados muestrales dependen del juicio de la persona que que selecciona la muestra. De nuevo, se necesita tener gran cuidado al llegar a conclusiones basadas en muestras por juicio, para despus hacer inferencias acerca de poblaciones. (David R. Anderson, Dennis J. Sweeney y Thomas A. Williams, p. 276, 2004, Mxico, Thomson En cuanto al muestreo probabilstico, si partimos desde el punto de vista de lo que significa la probabilidad. Valor entre cero y uno, inclusive, que describe la probabilidad relativa (oportuna o casualidad) de que ocurra un evento (Douglas A Lind, William G. Marchal y Samuel A. Watheh 2007), En el muestreo probabilstico, entonces se entiende que los dems tipos de muestreos: aleatorio simple, sistemtico, estratificado y por conglomerados, que se vern ms adelante son nuestros en donde interviene la probabilidad. 1.3.3. Muestreo aleatorio simple, sistemtico, estratificado y por conglomerados. En el muestreo aleatorio simple se refiere a la forma de seleccionar ciertos elementos de manera que cada integrante que conforman la poblacin (finita) posee la misma probabiliad de formar parte de la muestra a seleccionar. Con frecuencia se dan casos en que en forma emprica se utilizan en eventos, para determinar resultados y la toma de decisiones de manera fcil y sencilla. Esta forma de seleccionar la muestra -muestreo aleatorio simple-, ser una tcnica muy prctica ya que es muy usual. Por ejemplo, en un caso prctico, si se desea seleccionar una muestra de 50 estudiantes de una poblacin de 500, para determinar el promedio en aprovechamiento de un determinado ciclo escolar, la tcnica sera seleccionarse la muestra escribiendo en tiras de papel las dos ltimas cifras de la matrcula -500-, como es consecutiva y meterlos en una urna e ir extrayendo sin reposicin hasta completar la muestra. Esta forma no es la nica pueden utilizarse otras ms. Considrese una poblacin con 700 elementos de la que se va a elegir una muestra aleatoria de 54 elementos de la poblacin, cabe sealar que en este momento, todos los miembros de la poblacin tienen la misma oportunidad o probabilidad de ser de ser seleccionados. Una forma en este caso es escribir primero el nombre que le corresponde a cada uno de los elementos en tiras de papel (nombre si son personas) y luego depositarlos en una caja. Procedimiento siguiente es ir extrayendo cada uno hasta completar la muestra, es decir, los 54 elementos que previamente fue considerado (vase tema en Douglas A. Lind y

18

otros en Estadistica Aplicada a los Negocios y la Economa, 2007, China McGrawHill pp262). Se puede entender entonces que, en este tipo de muestreo existe la probabilidad de que todos los elementos tengan la probabilidad de ser seleccionados.

Otro de los mtodos de muestreo para conocer caractersticas buscadas de una poblacin a estudio, es: muestreo aleatorio sistemtico. Para utilizar ste, es indispensable primeramente seleccionar al azar uno de los primeros elementos para poder tener un punto de inicio, es decir, se debe tener en cuenta el resultado de dividir el tamao de la poblacin entre el tamao de la muestra, como se puede ver se trata slo de una simple divisin para encontrar el primer elemento y posteriormente se irn seleccionando los dems elementos con el mismo intervalo. Los siguientes ejemplos, servirn para entender y dejar ms claro la aplicacin de este mtodo de muestreo, es: muestreo aleatorio sistemtico y se procede de la siguiente forma: para una muestra de tamao 40 de una poblacin de 600 elementos, se podra muestrear un elemento de cada 600/40 =15 en la poblacin, lo que se debe entender que una muestra sistemtica en este sentido implica elegir aleatoriamente uno de los primeros 15 elementos de la poblacin. El proceso se sigue empezando por el primer elemento obtenido al azar. La muestra de 40 se selecciona entonces en forma sistemtica. Es ms correcto y fcil que si se utilizara el muestreo aleatorio simple.

En la versin de Douglas A. Lind Estadstica Aplicada a los Negocios y la Economa, 2007, China MacGraw-Hill p 265, se debe entender que primero se debe calcular k que quiere decir k-simo elemento de la poblacin, es decir, es el resultado de dividir el total de elementos de la poblacin entre los elementos de la muestra. Cuando k no cae en nmero entero hay que redondearlo. Tratando de dejar claro el criterio de este tipo de muestreo (aleatorio sistemtico) en la prctica se insiste en que por ejemplo si se hace entre 1 y k suponiendo que de 20 sea 12 por ejemplo para ir seleccionando los otros elementos para la muestra se tiene entonces que 12 es el primero, luego le sigue 24, 36. 48 etc.

Es importante insistir y recordar que para muestrear una poblacin, primeramente hay que definirla, ya que esa tarea da una idea de lo que se persigue sobre las caractersticas de sta poblacin-, de esa manera se tomar una adecuada decisin para elegir el mtodo de muestreo. Se insiste tambin en que en el mtodo que se explica en este apartado, existe la probabilidad de que todos los elementos de la poblacin a estudio pueden ser seleccionados en la muestra.

19

Cuando las caractersticas de la poblacin son relativamente homogneas, es ad hoc para la aplicacin del muestreo estratificado: Una poblacin se divide en subgrupos, denominados estratos y se selecciona una muestra de cada uno Estadistica para Administracin y Economa, Dogulas A. Lind, 2004, Mxico, Alfaomega. P. 269.

El estudio a realizarse, requiere la bsqueda de la viabilidad de introducir un producto en el mercado, Una lavadora sofisticada por ejemplo de las que adems de lavar y secar la ropa trae la funcin de planchado, si se estima que el precio ser de aproximadamente puede ser real- de 30 mil pesos, por lo que en la poblacin que se muestrear debe considerrsele un salario promedio mensual quiz de $20 mil pesos por ejemplo (caracterstica) de los elementos de la misma poblacin- . En este sentido el estudio no se podr aplicar muestrear- a una poblacin cuyas caractersticas en cuanto al salario promedio, es bastante bajo, ya que resultara inoficioso el trabajo. La forma que se debe proceder para el uso del muestreo estratificado, y dado que las caractersticas son relativamente homogneas, es formando grupos o estratos homogneos de la poblacin y de cada grupo se muestrearn ciertos elementos para su anlisis. De hecho existen dos formas de tomar muestras estratificadas. Vase Richar I. Levin, Eatadistica para la Administracin y la Economa, Mxico, Pearson. P.241 Despus de dividir la poblacin que se tiene que estudiar en estratos deben ser grupos homogneos- , para garantizar que cada grupo se encuentra representado en la misma muestra. Por ejemplo a los estudiantes de la Facultad de Ciencias de la Administracin C.IV, se les puede agrupar en estudiantes, por edad, sexo, talla o estatura posteriormente en cada grupo o estrato se aplica el muestreo aleatorio simple para formar la muestra. Ver el ejemplo que se indica que garantiza el aprendizaje de este mtodo de muestreo que se estudia: Suponga que se desea saber el nmero de horas que los estudiantes dedican a la preparacin o estudio del material para la clase del programa que estudian. Este ejemplo se puede considerar de la siguiente manera: SEMESTRES 1ER.SEM 2- SEM 3er. SEM 4. SEM GRUPOS A B A c TOTAL ESTUDIANTES 61 72 80 65 278 % .22 .26 .29 .23 1.00 SELECCIONADOS 13.42 18.72 23.2 14.95 70.29 aproximado de 70

Aqu la muestra fue estudiantes.

previamente decidida del tamao

20

Hipotticamente se puede derivar con la ayuda de la aplicacin de la formulita para obtener el promedio: lo que significa que se tendr que preguntar a los estudiantes de la muestra cuntas horas le dedica cada uno al estudio y preparacin de materias del programa: el ejemplo se puede resolver de la siguiente forma: = X/n, o sea = (3horas+1,5horas+2horas+n.3ho ras)/70, como ejemplo podra considerarse que en promedio los estudiantes del 1. Al 4. Semestre dedican al estudio de las materia 3.5 horas Recuerde, este es slo un nmero hipottico. Pues hay que desarrollar la frmula para contar con el dato correcto.

TABLA 8.1 Nmero seleccionado para una muestra aleatoria estratificada porcentual. Estrato Probabilidad (recuperacin capital) 30% y ms De 20% a 30% De 10% a 20% De 0 a 10% Dficit Nmero de empresas 8 35 189 115 5 de Frecuencia relativa 0.02 0.10 0.54 0.33 0.01 Nmero muestreado 1* 5* 27 16 1

1 2 3 4 5

*0.02 de 50 = 1, 0.01 de 50 =5, etctera (Douglas A. Lind, Williams G. Marchal y Samuel A. Wathen, p. p. 265, 2007) La tabla anterior cuya estructura demuestra que no cabe la posibilidad de aplicar el tipo de muestreo aleatorio simple, porque como se puede observar los estratos 3 y 4, consideran una probabilidad muy alta de poder ser seleccionados dichos elementos, pues casi constituyen en conjunto cerca del 0.90 por ciento, en comparacin con las empresas agrupadas en los dems estratos tienen pocas probabilidades de ser elegidos. Como se sigue observando, las empresas de los grupos (estratos) 1 y 5, podran no seleccionarse ninguna simple y sencillamente porque la eleccin es al azar. Aplicando el muestreo estratificado sin embargo, se

21

puede tener la seguridad que por lo menos una de las empresas de los ltimos grupos mencionados formen parte de la muestra. Al pie de la mencionada tabla se aprecia que la frecuencia de 0.02 de las 50 empresas es igual a 1, esto es, 1(0.02x50). El anlisis se basa desde la perspectiva de Douglas A. Lind, Estadistica Aplicada a los Negocios y la Economa, 2007, China McGraw-Hill p 265

De lo anterior resulta claro y entendido que este mtodo de muestreo ofrece y garantiza mayores ventajas y fidelidad que el muestreo aleatorio simple por ejemplo. Lo recomendable entonces para su aplicacin muestreo aleatorio estratificado-, es tener idea de la caracterstica que se desea conocer de la poblacin, para lograr los resultados deseados en el estudio a realizar. Muestreo aleatorio simple estratificado Mtodo para seleccionar una muestra en que primero se divide a la poblacin en estratos y a continuacin se toma una muestra aleatoria simple de cada estrato (David R. Anderson, Dennis J. Sweeney y Thomas A. Williams, p. 267, 2004). El siguiente mtodo de muestreo, diversos autores lo denominan por ejemplo; muestreo acumulado, muestreo de racimo y muestreo por conglomerados, sin embargo, el objetivo es hacia un mismo resultado, es decir, que consideran las categoras: homogeneidad y heterogeneidad de las caractersticas de la poblacin para su aplicacin segn el caso. La aplicacin del mtodo de muestreo por conglomerados definida ya la poblacin a estudio, sta de clasifica o se divide en pequeas unidades primarias y para seleccionar una muestra se elige una muestra aleatoria simple de los conglomerados, es decir, se analizarn todos los elementos de los grupos seleccionados, esto se debe a que la caracterstica que se desea estudiar de la poblacin es heterognea Se entiende que todos los elementos que integran un conglomerado muestreado se considera la muestra. Por ejemplo, Si una investigacin de mercado tiene la intencin de determinar por muestreo el nmero promedio de televisores por casa en una ciudad grande, podran usar un mapa de la ciudad para dividir el territorio en manzanas y luego escoger un cierto nmero de stas (racimos) para entrevistar a sus habitantes. Cada casa perteneciente a cada una de estas manzanas sera considerada para entrevistar a sus habitantes. Un procedimiento de muestreo de racimo bien diseado puede producir una muestra ms precisa a un costo considerablemente menor que el de un muestre o aleatorio simple (Richard I. Levin, p. 321, 1998) Es importante aclarar que tanto en el muestreo estratificado como el muestreo por conglomerados se dividen la poblacin en grupos pero se aplican: el primero estratificado, cuando existe en cada grupo una pequea variacin entre los elementos que lo integran, pero se observa una gran variacin entre los grupos.El

22

segundo mtodo por conglomerados-, cuando la variacin es significativo dentro de cada grupo, sin embargo los grupos presentan similitud entre s. 1.4 Sesgo y error de muestreo

23

SE SGO Y E RROR E N E L MUE STRE O

AL MUE STRE AR E N F ORMA ALE ATORIA *Se bu sca a l m u est r ea r u n a pobla cin qu e la m u est r a sea r epr esen t a t iva de est a en cu a n t o a su s ca r a ct er ist ica s.
Cu a n do la m u est r a en t on ces n o es r epr esen t a t iva , se dice qu e h a y u n sesgo en la in for m a cin y com o con secu en cia h a y u n sesgo en los r esu lt a dos. Refier e sin em ba r go, la m edida cu a n t it a t iva , por qu e a l fin a l de cu en t a s es u n r esu lt a do (est a dist ico o pa r m et r o sesga do)

(MTRO. CE LSO RE CINOS (Agost . 2012)

E J E MP LO: *De lo qu e ya se h a a lu dido. E l ca so de la t a lla o est a t u ra de los est u dia n tes de u n a u n iver sida d, a l tom a r u na m u est r a n o se especifica si esa ca r a ct er ist ica o pa r m et ro se r efiere a l gner o h om br e o m u jer , su a n lisis t iene que r efleja r el pr om edio de esta t u r a m u est r a l diga m os X= 1.79 m t s. Ma tem tica a m en t e es cor r ect o, sin em ba r go, la in for m a cin fu e sesga da . *Ot r o ca so se pu ede r efer ir a lo sigu ien t e: Su pon ga qu e desea sa ber la opinin de est u dia n t es de la F a cu lt a d, en r ela cin a l mt odo a ct u a l de eva lu a cin . Bu en o pues el m t odo es situ a r se a la s 9 de la m a a n a en la pu er t a de la F a cult a d y pr egu n t a r le su opinin en r ela cin a l m t odo a 100 est u dia n tes. E st e a ct o n os pr opor cion a el pr om edio o por cen t a je de los que esta n de a cu er do con dich o mt odo. E l a su n t o es qu e segu r a men te se t om den t r o de los 100 elem en t os per son a s que est u dia n en el pr im er sem est r e o que son per son a s que n a da t ien en qu e ver con la F a cu lt a d a ca dm ica m en te h a bla n do. (Agost o 2012 Mt r o. Celso Recin os Reyes)

24

P ORQUE NO SE DE F INE LA P OBLACIN A E STUDIAR

SE SGO P OR LA NO RE SP UE STA Si los est u dia n t es que n o respon den son los m s in con for m es con la s for m a s de eva lua cin , la m uest r a con t iene u n a por cin m enor de r esu lt a dos, y de n u evo, pu ede n o ser r epr esen t a tiva de la pobla cin qu e se t r a t a de in vest iga r .

Agost o 2012. Mt r o Celso Recin os Reyes

E RROR E N E L MUE STRE O

*Difer en cia qu e se obser va en t r e el est a dist ico de u n a m u est r a ( m edia m u est r a l) y(el pa r m et r o de la pobla cin ),(desvia cin est a n da r m u est r a l s) (desvia cin est a n da r pobla cion a l ) y (proporcin media muestral de la proporcin y (P media de la proporcin poblacional
Agosto 2012 Mtro. Celso Recinos Reyes

Originalmente, al muestrear en forma aleatoria al azar- una poblacin, por este hecho se puede registrar un sesgo en la informacin, ya que es importante recordar que lo que se busca, en realidad, es que los elementos seleccionados de un

25

universo poblacin-, sean representativos en cuanto a las caractersticas de sta. Cuando la muestra entonces no es representativa, se dice que sta tiene sesgo. Un ejemplo claro y sencillo creo que deja mucha posibilidad de identificar la forma de seleccionar una muestra insesgada, porque puede ser que por el desconocimiento de la importancia que tiene este concepto sesgo-, se pueden cometer errores en el muestreo de una poblacin. Posiblemente uno de los mtodos aplicados que pueden representar un sesgo es el siguiente: Supngase que se tiene el inters de conocer la opinin de los estudiantes de la Facultad de Ciencias de la Administracin C. IV, respecto al mtodo de las evaluaciones, para ello, a las 7 de la maana se designa a una persona para preguntar a los primeros 50 estudiantes que ingresan al edificio sobre el mtodo de evaluacin, es decir, la opinin debe ser s estn de acuerdo o no estn de acuerdo con el mismo. Por supuesto que se tienen respuestas de los entrevistados, sin embargo, se puede decir que no se determin la entrevista a estudiantes de qu semestres, en realidad lo que se hizo fue elegir la muestra de 50 estudiantes, por lo que en este caso se considera que hay una informacin sesgada, porque dentro de los elementos elegidos posiblemente se tomaron en cuenta a alumnos de primer semestre que en ese momento no tienen noticias del mtodo de evaluacin existente en la institucin educativa, por otra parte no se toman en cuenta a los estudiantes que no tengan clases en la primera hora.

Por eso cuando existen cierto nmero de elementos de la poblacin que tienen posibilidades ms altas frente a otros de ser seleccionados y por ese hecho estar representados en una muestra, se refleja un problema sesgo de seleccin-. Del caso anterior, tambin es de considerar que existe sesgo por la no respuesta, porque puede darse el caso que los estudiantes con mayor inconformidad con las evaluaciones no responden, lo cual indica entonces que la muestra no es representativa de la poblacin. (Vase Daniel Pea-Juan Romo p. 268 1997) De lo anterior, se puede concluir que: de acuerdo a los dos tipos de sesgos, que la poblacin observada no est bien definida determinada-, porque no es ad hoc con la poblacin que se desea estudiar. Por definicin se plantea que el error de muestreo no es otra cosa ms que la diferencia que se observa entre el estadstico de una muestra ( ) media muestral y el parmetro de la poblacin ( ) media poblacional. Desviacin muestral ( s ) y desviacin poblacional ( ). Y para la proporcin ( ) media muestral de la proporcin y ( )media de la proporcin poblacional. Error de muestreo El valor absoluto de la diferencia entre un estimador puntual insesgado y el parmetro poblacional correspondiente. Para una media muestral, la desviacin estndar y la proporcin muestral, los errores de

26

muestreo son |-|,|s-| y |-P|.(David R. Anderson, Dennis J. Sweeney y Thomas A. Williams, p. 277, 2004). Si se acepta que las muestras sirven para inferir sobre las caractersticas de una poblacin, entonces lo que se hace normalmente es utilizar el valor numrico de una muestra estadstico- para concluir que la media poblacional est representada por la media muestral Sin embargo, es de sealarse que como una muestra es un subconjunto de elementos de la poblacin, no necesariamente los estadsticos muestrales media y desviacin-, sean igual que los parmetros poblacional la media y desviacin. Entonces se dice que a esa diferencia se le llama error de muestreo. 1.5 Determinacin del tamao de la muestra.

ELECCIN DEL TAMAO ADECJADO DE LA MJUESTRA

AL DISEAR UN ESTUDIO ESTADISTICO DEBE PENSARSE SOBRE EL NMERO DE ELEMENTOS DEBE HABER EN UNA MUESTRA YA QUE: *SI LA MUESTRA ES DEMASIDO GRANDE SE GASTA BASTANTE DINERO EN RECABAR LA INFORMACIN (DATOS). *SI LA MUESTRA ES DEMASIADO PEQUEA LAS CONCLUSIONES RESULTAN INCIERTAS

EJEMPLO DE LA DETERMINACIN DEL TAMAO DE LA MUESTRA PARA LA MEDIA POBLACIONAL: 1.-Se calcula que una poblacin tiene una desviacin estndar de 10. Desea estimar la media de la poblacin a ms menos 2 unidades de error mximo admisible, con un nivel de confianza de 95%. De qu tamao debe ser la muestra? 2.-Un procesador de zanahorias, corta la hojas, lava las zanahorias y las incerta en un paquete. En una caja se guardan 20 paquetes para enviarse. Para controlar el peso de las cajas, se revisaron unas cuantas. El peso medio fue de 20.4 libras y la desviacin estndar de 0.5 libras. Cuntas cajas debe tener la muestra para conseguir una confianza de 95% de que la media de la muestra no difiere de la media de la poblacin por ms de 0.2libras? .

27

CRITERIOS CONSIDERADOS PARA DETERMINAR EL TAMAO DE LA MUESTRA.

1.-NIVEL DE CONFIANZA

*Precisin deseada, o sea que tan cerca del valor verdadero que est la estimacin *Los niveles de confianza ms comunes son 95% y 99%...El valor de confianza de 95% corresponde al valor Z de 1.96 y el nivel de confianza de 99% a un valor de Z de 2.58. *Si ms alto es el nivel de confianza elegido, mayor ser el tamao de la muestra correspondiente

EL MARGEN DE ERROR ADMISIBLE O QUE TOLERA EL INVVESTIGADOR

*Magnitud que se suma y resta de la media muestral para determinar los puntos extremos del intervalo de confianza *Tambien es la mitad de la amplitud del correspondiente intervalo de confianza. *Un error tolerable ms pequeo requerir una muestra mayor. *Por el contrario a un error admisible grande corresponde una muestra menor

28

LA VARIABILIDAD DE LA POBLACIN QUE SE ESTUDIA


*Qu grado de variabilidad est presente en la poblacin que se va a muestrear? *Si la poblacin se encuentra muy dispersa se requiere una muestra grande. *Si la poblacin se encuentra concentrada (homognea) el tamao de la muestra que se requiere ser menor. *Sin embargo, es necesario utilizar un estimador para la desviacin estandar de la poblacin. a)Utilizarun estudio comparativo . Si se considera confiable una desviacin estandar de un estudio anterior, se puede utilizar en el estudio actual. b)Un enfoque basado en el intervalo. Se necesita conocer o contar con un calculo de los valores mximo y mnimo de la poblacin. La regla empirica, dice que se podra esperar que casi todas las observaciones se encuentran a mas o menos 3 desviaciones estandares de la media si la distribucin sigue normal. Entonces la desviacin estandar de 6 c)Utiliza un estudio piloto..

EJERCICIOS DE TAMAO DE MUESTRA PARA LA MEDIA POBLACIONAL

1.-Qu tamao de muestra ser necesario para producir un intervalo de confianza del 90% en el caso de la media de la poblacin verdadera, con un error de 1.0 en cualquier sentido si la desviacin estndar de la poblacin es de 10.0? 2.-Una empresa de plsticos desea estimar la media de resistencia al impacto de una bobina. Cuntas bobinas debera probar si desea alejarse menos de 20 psi del valor verdadero con 99% de confianza?. La experiencia previa indica que una estimacin aceptable de 2 es de 4,900. 3.-Un asesor de la cadena de Moteles Kemble desea estimar la cantidad promedio de millas recorridas por dia por familias vacacionistas. Obtiene los nombres y direcciones de familias vacacionistas que se hospedaron en moteles de la cadema Kemble en ao pasado. Qu tan grande debe ser la muestra que seleccione el asesor a fin de estimar el millaje diariio sin alejarse ms de 25 millas con 95% de confianza?. Se cree que una estimacin razonable de 2 es de 18 000.

29

EJERCICIOS PARA EL TAMAO DE MUESTRA PARA LA PROPORCIN DE LA POBLACIN,

1.-El estimador de la proporcin pblacional debe estar a ms menos 0.05. Con un nivel de confianza de 95%. El mejor estimador de la proporcin poblacional es de 0.15. De qu tamao debe ser la muestra que se requiere 2.-Una empresa de investigacin de mercado Lincoln and Lind desea estimar la proporcin de hogares de cierta rea que cuenta con televisores a color: Querra estimar p sin alejarse ms de 0.05 con 95% de confianza. No dispone de ninguna estimacin de p. De cuantos hogares de ser la muestra? 3.-Una universidad urbana ofrecer clases sabatinas si la demanda estudiantil es suficientemente alta. Qu tamao debe tener la muestra de estudiantes para estimar con 95% de confianza, y sin alejarse ms de 0,05, la proporcin de estudiantes que se inscribiran a las clases sabatinas si se les ofreciera la oportunidad de hacerlo?. Parte del supuesto de que no se dispone de ningn estimador dep

En principio se debe considerar la existencia de poblaciones que por sus caractersticas no tienen una distribucin normal. Una distribucin normal se considera de uso ms importante en la distribucin de probabilidades. Se distingue por ser una distribucin de variable continua con campo de variacin + - Fue descubierto por Gauss al estudiar la distribucin de errores en las observaciones astronmicas www.uv.es/ceases/pdf/no 01/08/2012 Razones fundamentales de su importancia, y que se debern tomar necesarias para los estudios estadsticos de todas las variables de los negocios o empresas y entidades pblicas (mercadotecnia) 1. Los fenmenos reales son susceptibles de modelizar con la distribucin normal. Desde luego, es un enfoque cuantitativo que tienen la mayor cantidad de poblaciones. 2. Considerables casos de las distribuciones de uso frecuente, tienden a una caracterstica de distribucin normal bajo ciertas condiciones. 3.Existe relacin con el Teorema Central del Lmite. Visualmente los datos a trabajar dan la idea del tipo o la forma de distribucin a aplicar. Cuando estos (datos ) no sean normales se pueden utilizar otros mtodos estadsticos como los llamados mtodos no paramtricos Para tales casos, es importante sealar que es vlida la siguiente condieracin:

30

Papeal del tamao de la muestra

Obtener una buena aproximacin de los intervalos de confianza

Cuando la poblacin no tiene una distribucin normal

En el siguiente anlisis que se relaciona con la determinacin del tamao de la muestra para la media de la poblacin utilizando muestras grandes ( n 30 ) y en los casos en donde se conoce el valor de la desviacin estndar ( ), se aconseja cmo estimar o elegir un tamao adecuado para obtener un margen de error deseado. Para ello, es importante describir la estructura de la ecuacin para el clculo: Literalmente se seala La cantidad Z/2(/n) es el margen de error. De manera que, como se ve, Z/2, la desviacin estndar poblacional , y el tamao de la muestra n se combinan para determinar al margen de error. Una vez que se selecciona el coeficiente de confianza 1 , Z/2 puede ser determinado. Por tanto, si se tiene el valor de , es probable encontrar el tamao de la muestra n necesaria para proporcionar cualquier margen de error deseado. A continuacin se presenta el desarrollo de la frmula utilizada para calcular el tamao de n de muestra deseado. Sea E = el margen de error deseado: E = Z/2 /n Al despeja n = Z/2 / E Al elevar al cuadrado ambos lados de esta ecuacin, se obtiene la expresin siguiente para el tamao de la muestra Estadistica para negocios y economa David R. Anderson, Dennis J Sweeney y Thomas A. Williams,2012, Mxico, CENGAGE Learning. P.326. Ecuacin para el tamao de la muestra para la media de la poblacin: n = (Z /2)2 / E2 Parece muy importante al realizar un estudio mediante el muestreo de una poblacin, hacerse la pregunta qu tan grande o pequea debe ser la muestra?, porque puede ser que la misma no proporcione informacin suficiente, o contenga

31

demasiada informacin. Porque adems hay que recordar que si es demasiado grande se derrochan recursos tiempo y dinero- para obtener resultados, asimismo si la muestra tiene pocos elementos, los resultados carecen de valor prctico. En la determinacin de la muestra para la media de una poblacin es importante tener en cuenta: el nivel de confianza, el error tolerable y la variabilidad de la poblacin. 1.5.1 Grado de confianza, error mximo permisible y variacin de la poblacin. La primera pregunta significa el nivel de confianza, ste lo determina el responsable del estudio y generalmente, se debe auxiliar de la tabla de valores de la distribucin normal z. De hecho comnmente se utilizan en los estudios realizados cuatro niveles a saber: 90%, 95%, 98% y 99%. Sin embargo, no es limitativo se puede utilizar otro valor desde 0 a 100. En este factor, se tiene que identificar el valor de z en la tabla respectiva de valores, su manejo resulta bastante fcil. Cuando se plantea un nivel alto, tendr que seleccionarse una muestra grande. La segunda pregunta, es el error que pueden tolerar quienes conducen el estudio, y relaciona la mitad de la amplitud del correspondiente intervalo de confianza. La cantidad z/2(/n) es el margen de error. As, vemos que z/2 la desviacin estndar poblacional y el tamao de la muestra n se combinan para determinar el margen de error. Una vez que seleccionamos un coeficiente de confianza 1 , se puede determinar z/2. Entonces si tenemos un valor para , podemos determinar el tamao de n que se necesita para dar cualquier margen de error. A continuacin se presenta el desarrollo de la frmula utilizada para calcular el tamao de muestra requerido ( David R. Anderson, Dennis J.Sweenwy y Thomas A. Williams, p. 303, 2004). Estimacin del tamao de la muestra para la media de una poblacin. Para ello, es necesario desarrollar los siguientes ejercicios: Ejercicio: Supone una empresa X que desea estimar el promedio de gasto que realizan sus diversos departamentos en publicidad en el ejercicio 2009. Existen indicios de que la desviacin es de 20. Estima el tamao de la muestra que se debe tomar a fin de que esta (estimacin) se aleje en menos de 10 de la media verdadera con 95% de confianza. Desarrollando la frmula correspondiente, se tiene: n = (1.96x20/10)2 = 15.37 Por lo tanto se deben tomar aproximadamente 15 elementos. Ejercicio: Una Compaa que se dedica a la produccin de alimentos para ganado bovino, tiene la necesidad de conocer si el presente ciclo, podr tener ms rendimientos que el ciclo anterior; por ello se decide aplicar una encuesta, en una poblacin con una desviacin estandar de 1300. de qu tamao deber ser la

32

muestra seleccionada para estimar la media poblacional dentro de 500 puntos, considerando un nivel d confianza de 95%? Desarrollando la frmula (**), se tiene. n = (1.96x1300/500)2 = 25.93. Por lo tanto la muestra debe tener aproximadamente 26. Ejercicio: De una poblacin X se tiene una desviacin estndar de 60, estima de qu tamao debe tomarse la muestra para estimar la media poblacional dentro de 50 para un nivel de confianza de 95%. Sustituyendo la ecuacin se tiene lo siguiente: n = (1.96x60/50)2 =5.53 la muestra debe ser del tamao 5 aproximadamente. Ejercicio: Una poblacin determinada de la cual se sabe que hay una desviacin estndar de 2500 elementos. Estima el tamao de la muestra para la media de dicha poblacin que no este a 429 puntos, considerando un nivel de confianza de 99%. Sustituyendo la ecuacin se tiene lo siguiente: n = (2.57x2500/429)2 = 233.9. La muestra debe ser aproximadamente del tamao 234 elementos. Cabe sealar que el valor 1.96 que corresponde a z en este caso se localiza en la tabla de valores de distribucin z, bajo el siguiente procedimien to: Tomando en cuenta que se le est dando al problema un nivel de confianza de 95% y como se esta trabajando con distribucin normal en donde la figura completa distribucin normal tiene un valor del 100%. Esta figura tiene dos partes idnticas, por ello el nivel de confianza se divide en 2 para obtener el valor, enseguida se busca en la tabla el valor de z. Asi se tiene que .95/2= 0.4750, Se agrega el 0, debido a que la tabla presente valores de cuatro dgitos. El valor de z, lo ubica en la interseccin de la lnea y la columna correspondiente. En este caso el dato 0.4750 se localiz en el rengln o lnea 1.9 y la columna 6 lo que es igual a z=1.96. Los otros datos de la frmula, ya se tienen en el problema. Cuando el nivel de confianza sea de 90, 98 y 99% respectivamente, o cualquier otro nivel diferente para encontrar el valor de Z (distribucin normal), se sigue el mismo criterio que se especifica o se explica en el prrafo anterior De esta forma se pueden desarrollar tantos ejemplos en cuanto a la seleccin del tamao de la muestra. En el desarrollo de la seccin en clase se plantearn otros problemas como prctica de aprendizaje de este tema. Observar la siguiente figura:
Escala z. Distribucin 100%

33

Ahora se hablar sobre la determinacin proporcin o porcin de la poblacin.

del tamao de la muestra para una

Dentro de este anlisis de estimacin se considerar cual ser el tamao de los elementos elegidos como muestra para lograr una estimacin de la proporcin poblacional con una precisin determinada. Esta funcin que refleja el proceso para la muestra en la estimacin por intervalo de p es parecida al aplicado en el caso de la estimacin de la media poblacional. El margen de error asociado con la estimacin por intervalo de la proporcin poblacional es: Z/2 ( 1 - )/n. Este margen se basa en el valor de Z/2, en la proporcin muestral y en el tamao de la muestra n. Muestras mayores proporcionan mrgenes de error menores y mejor precisin

ALGUNOSV ALORES POSIBLES DE P*(1-P*)

P*

P*(1-P*9)

0.10 0.30 0.40 0.50 0.60 0.70 0.90

(0.10)(0.90) = 0.09 (0.30)(0.70) = 0.21 (0.40)(0.60) = 0.24 (0.50)(0.50) = 0.25***Max. V alor ( 0.60)(0-40) = 0.24 (0-70)(0.30) = 0.21 (0.90)(0.10) = 0.09

Anderson, Sweeney,WilliamsEstadistica para negocios y economa, 2012,Mxico, CENGAGE Learning.

El tamao de la muestra para la proporcin de la poblacin. Si se cuenta con un estimador disponible p a partir de un estudio piloto u otra fuente, se puede utilizar. Por otra parte, se utiliza 0.50 porque el trmino p(1-q) jams puede ser mayor cuando p =0.50. por ejemplo, si p=0.30, entonces p(1-p)=0.3(1-0.3)=0.2; pero

34

cuando p = 0-50, p(1- p) =0.5(1 0.5) = 0.25 (Douglas A. Lind, William G. Marchal y Samuel A. Wathen,p. 317, 2007) En este punto vale la pena insistir en que cuando se desea estimar la muestra para la proporcin de la poblacin y no se cuenta con un dato para el valor de p (p prima), lo recomendable es asignarle el 0.5, lo que quiere decir que, para el valor de q en este caso sera de igual forma 0.5 Se cree recomendable la transcripcin de un caso prctico que el autor citado en prrafo anterior plantea, con el objeto de ver la relacin de la teora sobre este tema con fenmenos reales: Ejercicio: Si estamos en la posicin de que nuestro margen de error se encuentre a 0.10 de la verdadera proporcin de la poblacin y el nivel de confianza se ubica en 90% y no tenemos disponible un buen estimador para la proporcin de la poblacin. Determina cul es el tamao requerido de la muestra? Solucin El estimador de la proporcin de la poblacin se encuentra a 0.10, por lo que E = 0.10. El nivel de confianza deseado es de 90%, que corresponde a un valor de z = de 1.64. Como no se encuentra disponible ningn estimador de la poblacin, se utiliza 0.50. El nmero surgido de observaciones es n = p( 1 p) z/E

( )2 ( /. )2 =68.0625

n = (.5)(1-.5) 1.65 10

El estudiante necesita una muestra aleatoria de 69 ciudades Ejercicio: Es inters de estimar la proporcin de tiendas requiere de un empleado capacitado. Determina de qu tamao debe ser la muestra y que no este a 0.05 del valor verdadero, cuyo nivel de confianza debe ser de 95%. La proporcin verdadera no puede ser superior a .30 Desarrollando la frmula: n =p(1- p)(z/E)2 se tiene: n = .3(1-.7)(1.96/0.05)2 = 322. La muestra es de alrededor 322 elementos. Como se puede observar, siempre se le asignar a p un valor entre 0 y 1, para efecto de calcular el tamao de n para la proporcin de la poblacin, de lo que se concluye que, cuando p = 0.50, q = 0.50; cuando p = 0.60, q = 0.40, y as sucesivamente. 1-6 Usos y abusos de la estadstica

35

Para tratar de explicar este tema, se parte de la idea que estadstica, es una tcnica que se aplica y tiene que ver con el estudio de los mtodos cientficos, de las ciencias sociales, como de aqullas econmico-administrativas, porque recoge, organiza, resume y analiza los datos, para derivar resultados e inferir sobre una poblacin y tomar decisiones. Sin embargo, tambin hay que creer que su utilizacin estadstica- en forma inadecuada, es capaz de reflejar conclusiones equvocas, pues como de igual manera es fcil cometer errores por ser humano puede ser una gran justificacin-, esto es, a travs de mentiras al dar informacin estadstica a personas, empresas, etc. Normalmente suceden hechos como por ejemplo, aqul que se traduce como un eslogan que a cada mexicano le corresponde en promedio pollo para su alimentacin. Desde el punto de vista estricto esa posibilidad es falsa. Quiz se ha llegado a pensar que cuando se habla de estadstica existe una relacin con la mentira, aseveracin que se basa en el pensamiento de Benjamn Disraeli (poltico y estadista ingls). Algunos piensan que las cifras no mienten, pero quien las imagina y las presente, se consideran los mentirosos. Con estas frases se puede entender el uso y abuso de la estadstica. Desde la perspectiva de la tica, es correcto mencionar lo siguiente: Dejando de lado los problemas ticos que surgieron en aos recientes con los informes financieros de compaas como Enron, las prcticas profesionales con la investigacin estadstica y la elaboracin de informes reciben mucho apoyo de la American Statistical Association (ASA). En 1999, este organismo proporcion lineamientos y sugerencias por escrito (visite http://www.amstat.org) acerca del profesionalismo y las responsabilidades que se aplican a los investigadores y asesores que emplean o realizan anlisis estadsticos (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, 17, 2005) Dentro del aprendizaje de la teora de la estadstica por los estudiantes, se cree importante, que adems de ello, se tiene que conocer y utilizar los lineamientos, independientemente cul es su formacin profesional (licenciado en Administracin, en Contadura, etc.) 1.6.1 Concepto de poblacin, muestra, parmetro y estimador. En el inicio de esta unidad, se defini lo que es la poblacin para la estadstica, las muestra, el parmetro y estimador. Como dinmica, se sugerir al estudiante, distinguir, una serie de poblaciones. 1.6.2 Escalas de medicin. Las escalas o niveles de medicin fueron tratadas en el curso de Estadistica Descriptiva, por lo que en el presente curso, Estadistica Inferencial, slo se har un breve recordatorio de las mismas (escalas de medicin).

36

De acuerdo con Douglas A. Lind y otros, Se habla en trminos de niveles de medicin que son clasificados como: nivel nominal, el ordinal, el de intervalo y el de razn En el caso del nivel escala- de medicin nominal, interesa un sistema de conteo, donde la variable se refiere a nombres o nmeros, es decir, que fsicamente se clasifican y cuentan. Ejemplo: Suponga que existen canicas de 4 colores, puede considerarse como un ejemplo de medicin nominal, porque en este sentido slo el inters consiste en clasificarlas por color y no el orden (as pues se refiere slo al nombre del color), porque no se est esperando que primero sean clasificadas las de color rojo, color azul por ejemplo. Si el ejercicio se refiere al gnero, es decir hombre y mujer, el conteo se hace cuantos son del sexo masculino y cuantos del sexo femenino. Si estas personas entran a un teatro se registra slo cuantos son hombres y cuantas mujeres, es decir, no se tiene inters en saber si se presentan en primer lugar, hombres o mujeres.

Vale la pena en este aprendizaje retomar el ejemplo de la siguiente tabla del suministro mundial del petrleo para 2004, en donde no se presenta un orden natural de las categoras, cuya variable de inters es el pas de origen. Fuente OPEP OCDE (incluye E. U) Rusia China Otra Nmero de barriles diario 32.91 22.76 11.33 3.62 12-35 _____ 82.35 Porcentaje 39.7 27.4 13.7 4.4 14.9 _____ 100.1

(Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 10, 2007) Observando lo anterior se puede decir que, en resumen los datos del nivel nominal de medicin consideran ciertas caractersticas: las categoras son etiquetas o nombres, y an cuando stos, representan nmeros, las categoras de los datos no presentan orden. En el nivel escala- ordinaria de medicin, se toma en cuenta que un nivel es ms alto o mejor que el siguiente, esto es, cada categora se registra en un orden lgico. Las categoras que representa son en escala, es decir, deben ordenarse por ejemplo: superior, bueno promedio, malo, inferior. Es decir, la clasificacin se refiere a los niveles: Superior, Bueno, Medio, Malo, Inferior.

37

Ejemplo: Cuando se va a evaluar la calidad del servicio de una empresa Pblica o Privada, la muestra del pblico que se seleccione para aplicar una encuesta tienen que evaluarlo, de acuerdo a su criterio el nivel que considere, es decir, superior, Bueno, etc.(Vase la siguiente tabla que se refiere a una muestra de 71 personas).

Calificacin Superior Bueno Promedio Malo Inferior

Frecuencia 6 28 25 12

En el caso del nivel de medicin de intervalo, existe de hecho un intervalo para agrupar los datos, es decir, la diferencia entre valores es una constante, en los ejemplos que se deben tratar, hay que considerar un nmero constante o diferencia. Las caractersticas del nivel de medicin de intervalo, en primer lugar, que la clasificacin de los datos son de acuerdo con la magnitud de la caracterstica en cuestin y en segundo trmino es que, responde a diferencias iguales en las caractersticas, significa que por ello las diferencias son iguales en las mediciones. Un intervalo puede considerarse como un espacio entre dos lmites, estos deben ser medidas constantes, adems este nivel de medicin indica las diferencias entre dos lados (puntos) y se dice que es constante en forma continua. En este ejercicio se toma en cuenta operaciones como la suma y la resta. Hay una gran variedad que se pueden mencionar como: fecha, la temperatura, las evaluaciones, etc. Diferencias iguales entre dos temperaturas son las mismas, sin importar su posicin en la escala. Es decir, la diferencia entre 10 y 15 grados Fahrenheit es de 5; la diferencia entre 50 y 55 grados tambin es de 5 (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, p. 12, 2007) Dentro de la teora se considera como un cuarto nivel de medicin, el nivel de razn. Y este incluye aquellas mediciones referentes a la produccin medidas en unidades, peso, cambio en los precios de las acciones, la distancia entre sucursales y la altura (Vase a Douglas A. Lind, Willian G. Marchal y Samuel A. Wathen p. 13, 2007) UNIDAD II ESTIMACIN DE PARMETROS E INTERVALOS DE CONFIANZA OBJETIVO. Calcular la estimacin por intervalo, de un parmetro de inters; dependiendo de las caractersticas de la muestra con un grado de confianza estipulado. 2.1 Definicin de estimador y estimacin.

38

A travs de la seleccin de una muestra en forma tal que sea representativa de la poblacin se puede estimar el parmetro. Por ello, es posible establecer que sta estimacin-, es un valor especfico tomado de un estimador. Y por ende, el estimador refleja tambin una medida especfica proporcionada por un estadstico caracterstica de la muestra-. Se debe considerar que un buen estimador, necesariamente tiene que pasar por varios criterios para su aceptacin, porque de ello depende la certeza aproximada de su evaluacin de la estimacin y la toma de decisiones. Bajo ese punto de vista, se tratar de explicar en este material las propiedades de stos estimadores-, para una mejor comprensin del estudiante en el proceso de aprendizajeenseanza. Para este anlisis fue consultada la bibliografa adecuado desde un particular punto de vista. 2.2 Propiedades de los estimadores: insesgamiento, eficiencia y consistencia. Cuando se dice que un estimador de un parmetro es insesgado, es porque el valor medio del estadstico calculado al realizar todas las muestras que sean necesarias de un tamao dado extrado de esa poblacin, tiene que coincidir ser igual- que el parmetro correspondiente: ejemplo, = , o = Si se trata de tomar datos de una muestra para un insesgamiento de la varianza de poblacin, se divide el total de la varianza de las desviaciones al cuadrado de los valores de la media entre n-1: observar y desarrollar las siguientes frmulas: S2 =(xj-)2
n-1

2 =(xj-)2 N

Obligatoriamente, se realizarn ejercicios para garantizar el aprendizaje de este tema. Se dice que la eficiencia es un concepto que se fundamenta en su variabilidad, por ello se puede decir que un buen estimador es el ms eficiente que otros, esto es porque observamos al compararlos que la varianza del primero es significativamente menor a la varianza del segundo y as sucesivamente. Cmo se puede calcular la eficiencia relativa? En trminos relativos, se puede obtener dividiendo la varianza del primero entre la varianza del segundo que matemticamente esta dado por: Varianza1/Varianza, o sea 1/2 Suponga que se compara una media muestral con la media con la mediana por ejemplo de la muestra desde el punto de vista de su eficiencia al estimar la media de una poblacin. Al hacer la estimacin correspondiente se sabe que la varianza de es menor a la varianza de la mediana de la muestra. Lo que hace comprender que para una muestra del mismo tamao tomada de una poblacin, la varianza de la media debe ser menor que la mediana.

39

De la caracterstica que se refiere a la consistencia, se dice que slo puede ser posible, cuando se aumenta el tamao de la muestra, porque el estimador se aproxima ms al parmetro poblacional. As, es de considerar que un estimador es insesgado cuando el valor de su varianza se aproxima a 0, obviamente porque la muestra tendr que ser cada vez ms grande, el error o sesgo puede ser casi cero. Obsrvese la siguiente expresin: s2 estimador consistente de 2. 2.3 Tipos de estimacin: puntual y por intervalo. Hasta el momento la teora solo reconoce dos tipos de estimacin. Cuando se trata de estimar una media o un valor especfico a partir de un solo dato como referente, se esta usando el concepto de estimacin puntualSupngase que se tiene informacin en relacin al tamao del PIB (producto interno bruto) del ao de 2012, sea ste en miles de millones de pesos sumatoria de todas las actividades de la economa durante un ao-, se puede hacer una estimacin del crecimiento para 2013. Con ello, se est haciendo una estimacin puntual. Una estimacin puntual que sirva como referencia para ahorrar tiempo en el trabajo relacionado con la actividad, es la que se hace por ejemplo a travs de la siguiente afirmacin. Si se sabe que la la sumatoria () de x es igual a 3875 y teniendo en cuenta que la muestra (n) es del tamao 40, se tiene que la media muestral ( ), es de 96.87. Al usar este valor -=96.87, como un estimador, se concluye que la estimacin puntual de la media de la poblacin, es redondeando el valor, 97 elementos. = x n x =3875 n=40; =3875 =96.87 40

As se tiene que: Si se entiende que una estimacin o estimador puntual se refiere a una medida derivada de una muestra para conocer el valor de un parmetro de una poblacin dada a estudio. Si se selecciona aleatoriamente una muestra de 60 por ejemplo y se estudia o se atiende a cada uno de esos elementos. El asunto es con ello, estimar la media de dicha muestra que servir como parmetro puntual (la media) de esa poblacin. Tambin se estima el intervalo de confianza. Su explicacin parte del enfoque de que se cuenta con ms informacin. Este fija un intervalo de valores intervalo de

40

confianza- que es posible para la estimacin del parmetro de la poblacin, - la media-. Del cual antes de proseguir, se transcribe su definicin a continuacin. Intervalo de confianza Conjunto de valores formado a partir de una muestra de datos de forma que exista la posibilidad de que el parmetro poblacional ocurra dentro de dicho conjunto con una probabilidad especfica. La probabilidad especfica recibe el nombre de nivel de confianza (Douglas A. Lind, William G. Marchal y Samuel A. Wathen. Pg. 295, 2007). Uno de los conceptos que interviene en el desarrollo de la estimacin de un intervalo de confianza es, considerar el error estndar de la media que se simboliza: =
n

= error estndar de la media para una poblacin finita. /n = desviacin estndar de la poblacin. Para muestras grandes se utilizar la Tabla de distribucional normal z y para muestras pequeas, n 30, se usar la Tabla de distribucin t student.

En forma simblica, para estimar el intervalo de confianza se tiene:


valor de z o t por - valor de z o t por (*)

Ejercicio: Ver el siguiente ejemplo: Un distribuidor de bombillas est interesado en conocer el promedio de vida que tiene la poblacin del producto que distribuye (focos). La empresa tiene una estimacin de la desviacin estndar de la vida til, la cual es de 4 meses. Selecciona aleatoriamente una muestra de 80 consumidores minoristas y de su anlisis resulta un promedio muestral de 19 meses. Solucin: Como se trata de una muestra grande, se usar la tabla de distribucin normal z, para encontrar su valor su valor. Utilizar el nivel de confianza de 95% (*) sustituyendo se tiene lo siguiente: 1. Se calcula el error estndar = /n, = 4 meses 4 = 0.05 80 80 2. Se divide el Nivel de confianza, 95% entre dos .95/2= 0.475 se agrega un 0 porque la tabla de valores de z, considera cuatro dgitos, por lo tanto es 0.47503 cuando el valor buscado en la tabla, no es el exacto, se toma el ms prximo pero menor y no el que supera al que se est localizando. 3. El nmero anterior se localiza en la tabla respectiva, el cual se ubica en el rengln 1.9 y la columna 6, por lo tanto el valor de z, es de 1.96. 4. Ahora se tiene: 19 Z 1.96 (.) (0.05)

1.96x0.05 = 0.098 por tanto

41

19 19

0.098 0.98

= 19.1 meses lmite superior y, = 18.9 meses lmite inferior.

Se puede concluir que, con base en la informacin que se tuvo disponible y su anlisis se estim que la vida promedio de la poblacin total de limpiadores de parabrisas se encuentra en el intervalo de 19.1 y 18.9 meses respectivamente. Con el fin de garantizar que el estudiante aprenda a identificar y aplicar los diferentes conceptos que se utilizan en este tema, se tendrn que desarrollar en sesiones de clase, diversos ejemplos. Ejercicio: Una fbrica de aparatos domsticos, desea comprar para fabricar sus productos (licuadoras) los accesorios necesarios, por lo que sabe que hay una desviacin estndar en los precios de $5. Muestrea aleatoriamente 30 de los accesorios y encuentra que el precio promedio () de uno de los accesorios es de $120.00. Se pide estimar el error estndar y un intervalo de confianza del 90%. Desarrollando la frmula matemtica se tiene: z () Ejercicio: Dada una muestra aleatoria del tamao 50, se deriva una media, con una desviacin poblacional de 18 puntos. Calcula el error estndar y el intervalo de confianza de 99% Desarrollar la frmula matemtica se tiene: z () Ejercicio: De una muestra de 100 elementos seleccionada aleatoriamente de X poblacin, se tiene una media de 42. La desviacin estndar de la poblacin es de 18 puntos, con un nivel de confianza de 95%, se pide: a) Calcula el error estandar b) Construye un intervalo de confianza para la media poblacional

Para el clculo de la estimacin del intervalo de confianza al igual que los estimadores puntuales comienzan a travs del estudio del clculo de la media poblacional. Y de acuerdo a la bibliografa consultada, se parte de la identificacin de los siguientes casos para las estimaciones: 1. Se dispone con la informacin del valor de la desviacin estndar de la poblacin ( ), y 2.No se cuenta con la desviacin estndar poblacional. Pero se recomienda la sustitucin de la desviacin estndar de la muestra ( s ), por la desviacin estndar de la poblacin. Bajo esa premisa, se puede aclarar que los ejercicios desarrollados con anterioridad, se refieren a casos donde su utiliza la Tabla de Distribucin normal

42

(z). Ahora se proceder a trabajar en la estimacin de intervalos de confianza utilizando la distribucin compacta (dist. t). Su utilizacin o manejo se puede resumir de la siguiente forma: considerando que es una muestra 30, en este tipo de distribucin, se utiliza grados de libertad que se obtiene restando 1 al tamao de la muestre (n-1), es decir, si n=20, se tendra 20-1 de tal manera que sentendrn 19 grados de libertad. La frmula matemtica se construye: t () Ejercicio: De una muestra de 30 elementos, seleccionados aleatoriamente de una poblacin, se tuvo una media muestral de 42 y una desviacin estndar muestral de 18 puntos: A) Calcular el error estndar b) Estimar el intervalo de confianza de 99% para la media (desarrollando la frmula). Ejercicio: Se selecciona de una poblacin, una muestra del tamao 28, se tuvo una media de 25 elementos, y una desviacin estndar de 12 puntos. Se pide: a)Estimar el error estndar de l media b)Calcula el intervalo de confianza de 99% para la media. En la descripcin que sigue, es el estudio de elementos, que adems del tamao de la muestra y el nivel de confianza, para la estimacin de un intervalo para la proporcin de la poblacin, se incluyen p que son xitos y q los fracasos. ESTIMACION DE INTERVALOS DE CONFIANZA PARA LA PROPORCIN. Para crear un intervalo de confianza para una proporcin, es necesario cumplir con los siguientes supuestos: a) Los datos de la muestra son resultados de conteo. b) Slo hay dos posibles resultados (lo normal es referirse a uno de los resultados como xito y al otro como fracaso). c) La probabilidad de un xito permanece igual de una prueba a la siguiente. d) Las pruebas son independientes. Esto significa que el resultado de la prueba no influye en el resultado de otra. (Daouglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 310, 2007) Como se seal en la parte correspondiente a la determinacin del tamao de la muestra para la proporcin en este material, que se le asigna un valor a p, de .50 por ejemplo y q de .50 Esta escala es la ms comn, sin embargo, se puede utilizar otras, de tal suerte que tanto el valor de p y de q, deben sumar 1. La frmula de la proporcin muestral es p = x n

43

Qu es la proporcin de una poblacin?. Se considera no slo una fraccin de la poblacin, tambin es una razn o porcentaje, que interviene para el anlisis de inters. La frmula para la estimacin del intervalo de confianza para la proporcin de una poblacin est dada por:

pz p( 1-p )
n

Para la estimacin del intervalo de la proporcin de una muestra, primero se calcula, el porcentaje de la poblacin, que se muestrear. La aplicacin del criterio de opinin: De acuerdo en desacuerdo, falso verdadero, si no. En las sesiones, se desarrollaran por parte de los estudiantes una serie de ejercicios para la estimacin de los intervalos correspondientes. Ejercicio: Una compaa que fabrica computadoras de marca desea conocer la proporcin de las computadoras de un lote de 24,000 unidades que contienen ciertos defectos de funcionamiento, de una muestra de 1,800 determin que 700 presentaron problemas defectuosos. Se pide: Calcular el porcentaje de la muestra y estimar el intervalo del 95% de la proporcin. Desarrollando la frmula pz p(1-p) n

2.4 Probabilidad de que el verdadero parmetro de la poblacin est contenido dentro de la estimacin por intervalo. En este apartado, se tratar, de hacer un anlisis en forma especfica de la probabilidad que existe una vez realizada una distribucin, de que el intervalo contenga la media de la poblacin. La afirmacin que a continuacin se transcribe, desde el punto de vista muy particular tiene lgica y congruencia ya que como es aceptado, de que entre ms grande sea la muestra seleccionada hay ms certeza probabilidad-, de que el intervalo estimado contenga el parmetro de la poblacin. Basado en el teorema del lmite central y sobre todo cuando se trata de muestras grandes razonablemente, se puede decir como ejemplo que, cuando se aplica un 95% del nivel de confianza de las medias de las muestras seleccionadas de una poblacin se ubicarn a 1.96 desviaciones estndares de la media poblacional. Si es el caso de 99%, se encontrarn a 2.57 desviaciones estndares de la media poblacional. Estas dos aseveraciones se les llaman intervalo de confianza de 95% e intervalo de confianza de 99%.

44

Pero como se debe comprender el proceso de valorar la probabilidad de que el intervalo estimado contenga el parmetro de la poblacin, cobra importancia el diseo de intervalos de confianza. Antes de proseguir con el anlisis de este tema, es preciso determinar qu es el teorema del lmite central. Desde una concepcin personal, ste se puede entender como el proceso a travs de seleccionar muestras de slo un tamao en particular de la poblacin que sea, en consecuencia, la distribucin de la media muestral tender a aproximarse a una distribucin normal. Esto puede ser posible cuando la muestra es de tamao ms grande Cuando se abord el tema de estimacin se hizo referencia a la estimacin puntual y estimacin por intervalo. En el anlisis se dej claro la diferencia y cmo se utiliza cada una de ellas. Al tomar este tema teorema del lmite central-, que trata adems de la discusin de la probabilidad, que existe de que en el intervalo estimado, este contenido el parmetro poblacional. Ahora bien, si se recuerda que un intervalo contiene una serie de medidas o valores especficos razonables para la media poblacional que para su estimacin, se asocia el nivel de confianza que decida el investigador, amen de conocer los dems datos para ello. Para el caso de la probabilidad de que el parmetro se encuentre dentro del intervalo, analizar la siguiente transcripcin: Suponga que selecciona varias muestras de 256 gerentes, tal vez varios cientos, para cada muestra calcula la media y despus construye un intervalo de confianza de 95%, como en la seccin anterior. Puede esperar que alrededor de 95% de estos intervalos de confianza contenga la media de la poblacin. Cerca de 5% de los intervalos no contendran el ingreso anual medio poblacional, . No obstante, un intervalo de confianza particular contiene el parmetro de poblacin o no lo contiene. El siguiente diagrama muestra los resultados de seleccionar muestras de la poblacin de gerentes en la industria del menudeo, se calcula la media de cada una y, posteriormente,se determina un intervalo de confianza de 95% para la media poblacional. Obsrvese que no todos los intervalos incluyen la media poblacional. Los dos puntos extremos de la quinta muestra son inferiores a la media poblacional. Esto se debe al error de muestreo, que constituye el riesgo que se asume cuando se selecciona el nivel de confianza (Douglas A. Lind. William G. Marchal y Samuel A. Wathen, pg. *299, 2007)

45

Diagrama.
De las seis muestras solo la ltima contiene La media poblacional

2.5 Clculo de las estimaciones por intervalo de la media en las muestras grandes Un intervalo de confianza para la media poblacional con una desviacin estndar conocida, supone tericamente, la seleccin de muestras grandes. De ah que se tendr para efectos del aprendizaje del estudiante, trabajar con muestras mayores a 30 elementos. Cuando se abord el tema de estimacin de intervalos, se plante en forma simblica la representacin de los lmites de confianza superior e inferior-, que aqu se repiten: valor de z t (). Lo ms preciso en este apartado es el desarrollo de una serie de ejercicios, en sesiones de clase. Ya que previo a ello se ha trabajado sobre la conceptualizacin de los temas y el beneficio en su utilizacin. Del texto bibliogrfico Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 301-302, 2007) , se cree prudente y de mucho inters tomar algunos modelos de problemas, para la aplicacin de la tcnica y criterios en relacin al tema de la estimacin de intervalos para la media poblacional con muestras grandes. 1. Se toma una muestra de 49 observaciones de una poblacin normal con una desviacin estndar de 10. La media de la muestra es 55. Determine el intervalo de confianza de 99% para la media poblacional 2. Se toma una muestra de 81 observaciones de una poblacin normal con una desviacin estndar de 5. La media de la muestra es de 40.Determine el intervalo de confianza de 95% para la media poblacional 8. La doctora Patton es profesora de ingls. Hace poco co nt el nmero de palabras con faltas de ortografa en un grupo de ensayos de sus estudiantes. Observ que la distribucin de palabras con faltas de ortografa por ensayo se rega por la distribucin normal con una desviacin estndar de 2.44 palabras por ensayo. En su clase de 40 alumnos de las 10 de la maana, el nmero medio de palabras con faltas de ortografa fue de 6.05. Construye un intervalo de confianza de 95%, para el nmero medio de palabras con faltas de ortografa en la poblacin de ensayos.

46

De (Richard I. Levin, pg. 383, 1998), se transcriben: 7-30 De una poblacin de 540 individuos, se toma una muestra de 60. A partir de esta muestra, se encuentra que la media es de 6.2 y la desviacin estndar de 1.368. a). Encuentre el error estndar estimado de la media. b) Construya un intervalo de confianza de 96% para la media. 7-31 En una prueba de seguridad automovilstica efectuada por el Centro de Investigacin en Seguridad Carretera de Carolina del Norte, la presin promedio en las llantas de los automviles de una muestra de 62 neumticos fue de 24 libras por pulgada cuadrada y la desviacin estndar fue de 2.1 libras por plgada cuadrada. a). Cul es la desviacin estndar de esta poblacin? (Hay aproximadamente un milln de automviles registrados en Carolina del Norte.) b) Calcule el error estndar estimado de la media. c) Construya un intervalo de confianza del 95% para la media de la poblacin. En todos los ejercicios para la estimacin de intervalos se har uso de la distribucin normal z.

Se construyen con la imaginacin y creatividad de los estudiantes, otros ejercicios que se deben presentar en sesiones de clases, con el propsito de generar la habilidad de distinguir los elementos que se utilizan en problemas de la estimacin de intervalos de confianza que incluyan a estos parmetros-. 2.6 Clculo de las estimaciones por intervalo de la proporcin de muestras grandes. En la descripcin que se hizo en relacin a la estimacin por intervalo, se estableci la frmula punto 2.3 del contenido de este material para la estimacin de la proporcin de una poblacin. Aqu se plantean algunos ejemplos sobre este tema y que son tomados de la bibliografa (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 312, 2007) consultada con el propsito de insistir en el estudiante una mayor claridad con la prctica aplicando los conceptos que son necesarios incluir en el anlisis: 15. El propietario de West End Kwick Fill Gas Satation desea determinar la proporcin de clientes que utilizan tarjeta de crdito o dbito para pagar la gasolina en el rea de las bombas. Entrevist a 100 clientes y descubre que 80 pagaron en el rea de las bombas. a). Calcule el valor de la proporcin de la poblacin. b). Construya u intervalo de confianza de 95% para la proporcin poblacional. c) Interprete sus conclusiones

47

17. La red Fox TV considera reemplazar uno de sus programas de inversin de crmenes, que se transmite las horas de mayor audiencia, con una nueva comedia orientada a la familia. Antes de tomar una decisin definitiva, los ejecutivos estudian n una muestra de 400 telespectadores. Despus de ver la comedia ,250 afirmaron que la veran y sugirieron reemplazar el programa de investigacin de crmenes. a). Calcule el valor de la proporcin de la poblacin. b). Construya un intervalo de confianza de 99% para la proporcin poblacional. c). Interprete los resultados que obtuvo. De (Richard I. Levin, pg. 386, 1998) se transcriben los siguientes ejercicios: 7-35 Pascal Inc., una tienda de computacin que compra, al mayoreo, chips sin probar para computadora, est considerando cambiar a su proveedor por otro que se los suministre probados y con garanta a un precio ms alto. Con el fin de determinar si ste es un plan costeable, Pascal debe determinar la porcin de chips defectuosos que le suministra el actual proveedor. Se prob una muestra de 200 chips y de stos 5% tena defectos. a). Estime el error estndar de la porcin de chips defectuosos. b) Construya un intervalo de confianza de 98% para la porcin de chips defectuosos adquiridos 7-36 Una muestra de 70 ejecutivos de pequea empresa fue investigada con respecto al pobre desempeo que sta tuvo en noviembre, 65% de los ejecutivos crea que la disminucin en las ventas se debi al alza inesperada de la temperatura, lo cual trajo como consecuencia que los consumidores retardaran la adquisicin de productos de invierno. a). Estime el error estndar de la porcin de ejecutivos que culpan de las ventas bajas al clima clido. b) Encuentre los lmites superior e inferior de confianza para esta porcin, dado un nivel de confianza igual a 0.95. Como se seala al final del punto 2.5 de este material, se insistir en la imaginacin y creatividad de los estudiantes, una vez que hayan tenido la habilidad de distinguir y aplicar los diferentes conceptos, para la estimacin de intervalos, para la proporcin de la poblacin, a travs del planteamiento de ejercicios prcticos. 2.7 Estimacin de intervalo mediante la distribucin t. Es importante saber que en ocasiones, la distribucin normal no es ad hoc para el estudio y construccin de intervalos de confianza. Por eso, en este apartado se trabajara con valores de t. Se debe recordar que en los puntos anteriores de este material, se trabaj con muestras grandes, ahora se har preferentemente con muestras n30. Sin embargo, habr casos especiales en que siendo la muestra n30, se aplicar la distribucin normal z.

48

Los primeros trabajos tericos sobre la distribucin t fueron hechos por W. S.Gossett, durante los primeros aos del siglo xx. Gossett era empleado de la Guinness Brewery en Dublin Irlanda; la empresa no permita que los empleados, con su propio nombre, publicaran sus hallazgos de investigacin. De modo que Gossett adopt el seudnimo de Student para publicas (Richard I. Levin, pg. 388, 1998) Es conveniente antes de entrar a el anlisis de su aplicacin en la estimacin de intervalos de confianza, conocer algunos aspectos importantes sobre dicha distribucin: Como ya se ha sealado con anterioridad, su uso para las estimaciones se requiere tomar muestras pequeas, y la desviacin estndar de la poblacin es desconocida, por otra parte, se supone que la poblacin de la cual se toma la muestra, es casi normal. Para calcular el valor de t que servir para la estimacin del intervalo, se requiere de la determinacin del grado de libertad, Qu son los grados de libertad? Podemos definirlos como el nmero de valores que podemos escoger libremente. (Ricard I. Levin, pg. 388, 1998) para encontrar el valor de t.Practicamente el enfoque de esta distribucin es buscar o medir la probabilidad de que el parmetro que se est estimando no est dentro del intervalo. En el caso de uso de la distribucin normal -z- hay mayor amplitud para determinar su valor, es decir, va desde 0,00 hasta 0.09, sin embargo para distribucin t,como se presenta ms compacta slo contiene cuatro columnas y en algunos casos cinco columnas, -normalmente son 10, 5, 2 y 1% respectivamente. De tal manera que para la aplicacin a casos, se debe contar con tamao de la muestra n, grados de libertad gl que se determina n-1, por ejemplo si la muestra es n=25, se tiene que 25-1 = 24-, nivel de significancia probabilidad de que el parmetro no se encuentre dentro del intervalo estimado-, la media muestral y la desviacin estndar de la muestra. Si estamos haciendo una estimacin a un nivel de confianza de 90%, buscamos en la tabla t en la columna encabezada con el valor 0.10. Esta probabilidad de 0.10 de tener error se representa con el smbolo , letra griega alfa. Encontraramos los valores tapropiados, para intervalos de confianza de 95%, 98% y 99% en las columnas alfa encabezadas por los valores 0.05,0.02 y 0.01 respectivamente. (Richard I. Levin, pg. 390, 1998). La caracterstica de la distribucin t posee una mayor dispersin que la distribucin z, por eso se va a observar que en la tabla, aparecern valores con mayor magnitud, por ejemplo, para z ,se encontrarn valores para los niveles de confianza, 90%, 0.4500, su valor es de 1.64, 95%, 0.4750, su valor es 1.96, mientras que con los mismos niveles para t cuando n= 25, su valor es 1.711, cuando n=18, su valor es 2.110 y cuando n=10, su valor es 2.262 respectivamente

49

Grfica t. n = 14 df = 13 grados de libertad


0.05 del rea bajo la Curva 0.05 del rea bajo la curva 0.90 del Bajo la curva Distribucin t

-1.771

+1.771

Como ya se conoce la tcnica para determinar tanto la media poblacional como la media muestral, seleccin del tamao de n, la desviacin estndar, decisin del nivel de confianza, se prosigue con algunos ejemplos, con el propsito de familiarizarse con la identificacin y aplicacin de los conceptos para la estimacin de intervalos de confianza. Si se tienen muestras de los siguientes tamaos y niveles de confianza, encontrar los valores apropiados para t y poder construir intervalos de confianza: n = 20, 90%_______, n = 13, 90%_______, n = 30, 98%_______, n = 18, 99%----. Independientemente de poder realizar muchos ejercicios, se insiste en la imaginacin y creatividad de lo estudiantes para el aprendizaje en el manejo de esta distribucin, se harn actividades con los siguientes ejemplos que se transcriben de la bibliografa consultada: Un fabricante de llantas desea investigar la durabilidad de sus productos. Una muestra de 10 llantas para recorrer 50 000 millas revel una media muestral de 0.32 pulgadas de cuerda restante con una desviacin estndar de 0.09 pulgadas. Construya un intervalo de confianza de 95% para la media poblacional. Sera razonable que el fabricante concluyera que despus de 50 000 millas la cantidad media poblacional de cuerda restante es de 30 pulgadas? (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 305, 2007) Antes de proseguir con el desarrollo de la solucin del problema, es conveniente saber que, como no se conoce la desviacin estndar de la poblacin se llegar a establecer una igualdad como se expresa a continuacin y aqu aplica el anlisis que se hizo en el punto 1.2 de este material. s= 0-09. Solucin 1o. Se tiene que calcular el error estndar estimado de la media de la poblacin, utilizando la siguiente frmula:

50

= /n = = 0.09/10; = 0.09/3.16 = 0.028 0.03. Luego, como se est trabajando con un nivel de confianza de 95%, hay un nivel de significancia de 0.05 de probabilidad de que no se encuentre el parmetro dentro del intervalo, entonces se busca en la tabla de dist. t su valor. La muestra es de 10 y como se necesita el grado de libertad gl. ste es igual a 10-1, se tiene que es 9. Posesionarse en el rengln de la tabla en el nmero 9 y se recorre hasta la columna 0.05, cuyo valor es 2.262. As ya se puede desarrollar la siguiente expresin para los lmites superior e inferior: ts/n: 0.322.262(0.03) = 0.32+0.07 = 0.39 lim.sup. y 0.32-0.07=0.25 lim. inf. Es razonable pensar que el parmetro , se encuentra entre el intervalo de 0.25 y 0.39. Esto permitir al fabricante tener una certeza del 95%. Proponer y resolver ejercicios por parte de los estudiantes en sesiones de clases para garantizar el aprendizaje-enseanza de este tema, es decir distinguir el porqu y cuando se tendr que hacer uso de la distribucin t2.8 Tamao de la muestra para estimar una media. 2.9 Tamao de la muestra para estimar una proporcin. En el punto 1.5 de este trabajo material-, se realiz el anlisis, sobre el proceso y criterio y adems los conceptos que son aplicados para calcular el tamao de la muestra (n) al ensear el uso de stos para obtener informacin significativa de una poblacin, ya sea para estimar la media y tambin la proporcin poblacional, sin embargo, aqu se retomaran las observaciones y puntos de vista ms especficos sobre el tema para mejor comprensin y aplicacin del mismo, ya que en la mayora de los estudios que los estudiantes tienen que realizar, hay presencia de la duda sobre, de qu tamao o cuantos elementos debe contener una muestra? 2.10 Medidas de dispersin: Rango, desviacin estndar, varianza y coeficiente de variacin. Tambin se conocen como medidas de variabilidad y su uso es importante para conocer el grado de dispersin en que se encuentra una poblacin de la cual es seleccionada la muestra. En los cursos de estadstica, parece que la descripcin ms comprensiva en lo que se refiere a la dispersin, son las que tienen que ver con la desviacin promedio, con respecto a medidas que se trataron en el tema de la teora central del lmite. Adems de las medidas de localizacin, con frecuencia es conveniente considerar medidas de dispersin o variabilidad: Por ejemplo, suponga que es un agente de compras de una importante empresa manufacturera, y que con regularidad coloca pedidos con dos proveedores distintos. Despus de varios meses de trabajar as, encuentra que el promedio de das necesarios para surtir los pedidos es de

51

aproximadamente 10, para cada proveedor. Los histogramas que resumen la cantidad de das hbiles requeridos para surtir los pedidos se muestran en la figura 3.2. Aunque la cantidad promedio es, ms o menos, de 10 en ambos casos, tienen stos el mismo grado de confiabilidad para entregar a tiempo?. Observe la dispersin, o variabilidad en los histogramas. Qu proveedor prefiere usted? (David R. Anderson, Dennis J. Sweeney y Thomas A. Williams, pg. 83, 2004) *histogramas.
Frec.relativa Frec.relativa

FIGURA 3.2

Dawson Supply

J. C. Clarck Distributor

9 10 11 Das hbiles

7 8 9 10 11 12 13 14 15 Das hbiles

Parece razonable que lo importante en todos los casos de las empresas que necesitan el suministro de materiales a tiempo, se inclinan por aqullos agentes que en esta tarea suministro-, registran menor dispersin en cuanto a las fechas das-. En el caso de la ilustracin de las figuras antes descritas y que se refiere al planteamiento anterior, es ms conveniente, preferir al proveedor Dawson Supply. Ahora es momento de realizar una breve presentacin, de algunas medidas de variabilidad dispersin-, que son utilizadas con ms frecuencia. Rango, que representa la medida de dispersin ms simple, ya que registra la diferencia entre los valores mximo y mnimo de una serie de datos. La produccin media aritmtica por hora tanto en la planta de Boton Rouge como en la de Tucson es de 50. Sobre la base de las dos medias, podra concluir que las distribuciones de las producciones por hora son idnticas. Sin embargo, los registros de produccin de 9 horas en las dos plantas revelan que esta conclusin no es correcta (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 72, 2007) En la siguiente figura, se aprecia, que la produccin de Baton Rouge tiene una variabilidad que va de 48 a 52 montajes por hora, cuya diferencia es de 4 montajes es el rango-, se aprecia sin embargo que la produccin en la planta de Tucson, se presenta sin lugar a dudas ms errtica, ya que la medida de dispersin tiene un valor de 20 montajes, por lo que se concluye que la produccin por hora en Beton Rouge se acerca a la media, mientras que en Tucson sucede que hay una mayor dispersin en la produccin. Ver figura.

52

Produccin por hora de monitores de computadoras en las plantas de Beton Rouge y Tucson.

Baton Rouge

48

49

50

51

52

Tucson

50 60 (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg.72, 2007 La desviacin estndar, es la raz cuadrada de la varianza, cuya frmula para la poblacin esta dada por: = (x-)2/N. Tanto el rango como la desviacin media resultan fciles de interpretar. El rango es la diferencia entre los valores alto y bajo de un conjunto de datos, y la desviacin media de las desviaciones de la media. Sin embargo, la varianza resulta difcil de interpretar en el caso de un solo conjunto de observaciones. La varianza de 106.8 del nmero de multas levantadas no se expresa en trminos de multas, sino de multas elevadas al cuadrado (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pgs.,77-78, 2007) Coeficiente de variacin, relaciona de hecho los parmetros poblacionales ( y ) de igual manera con los estadsticos ( y s ). El resultado de las operaciones matemticas, se expresan en porcentajes.

40

53

Leonardo Kazmier, define el concepto de coeficiente de variacin con la siguiente expresin: Coeficiente de variacin indica la magnitud relativa de la desviacin estndar en comparacin con la media de la distribucin de medias, expresada como porcentajes. As las frmulas son. Poblacin CV = /x100 Muestra CV = S/X100

El ejemplo siguiente, es con el propsito de aplicar como ejercicio los elementos, para comparar dos tipos de casos y considerar la variacin: En 2 emisiones de acciones de la industria electrnica, el precio medio de mercado al cierre durante un periodo de un mes fue de $150, con =$5 en el caso de las acciones A. En el caso de las acciones B, el precio medio fue de $50, con una desviacin estndar de $3. Con base en una comparacin absoluta la variabilidad del precio de las acciones A fue mayor a causa de una mayor desviacin estndar. Pero en cuanto al nivel de los precios deben compararse los respectivos coeficientes de variacin . (Leonardo J. Kazmier, pg. 63-64, 1999). CV (A) = 5/150X100 = 3.3%, CV(B) = 3/50X100 = 6.0%

Se denota que desde el punto de vista de precios de cada emisin accionaria, son las accin de tipo B, alrededor de 2 veces ms variables en su precio que las de tipo A. UNIDAD III PRUEBA DE HIPOTESIS OBJETIVO: Aplicar la prueba a una hiptesis propuesta, dependiendo de las caractersticas de la muestra para saber si es correcta o no. 3.1 Concepto de prueba de hiptesis

54

Hiptesis nula: Ho supuesto tentativo acerca de un parmetro poblacional.

Hiptesis alternativa: Contradice lo establecido por la Hiptesis nula Ho . Su notacin , H1 o Ha (investigcin). PRUEBA DE HIPOTESIS En el procedimiento de esta prueba de hiptesis, slo es posible usar datos contenidos en una muestra, para probar dos afirmaciones podra decirse opuestas: es decir, las indicadas por: Ho. Y H1

Anlisis de prueba de hiptesis de una media y proporcin de una poblacin.


Distribuciones utilizadas: Normal Z, t, Ji-cuadrada (X2) y Dist. F.

Como se recordar en las sesiones anteriores nos ocupamos del estudio de la inferencia estadstica mediante la construccin de un intervalo de confianza, para darle valor mas confiable al parmetro de la poblacin derivado de una muestra.
Ahora en este caso en lugar de crear un conjunto de valores en el que se considera se encuentre el parmetro poblacional, se utilizar un esquema o un procedimiento para probar la VALIDEZ de un enunciado relacionado a un parmetro poblacional.

Vanse algunos ejemplos de enunciados que son susceptibles de probar.

55

EJEMPLO DE ENUNCIADOS TENTATIVOS (Ho) La velocidad media de los automviles que pasan por la seal de 150 millas de la carretera Wes tVirginia es de 68 millas por hora . La cantidad media de millas recorridas en una ChevyTrailBlazer rentada durante 3 aos es de 32000 millas . El tiempo medio que una familia estadounidense vive en una vivienda en particular es de 11.8 aos. En 2005, el salario inicial medio en ventas para un graduado de universidad es de $ 37 130 . Treinta y cinco por ciento (35%) de los jubilados de la regin Norte de Estados Unidos vende su hogar y se muda a un clima ms clido despus de un ao de haberse retirado. Ocho por ciento (8%) de los jugadores asiduos a la lotera estadounidense jams gana ms de $ 100 en juego.

HIPOTESIS ALTERNATIVA DE DOS EXTREMOS: Ho: = o H1: o

HIPOTESIS ALTERNATIVA DE UN EXTREMO INFERIOR O SUPERIOR . Ho: o Extremo superior H1: > o Ho: o H1: < o

Extremo inferior

56

PRUEBA DE HIPOTES IS DE DOS EXTREMOS (COLA)


REGION NO RECHAZO

REGIN NO RECHAZO

REGION NO ACEPTACIN

PRUEBA DE HIPOTES IS UN EXTREMO ( S UPRIOR E INFERIOR)

EXTREMO INFERIOR (IZQUIERDO) NO ACEPTACIN

REGION NO RECHAZO

EXTREMO S UPERIOR (DERECHO) NO ACEPTACI N

VALOR CRITICO

57

ESTRUCTURA DE PUNTOS PARA PROBAR UNA HIPOTGESIS 1.-Construir la hiptesis nula (Ho) y la hiptesis alternativa (H1)

2.-Determinar el estadisco de prueba a aplicar y el nivel se significancia


( = la probabilidad de error de rechazar una hptesis verdadera) y encontrar el valor crtico ( punto que divide las regiones de no rechazo y no aceptacin de la hiptesis nula) 3.-Calcular el error estndar y el valor estandarizado de la prueba de hiptesis . 4.-Identificar en el grfico la regin de no rechazo y no aceptacin . 5.-Tomar en funcin del resultado la decisin de no rechazar o no aceptar la hiptesis nula

Conceptualmente, la prueba de hiptesis se define como: Procedimiento basado en evidencia de la muestra y la teora de la probabilidad para determinar si la hiptesis es una afirmacin razonable" (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 332, 2007) Siempre que se realiza una investigacin existe el enfrentamiento a diversas interrogantes y como consecuencia se llega a emitir afirmaciones tentativas, o suposiciones hiptesis- sobre los parmetros de una poblacin. La teora seala procedimientos para probar una hiptesis y el que se aconseja viene desarrollando a travs de los siguientes pasos: 1. Es indispensable plantear la hiptesis nula: La hiptesis nula se identifica por Ho.se lee H subndice cero y al construirla ser siempre anteponiendo la igualdad, es decir, ejemplo = 12.5. Por otra parte, la hiptesis alternativa que se identifica por H1, su construccin ser a travs de 3 formas que pueden ser: H>12.5; H<12.5 y H12.5. Nota. Es de considerar que la hiptesis nula (Ho) no permite cambios por el hecho de que siempre ser igual. La hiptesis alternativa nunca trata la igualdad, entonces es algo as como que le lleva la contraria a la Ho, ya que si sta dice que es igual, la hiptesis alternativa dice que: <12.50, 12.50 o 12-50 se aconseja que as se debe ver o entender para la aplicacin de la tcnica de la prueba de hiptesis. Hiptesis nula Enunciado relativo al valor de un parmetro poblacional formulado con el fin de probar evidencia numrica Hiptesis alternativa Afirmacin que se

58

acepta si los datos de la muestra ofrecen suficiente evidencia para rechazar la hiptesis nula (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 333, 2007) 2. Nivel de significancia, cuando se trabajo en el apartado de la estimacin y estimador en este material, se habl de nivel de confianza por lo que es necesario aclarar para identificar la diferencia entre ste y el nivel de significancia. Por un lado, el primero, indica la certeza, por mencionar un ejemplo, se dice que se tiene un 98% de certeza y por el otro nivel de significancia- probabilidad de rechazar la hiptesis nula ( Ho) an cuando sta sea verdadera. Entonces el nivel de significancia es el porcentaje del error, 10, 5, 2 y 1 % respectivamente. El nivel de significancia estar en funcin del tamao de la muestra seleccionada. Se determina el valor crtico punto- donde se dividen la regin de aceptacin y rechazo. Se selecciona el tipo de distribucin 3.Se calcula el error estndar y se estandariza el valor de la prueba de hiptesis z y t. 4. Marcar la regin de aceptacin y rechazo de la hiptesis nula.

Regin de aceptacin 0.95 Regin rechazo Probabilidad 0.5

Escala z 1.96 Valor crtico.

5o.Cuando ya se ha calculado el valor crtico y el valor estandarizado de z o t, se compara para determinar la toma de decisin. Si el valor de la prueba de hiptesis z y t es mayor que valor crtico, la hiptesis nula se rechaza, si es menor, se acepta. 3.1.1. Tipos de hiptesis Existen dos tipos de hiptesis, como ya qued sealado en lneas anteriores de este material, sin embargo, aqu se transcribe el punto de vista siguiente:

59

hiptesis nula, la cual se designa Ho, y se lee H subndice cero. La letra mayscula H representa la hiptesis, y el subndice cero implica que no hay diferencia. Normalmente se incluye un trmino no en la hiptesis nula, que significa que no hay cambioLa hiptesis nula es una afirmacin que no se rechaza a menos que la informacin de la muestra ofrezca evidencia convincente de que es falsa. La hiptesis alternativa describe lo que lo que se concluir si se rechaza la hiptesis nula. Se representa H1 y se lee H subndice uno. Tambin se le conoce como hiptesis de investigacin (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 333, 2007) 3.2 Tipos de error y nivel de significancia Es evidente la relacin de los tipos de error y el nivel de significancia, por la razn de que ste nivel de significancia-, como qued establecido anteriormente, es el riesgo o la probabilidad de rechazar la hiptesis nula, cuando es correcta por un lado y por aceptar una hiptesis an cuando es falsa, se cometen Error tipo I y Error Tipo II respectivamente. Vase siguiente cuadro: Investigador ________________________________________ Hiptesis nula No rechaza Rechaza Ho. Ho. _________________________________________________________ Ho es verdadera Decisin correcta Error tipo I

Ho es falsa Error tipo II Decisin correcta _________________________________________________________ (Douglas A. Lind, William G. Marchal y Samuel A., pg. 335, 2007) 3.3 Prueba de hiptesis con uno o dos extremos. Una vez que ya se ha estudiado los diferentes conceptos y argumentos sobre la forma o decisin de aceptar o probar una hiptesis, en esta seccin del material se proceder a resolver algunos ejemplos e identificar una prueba de hiptesis de una y dos colas que tambin se conocen como de un extremo dos extremos o de una o dos regiones. Las grficas se presentan de la siguiente forma:
Prueba de una cola Prueba de dos colas

A continuacin se plantean ejemplos, en primer lugar transcritos de la bibliografa consultada que se refieren a las pruebas con una y dos colas y se trabajar con ejemplos planteados por los estudiantes; a nivel de tarea para su presentacin en sesiones de clases.

60

En algunos casos no es usual la prueba de hiptesis de dos extremos, vase el siguiente ejemplo: Consideremos el caso de un comerciante al mayoreo que compra focos elctricos al fabricanteEl mayorista los compra en grandes lotes y no desea aceptar un lote de focos a menos que su vida media sea al menos 1,000 horas. Cada vez que llega una remesa, el mayorista prueba una muestra para decidir si acepta la remesa o no. La compaa rechazar sta slo si le parece que la vida media est por debajo de las 1,000 horas. Si cree que los focos son mejores de lo esperado (con un vida media superior a 1,000 horas), es claro que no rechazar la remesa, porque esto no supondr un costo extra. As que las hiptesis del mayorista son Ho: = 1,000 horas y H1:<1,000 horas. Rechaza Ho slo si la vida media de los focos muestreados est significativamente por debajo de las 1,000 horas. (Richard I. Levin, pg. 430, 1996). Ver figura.
La cae en esta regin Aceptamos Ho.

1,000 horas Si la cae en esta regin se rechaza Ho.

Hay que distinguir que se utiliza una prueba de hiptesis de extremo inferior, es decir, del lado izquierdo de la media cuando sus hiptesis son: Ho:=Ho y H1:<Ho. Cuan es una prueba de un extremo derecho, es porque las hiptesis estn representadas: Ho:=Ho y H1:=Ho. Una prueba de hiptesis de dos extremos es apropiada cuando la hiptesis nula es =Ho (en donde Ho es algn valor especificado) y la hiptesis nula es Ho.Suponga que un fabricante de focos elctricos desea producirlos con una vida media de =Ho = 1,000 horas. Si el tiempo de vida es ms corto, perder clientes a favor de su competencia; si el tiempo de vida es ms largo, tendr un costo de produccin muy alto porque los filamentos sern excesivamente gruesos. Para verificar que su proceso de produccin est operando adecuadamente, toma una muestra del producto con el fin de probar la hiptesis Ho:=1,000. Como no quiere desviarse significativamente de 1,000 horas en ninguna direccin, la hiptesis alternativa adecuada es H1:1,000, y entonces utiliza una prueba de dos extremos. Esto es, rechaza la hiptesis nula si la vida media de los focos de la muestra est muy por arriba de 1,000 o muy por debajo de 1,000 horas.(Richard I. Levin, pg. 429, 1996). Ver grfica.

61
Si cae en esta regin Ho. Se acepta

Ho
Rechazaremos la hiptesis nula si la media de la muestra cae en cualquiera de estas regiones

Para los siguientes casos, especifique qu distribucin de probabilidad se debera utilizar en una prueba de hiptesis: a) Ho: = 27, H1:27, = 33,=4, n= 25 b) Ho: = 98.5, H1: >98.5, = 99.1, 0 1.5, n = 50 c) Ho: = 3.5, H1: < 3.5, = 2.8, = 0.6, n = 18 d) Ho: = 382, H1: 382, = 363, = 68, n = 12 e) Ho: = 57, H1: > 57, = 65, = 12, n = (Richard I. Levin, pg. 432, 1996) 3.4 Prueba de hiptesis para la media, muestras grandes y pequeas Un fabricante suministra los ejes traceros para los camiones correo del Servicio Postal de Estados unidos de Amrica. Estos ejes deben soportar 80,000 lb por pulg2 en pruebas de carga, pero un eje excesivamente fuerte eleva los costos de produccin de manera significativa.. La larga experiencia indica que la desviacin estndar de la fuerza de sus ejes es 4,000 lb por pulg2. El fabricante selecciona una muestra de 100 ejes de la produccin, los prueba y encuentra que la capacidad de carga media de la muestra es 79,600 lb por pulg2. Escritos simblicamente, los datos en este caso son Ho = 80,000 valores hipotetizados de la media de poblacin = 4,000 desviacin estndar de la poblacin n = 100 tamao de la muestra = 79,600 media de muestra Si el fabricante de ejes utiliza un nivel de significancia () de 0.05 en la prueba, satisfarn los ejes sus requerimientos de carga? (Richard I. Levin, pg. 433, 1996) Para la solucin del problema, se aplican los 5 pasos ya descritos con anterioridad. 1. Ho:= 80,000 hiptesis nula: la media poblacional es de 80,000 lbxpulg2 H1: 80,000 hiptesis alternativa la media no es 80,000

62

2. Se usa distribucin normal z, porque la muestra es grande y adems se conoce la desviacin estndar. Calcular el valor crtico, y es una prueba de dos colas, por la construccin de la hiptesis alternativa ( H1): observar grfica.

Regin de aceptacin
Regin de rechazo Regin de rechazo

Escala z
Valor crtico - 1.96 valor critico + 1.96

3. Calcular el error estndar y el valor estandarizado de la prueba de hiptesis z =/n = 4,000/100 = 4,000/10 = 400 z = -/ = Z= 79,600-80,000/400 = -1

4. Como el valor de z es negativo, o sea, z= -1, la regin de rechazo se marcar en el lado izquierdo de la campana, es decir, como se seala en la figura.
valor estandarizado de z es menor que valor crtico, es decir, -1 menor que -1.96 se acepta Ho. Regin de rechazo

-1.96
Valor crtico

5. El fabricante debe aceptar que la serie de produccin rene los requerimientos de carga. Recuerda, que se acepta Ho. Porque el val or estandarizado de z es menor que el valor crtico. Si sucediera lo contrario, entonces la Ho. Se rechaza. Los casos que se estudien y resuelvan con muestras pequeas, cae dentro del tratamiento de la distribucin t. Se utiliza el mismo procedimiento para probar una hiptesis que el de la distribucin normal.

3.5 Prueba de hiptesis de proporciones, muestras grandes y pequeas De la misma manera que se trat en la estimacin de intervalos de confianza para las proporciones, es factible probar una hiptesis para una porcin de la poblacin considerando que una proporcin es la razn entre el nmero de xitos y el

63

nmero de observaciones (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 353, 2007) Al aumentar el tamao de la muestra, la distribucin binomial se aproxima a la normal en sus caractersticas, y podemos utilizar la distribucin normal para aproximar la distribucin de muestreo. Especficamente np y nq cada una debe ser al menos 5 antes de que podamos utilizar la distribucin normal como aproximacin de la binomial (Richard I. Levin, pg. 443, 1996) Consideremos como ejemplo, una compaa que est evaluando la promocin de sus empleados, es decir, est determinando la porcin de aqullos cuyas capacidad, capacitacin y experiencia de supervisin los califican para promocionarlos al siguiente nivel de administracin. El director de recursos humanos le dice al presidente que aproximadamente el 80%, o 0.8 de los empleados de la compaa son promocionables. El presidente rene un comit especial para evaluar la capacidad de promocin de todos los empleados. Este comit efecta entrevistas a fondo con 150 empleados y encuentra que, a su juicio, slo 70% de la muestra est calificada para su promocin. (Richard I. Levin, pg. 443, 1996). Este autor agrupa los datos para realizar la prueba de hiptesis de la siguiente manera: pHo = 0.8 valor hipotetizado de la porcin de la poblacin de xitos qHo = 0.2 valor hipotetizado de la porcin de la poblacin de fracasos n = 150 p = 0.7 q = 0.3 tamao de la muestra porcin de muestra de promocionables porcin de muestra considerados no promocionables.

Siguiendo los 5 pasos para la prueba de hiptesis que para la media, se pasa a la solucin del problema. 1.Ho:p =0.8 80% de los empleados son promocionables H1:p 0.8 la porcin de empleados promocionables es diferente a 80% = .05 nivel de significancia para probar hiptesis 2. Uso de la distribucin normal z, y se calcula el valor crtico: 95/2 = .4750 en la tabla.

64

Valor crtico Z= -1.96

valor critico Z = +1.96

0.025 del rea

o.4750 o.4750

0.025 del rea

3. Error estndar: p

pHoqHo/n = (0.8)(0.2) /150 =0.0010666= 0.0327

Se calcula el valor estandarizado de la prueba de hiptesis Z = p pHo/p = 0.7-0.8/0.0327 = -3.06 4. Trazar la lnea que divide las regiones de aceptacin y echazo.
porcin de muestra estandarizada

3.06

-1.96 5. Se interpreta el resultado diciendo que se rechaza la hiptesis de que el 80% o 0.8 del personal son promocionables, y est avalado ya que el valor crtico calculado es menor que valor de z. Para las muestras pequeas se indica que es el mismo procedimiento, slo que para estos casos, la distribucin adecuada es la t Student. 3.6 Prueba de hiptesis mediante la distribucin F La distribucin F, Es una familia de distribuciones diferenciadas por dos parmetros (grados de libertad del numerador, grados de libertad del denominador), utilizada principalmente para probar hiptesis con respecto a varianzas ( Richar I. Levin, pg. 631, 1996) Para la prueba de hiptesis de la distribucin F, es recomendable auxiliarse de la Tabla de valores, en donde se ubican valores que para efectos de la prueba se denominan valor crtico. En la estructura de la tabla en las columnas se representa el numerador, y las lneas representan el denominador grados de libertad respectivamente-.

65

Al igual que como se trabaj con las anteriores distribuciones distribucin normal, z, distribucin t, la teora recomienda pasos a seguir para una prueba de hiptesis, los cuales se describen a continuacin: Se plantea un problema sencillo para ilustrar la forma de resolverlo, aplicando conceptos estadsticos en el proceso de la prueba La Oficina de Contabilidad del Gobierno (OCG) de EUA, est interesada en ver si las oficinas de tamao parecido, gastan la misma cantidad de dinero en personal y equipo. (Las oficinas que gastan ms son susceptibles de una auditoria especial.). Se examinaron los gastos mensuales de tres oficinas:: una de ellas en el Departamento de Agricultura, otra en el Departamento de Estado y la ltima en el Departamento del Interior. Los datos se presentan a continuacin. Al nivel de significancia de 0.01, existen diferencias en los gastos de las diferentes oficinas?(Richar I. Levin, pg. 613, 1996) Gastos mensuales (en miles de dlares) Algunos meses _____________________________________________.__________ Agricultura 10 8 11 9 12 Estado 15 9 8 10 13 13 Interior 8 16 12 ________________________________________________________ (Richard I. Levin, pg. 613, 1996) Antes de desarrollar el proceso para la prueba de hiptesis es indispensable identificar los siguientes conceptos que integran las frmulas aplicadas: Tomados de la bibliografa consultada. 2 = nuestra primera estimacin de la varianza de la poblacin, basada en la varianza entre las medias de las muestras (la varianza entre columnas) nj = tamao de la J-sima muestra j
=

media de la muestra de la J-sima muestra

X = gran media n = tamao de la muestra k = nmero de muestras s2j = varianza de muestra de la J-sima muestra nT = nj tamao de muestra total

66

Frmulas: s2 =(x- )2/n-1

varianza de la muestra

2 = nj(-X)2/k-1 nj - 1 2 =

primera estimacin de la varianza de la poblacin

nT k

sj

segunda estimacin de la 2 poblacional.

Con la aplicacin de todos los elementos sealados, se procede a probar la hiptesis. 1. Ho:1
= 2 =2

hiptesis nula existe diferencias en los gastos

H1:1, ,3 no son todas iguales, hiptesis alternativa. 2. 3. Desde luego que la prueba apropiada es Dist. F Se calcula las medias muestrales. 10 +8 + 11 + 9 + 12 = 50/5 = = 10 15 + 9 + 8 + 10 + 13 + 13 = 68/6 = = 11.33 8 + 16 + 12 = 36/3 = = 12 Se calcula la gran media: es x doble barra. X 50+68+36 = 154/14 =. X = 11

67

2 =nj( - )2/k 1

n 5 6 3

10 11.3 12

11 11 11

- -1 .3 1

( - )2 n( - )2 1 .9 1 nj(-)2 5 5.4 3 13.4

2 = nj( - )2 k1 Agricultura = 10 X- 10 8 11 9 12 10 10 10 10 10 (x-)2 0 4 1 1 4

13.4 2

6.7 varianza entre columnas Estado =11.3 Interior =12 x - 8 16 12 12 12 12 ( x - )2 16 16 0

x - 15 9 8 10 13 13 11.3 11.3 11.3 11.3 11.3 11.3

(x - )2 13-69 5.29 10.89 1.69 2.89 2.89 37.34

(x-)2 = 10 S12 =( x - )2 n - 1 S32 = (x - )2 n1 10 4 32 2

(x-)2 = 2.5 16

(x-)2 = 37.34 5

32 7.47

S22 = ( x - )2 n1

Segunda estimacin de la varianza de la poblacin: 2 =

nj-1 Sj2 nT-k

= 16.82 dado por: 4 (2.5)+ 5(7.47) + 2 (16) 11 11 11 4. Grados de libertad: No. De muestras 1 nT k 2 11

El nivel de significancia es de 0.01, por lo que se usa la tabla de valores de F, para encontrar el valor crtico. As dicho valor es de 7.21 que se busca con 2 grados de libertad del numerado y 11 grados de libertad del denominador.

68

5.Decisin, como 6.7 = 0.42 16 Este valor -0.42-, frente al valor crtico, 7.21, es menor, por lo tanto se puede concluir que se acepta, que existe variacin en los gastos de las diferentes oficinas. 3.6.1. Principales caractersticas de la distribucin F Se transcriben las principales caractersticas tomadas de la bibliografa consultada para este tema (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg.407408, 2007). 1. Existe una familia de distribuciones F. Un miembro particular de la familia se determina mediante dos parmetros: los grados de libertad en el numerador y los grados de libertad en el denominador. 2. La distribucin F es continua. Esto significa que se supone un nmero infinito de valores entre cero y el infinito positivo 3. La distribucin F no puede ser negativa. El valor menor que F puede tomar es 0. 4. Tiene sesgo positivo. La cola larga de la distribucin es hacia el lado derecho, cuando el nmero de grados de libertad aumenta, tanto en el numerador como en el denominador, la distribucin se aproxima a ser normal. 5. Es asinttica. Cuando los valores de x aumentan, la curva F se aproxima al eje de x pero nunca lo toca.

Regin de aceptacin

Valor de F =

0.42

Regin de rechazo, con rea de 0.005

7.21 3.7 Prueba de hiptesis mediante la distribucin X2.

valor crtico

En los apartados anteriores, se realizaron pruebas de hiptesis en donde se utilizaron una sola, dos y hasta tres medias de poblaciones, siguiendo la distribucin de probabilidad normal. Pero existen pruebas disponibles, en las que se supone una poblacin normal. Estas, reciben el nombre de pruebas no

69

paramtricas Tambin hay pruebas, en donde los datos son tomados como a escala de medicin nominal, es decir solamente interesan nmeros y que stos se clasifican sin un orden natural. En este tipo recae el estadstico de prueba Jicuadrada o x2 3.7.1. Prueba de bondad de ajuste x2 : frecuencias esperadas iguales. Esta prueba prueba de bondad de ajuste-, su uso es ms comn, en la que se suponen frecuencias esperadas iguales. En esta prueba se conjuga el binomio de frecuencias observadas y frecuencias esperadas, respectivamente, al igual que en las pruebas de bondad de ajuste en donde las frecuencias esperadas son desiguales. Antes de continuar con el anlisis es importante sealar que estas dos frecuencias significan: frecuencia observada (fo), es el registro del nmero de sucesos o eventos, mientras que frecuencia esperada (fe), frecuencias que tericamente se esperan ver en una distribucin de frecuencias.

En este tipo de prueba de bondad de ajuste interesa comparar bsicamente una distribucin observada contra otra distribucin esperada. En otras palabras se quiere saber si los hechos o acontecimientos estn distribuidos en forma normal. Para la prueba de este estadstico es necesario usar la tabla de valores de esta distribucin Ji-cuadrara o x2- y adems hay que establecer el nivel de significancia y grados de libertad para encontrar el valor crtico, que se ubica en el rengln del grado de libertad y la columna correspondiente: ejemplo n=20, n- 1 = 19 y 0.02. El siguiente ejemplo que se desarrolla, es tomado de la bibliografa consultada (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 647-648, 2007): La seora Jan Kilpatrick es la gerente de marketing de una fbrica de tarjetas deportivas. Ella planea iniciar la venta de una serie de tarjetas de fotografas y estadsticas de juego de ex jugadores de las ligas mayores de Beisbol. Uno de los problemas es la seleccin de ex jugadores. En una exhibicin de tarjetas de beisbol en Soutthwyck Mal el pasado fin de semana, instal un puesto y ofreci tarjetas de los siguientes seis jugadores miembros del Saln de la Fama. Tom Seaver, Nolan Ryan, Ty Cobbg, George Brett, Hank Aaron y Johnny Bench. Al final del da vendi u n total de 120 tarjetas. El nmero de tarjetas vendidas de cada jugador aparecen en la tablaLa seora Kilpatrick puede concluir que las ventas no son iguales para cada jugador?

70

Jugador Tom Seaver Nolan Ryan Ty Cobb George B Hank Aaron Johonny Bean Total

Tarjetas vendidas 13 33 14 7 36 17 120

TABLA 17.2 Frecuencias observadas y esperadas de las 120 tarjetas vendidas

Jugador

Tarjetas Vendidas (fo ) 13 33 14 7 36 17

Nmero vendido esperado (fe ) 20 20 20 20 20 20

Tom Seaver Nolan Ryan Ty Cobb George Brett Hank Aaron Johnny Bench

Total 120 120 (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 648, 2007) Como se observa, se han determinado el nmero de frecuencias observadas y el nmero de frecuencias esperadas, por cada jugador. Ahora para probar la hiptesis que las ventas son iguales para todos los jugadores . Se procede a desarrollar el proceso de la prueba de la siguiente forma: 1. Se Construyen: Ho: No hay diferencia entre las frecuencias esperadas. H1: Hay una diferencia entre las fo y fe. frecuencias observadas y

2. Se selecciona el nivel de significancia. En este caso se aplica 0.05, que como se ha explicado que ste es la probabilidad de que se rechace la Ho.

71

3. En este tema no hay problema, simplemente se sabe que el estadstico de prueba de hiptesis es x2: y se aplica la siguiente frmula: X2 = ( fo fe)2 Fe 13 33 14 736 17 20 20 20 20 20 20 =7 (7)2 49/20 = 13 (13)2 169/20 =-6 (-6)2 36/20 2 =-13 (-13) 169/20 = 16 (16)2 256/20 =-3 (-3)2 9/20 = 2.45 = 8.45 = 1.8 = 8.45 =12.8 = 0.45 34.45

3. Se toma la tabla de Ji-cuadrada ( x ). Para determinar el valor crtico, que trazado en la grfica es el punto de separacin de la regin de aceptacin y regin de rechazo. En este ejercicio es: para los grados de libertad k 1, sustituyendo entonces 6 1 = 5 porque k es igual al nmero de muestras. Si el nivel de significancia de 0.05, se tiene 11.070. Se representa la regla de decisin en la siguiente grfica:

Regin de rechazo 0.05 Probabilidad

No se Rechaza Ho. 11.070


Valor crtico 34.45 valor x
2

La hiptesis nula es rechazada, ya que es mayor el valor de x2 que valor crtico. Hay que desarrollar otros ejercicios como tarea que presentarn los estudiantes en sesiones de clase, para lograr el dominio e identificar todos los elementos que incluye el proceso de la prueba de este estadstico. 3.7.2. Caractersticas de la distribucin x2 Como toda distribucin aplicada a los problemas en los negocios contienen sus caractersticas que las distinguen unas de otras. Para el caso del estadstico de prueba x2, se describen las siguientes: (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 651, 2007) 1. Los valores Ji-cuadrada nunca son negativos. Esto se debe a que la diferencia entre fo y fe se elevan al cuadrado

72

2. Existe una familia de Ji-cuadrada. Hay una distribucin de Ji cuadrada para 1 grado de libertad, otra para 2 grados de libertad, otra para 3 grados de libertad, etc.,Por lo tanto, la forma de distribucin Ji cuadrada no depende del tamao de la muestra, sino del nmero de categoras. 3. La distribucin Ji cuadrada tiene un sesgo positivo. Sin embargo, a medida que aumenta el nmero de grados de libertad, la distribucin comienza a aproximarse a la distribucin normal. 3.7.3. Prueba de bondad de ajuste de x2: frecuencias esperadas desiguales. Este tipo de prueba de hiptesis bsicamente est relacionada con las porciones de una poblacin a travs de las muestras. Es decir, normalmente interesa la opinin o decisin de la poblacin en cuanto a algo. An cuando la Prueba Ji cuadrada tiene frecuencias esperadas que no son iguales, es til su aplicacin. En muchas ocasiones, los administradores necesitan saber si las diferencias que observan entre varias proporciones de muestra son significativas o solamente son resultados del azar. Suponga que el administrador de campaa de un candidato a la presidencia del pas estudia tres regiones diferentes y encuentra que 35, 42 y 51%, respectivamente, de los votantes investigados de las tres regiones reconocen el nombre del candidato. Si esta diferencia es significativa, el administrador puede llegar a la conclusin de que el lugar afectar la forma en que debe actuar el candidato. Pero si la diferencia no es significativa (es decir, si el administrador llega a la conclusin de que la diferencia solamente se debe al azar), entonces puede decidir que el lugar escogido para pronunciar un discurso proselitista en particular no tendr efecto en su recepcin. Para conducir la campaa con xito, entonces, el administrador necesita determinar si el lugar y el reconocimiento del nombre del candidato son dependientes o independientes. ( Richard I. Levin, pg. 578, 1996). A continuacin se transcribe un ejemplo, tomado de la bibliografa consultada y que se considera de utilidad para el aprendizaje-enseanza de esta tcnica; para distinguir si una proporcin difiere de otra. La Amrican Hospital Administrator Association (AHAA) reporta la siguiente informacin respecto del nmero de veces que los adultos mayores son admitidos en un hospital durante un perodo de un aoUna encuesta de 150 residentes de Bartow Estates, comunidad con una poblacin predominante de adultos mayores activos en el centro de Florida, revel que 55 residentes no fueron admitidos durante el ao pasado (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 654, 2007), y as sucesivamente como se observa en la siguiente tabla: TABLA 17.4 Resumen del estudio de la AHAA y de una encuesta de los residentes de Bartow Estates.

73

Nmero de Porcentaje de Nmero de residentes Nmero esperado Admisiones AHAA del total de Bartow ( fo ) de residentes(fe) 0 40 55 60 1 30 50 45 2 20 32 30 3 o ms 10 13 15 Total 100 150 150 (Douglas A. Lind, William G. Marchal y Samuel A. Wathen, pg. 654, 2007) Como no se puede comparar los porcentajes que registra Bartow, en la tabla, con las frecuencias observadas, es preciso convertirlos para conocer las frecuencias esperadas tericamente. As una vez organizados los datos se procede para calcular las frecuencias esperadas de la siguiente forma: Este proceso es muy sencillo, vean 150x.40 = 60, 150x.30= 45, son las frecuencias esperadas sucesivamente. Este criterio da la posibilidad de agrupar tanto las fo como las fe, para calcular el valor de Ji cuadrada x2..como esta estructura del problema manejan cuatro categoras, entonces para calcular el valor crtico, se tiene n 1 = 4 1 = 3 grados de libertad y el nivel de la probabilidad, se prueba la hiptesis. En la tabla de valores de Ji cuadrada o x2 se localiz al nivel de significancia de 0.05 y 3 grados de libertad el valor crtico que es igual a 7.815 y aplicando la frmula desarrollada en el paso 3 de la prueba con frecuencias esperadas iguales, de este material se obtuvo que x2 =1.3723. Por lo tanto se concluye que se acepta la hiptesis nula Ho. No hay diferencia entre la experiencia local y la nacio nal respecto de las admisiones en un hospital. UNIDAD IV.- ANALISIS DE REGRESIN Y CORRELACIN OBJETIVO: Identificar el grado de relacin y correlacin entre un conjunto de pares de datos estimando el intervalo con un grado de confianza . 4.1. Introduccin La determinacin de la relacin entre variables es fundamental para los estudios y la toma de decisiones. Tanto en la administracin pblica como privada, las tomas de decisiones estn fundamentadas en el conocimiento de la informacin para que la evaluacin sea significativa, para conocer verazmente la relacin que existe entre dos variables en particular. Una que se conoce y que corresponde a una variable independiente, y la otra que es desconocida y que recibe el nombre de variable dependiente. Para el caso del presente anlisis, se identificar a la variable independiente como X y a la variable dependiente como Y. 4.2. Tipos de relaciones.

74

Como se trata de interpretar las relaciones que existen entre variables, se definir y describir que el anlisis de regresin y correlacin lineal corresponde a una relacin asociada que existe entre dos variables que como se ha sealado antes, la variable X que es conocida y la variable Y desconocida. Considrense los siguiente ejemplos: En una fbrica se sabe que hay una relacin entre la tecnologa y la productividad; la venta de latas de aerosoles y el nivel de contaminacin ambiental; el PIB (producto interno bruto) y el consumo total. Ntese que en estos ejemplos que hay un incremento en la variable independiente que provoca un incremento en la variable dependiente por lo tanto, se est hablando de una relacin directa. Cuando se habla por ejemplo de la competencia, existen dos establecimientos que producen y venden bienes, si uno de los dos mejora e incrementa su produccin puede ser que vende ms que el otro, en este sentido se habla de una relacin en donde la variable independiente crece mientras que la variable dependiente disminuye. Esta es una relacin inversa. 4.3. Diagrama de dispersin. Un diagrama de dispersin es un grfico por puntos que son pares de los cuales el primero se refiere a lo que se conoce como variable independiente y el segundo que es la variable dependiente. En este campo se puede figurar la tendencia de una recta o una tendencia diferente o sea curva. Como ejemplo de este subtema, se puede considerar la siguiente tabla que se refiere a la variable independiente (llamadas) y nmero de unidades de producto vendidas variable dependiente (ventas)

Vendedores A B C D E F G H I J

Llamadas 25 45 20 40 10 10 20 20 30 30

Unidades vendidas 35 65 40 60 35 60 50 40 40 60

DIAGRAMA DE DISPERSIN DATOS DE LA TABLA ANTERIOR

75

70 60 50 40 Series1 30 20 10 0 0 10 20 30 40 50 Series2

Los datos observados de la tabla y grfica, dan la idea de la relacin entre el nmero de llamadas y las ventas del producto, lo que indica que los vendedores que ms llamadas hicieron pudieron vender ms unidades, pero no se puede aventurar y decir que la relacin es la ideal, es decir perfecta, sin embargo como se observa el vendedor F que slo hizo 10 llamadas pudo vender ms que el vendedor C. La lnea de regresin se representa mediante una recta en la grfica siguiente

76

70 60 50 40 Series1 30 20 10 0 0 10 20 30 40 50 Series2

4.4. Representacin grfica de los tipos de relacin: lineal y curvilnea.

4.5. Determinacin de Y estimada mediante ajuste de mnimos cuadrados. La ecuacin de regresin expresa la relacin lineal entre dos variables y recibe el nombre de Y estimada, cuyo smbolo es Y. As se determina la ecuacin para la estimacin de la variable dependiente Y. Y = a + bX De la cual se explica lo siguiente: (frmula)

a=interseccin de la recta con el eje vertical (y) b=pendiente de la recta

77

X=variable independiente Estimacin mediante la lnea de regresin, en los diagramas visualmente se observa que la lnea se coloca al ajustar los puntos de datos. La lnea de regresin es una ecuacin y esta dada por y = a +bx. Con esta ecuacin, se puede tomar cierto valor de la variable x independiente--, para calcular el valor de y la letra a representa la interseccin y Por ejemplo, considere que a = 3 y b = 2, el valor de y cuando x = 7, por lo que sustituyendo los valores en la ecuacin se tiene: Y = 5 + 2(7) = 5 + 14 = 19 Ahora vase como se obtiene el valor de la pendiente b, a travs de una representacin en el grfico suponiendo los siguientes puntos: Primer punto: (x1,y1) = 4,5 y (x2,y2) = 5,7. Entonces se tiene que el valor de b esta dado por:

(x2,y2) segundo punto (x1,y1) primer punto

=3

Sustituyendo b = y2 y1 = 7 - 5 x2 x1 5-4

=2 1

= 2

Ahora aplicando la ecuacin mediante el uso del mtodo de mnimos cuadrados, para la y estimada que se simboliza: Y=variable dependiente ye estimada. Ahora se procede a estimar los valores de a (interseccin) y b (pendiente) Para ello es prctico suponer un ejercicio para el uso de la ecuacin de la estimacin mediante este mtodo.

78

Ejemplos hipotticos: (ejemplo 1) El Gerente de administracin de una empresa necesita estimar lo que le implicar gastar para la reparacin de su equipo de transporte. Suponiendo que cuenta con una camioneta de lujo con una antigedad de 3 aos. En otras palabras el gerente tiene inters en conocer la relacin que existe entre la antigedad y el gasto que se tiene que hacer en reparacin. Para ello, se ha concentrado informacin considerable sobre cuatro camionetas de las mismas caractersticas que posee la empresa La solucin se determina de la siguiente manera: Primeramente se tiene que organizar los datos requeridos para calcular la lnea de regresin. Ordenar a continuacin dichos datos: GASTOS ANUALES DE REPARACIN DE VEHCULOS. Cuadro 1 No.de unidad Edad de Cada unidad (X) Gastos de reparacin durante el ltimo ao (Y)

1 2 3 4

6 4 4 2

7 8 6 5

Obtener los valores de XY, X2, Y2 Cuadro 2 Unidad 1 2 3 4 4 X2 36 16 16 4 72 Y2 49 64 36 25 174

Edad (x) 6 4 4 2 16

Gastos (y) 7 8 6 5 26

XY 42 32 24 10 108

Con los datos de los cuadros 1 y 2 se puede determinar la ecuacin, para estimar los valores de y cuando X=7 y X=8 aos respectivamente. Estableciendo el criterio a aplicar se tienen que desarrollar:

79

X = 4,

Y = 6.5 (ecuacin 1)

b =XY- nXY X2 nX2 a= Y bX = a + bx

(ecuacin 2) (ecuacin 3)

Sustituyendo las ecuaciones propuestas, se tiene: b = 108 4(4)(6.5)/72-4(16) = .5

a= 6.5 0.5(4) = 6.5 2. = 4.5 Cuando X = 7, ye estimadada es: = 4.5 + .5(7) = 4.5 + 3.5 = 8 1 camioneta con antigedad de 7 aos, har un gasto
de 8 mil pesos.

Cuando X = 8 ye estimada es: = 4.5 + .5(8) = 4.5 + 4 = 9.5 camioneta con antigedad de 8 aos, se har un gasto de
9 mil pesos.

(Ejemplo 2) La siguiente muestra de observaciones se tom aleatoriamente. (Cuadro 3) Variables X 4 5 3 6 Y 4 6 5 7 (Cuadro 4) X 4 5 3 6 10 x 28 X2 16 25 9 36 100 x2 186

10 7 Y2 16 36 25 49 49 y2 175

Y 4 6 5 7 7 y 29

XY 16 30 15 42 70 xy 173

Con los puntos tomados del cuadro 4, se puede determinar la ecuacin, para estimar los valores de y cuando X=7

80

(Ejemplo 3) El departamento de Recursos Humanos de una empresa importante desea conocer la relacin de calificaciones de pruebas y la destreza en la productividad, por lo que analiza comparativamente una muestra aleatoria de 5 empleados de una lnea de produccin con su rendimiento por hora (productividad), cuyos datos fueron registrados como se indica en el siguiente cuadro: (Cuadro 5) Empleado 1 2 3 4 5

Calif. Prueba de destreza (x) 11 13 15 16 11

Unidades producidas por hora (y) 57 65 69 70 52

Ahora, los clculos que se tienen que realizar para calcular la pendiente y el punto de interseccin de y de la ecuacin correspondiente, es decir, = a + bx estn registrados en el siguiente cuadro: (Cuadro 6) Empleado 1 2 3 4 5 x X2 Y2

Calif. x 11 13 15 16 11

Productividad xy por hora 57 65 69 70 52 y xy

x2

y2

Aplicar las frmulas matemticas: 1, 2 y 3

4.6 Error estndar de la estimacin El propsito de esta medicin constituye el desarrollo de intervalos para mejor confianza de la variable predicta (dependiente). En razn de ello, se deber primeramente conocer o determinar atreves de ecuacin matemtica el error estndar de la estimacin el cual se identifica por: (Se), desviacin estndar que se refiere a la forma de dispersin de los pares de puntos que se localizan arriba y debajo de la de la lnea de regresin. Retomando el caso del cuadro 2, para calcular el error estndar atreves de:

81

Se = (Y - ) 2 n2

(Ecuacin 4)

(Cuadro 7) X 6 4 4 2

y 7 8 6 5

7.82 6.5 6.5 5.18

( y ) ( - 0.82) ( 1.5 ) ( -0.5 ) ( -0.18 )

( y )2 0.25 2.25 0.25 0.25 2 (y - ) 3.00

Desarrollando la ecuacin 4: Se = 3.2 42 = 3. 2 = 1.6 Se = 1.26 ( error estndar )

Estimacin de intervalo para la ye estimada. Como se trata de muestras pequeas, se utilizar la tabla de valores de t. Desarrollando la siguiente expresin matemtica: = a + bx tSe (Ecuacin 5)

Sustituyendo la ecuacin, se tiene la estimacin de los lmites superior e inferior. = 4.5 + 0.5(7) 1.26,
= 81.26;

= 4.5+3.5(1)1.26 lmite superior lmite inferior

8+1.26 = 9.26 8 1.26= 6.7

Asi se tiene una confianza de ms de 68% que el monto de gasto de una camioneta con 7 aos de antigedad estar ente 6.7 y 9.26. Con un nivel de confianza de ms de 95% el intervalo se obtiene con un 2 Se. 4.6.1 Comentario sobre la interpretacin del error estndar de la estimacin. En un diagrama de dispersin, en donde existe una lnea recta de ye estimada y trazando lneas por encima y de debajo de la recta de ye estimada, se puede observar el grado de dispersin de los valores dados por cada par de datos (variable independiente y variable dependiente), cuando se aplica por ejemplo, 1,

82

2, y 3 errores estndares de niveles de confianza ms de 68%, 95% y 99% respectivamente.

You might also like