You are on page 1of 13

Unidad 1.

Fundamentos de la estadstica
Presentacin de la unidad
La palabra estadstica a menudo te remite a grficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografa, ingresos, deudas, crditos, etc. No obstante, para aprovechar las herramientas de anlisis estadstico, es necesario comprender qu representa cada concepto y la metodologa mediante la cual se obtiene un dato estadstico. En esta unidad se hablar sobre la importancia de la estadstica, conocers sus conceptos bsicos, as como la metodologa del muestreo para que al final, obtengas una muestra aleatoria simple.

Propsitos de la unidad
Identificars los conceptos bsicos relacionados con la Estadstica. Reconocers la utilidad e importancia de la Estadstica. Aplicars el procedimiento para obtener una muestra aleatoria simple.

Competencia especfica
Aplica la metodologa estadstica para obtener una muestra aleatoria simple, identificando los elementos que intervienen en un problema estadstico.

1.1. Introduccin a la estadstica


La estadstica es la ciencia cuyo objetivo es reunir informacin cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al anlisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadstica, en general, es la ciencia que trata la recopilacin, la organizacin, la presentacin, el anlisis y la interpretacin de datos numricos con el fin de realizar una toma de decisiones ms efectiva.

Las estadsticas
La palabra estadstica tambin se utiliza para referirse a la informacin estadstica (descripcin de parmetros); es decir, a series de datos, tablas y grficas que presentan resultados. Por ejemplo, cuando leemos las estadsticas de los equipos o escuchamos la estadstica muestra que el ndice de reprobacin en las escuelas es tal, se hace referencia a los datos y no al procedimiento o metodologa de anlisis.

Utilidad e importancia de la estadstica La estadstica resulta muy til no slo para recopilar y describir datos, sino tambin para interpretar la informacin obtenida, que puede ser aprovechada para demostrar la evolucin de un fenmeno a travs de cierto tiempo. En Mxico, el Instituto Nacional de Estadstica y Geografa (INEGI) se encarga de recabar informacin estadstica y geogrfica de todo el pas, en diferentes reas y contextos. Los mtodos estadsticos se utilizan en investigaciones de todas las reas del conocimiento en el mbito acadmico, profesional y laboral. La finalidad es resolver un problema, entendiendo ste como la diferencia entre lo real y lo deseado, donde la estadstica muestra la realidad para que el investigador la analice y tome una decisin. Divisin de la estadstica La estadstica, por su aplicacin se divide en:

1.2. Conceptos de estadstica


La estadstica tiene aplicacin en prcticamente todas las reas del conocimiento, inclusive en la vida cotidiana, mucho ms a menudo de lo que crees. La siguiente actividad te permitir apreciar una aplicacin simple de la estadstica e identificar algunos conceptos relacionados con ella: 1. Lee el texto La estadstica y la salud. 2. Identifica los conceptos relacionados con la estadstica. 3. Define cada concepto utilizando slo la informacin de la lectura. No es necesario que busques definiciones. Da clic en el icono para descargar el documento.
EB_U1_LaEstadistica YlaSalud.pdf

Conceptos bsicos de estadstica Los conceptos ms utilizados en estadstica son los que a continuacin se presentan.

Tipos de variables La variable es una caracterstica de la poblacin o muestra que desea estudiarse. Las variables pueden ser:

Cmo utilizamos los conceptos? En el ejemplo La estadstica y la salud identificaste algunos conceptos bsicos de estadstica. Ahora, revisemos juntos(as) los conceptos que estaban en el texto. La poblacin de estudio es la sangre del individuo, de la cual se toma una muestra que representa una pequea parte de esta poblacin. Esta muestra contiene informacin sobre las caractersticas que se desean observar. Los (las) expertos(as) de laboratorio preparan la sangre para observar en un microscopio electrnico los elementos (variables) que contiene, por ejemplo pueden observar la cantidad de plaquetas o neutrfilos (las plaquetas y los neutrfilos son los individuos y la cantidad que contiene la sangre de estos elementos son los datos) que contiene la muestra por unidad de volumen. Se realiza un conteo, en este caso, del nmero de plaquetas y del nmero de neutrfilos, esta informacin se representa por medio de un estadstico, caracterstica numrica que refleja la informacin contenida en la muestra, en la que se observa el total de plaquetas. Aunque, en realidad, lo que nos interesa conocer o estimar es el total de plaquetas en el total de la sangre (poblacin) del individuo. Cuntos conceptos identificaste en la lectura?

La metodologa para solucionar un problema estadstico comprende los siguientes pasos: 1. Planteamiento del problema. En el planteamiento se define si se requiere de una muestra o es posible estudiar la poblacin, las caractersticas a estudiar (las variables), si es necesario establecer una hiptesis, entre otros. En este punto tambin se analizan los medios de los que se dispone y el procedimiento a seguir. 2. Elaboracin de un modelo. Se establece un modelo terico de comportamiento de las variables de estudio. En ocasiones no es posible disear el modelo hasta realizar un estudio previo. Los posibles modelos son normal, binomial, poisson, uniforme, y otros como binomial negativa, geomtrico. 3. Extraccin de la muestra. Se usa alguna tcnica de muestreo o un diseo experimental para obtener informacin de una pequea parte de la poblacin. 4. Tratamiento de los datos. En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que sern necesarios en pasos posteriores, como la media y la varianza de la muestra. Los mtodos de esta etapa corresponden a los mtodos de la estadstica descriptiva. Algunas de las etapas de esta fase son: recopilacin, clasificacin y presentacin de la informacin. 5. Estimacin de los parmetros. La estadstica inferencial nos proporciona herramientas para la prediccin o estimacin de los parmetros de la poblacin que nos ayudarn a resolver el problema. Un ejemplo de estas herramientas son las pruebas de hiptesis que se obtienen del anlisis de los datos y los intervalos de confianza.

1.3. Muestreo aleatorio


Introduccin Los estudios estadsticos normalmente se hacen con una parte de la poblacin, ya que realizarlos sobre la totalidad resultara demasiado complicado. Para que la informacin obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones especficas. Estas condiciones estn relacionadas con el mtodo para determinar el tamao y caractersticas de la muestra y los individuos que la componen. Los mtodos de muestreo se pueden clasificar en:

Revisa los mtodos de muestreo probabilstico, para ello, lee el texto Tipos de muestreo. Da clic en el icono para descargar el documento.
EB_U1_MuestreoAle atorio.pdf

1.3.1. Conceptos bsicos de muestreo aleatorio


Muestreo aleatorio simple El muestreo aleatorio simple es el procedimiento por medio del cual se obtiene una muestra aleatoria simple. Una muestra aleatoria simple es la que resulta de aplicar un mtodo por el cual todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos. A continuacin, conocers cules son los pasos para obtener una muestra aleatoria simple.

Paso 1. Definir la poblacin de estudio y el parmetro a estudiar. Paso 2. Enumerar a todas las unidades de anlisis que integran la poblacin, asignndoles un nmero de identidad o identificacin. Paso 3. Determinar el tamao de la poblacin, determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar. Paso 4. Determinar el tamao ptimo de la muestra para el estudio. Paso 5. Seleccionar los sujetos dela muestra usando nmeros aleatorios.

1.3.2. Metodologa del muestreo aleatorio


Pasos para obtener una muestra aleatoria simple Has visto una descripcin general del procedimiento que debes seguir para obtener una muestra aleatoria simple, ahora revisars cada paso especfico.

Paso 1. Definir la poblacin de estudio y las variables a estudiar.

Recuerda que la poblacin es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas comunes, observables en un lugar y en un momento determinado. Por lo tanto, el paso 1 es determinar qu se estudiar. Ejemplo Un investigador realiza un estudio sobre las relaciones de gnero en el noviazgo, su objeto de estudio son las manifestaciones de violencia fsica y psicolgica entre los (las) estudiantes del ltimo ao de la carrera de qumica. Su poblacin es el total de estudiantes del ltimo ao de ingeniera qumica que tengan novio o novia; el total de individuos con esta caracterstica es de 386. Por lo que, la poblacin es de 386 individuos y las variables son: violencia fsica y violencia psicolgica.
Paso 2. Numerar todas las unidades de anlisis que integran la poblacin, asignndoles un nmero de identificacin.

Una vez que has definido la poblacin y las variables a estudiar, es necesario asignar un nmero de identificacin a cada individuo de la poblacin. Siguiendo con el ejemplo de la relaciones de gnero en el noviazgo de los (las) estudiantes de qumica, lo que sigue es numerar a los 386 estudiantes un nmero del 1 al 386.

Paso 3. Definir la poblacin, determinar el porcentaje de error y el porcentaje de confianza.

Para calcular el tamao de una muestra hay que tomar en cuenta tres factores: 1. El porcentaje de confianza con el que se quiere generalizar los datos, desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin.

3. El nivel de variabilidad que se calcula para comprobar la hiptesis. A continuacin definiremos estos conceptos.

Significa determinar el nmero de individuos que la constituyen; la variable N representa el tamao de la poblacin.

Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto se busca un porcentaje de confianza menor, comnmente es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningn clculo) para poder acertar al valor verdadero de la poblacin. Este dato se obtiene a partir de la distribucin normal estndar.

Este error es una distancia alrededor del valor que deseamos estimar y nos da un margen de aproximacin. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.

Es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere comprobar. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se indica con p (tambin llamada probabilidad de xito ), y el porcentaje con el que se rechaz la hiptesis es la variabilidad negativa, identificada por q (tambin llamada probabilidad de fracaso y se obtiene 1-p). Variabilidad positiva=p= a la probabilidad de que suceda el evento Variabilidad negativa=q=a la probabilidad de que no suceda el evento La variabilidad positiva (p) al sumarla con la negativa (q) siempre nos debe dar la unidad p+q=1.Cuando no se tienen antecedentes sobre la investigacin, entonces los valores de variabilidad son p=q=0.5

Paso 4. Determinar el tamao de la muestra ptimo para el estudio.

Una vez que la poblacin, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad han sido determinados, se debe determinar el tamao de la muestra. Puedes calcularlo mediante alguna de las dos frmulas que examinars: una para los casos en que se conoce el tamao de la poblacin y la otra para cuando este dato se desconoce. Frmula para cuando no se conoce el tamao de la poblacin Frmula para cuando se conoce el tamao de la poblacin

Nota. En este momento no conoces los procedimientos para obtener todos los componentes de las frmulas, en los ejemplos, estos componentes ya estn dados. Estos procedimientos se vern ms adelante.

Ejemplo de cmo se aplican. Cuando no se conoce el tamao de la poblacin: n es el tamao de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa E es la precisin o error Ejemplo: En un lote grande de medicinas, se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Supn que la variabilidad p=q=0.5. Solucin: Para el nivel de confianza sea igual al 95%, tienes que P(Z)=0.95 si Z=1.96. Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en el caso necesario, hay que convertir esos valores a proporciones. Sustituyendo:
( ) ( )( ( ) )

Es decir, se ocupar una muestra de aproximadamente 384 unidades.

Cuando se conoce el tamao de la poblacin: n es el tamao de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa N es el tamao de la poblacin E es la precisin o error Ejemplo: En un lote de 25,000 cajas de medicina, se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Supn que la variabilidad p=q=0.5. Solucin: Para el nivel de confianza sea igual al 95%, tienes que p(Z)=0.95 si Z=1.96. Sustituyendo:
( ( ) ( ) )( ( )( ) )

En otras palabras, se ocupar una muestra de aproximadamente 378 cajas.

Paso 5. Seleccionar los sujetos de la muestra usando nmeros aleatorios.

El ltimo paso para obtener la muestra es saber qu individuos especficos de la poblacin se tomarn. Para hacer esto debes: 1. Numerar a los individuos de la poblacin del 1 a N (donde N es el tamao de la poblacin). 2. Generar nmeros aleatorios para seleccionar los individuos de la muestra. 3. Tomar los individuos correspondientes a los nmeros elegidos. Los nmeros aleatorios se pueden generar por diversos mtodos, por ejemplo mediante programas computaciones (por ejemplo en Excel con la funcin =aleatorio()), funciones en calculadora, sacando nmeros de una urna o lanzando una moneda al aire, o bien utilizando tablas de nmeros aleatorios. Para obtener los nmeros aleatorios, utilizars la tabla, para ello lee el documento Uso de la tabla de nmeros aleatorios. Da clic en el icono para descargar el documento.
EB_U1_UsoTabla.pdf

Cierre
Has concluido la unidad Fundamentos de la estadstica. A continuacin, un breve recuento de lo que viste: La estadstica tiene aplicaciones en, prcticamente, todas las reas de conocimiento y en muchas ocasiones recurrimos a ella para solucionar problemas y tomar decisiones. Tambin es una metodologa muy til para presentar informacin y analizar diferentes situaciones de la vida cotidiana. Los conceptos bsicos que revisaste son: Estadstica descriptiva Estadstica inferencial Poblacin Individuo Dato Parmetro Variable Muestreo

Dentro de los tipos de muestreo, te centraste en el muestreo probabilstico y pusiste especial nfasis en el muestreo aleatorio simple, en el que todos los individuos de la poblacin tienen las mismas posibilidades de ser elegidos. El procedimiento para obtener una muestra aleatoria simple consiste en determinar la muestra y seleccionar a los individuos de la poblacin que formarn parte de ella. Esta seleccin se lleva a cabo a travs de nmeros aleatorios, que se pueden generar de varias formas: aplicaciones informticas para estadstica, calculadoras, tablas de nmeros aleatorios, etctera. Es muy importante que tengas presente los conceptos de esta unidad, ya que constituyen una base para los siguientes temas.

Para saber ms
Te invitamos a visitar la pgina del Instituto Nacional de Estadstica y Geografa para que veas algunas aplicaciones de la estadstica: http://www.inegi.org.mx

Fuentes de consulta
Statistics. (2010). En Merriam-Webster Online Dictionary. Recuperado el 8 de marzo de 2010 desde: http://www.merriam-webster.com/dictionary/statistics. Borrego, Silvia (2008). Estadstica descriptiva e inferencial. Revista digital innovacin y experiencias educativas 13. Recuperado el 10 de marzo de 2010 desde: http://www.csicsif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf. Casal, Jordi, Mateu Enric. (2003). Tipos de muestreo. Rev. Epidem. Med. Prev. (2003), 1: 37. Recuperado el 1 de marzo de 2010 en http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf. Castillo Manrique, Isabel (2006). Estadstica descriptiva y clculo de probabilidades. Mxico: Pearson Educacin. Ferris, Ritchey (2008). Estadstica para las ciencias sociales. Segunda edicin. Mxico: McGraw-Hill. Galbiati Riesco, Jorge M. Conceptos Bsicos de Estadstica. Pontificia Universidad Catlica de Valparaso, Instituto de Estadstica. Recuperado el 1 de marzo de 2010 desde:http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf. Larios Osorio, Vctor (1999). Unidad 5. Teora de muestreo. Recuperado el 12 de marzo de 2010 desde: http://www.uaq.mx/matematicas/estadisticas/xu5.html. Lind, Douglas, Marchal, William y Wathen, Samuel (2008). Estadstica aplicada a los negocios y la economa. Dcimo tercera. Edicin). Mxico: McGraw-Hill. Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadstica aplicadas a la ingeniera. Cuarta edicin. McGraw-Hill, Mxico. Ruz Muoz, David (2004). Manual de estadstica (versin electrnica). Recuperado el 9 de marzo de 2010 desde: http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm. Wackerly, Dennis D., Mendehall William y Scheaffer Richard L. (2010). Estadstica Matemtica con Aplicaciones. Sptima edicin. Mxico: Cengage Learning. Walpole Ronald E., Myers Raymond H., et al. (2007). Probabilidad y Estadstica para Ingeniera y ciencias. Octava edicin. Mxico: Pearson Educacin.

You might also like