Professional Documents
Culture Documents
CONTENIDO
Pg.
Introduccin
Objetivos
1
3
4
4
6
10
13
15
17
18
51
51
52
52
55
57
59
62
63
63
64
65
67
68
18
18
19
21
21
22
22
30
34
34
50
69
69
69
70
71
72
74
78
80
81
82
87
91
93
100
REFERENCIAS
101
ANEXO
103
Introduccin
La investigacin de mercados, hoy en da, se ha constituido como la
herramienta ms poderosa del mundo empresarial. Su fin esencial, est
enmarcado en la bsqueda de los niveles de aceptacin de un producto y de los
aspectos que se deben considerar a futuro en su diseo y fabricacin. Si tomamos
en cuenta que vivimos en una sociedad rodeada de productos, podremos
comprender la importancia que tiene investigar cul es el mercado para dichos
productos, y cmo este mercado se comporta.
Por esto, se requiere de todo un instrumental tcnico y del manejo de una teora
que habilite al estudioso en tal disciplina. Significa entonces que la investigacin
de mercados no es slo un desarrollo cuantitativo, sino que requiere de un
tratamiento especial en la ciencia Estadstica para el manejo de informacin.
Ciertamente, la Estadstica ha provisto a sus seguidores dentro de la investigacin
de mercados, de elementos necesarios que sustentan la base de la Mercadotecnia
en su esfera cuantitativa. Cada necesidad de la Mercadotecnia es respondida por
un cuantioso nmero de alternativas (tcnicas y mtodos) que le corresponden a
la Estadstica. Tales alternativas van desde la elaboracin de una encuesta,
pasando por su diseo, aplicacin y valoracin, muestreo, pruebas de hiptesis,
tabulacin cruzada, hasta el anlisis de regresin y el uso de tcnicas
multivariadas.
De esta manera, para la investigacin de mercados el Estadstico es el profesional
que la lleva a sus fines ulteriores; y para este significa desarrollarse como tal y
ampliar el campo de trabajo junto con las perspectivas de desarrollo de la misma
ciencia, ya que ante todo, existe una retroalimentacin entre la ciencia y la
investigacin, aun cuando esta ltima no sea pura. Cuando hablamos de
desarrollo, nos referimos a un gran reto, no significa solamente extenderse y
abarcar indistintamente cualquier aspecto de la Mercadotecnia (entendida esta
como el conjunto de tcnicas, procedimientos y teoras para el estudio del
mercado), sino ms bien debemos referirnos al desarrollo como un mejoramiento
en todos los sentidos de las tcnicas estadsticas que optimicen los fines de la
Mercadotecnia. Es decir, debemos ampliar el horizonte de la Estadstica y
adecuarlo a la expansin del mercado conforme este va desarrollndose.
Este desarrollo slo puede tener un indicativo tanto para investigadores como para
aquellos que requieren de estos ltimos; es decir, los empresarios: motivar la
bsqueda de actualizacin y aportacin en la Investigacin de Mercados. Estudiar
al mercado, encierra en s mismo un sin nmero de implicaciones que deben
culminar en la puesta en prctica de recomendaciones y acciones especficas.
Si se orienta la investigacin de mercados hacia campos de lucro, y si se hace
persiguiendo un fin social, en ambas formas tendramos que aceptar la
generalizacin del uso de la Estadstica. Cada da la extensin geogrfica y
1
Objetivos
Objetivo General
Que los estudiantes adquieran las competencias bsicas para el diseo y
desarrollo de la investigacin de mercado y de estudios de satisfaccin del cliente
en el marco de la gestin de la calidad.
Objetivos particulares
1. Que el estudiante conozca los diferentes mtodos para la obtencin de
informacin en la investigacin de mercado y la satisfaccin del cliente.
2. Que el estudiante aprenda a construir y validar instrumentos para evaluar la
satisfaccin del cliente.
3. Que el estudiante sepa como establecer la forma y el tamao de la muestra a
tomar en la investigacin de mercado y la evaluacin de la satisfaccin del
cliente.
4. Que el estudiante conozca mtodos estadsticos para el anlisis de la
informacin obtenida en la investigacin de mercado y evaluacin de la
satisfaccin del cliente.
5. Que el estudiante aprenda a elaborar reportes de estudios de mercado y
satisfaccin del cliente.
INFLUYEN
Situacin econmica
Tecnologa
Aspectos legales y polticos
Publicidad
Aspectos sociolgicos
Competencia
Ventas
Etc.
ELEMENTOS DEL
MIX
Precio
Producto
Promocin
Distribucin
11
estadsticas vitales sobre los clientes. Por ejemplo, cuando salimos a comprar
ropa, aunque el vendedor rene cierta informacin demogrfica sobre nosotros,
como estatura, peso, medidas, etc., el vendedor an no sabe cules son nuestros
gustos, colores preferidos; slo tiene datos generales sobre nosotros. Los datos
demogrficos son datos sobre perfiles reales de los diferentes segmentos de
clientes a quienes se pretende llegar con algn producto o servicio; incluyen
informacin sobre caractersticas fundamentales de los clientes, tales como edad,
sexo, estado civil, ingresos, etc. Permiten conocer el tamao, densidad y
distribucin de diferentes grupos de clientes. Debido a que los factores
demogrficos suministran el perfil de los clientes, stos constituyen la primera
fuente de informacin. Estos datos son el medio ms comn para identificar
nuevos objetivos para algn producto o servicio; es decir, ayudan a conocer
quines son los clientes. Los datos demogrficos se pueden obtener de censos
estatales y locales, si es que se necesitan datos generales. Muchas
organizaciones cuentan con departamentos que se encargan de recoger perfiles
demogrficos de clientes. Si algn negocio no lo tiene, puede recurrir a una fuente
externa para que le proporcione esta informacin.
Sin embargo, los datos demogrficos no dirn por qu compran los clientes, cmo
lo hacen, ni acerca de qu los motiva, irrita, los hace venir o alejarse. Para esta
informacin se necesitan datos psicogrficos. Con estos datos se responde a
preguntas que le inquietan al gerente, como: qu les viene a la mente a los
clientes cuando piensan en su negocio?, qu les motiva?, qu pasa por su
cabeza en el momento de la verdad?, etc. Es decir, estos datos son tiles cuando
nos queremos meter en la cabeza del cliente para saber qu es lo que piensa o
siente acerca de algn producto o servicio. Los datos psicogrficos explican en
gran parte los factores crticos en las evaluaciones hechas por los clientes; y
permiten conocer los acontecimientos significativos asociados a la satisfaccin con
algn producto o servicio. Estos datos son importantes porque nos dan un
conocimiento y una idea sobre qu motiva e influye en los clientes en sus
relaciones con el negocio. Muchos negocios pueden cometer errores en este
punto. Creer que saben de antemano lo que motiva a los clientes hace que se
diseen sistemas y mtodos que pueden no ser apropiados para elevar la
satisfaccin.
Existen diferentes tipos de clientes, dependiendo de lo que ellos quieren y cmo
salen a conseguir lo que quieren. Algunos clientes estn ms orientados hacia el
proceso que hacia el contacto con la gente; es decir, hacia los empleados
encargados del servicio. Generalmente se interesan ms por cmo funcionan las
cosas que por el componente relaciones humanas. Otros le dan ms importancia a
la relacin humana.
Dependiendo de cmo salen los clientes a conseguir lo que quieren, algunos
operan con un nivel alto de exigencia y otros se conforman con niveles bajos de
atencin. Los clientes exigentes generalmente quieren lo mejor, piden que las
cosas funcionen bien desde la primera vez y tienen poca tolerancia para las fallas
14
17
2.4.2.1 Cuestionario
A la lista formal de preguntas se le llama cuestionario. La funcin del cuestionario
es la medicin: puede medir el comportamiento pasado (a menos que existan
registros, los eventos pasados no podran ser analizados ms que por el mtodo
de cuestionario); puede medir las actitudes, esto es, las actitudes, que no se
pueden medir de otra manera ms que por este mtodo; tambin puede medir las
caractersticas del perfil del encuestado, como edad, sexo, nivel socioeconmico,
etc.
Ventajas y desventajas del cuestionario
Una de las ventajas es su versatilidad, sta es quiz la ms importante, la
cual permite que casi todos los problemas de la investigacin de mercados
puedan ser analizados a partir de un cuestionario. Debido a que en todo problema
de mercado estn involucradas personas que pueden ayudar a ver dnde est el
problema y qu solucin es posible darle, y esto se logra por medio de un
interrogatorio.
Otra de las ventajas es la rapidez y costo; la encuesta es ms rpida y ms barata
que la observacin y proporciona a los entrevistadores un mejor control de sus
actividades comparado con los observadores, adems se pierde menos tiempo en
un estudio realizado por medio de un cuestionario.
Una de las desventajas que tiene el cuestionario es la posible renuncia de los
interrogados a proporcionar la informacin. En muchas ocasiones los
entrevistados se niegan a responder una lista de preguntas de un desconocido, ya
sea porque el tema de la entrevista tiene muy poco o ningn inters para el
entrevistado, aunque el entrevistador sea muy amable y tenga carcter para tratar
a las personas y lograr su cooperacin, el entrevistado se niega a ceder un poco
de su tiempo para la entrevista o a contestar algunas preguntas especficas,
especialmente como las que se refieren al ingreso, o aquellas que son de ndole
personal. Para superar esta apata por parte de los entrevistados, se han
desarrollado varios mtodos; el ms importante es el arte de vender por parte del
entrevistador. Las recompensas en efectivo muchas veces ayudan a conseguir la
cooperacin de la gente, asegurndole al entrevistado que sus respuestas van a
ser tratadas confidencialmente. Todas estas maneras ayudan a obtener la
cooperacin de la gente sobre todo cuando las preguntas son de ndole personal.
Otra parte de las desventajas es la incapacidad de los entrevistados para
proporcionar informacin. Muchas personas se encuentran en la mejor disposicin
de cooperar, pero estn incapacitadas para responder a las preguntas que son de
inters para el investigador de mercados, ya sea que no recuerdan los hechos
deseados, o porque nunca los han conocido; por ejemplo un entrevistador puede
preguntar Cuntas veces comi carne en el desayuno durante el mes pasado?,
pocas personas podrn responder con exactitud, ya que rara vez las personas se
23
El contenido de las preguntas tiene que ver con la habilidad o buena voluntad del
encuestado para responder con precisin. El investigador debe de estar
consciente de la capacidad del encuestado para proporcionar informacin. Mucha
informacin no se puede recopilar con exactitud, ya sea porque el encuestado no
est bien informado o porque sea olvidadizo, como se explic anteriormente. Una
vez que se han analizado los problemas que trae consigo el contenido de las
respuestas, se debe de analizar el tipo de preguntas que van a utilizarse. Estas
preguntas se basan en formatos de respuesta estructurados y no estructurados.
Las preguntas pueden ser de respuesta abierta, de eleccin mltiple o dicotoma.
En las preguntas de respuesta abierta, los encuestados tienen la libertad de
contestar lo que ellos piensen que es lo correcto, con sus propias palabras. En la
entrevista por correo se debe dejar un espacio para la respuesta, y en entrevistas
personales el investigador debe de apuntar en el cuestionario lo que el encuestado
conteste verbalmente. La ventaja de este tipo de preguntas es que permiten que
se expresen las actitudes generales y pueden ser de gran ayuda para interpretar
las preguntas ms estructuradas. Adems establecen una armona y logran
obtener la cooperacin del encuestado para que conteste preguntas ms
especficas estructuradas; estas preguntas son muy importantes como
introduccin en una entrevista por correo. Otra de las ventajas es que puede
proporcionar al investigador ideas, comentarios y razones tiles para darse una
idea de los resultados de la investigacin.
Una desventaja de las preguntas abiertas, es que muchas veces el entrevistador
no toma la respuesta tal y como se la da el encuestado, si no que escribe los
puntos que considera ms importantes; esto se debe a que los entrevistadores no
escriben rpido o estn limitados de tiempo y mientras ms resuman la respuesta
registrada menos se parecer a la respuesta real. Cuando los entrevistadores
utilicen este tipo de preguntas es conveniente utilizar una grabadora; otra
desventaja es el tiempo y el costo asociado con la codificacin de las respuestas,
ya que en una encuesta grande se necesitan procedimientos exhaustivos de
codificacin, para resumir las respuestas en un formato til para el anlisis y
presentacin de la informacin. El tiempo y costo del proceso de codificacin
puede ser muy significativo en el costo total de la investigacin. Las preguntas de
respuestas abiertas son apropiadas para el anlisis exploratorio de un problema.
Algunas veces se utilizan preguntas precodificadas con el fin de aprovechar las
ventajas de las preguntas abiertas y disminuir las desventajas en tiempo y costo.
Una pregunta precodificada es una pregunta de eleccin mltiple. En las
preguntas de eleccin mltiple el encuestado debe de elegir una respuesta de una
lista suministrada en la pregunta. El entrevistado puede elegir una o ms
alternativas que se le presenten. Estas preguntas superan muchas de las
desventajas de las preguntas abiertas; la ms importantes es que reducen el costo
y tiempo asociado con el procedimiento de la informacin. Pero tambin tiene sus
desventajas, una de ellas es que el diseo de preguntas efectivas de la seleccin
mltiple requiere de una cantidad considerable de tiempo y costo. Por lo general
se requiere un estudio exploratorio con base a preguntas abiertas, para poder
26
28
30
31
El alto grado de respuestas. Son pocas las personas que declinan responder al
ser un contacto tan directo y muchas menos las que lo abandonan una vez
iniciado.
Se puede realizar a cualquier persona independientemente de su status social,
cultural, etc.
En las respuestas del entrevistado se evita la influencia de terceras personas.
Mediante las explicaciones de las preguntas y de las posibles respuestas del
entrevistador se eliminan las respuestas evasivas No sabe (NS)/ No contest
(NC).
Se puede mostrar o entregar cosas al entrevistado, tales como anuncios,
paquetes, productos, etc., Por lo que si se requiere hacer alguna demostracin
en el estudio se debe usar la encuesta personal.
Se puede obtener informacin adicional del entrevistado a travs de la
observacin por el encuestador, por ejemplo forma de vestir, nivel cultural,
social, etc.
La rapidez, dividiendo la muestra en distintos mercados y realizando entrevistas
en varios mercados es factible determinar estudios grandes en un perodo de
tiempo relativamente corto. Si bien sera ms largo que realizar encuestas por
telfono.
Las desventajas que surgen son:
En primer lugar est el costo por entrevista, especialmente las entrevistas
puerta a puerta tienen un coste por entrevista varias veces superior a las
investigaciones realizadas por correo o telfono. De manera que slo en
aquellas ocasiones que sea estrictamente necesario el contacto personal se
utilizarn las mismas dado que los fuertes costes suponen un elemento en
contra.
Es una metodologa lenta en obtener la informacin puesto que depende del
nmero de entrevistas que se realicen y de su duracin.
Existe la posibilidad de que el entrevistador incorpore distorsiones en la
obtencin de la informacin debido a las explicaciones, la forma de preguntar,
etc. Lo que puede originar que las respuestas no sean las que libremente dara
el entrevistado por lo que esto representa una importante dispersin en el
proceso de obtencin de informacin.
Los entrevistadores deben ser controlados para que la informacin que
presentan sea veraz y comprobar que realmente procede de las personas
entrevistadas que conforman la muestra. Para comprobar todo ello es necesario
incorporar muchos controles de seguridad.
En cuanto a las tendencias sobre las entrevistas personales a pesar de los
inconvenientes anteriormente mencionados debemos decir que existen algunos
tipos de investigaciones comerciales: publicidad, packaging, por mencionar
algunas, en las que es necesario contactar personalmente con los entrevistados,
de ah que han surgido un nuevo tipo de entrevistas, que son las entrevistas por
detencin, que consiste en detener a los entrevistados en zonas de gran afluencia
32
k
k 1
i2
i2
Donde:
k es el nmero de tems
0.60 a 0.70 poco aceptable, 0.70 a 0.80 respetable, 0.80 a 0.90 muy bueno y
valores >0.90 se debe considerar una reduccin del nmero de tems en la escala.
Ejemplo, suponga, que tenemos 5 tems y que estos son altamente consistentes
con un coeficiente alfa observado de 0.80. Donde cada tem tiene respuestas de 1
hasta 5 (Respuesta tipo Likert). La suma de la escala es la suma de las cinco
respuestas a los tems. Tericamente los valores mnimo y mximo son 5 y 25
respectivamente. La suma de la escala no debera ser hecha cuando los tems no
son internamente consistentes es decir, si hay tems con coeficientes alfa bajos, o
si son muy pocos los tems o tienen muy poco en comn.
Un coeficiente de confiabilidad de 0.85 significa que 85% de la varianza en las
puntuaciones de la prueba depende de la varianza verdadera en el rasgo medido y
que el 15% depende de la varianza del error.
La interpretacin ms clara sigue siendo la que se limita a expresar lo que dice la
misma frmula: es la proporcin de co-variacin, que si es grande implica
relaciones claras entre los tems. Consistencia interna parece un trmino
adecuado en este caso.
Sobre el valor mnimo que debe tener el coeficiente no hay normas especficas,
ni tampoco puede hablarse de una prctica comn; es un valor que est entre 0 y
1 y hay que evaluar teniendo en cuenta ms datos y el uso previsible del
instrumento. Algunos autores proponen un mnimo de 0.70 para investigaciones
bsicas, algunos otros ponen el lmite en 0.85 si van a tomar decisiones sobre
individuos y de 0.60 para otros usos. Se trata, por supuesto, de valoraciones
orientadoras.
2.5.2 Validez
La definicin de validez en un sentido general menciona que un cuestionario
es vlido si mide lo que se pretende medir con l. Por lo tanto, la validez de los
instrumentos de medicin tiene que ver con lo que miden y con qu tan bien lo
hacen; nos indica qu se puede inferir a partir de sus resultados, es decir, un test
es vlido cuando est demostrado que mide aquello que se presupona o se
pretenda midiese.
El anlisis factorial es esencialmente un mtodo para encontrar aquellas variables
que tienen algo en comn. Si algunos reactivos de una prueba de personalidad
estn diseados para medir satisfaccin, entonces en un anlisis factorial, dichos
reactivos deben cargarse mucho hacia un factor y poco hacia los otros, por lo
tanto el anlisis factorial constituye un mtodo que indica en qu medida miden la
misma cosa y en qu grado miden aquello que miden.
El anlisis factorial es particularmente relevante para los procedimientos de
validacin del cuestionario dicho anlisis contribuye directamente a aclarar dos
puntos fundamentales en la explicacin de los cuestionarios o constructos 1) su
38
39
Donde:
n es el nmero de individuos u
objetos. p es el nmero de variables.
X ij es la observacin sobre el i-simo individuo u objeto en la j-sima variable
que esas variables sean casi independientes entre s y, por tanto, no tenga sentido
buscar otras dimensiones ortogonales (independientes) que nos definan
elementos o aspectos independientes.
A partir de la matriz de datos n p se obtiene la matriz de correlaciones entre
todas las variables, de dimensiones p p , y simbolizada como R (matriz de
correlaciones de todas las variables entre s).
Despus de que se ha calculado la matriz de correlaciones R (s es que existen
correlaciones altas), el paso siguiente en el anlisis factorial consiste en elegir la
matriz factorial que resuelva el problema de la explicacin de la informacin de la
matriz de correlaciones R, es decir, determinar el menor nmero de variables
hipotticas, constructos o factores comunes de tal manera que reproduzcan
satisfactoriamente las correlaciones entre las variables. Esto se hace a travs de
un proceso llamado extraccin de factores.
En la literatura existe una gran variedad de mtodos para la extraccin de factores
a partir de una matriz de correlacin: componentes principales, mxima
verosimilitud, centroide, alfa, entre otros. No es posible analizar aqu todos estos
mtodos, por lo que la explicacin se limitar a uno de los mtodos. El mtodo
ms utilizado actualmente y que est fcilmente disponible en las instalaciones
computacionales es el mtodo de componentes principales, sin que esta
valoracin excluya otros tipos de anlisis factorial.
A continuacin se presenta una breve descripcin de los principales mtodos de
factorizacin:
Componentes principales: sigue un principio de extraccin que supone maximizar
la varianza explicada, es decir, conseguir que la contribucin del factor a alguna de
las comunalidades de las variables del estudio sea mxima. De ah que el factor
que mejor explique una dimensin analizada (el que represente mayor
variabilidad) se convierta en el primer componente principal, el que mejor explique
la segunda dimensin (el que represente mayor variabilidad en la matriz de
residuales) ser el segundo componente principal y as sucesivamente. Su
aplicacin supone transformar directamente un conjunto de variables
correlacionadas en otro conjunto de variables no correlacionadas.
Mxima verosimilitud: considera la mejor estimacin posible de la matriz de
correlacin reproducida en la poblacin como principio de extraccin. Es decir,
busca la solucin factorial que mejor se ajustara a las correlaciones observadas.
Utiliza chi-cuadrado como estadstico para determinar el grado de ajuste entre lo
observado y lo estimado, lo que permite determinar el nmero de factores
necesarios para que no haya una desviacin significativa de los datos observados.
La fijacin de las comunalidades se realiza por un procedimiento iterativo que
converge en el mejor valor.
42
ello indicara que la variable se solapa totalmente con los tres factores, en lo que
mide. Si una variable tuviera una comunalidad de 0, por otra parte, los pesos de
los tres factores para esta variable seran cero y la variable no tendra nada en
comn con ninguno de ellos. Los valores de comunalidad entre 1.0 y 0 indican
solapamientos parciales entre las variables y los factores en lo que miden.
Por lo tanto las comunalidades debern ser ciertos valores tales que:
0 h2 1
Esta solucin permite aceptar el cumplimiento del objetivo fundamental del AFE:
explicar mediante tres factores ortogonales, las correlaciones existentes entre 9
variables.
Como se ha mencionado el anlisis factorial implica cierto nmero de pasos, entre
ellos se encuentra la extraccin de factores. Muchos de los mtodos producen
factores que no son interpretables. Por consiguiente, dichos factores sin rotacin
se rotan con propsitos de interpretacin, ya que si se intenta interpretar la matriz
sin rotar de la Tabla 1, se enfrenta un problema. Se puede decir que todas las
pruebas se cargan de forma sustancial sobre un factor 1. Lo anterior equivale a
decir que todas las pruebas miden lo mismo (factor 1).
Por lo tanto el anlisis factorial no termina con la extraccin de los factores y la
preparacin de una tabla de pesos o cargas factoriales no rotados. Aunque esta
tabla da una solucin factorial basada en construcciones representadas
aceptables matemticamente, estas construcciones representadas en una matriz
factorial no rotada son raramente usadas en el trabajo cientfico.
Existen grficos que sirven de apoyo importante la hora de valorar tanto el nmero
de factores que se han de elegir como la composicin de cada uno de ellos en
funcin de las saturaciones de las variables.
Para tomar la decisin acerca del nmero de factores puede recurrirse al llamado
scree test o scree plot tambin llamado grfico de sedimentacin. Este grfico
reproduce los autovalores de los distintos factores, los factores importantes deben
explicar la mayor parte de varianza y tener autovalores grandes. En este grfico se
representan en el eje de ordenadas los valores de los autovalores y en el de
abscisas los sucesivos factores. Habr un punto en el que la pendiente de la curva
tiende a ser 0, es decir, los autovalores comienzan a ser casi iguales. En este
punto se establece el punto de corte para el nmero de factores.
La interpretacin del grfico de sedimentacin se realiza as: se aceptan los
valores, comenzando por el primero, cuya lnea de unin con el siguiente se
inclina (en mayor o menor grado), rechazando aquellos factores cuya unin con
los siguientes sea una lnea horizontal (en mayor o en menor grado de
aproximacin a la horizontalidad).
44
objeto hasta donde se sita el ojo del observador. Cada superficie que
observamos es la interseccin de un plano con esas lneas de mira).
matriz factorial que cumpliera con los cinco principios propuestos por Thurstone
tendra la configuracin siguiente (en un caso de 3 factores obtenidos a partir de 9
variables empricas.
Por supuesto, el modelo que representa la matriz D resulta por muchas razones
exagerado, ya que dichas estructuras factoriales perfectas son poco frecuentes.
Sera ms realista reemplazar los valores 1 por el Mximo y los valores 0 por el
mnimo (ya que nunca se darn valores 1 y 0 en una matriz factorial).
Del mismo modo en que existen muchos mtodos de extraccin de factores,
tambin existe una serie de mtodos de rotacin. Los dos tipos principales de
rotacin son: ortogonal y oblicua. A continuacin se dar una breve explicacin
de cada uno.
1. MTODOS DE ROTACIN ORTOGONAL: en esta rotacin los ejes o factores
se mantienen perpendiculares, los nuevos factores son no correlacionados, es
decir, los factores son independientes. Esto se ilustra en la Figura 5, en donde
se supone un anlisis factorial con 7 variables, en que se definen dos factores
F1 y F2. En la Figura 5 se observa que el primer factor est conformado por tres
variables, mientras que el segundo lo constituyen cuatro variables.
1.1. Mtodo Quartimax. Su fundamento es la idea que cada variable est cargada
significativamente slo en un factor. Por ejemplo, si se tiene una variable con
dos factores, si la variable se encuentra sobre un factor, su carga en el otro
factor sera igual a 0, con lo que el producto cruzado de estas dos cargas sera
igual a 0. Por lo tanto, si se consigue minimizar la suma de los productos
cruzados de los cuadrados de las cargas de las variables en dos factores,
significa que las variables que estn significativamente cargadas en uno de los
factores lo estn mnimamente (lo ms cercano a 0 posible) en el otro.
1.2. Mtodo Varimax. Mtodo ideado por Kaiser. Este mtodo est orientado a
limpiar los factores, produciendo factores que tienen altas correlaciones con
un conjunto pequeo de variables y pequea o nula correlacin con el resto de
las variables.
1.3. Mtodo Equimax. En este mtodo se minimizan tanto el nmero de variables
que saturan alto en un factor como el nmero de factores necesarios para
explicar una variable.
2. MTODOS DE ROTACIN OBLICUA. Este tipo de rotaciones se admite que
los nuevos factores resultantes estn correlacionados. Una solucin factorial
oblicua es la que proporciona factores no ortogonales, es decir, correlacionados
entre s. De acuerdo con Garca et al (2000). Una rotacin oblicua es ms
general que una solucin ortogonal puesto que no se impone la restriccin de
que los factores tengan correlaciones nulas entre s. Su ventaja sobre la
rotacin ortogonal es que, despus de llevar a cabo las rotaciones oblicuas, si
los factores resultantes son ortogonales, se tiene la seguridad de que la
ortogonalidad no ha venido impuesta por el mtodo de rotacin. Lo anterior se
ilustra grficamente en la Figura 6, donde se supone un anlisis factorial con
siete variables, en el que se definen dos factores F1 y F2.
48
49
50
C nN
N!
(N n)!n!
(3.1)
la encuestas por
posibles muestras,
1 .
P o b l a c i n fi n i ta d e ta m a o
N -3
....
N -2
N -1
5
N
Seleccin
aleatoria
M u e s t r a a le a t o ria
s im p le d e t a m a o
4
2
..
n.
.
n
El segundo paso sera poner en papelitos todos los nmeros de las muestras,
depositarlos en un recipiente y mezclarlos de tal manera que pueda ser escogido
un papelito sin ver, cuyo nmero identifica una muestra al azar de 2 piezas de pan.
Si el proceso se realiza un gran nmero de veces y cada vez que se tome un
papelito se regresa al recipiente antes de que se efecte la siguiente seleccin, a
la larga cada papelito y por consiguiente cada muestra se extraer con la misma
frecuencia y con una probabilidad conocida de 1/15.
El proceso de seleccin de una muestra aleatoria simple asegura que cada
elemento de la poblacin tiene la misma probabilidad de ser seleccionado. Para
seleccionar una muestra se puede proceder escogiendo los elementos de la
poblacin uno por uno al azar o escogiendo una muestra completa como se ilustr
con el ejemplo. Es claro que este procedimiento resulta poco prctico, por lo que
para seleccionar muestras aleatorias simples se utilizan tablas de nmeros
aleatorios en lugar de seleccionar papelitos de un recipiente, o bien generadores
de nmeros aleatorios en una calculadora o computadora.
Una tabla de nmeros aleatorios es un conjunto de enteros generados de modo
que la tabla contendr los diez dgitos enteros (0,1,2,....,9), en proporciones
aproximadamente iguales, sin tendencias en el patrn en que se generaron los
dgitos; es decir, el nmero que se seleccione de la tabla puede ser cualquiera de
los dgitos entre 0 y 9, ya que todos tienen la misma probabilidad de ser
seleccionados.
La seleccin de nmeros por medio de tablas de nmeros aleatorios es anloga a
la seleccin por medio de papelitos.
La pregunta es Cmo seleccionar esos nmeros de la tabla? Una manera de
hacerlo es apuntando con un lpiz hacia un punto inicial de la tabla y decidir tomar
el ltimo o primer dgito del nmero seleccionado. Antes de iniciar se define si los
siguientes nmeros a obtener van a ser los de abajo o los de un lado del punto
inicial; si un nmero se repite, lo ignoramos puesto que ya ha sido seleccionado;
tambin se omite si aparece un nmero mayor que los que contiene la poblacin, y
se selecciona el siguiente nmero. Esto ltimo es muy raro que suceda ya que
generalmente se manejan poblaciones grandes. De esta manera obtenemos una
muestra aleatoria simple por medio de tablas.
54
.
4
.
...
.
n
55
Note que para llevar a cabo el procedimiento anterior, lo nico que se requiere es
la posibilidad de recorrer fsicamente la poblacin, de tal manera que dicho
recorrido comprenda todas las viviendas, y no los tome en cuenta ms de una vez.
Para el caso en que N no es mltiplo de n se tendra, por ejemplo con N 15,600
y n 500 , k 31.2 , entonces podra tomarse alguna de las siguientes dos
alternativas: k 31 o k 32 .
El muestreo sistemtico es de uso frecuente. La ventaja principal de este mtodo
de muestreo es su simplicidad, ya que a partir de una lista se escoge un elemento
al azar y se contina seleccionando cada elemento n-simo, y es ms sencillo que
elegir una muestra aleatoria simple. Est menos expuesto a errores y
frecuentemente proporciona mayor informacin que el muestreo aleatorio simple
por unidad de costo. Una muestra sistemtica por lo general se extiende por toda
la poblacin, es decir, los elementos de la muestra estn ms distribuidos en ella y
por lo tanto puede dar ms informacin acerca de la poblacin que se est
analizando que una muestra aleatoria simple con la misma cantidad de elementos.
A manera de ilustracin, suponga que tenemos una lista de 100 archivos de los
alumnos de la Facultad de Estadstica y queremos seleccionar una muestra
sistemtica para determinar la proporcin de archivos incorrectos. Suponga
adems que los primeros 50 archivos han sido archivados correctamente y los
otros 50 incorrectamente por diversas razones. El muestreo sistemtico incluir la
misma cantidad de archivos correctos e incorrectos y dar una estimacin ms
precisa de la proporcin de archivos almacenados incorrectamente. En cambio el
muestreo aleatorio simple podra seleccionar un gran nmero de archivos
incorrectos o quiz todos y dar una estimacin muy diferente de p. Si los archivos
incorrectos hubieran sido distribuidos aleatoriamente, la ventaja del muestreo
sistemtico se perder, ya que la precisin de las estimaciones de este muestreo
depende del orden de las unidades de muestreo en el marco.
El muestreo sistemtico se utiliza en muchas reas, por ejemplo, los auditores
utilizan el muestreo sistemtico al muestrear una lista de cuentas para verificar
cantidades o para comprobar que los procedimientos de contabilidad se cumplan.
Tambin es utilizado por los investigadores de mercado y por encuestadores que
muestrean personas en movimiento.
Este tipo de muestreo tambin tiene sus dificultades. Una de ellas es que no se
puede obtener una estimacin sin sesgo del error de muestreo atribuido a la media
estimada sin recurrir a algunas suposiciones, debido a que este muestreo solo
identifica a un conglomerado y para poder evaluar el error de muestreo se
necesitan cuando menos dos conglomerados. Sin embargo, se podra obtener una
estimacin sin sesgo del error de muestreo si en lugar de obtener una muestra
sistemtica de 100 elementos, se obtuvieran 5 muestras sistemticas de 20
elementos cada una, ya que la variacin entre estas muestras permite la medicin
del error de muestreo.
56
n1 n2 nL =n
Figura 9. Esquema de un muestreo aleatorio estratificado.
El muestreo aleatorio estratificado es ampliamente utilizado por varias razones:
Permite estudiar en forma independiente a cada uno de los estratos.
La estimacin de los parmetros correspondientes tienden a ser ms precisos
que los obtenidos mediante la utilizacin de un m.a.s.
Permite resolver muchos problemas de coordinacin en la obtencin de la
informacin en el trabajo de campo.
Ahorra dinero, tiempo y esfuerzo, es decir, se puede ahorrar el costo, el tiempo
y traslado del entrevistador, ya que las muestras pueden ser tomadas por reas
geogrficas y el entrevistador no andara de un lado a otro consumiendo tiempo
y dinero. El investigador con este ahorro de capital podra tomar una muestra de
mayor tamao que la que se podra tomar en un Muestreo Irrestricto Aleatorio
del mismo costo.
58
59
Conglomerados
de Elementos
unidades de muestreo
1 Ciudad A
Manzanas
2 Ciudad B
Viviendas
3 Aeropuertos
Vuelos
Escuela
Secundaria
Variables
Caractersticas de
vivienda
Personas
Grado de estudios
Pasajeros que Informacin acerca
salen
viajes
la
Viviendas
Salones de clase
Estudiantes
Planes de carreras
Vehculos
Origen y destino
Artculos
de
Poblacin finita de
N conglomerados
2
.
4
..
N
Seleccin Aleatoria
de conglomerados
3
1
. .
n
conglomerados
60
Cuando los conglomerados han sido especificados, se debe realizar una lista que
contenga todos los conglomerados que conforman la poblacin. Entonces se
selecciona una muestra aleatoria simple de conglomerados.
Considerando la eficiencia econmica, es decir, el costo relativo de las
observaciones en cada uno de los mtodos, casi siempre veremos que el
muestreo por conglomerados es ms econmico que el muestreo aleatorio simple
y que el estratificado, si el costo por obtener un marco que liste todos los
elementos de la poblacin es muy alto o si el costo por obtener las observaciones
aumenta con la distancia que separa a los elementos, por ejemplo; suponga que
deseamos calcular el gasto promedio por familia de una ciudad. Si usamos
Muestreo Aleatorio Simple se necesita un marco que liste todos los hogares
existentes en la ciudad y esto puede ser muy costoso o imposible de lograr, no se
puede evitar esto utilizando muestreo estratificado ya que se necesita un marco
para cada estrato de la poblacin, lo que se podra hacer es dividir a la ciudad en
regiones tales como manzanas o conglomerados de elementos y seleccionar una
muestra aleatoria de ellos, esto se puede realizar con facilidad utilizando un marco
que liste todas las manzanas existentes, de esta manera se puede calcular el
gasto promedio de cada familia dentro de cada manzana. Adems si se selecciona
una muestra aleatoria de toda una lista de hogares en la ciudad resulta ser muy
costosa, debido a que la muestra elegida puede estar dispersa en toda la ciudad y
los entrevistadores pierden tiempo y dinero en gastos relativos. El muestreo
estratificado es el ms adecuado para reducir estos gastos de transporte, ya que
los elementos de un conglomerado deben de estar geogrficamente cerca uno del
otro.
62
Total
47%
53%
100%
67
Los grupos son pequeos debido a que son muy costosos y adems la
informacin que se tiene de cada grupo est poco estructurada debido a que la
entrevista es en forma libre y se realiza con varias personas a la vez. Por lo
general, este tipo de muestreo se utiliza en las investigaciones exploratorias con el
propsito de conocer las creencias y prcticas de los consumidores respecto al
producto en cuestin. Cada grupo no es un intento riguroso de estimacin de los
parmetros de alguna poblacin. Las muestras de grupo pueden aportar datos
importantes para el desarrollo de hiptesis, no se debe de considerar que aporta
pruebas de magnitud de algn parmetro debido a la dificultad que se tiene en
muestrear a la poblacin mediante esta tcnica, o debido a que cada entrevista es
en realidad una muestra de uno, consistente usualmente en un aglomerado poco
definido de respuestas. En la prctica es comn variar la forma y el contenido de
los interrogatorios de un grupo a otro. Dado que las personas de un grupo son
entrevistadas en conjunto, la respuesta de cada una de ellas est condicionada
por las dems. Los datos que se obtienen de tres grupos cada uno de ellos con
cinco personas, no son equivalentes a los datos que se obtienen de 15 entrevistas
individuales seleccionadas al azar, debido a que los grupos son muestras de
conglomerados por cuotas.
Muestras de intercepcin de centros comerciales
Este muestreo es otra tcnica del muestreo no probabilstico de uso
generalizado. Busca a los entrevistados, para realizarles entrevistas individuales
(utilizando cuotas asignadas) en sitios fijos de centros comerciales. En la prctica
es comn que en una investigacin se utilicen varios centros comerciales con
diferente nivel socioeconmico en varias ciudades.
Estas muestras son utilizadas frecuentemente en estudios de magnitud moderada
(100 a 200) carcter experimental. Se emplean, por ejemplo, para comparar las
respuestas de dos o ms centros comerciales, dos o ms conceptos del producto,
etc. y no para estimar los parmetros de una sola poblacin existente. Estas
muestras deben de ser de carcter informativo para tales propsitos, bajo el
supuesto de que las diferencias resultantes en el experimento no dependan en
gran parte de las caractersticas de la muestra.
68
xi yi
xy
i 1
n
n
xi2
i 1
yi2
2 i 1
x
n
rechazar esta hiptesis, ntese que en esta segunda fase del ejemplo se pretende
llegar a una decisin correcta y no estimar un parmetro. Nuevamente se est
dependiendo de la teora estadstica para obtener as una medida que precise la
decisin a tomar.
En esta antologa se presentan de manera general algunas de las pruebas de
hiptesis tales como para proporciones, para probar independencia y
homogeneidad.
4.2.1 Prueba de hiptesis para proporciones
Las pruebas de hiptesis relacionadas con proporciones son utilizadas en
diversas reas. Por ejemplo, un candidato a diputado est interesado en conocer
la proporcin de personas que votarn a su favor; un fabricante de zapatos desea
saber la proporcin de artculos defectuosos cuando se realiza un envi; un
fabricante de un determinado producto desea saber la proporcin de personas que
prefieren su producto, etc. Analizaremos como se llevan a cabo estas pruebas de
hiptesis para proporciones.
Se probar la hiptesis de que la proporcin de xitos de un experimento binomial
sea igual a un valor especfico, es decir, la hiptesis nula ser p p0 , donde p
es el parmetro de la distribucin binomial y la hiptesis alterna ser cualquiera de
las siguientes p p0 , p p0 p p0 , bilateral o unilateral segn sea el caso.
El estadstico en el cual se basa el criterio de decisin es la variable aleatoria
binomial X = nmero de xitos observados en una muestra de tamao n.
Aunque tambin se puede utilizar el estadstico p X / n , valores de X lejanos de
la media np0 produce el rechazo de la hiptesis nula, debido a que X es una
variable binomial discreta, es muy poco probable que se establezca una regin
crtica exactamente igual al valor de , por tal motivo es preferible basar las
decisiones en los valores de P.
Cuando n es pequea se utiliza la tabla o la formula binomial real. Cuando n es
grande se utilizan aproximaciones, si el valor de p0 se encuentra muy cerca de 0
de 1 se puede usar la distribucin Poisson con parmetro np0 . Tambin puede
ser utilizada la distribucin normal con parmetros np0 y
np0 q0 , sta es
x np0
np0 (1 p0 )
72
Ejemplo.
Una empresa refresquera distribuye dos marcas de refresco, marca A y marca B, y
afirma que el 20% de los consumidores en Xalapa prefieren la marca A. Para
probar esta afirmacin se tom aleatoriamente una muestra de 120 personas y se
les pregunt que marca prefieren. Si 36 de los 120 responden que prefieren la
marca A, qu conclusin puede obtenerse?, Con un nivel de significancia de
0.05.
Solucin
Las hiptesis que se plantean son:
H0 : p 0.20
H1 : p 0.20
Donde
n 120 , p0 0.20 , x 36
np0 120(0.20) 24
Como n es muy grande, se utiliza la distribucin normal.
La regin crtica z < -1.96 y z > 1.96
Z
0
x np0
np0 (1 p0 )
36 24
120(0.20)(0.80) 2.7386
Conclusin.
Se rechaza H 0 , es decir, que los consumidores de refresco en Xalapa que
prefieren la marca A no es igual al 20%.
...
Bj
N1j
n2j
:
:
nij
:
:
nrj
n+j
...
...
Bc
nic
n+c
n1+
n2+
:
:
ni+
:
:
nr+
n++
representa la clasificacin
Tambin a esta tabla se le puede agregar otra que represente las probabilidades
observadas.
Tabla 5.Tabla de probabilidades observadas
B1
B2
B3
B
...
A
A1
A2
:
:
Ai
Pi1
Pi2
:
:
Ar
P+1
P+2
Bj
N1j
n2j
:
:
Pij
:
:
Prj
P+j
...
...
Bc
Pic
P1+
P2+
:
:
Pi+
:
:
Pr+
1
75
Donde Pij es la proporcin total de la muestra que cae dentro de cada casilla, esto
es:
Pij nij / n ; por lo tanto i j Pij 1
A este conjunto de probabilidades se le denomina distribucin conjunta. A los
totales de las filas y de las columnas se le denomina distribuciones marginales, es
decir, Pi y P j , que se obtienen sumando las filas y las columnas, esto es:
P
i
ij
ij
/ n y que Pi P j 1.
Ejemplo.
Suponga que mediante una tabulacin cruzada se discute el punto de que el
dueo de una rasuradora elctrica (variable dependiente) est con ms frecuencia
entre los hombres de menos de 40 aos que entre los que tienen 40 aos o ms
(variable independiente). Se tom una muestra de tamao 500. Los datos
observados se presentan a continuacin:
Tabla 6. Datos observados
Poseen rasuradora
elctrica
Si (B1)
No (B2)
Total
A1
40 aos o menos
50 (20%)
200 (80%)
250
Grupo de edad
A2
Mayores de 40 aos
25 (10%)
225 (9%)
250
A3
Total
75
425
500
A1
40 aos o menos
0.1
0.4
0.5
Grupo de edad
A2
Mayores de 40 aos
0.05
0.45
0.5
A3
Total
0.15
0.85
1
i Pi = 0.15+0.85 = j P j =0.5+0.5 = 1
La Tabla 6 refleja que un 20% de los hombres que tienen 40 aos o menos poseen
una rasuradora elctrica, un 10% de los hombres mayores de 40 aos poseen una
rasuradora elctrica, etc.
Puede suceder que estos resultados no sean satisfactorios para el analista y
desee encontrar una relacin mejor, supongamos que l piensa que el factor
ingreso puede explicar mejor la obtencin de una rasuradora.
La Tabla 6 se modificara de la siguiente manera:
Poseen
rasuradora
elctrica
Si
No
Total
Ingresos de $300,000 o ms
40 aos o
Ms de 40
menos
aos
30
15
70
85
100
100
ei
Donde oi representa las frecuencias observadas y ei las frecuencias esperadas
que se obtienen multiplicando la probabilidad de cada celda por el total de
observaciones.
Ejemplo:
Tomando como referencia el ejemplo de las rasuradoras de la seccin anterior,
suponga que el investigador desea saber si la variable de uso de rasuradoras
elctricas es independiente de la edad de las personas. Las frecuencias
observadas se presentan a continuacin:
Tabla 8. Tabla de frecuencias observadas
Uso
de
A1
rasuradora
elctrica
< de 25
Si usan (B1)
50
No usan (B2)
65
Total
115
A2
25-39
75
60
135
Grupo de edad
A3
40-54
95
35
130
A4
> de 54
30
90
120
Total
250
250
500
Solucin:
H 0 : Existe independencia entre las variables
H1 : No existe Independencia entre las variables
Las frecuencias marginales son:
P(A1) = 115/500
P(A2) = 135/500
P(A3) = 130/500
P(A4) = 120/500
Si la hiptesis nula es verdadera y las dos variables son independientes se
debera tener:
P(A1,B1) = (115/500) (250/500) = 0.115
P(A1,B2) = (115/500) (250/500) = 0.115
P(A2,B1) = (135/500) (250/500) = 0.135
P(A2,B2) = (135/500) (250/500) = 0.135
P(A3,B1) = (130/500) (250/500) = 0.13
P(A3,B2) = (130/500) (250/500) = 0.13
P(A4,B1) = (120/500) (250/500) = 0.12
P(A4,B2) = (120/500) (250/500) = 0.12
= 1.00
Las frecuencias esperadas son:
e1= (0.115)(500) = 57.5
e2= (0.115)(500) = 57.5
e3= (0.135)(500) = 67.5
e4= (0.135)(500) = 67.5
e5= (0.130)(500) = 65
e6= (0.130)(500) = 65
e7= (0.120)(500) = 60
e8= (0.120)(500) = 60
Grupo de edad
A2
A3
25-39
40-54
75 (67.5)
95 (65)
60 (67.5)
35 (65)
135
130
A4
> de 54
30 (60)
90 (60)
120
Total
250
250
500
79
El estadstico 2 .
2 (50 - 57.5)2 /57.5 + (75 - 67.5)2 /67.5 + (95 - 65)2 /65 + (30 - 60)2 /60 + (65 - 57.5)2 /
57.5 + (60 - 67.5)2 /67.5 + (35 - 65)2 /65 + (90 - 60)2 /60
61.3155
Xalapa
65
45
93
Ciudad
Veracruz
Poza Rica
66
40
30
33
54
54
Crdoba
34
42
24
H0 :Las opiniones entre las cuatro ciudades relacionadas con la nueva bebida son
las mismas.
H1 :Al menos una opinin entre las cuatro ciudades relacionada con la nueva
bebida no es la misma.
La tabla de frecuencias observadas y esperadas es la siguiente.
Opinin
Xalapa
A favor
En contra
Sin opinin
Total
65
45
93
200
Ciudad
Veracruz
Poza
Rica
66
40
30
33
54
54
150
127
Crdoba
Total
34
42
24
100
205
147
225
577
(65 - 71)2 /71 + (45 - 51) 2 /51 (93 - 77.98)2 /77.98 (66 - 53.3)2 /53.3 + (30 - 38.2) 2 /
38.2
(54 - 58.5)2 /58.5 (40 - 45.1)2 /45.1 + (33 - 32.4)2 /32.4 + (54 - 49.5)2 /49.5 + (34 - 35.5)2 /
35.5
26.78
v (3 1)(4 1) 6 ; 2(0.01,6) 16.812
Conclusin.
Como 2 2 , rechazamos H 0 por lo tanto las opiniones no son homogneas.
81
1 = es el estimador de 1
82
Yi
Yi 2
XY
n X i 2 X i 2
i
0 Y 1 X
Donde X y Y son medias muestrales de X i y Yi .
Siempre que se lleve a cabo un anlisis de regresin, los investigadores tendrn la
necesidad de saber que tan bueno es, es decir, si la ecuacin de regresin explica
adecuadamente la variacin observada de la variable dependiente (Y). Para esto,
se calcula el coeficiente de determinacin ( R2 ). Este coeficiente puede tomar
valores entre 0 y 1; si R2 1 indica que la ecuacin de la regresin explica al 100%
la variacin que se da en la variable dependiente con relacin a su media, y
por lo tanto todos los residuos deben ser iguales a cero. Cuando R2 0 la ecuacin
de la regresin no se ajusta a los datos, y algunos residuos sern mayores de
cero.
Varianza total en la Varianza "no exp licada"
por
8
3
R2
Suma de
cuadrados
SCR
SCE
SCT
Grados de
libertad
1
n-2
n-1
Suma de
cuadrados medios
SCR/1
SCE/(n-2)
Donde:
SCR= 12 X i X 2
SCE= ei 2
SCT= Yi 2
El estadstico calculado es el siguiente:
F
c
2 X X 2 /1
1
ei
(n 2)
84
Ejemplo.
Se entrevistaron a 10 familias de la ciudad de Coatepec, con el nico propsito de
estudiar la relacin entre el consumo de la leche y los ingresos, para saber si el
consumo familiar de leche aumenta o disminuye conforme se incrementan los
ingresos anuales. El consumo de leche es la variable dependiente, en los datos
que se obtuvieron se observa que sta vara en cada familia. Esta variacin
puede ser explicada por el ingreso?
Familia
Consumo mensual
de leche (litros)
4
8
10
5
6
7
12
11
9
13
1
2
3
4
5
6
7
8
9
10
Y
i
2
Familia
1
X
Y
Y
10
4
16
XY
40
85
145
14.5
8.5
2
X
100
Y Y
i
Yi Yi
Yi
Yi
Xi X
Yi
X 2
i
-4.5
20.25
4.3272
-0.3272 0.10705984
-4.5
20.25
14
64
196
112
-0.5
0.25
8.0364
-0.0364 0.00132496
-0.5
0.25
15
10
100
225
150
1.5
2.25
8.9637
1.0363 1.07391769
0.5
0.25
11
25
121
55
-3.5
12.25
5.2545
-0.2545 0.06477025
-3.5
12.25
12
36
144
72
-2.5
6.25
6.1818
-0.1818 0.03305124
-2.5
6.25
13
49
169
91
-1.5
2.25
7.1091
-0.1091 0.01190281
-1.5
2.25
17
12
144
289
204
3.5
12.25
10.8183
1.1817 1.39641489
2.5
6.25
16
11
121
256
176
2.5
6.25
9.891
1.229881
1.5
2.25
18
81
324
162
0.5
0.25
11.7456
-2.7456 7.53831936
3.5
12.25
10
19
13
169
361
247
4.5
20.25
12.6729
0.3271 0.10699441
4.5
20.25
Suma
145
85
805
2185
1309
2185
2
X
i
Yi
Yi
X i Yi
11.56330
82.5
11.5636365
Yi
1309
1.109
82.5
Y 2 82.50
X i
X 82.50
85
R2
82.50 11.5633
0.86 82.50
0.8598
= -4.945 + .92727 * x
14
12
10
10
12
14
16
18
20
INGRESO ANUAL
Suma de
cuadrados
70.9405
11.5595
82.50
Grados de
libertad
1
8
9
Suma de
cuadrados medios
70.9405
1.4449
70.9405
1.4449 49.10
El tamao de la muestra que se utilice en este tipo de anlisis debe de ser cuando
menos el doble o el triple de las variables medidas.
En el anlisis de regresin lineal mltiple tratamos de encontrar la recta que mejor
se ajuste a un conjunto de datos. En este caso se trata de tres dimensiones y la
expresin que mejor se ajuste ser un plano bidimensional.
La ecuacin de regresin mltiple que se utiliza es:
Y 0 1 X1 2 X 2 3 X 3 pXp
Donde Y es la variable dependiente y X1 , X
, X
, , X
YX 1 X 2 2 YX 2 X1 X
X12 X 2 2 X1 X 2
YX 2 X12 YX 1 X1 X
X12 X 2 2 X1 X 2
para
0 y 1 x1 2 x2
88
729
y 91.125
Pizzera
Y=
X 1= x
X12
1
220
x1 27.5
X 2= x
2
x2
Cupo
50
34
42
42
45
22
30
24
289
x 2 36.125
X22
YX1
YX2
X1X2
13.875
4.5
20.25
13.875
192.516
62.4375
192.516
62.4375
-4.125
-5.5
30.25
-2.125
4.51563
22.6875
8.76563
11.6875
-1.125
-4.5
20.25
5.875
34.5156
5.0625
-6.6094
-26.4375
18.875
7.5
56.25
5.875
34.5156
141.5625
110.891
44.0625
15.875
1.5
2.25
8.875
78.7656
23.8125
140.891
13.3125
-11.125
-1.5
2.25
-14.125
199.516
16.6875
157.141
21.1875
-31.125
-5.5
30.25
-6.125
37.5156
171.1875
190.641
33.6875
-1.125
3.5
12.25
-12.125
147.016
-3.9375
13.6406
-42.4375
728.875
439.5
807.875
117.5
Suma
174
YX 1 X 2 2 YX 2 X1 X 2
1
x1
Precio
32
22
23
35
29
26
22
31
y
# de clientes
105
87
90
110
107
80
60
90
X X X
1
2 2
X2
(439.5)(728.875) (807.875)(117.5)
(174)(728.875) (117.5)2
1.994
89
YX 2 X1 2 YX 1 X1 X
(807.875)(174) (439.5)(117.5)
X X X
1
X2
(174)(728.875) (117.5)2
0.7869
x
32
22
23
35
29
26
22
31
220
yi 91.125
x
50
34
42
42
45
22
30
24
289
y
105
87
90
110
107
80
60
90
729
2
R2
Y2
Y
111.016
78.4856
86.7748
110.7028
101.0995
77.0188
75.338
88.5626
728.9981
y 1912.88
1912.88 400.6069
1912.88
192.516
17.0156
1.26563
356.266
252.016
123.766
968.766
1.26563
1912.88
yi
Yi
36.192256
72.49500736
10.40191504
0.49392784
34.81590025
8.88755344
235.254244
2.06611876
400.6069227
400.6069
0.7906
91
94
LIBRE
FLOTANTE
Caractersticas
Un predictor es montono, si sus categoras pertenecen a una escala
ordinal, lo que en otras palabras quiere decir, que slo dos categoras
contiguas pueden ser colapsadas.
Si tenemos un predictor con categoras en escala nominal, este es un
predictor libre, ya que se puede agrupar cualquier par de categoras del
predictor. Se utiliza, cuando las categoras del predictor no tienen una
ordenacin natural.
Cuando todas las categoras del predictor, pertenecen a una escala ordinal
menos una de ellas, de las que se desconoce la posicin en la escala
ordinal, entonces tendremos un predictor flotante. En otras palabras, un
predictor flotante, es un predictor montono con una categora flotante de la
cual, no se conoce su posicin.
CC
2
n2
del cual se dice que es igual a cero, cuando hay independencia absoluta entre
las variables, pero no es igual a 1 cuando hay dependencia total (su valor
mximo depende del nmero de categoras de las variables)
CC max r 1
r
donde: r es mnimo entre el nmero de filas y de columnas.
96
Tamao Antes (TA). Se establece un tamao mnimo, para que un grupo pueda
segmentarse, es decir, si un grupo G cualquiera, es menor que TA en
individuos, el grupo no se segmenta y se declara terminal.
Tamao Despus (TD). Se establece un tamao mnimo para que un subgrupo
pueda formarse, es decir, si algn grupo formado en la segmentacin de G,
digamos Gj, tiene menos de TD individuos, la segmentacin es descartada.
Filtro de Nivel (FN). Se establece un mximo de nmero de niveles de
segmentacin, tambin denominados niveles de profundidad. Una
segmentacin con un solo nivel resulta demasiado simple, pero por otro lado
una segmentacin de muchos niveles puede resultar compleja de manejar.
Un resultado de aplicar el mtodo CHAID es el denominado, Diagrama de rbol,
como el que se muestra en la Figura 15.
De tal forma, que indistintamente del tipo de predictor, para variables dependientes
nominales, en el proceso de agrupamiento de categoras, los pares elegibles de la
variable predictora y la variable dependiente, realizan la correspondiente prueba
de independencia, como usualmente lo considera el algoritmo de KASS, es decir,
las frecuencias estimadas se plantean como
H1 : log fij ij ij .
Por otra parte, si ahora suponemos que el modelo existe para una variable
predictora, es posible contrastar la hiptesis nula de independencia, contra un
modelo C de asociacin no saturado.
logfij i j j yi y
donde se cumple:
i
R
C
j
0 , los j
(4.1)
desconocidos.
El modelo
(4.1), tiene IJ 1 (J 1) (I 1) (J 1) (I 2)(J I ) grados de
libertad, y es no saturado cuando I 2 . El modelo de independencia, es un caso
especial de este modelo y considera todos los j 0 , de no cumplirse la
independencia, el trmino de asociacin refleja la desviacin de las frecuencias
esperadas, respecto del modelo de independencia. Los parmetros de efectos
columna j , pueden ser interpretados como sigue: dentro de una columna
cualquiera, la desviacin de las frecuencias esperadas de independencia, son una
funcin lineal de la variable ordinal, representada por un puntaje j . Si j 0 ,
entonces en la columna j, la probabilidad de clasificacin por arriba de y en i, es
99
dj'
log
dj
cj '
j ' yd yc
100
REFERENCIAS
A.Aaker, D. y S. Day, G. 1994. Investigacin de Mercados. Tercera Edicin.
Editorial Mc Graw Hill. Mxico.
Agresti, A. 1984, Analysis of Ordinal Categorical Data. Wiley and Sons.
Breiman, l., Friedman, j., Olsen, r. y Stone, C. 1984: Classification and Regression
Trees. Chapman and Hall.
Bovd. Westfall y Stasch, 1987, Investigacin de Mercados, texto y casos, Mxico.
Editorial UTHEA.
Caldern M. M. 2006, El Anlisis de tems: Comprobacin de la fiabilidad y
validacin del constructo. Tesis de Licenciatura. Facultad de Estadstica e
Informtica. Universidad Veracruzana.
Draper N.R. and Smith H. 1981, Applied Regression Analysis, New York. Editorial
Whiley and Sons Inc.
Frank R.E. Kuehn A. A., Masinv W. S., 1980, Anlisis de Mercados, tcnicas
cuantitativas Mxico, Editorial Trillas.
Fischer de la Vega, L. y Navarro, A.E.1996. Introduccin a la Investigacin de
Mercados. Tercera edicin. Editorial Mc Graw Hill. Mxico, D.F.
Garca E, et. al.. 2000, Anlisis Factorial. Madrid: La Muralla.
Hayes, B.E. 2003. Cmo medir la satisfaccin del cliente. Diseo de encuestas,
uso y mtodos de anlisis estadstico. Segunda edicin. Editorial Oxford. Mxico.
Jonhson R., 1991, Estadstica Elemental, Mxico, Editorial Trillas.
Kass, G. 1980, An Exploratory Technique for Investigating Large Quantities of
Categorical Data. Applied Statistics, 29, 2, 199-127.
Kinnear C. T. y Taylor R. J., 1981, Investigacin de Mercados, Mxico, Editorial
McGraw-Hill Latinoamericana, s.a.
Kotler, P. 1988, Marketing Management 6a ed. Prentice Hall. New Jersey.
Morgan, J. y Sonquist, J. 1963, Problems in the Analysis of Survey Data and A
Proposal. Journal of the American Satistical Association. 67, 768-772.
Scheaffer, Mendenhall, Ott, 1987, Elementos de Muestreo, Mxico, Grupo Editorial
Iberoamericana.
101
102
ANEXO
103
Tamao de muestra
La determinacin del tamao de muestra es un tema que ha dado origen a mucho
trabajo investigativo por parte de los estadsticos. Dado que el tamao de muestra
depende de muchos factores, varias soluciones tericas enfrentan dificultades
prcticas o restricciones de costo. Los factores ms importantes que deben tomarse
en cuenta para la determinacin del tamao de muestra son:
1)
2)
3)
4)
PARMETRO
DE INTERS
MUESTREO
ALEATORIO SIMPLE
Estimar
FRMULA PARA EL
TAMAO DE MUESTRA
z2 2 2
n
Estimar
B2
pq
z2 2
B2
ALEATORIO
ESTRATIFICADO
Ni
i1
wi
wi
/2
es un valor de
V (x
Ni i
st
ni
n
N
i1
si
N 2
i1
/2
s2 N
2 i
N
i1
L
i1
Ni2
pi qi
w
N D Ni pi qi
2
i1
Ni
Ni i2
ni
Estimar p
j 1
V (st )
i1
xij xi
L
Ni
ni
i1
1
1
2
2 si
n
i
Estimar
tablas que
z 2 N
n
Estimar
z2 2
B2
Estimar p
MUESTREO
DONDE:
1
V ( pst )
L
2
i1
N n
Ni
Ni
p q
n
i
104
TIPO DE MUESTREO
MUESTREO POR
CONGLOMERADOS
PARMETRO
DE INTERS
Estimar
FRMULA PARA EL
TAMAO DE MUESTRA
DONDE:
N c2
B2M
xi x Mi
sc
i1
n 1
n
M
m 1 i
n
Estimar
usando M x
N c2
B
Nz
sc2
2
c
xi
i1
i1
xM i
n 1
/2
estimar
usando N xt
N t2
B2
Nz2 / 2
Estimar p
2
t
N c
B M
z2
sc
ai pM i
i1
n 1
105