You are on page 1of 111

INVESTIGACIN DE MERCADO Y

SATISFACIN DEL CLIENTE

CONTENIDO
Pg.
Introduccin
Objetivos

1
3

UNIDAD 1. ESTUDIOS DE MERCADO Y SATISFACCION DE CLIENTES


1.1 Desarrollo histrico
1.2 Naturaleza de la Investigacin de Mercados
1.3 La estadstica en los negocios y la mercadotecnia
1.4 Caracterizacin de los clientes y usuarios
1.5 Necesidades y satisfaccin de clientes
1.6 Preguntas de repaso

4
4
6
10
13
15
17

UNIDAD 2. DISEO DE ESTUDIOS DE MERCADO Y SATISFACCION DE


CLIENTES
2.1 Aspectos generales
2.2 Tipos de investigacin de mercados
2.3 Proceso de la investigacin
2.4 Levantamiento de datos
2.4.1 La observacin
2.4.2 La encuesta
2.4.2.1 Cuestionario
2.4.2.2 La entrevista
2.5 Confiabilidad y validez
2.5.1 Confiabilidad
2.5.2 Validez
2.6 Actividades de la unidad

18

UNIDAD 3. ESQUEMAS BSICOS DE MUESTREO


3.1 Introduccin
3.2 Muestreo probabilstico
3.2.1 Muestreo aleatorio simple
3.2.2 Muestreo sistemtico
3.2.3 Muestreo aleatorio estratificado
3.2.4 Muestreo por conglomerados
3.3 Muestreo No Probabilstico
3.3.1 Muestreo a conveniencia
3.3.2 Muestreo a criterio o dirigido
3.3.3 Muestreo de bola de nieve
3.3.4 Muestreo por cuotas
3.3.5 Formas especiales del muestreo no probabilstico
3.4 Actividades de la unidad

51
51
52
52
55
57
59
62
63
63
64
65
67
68

18
18
19
21
21
22
22
30
34
34
50

UNIDAD 4. ANLISIS ESTADSTICO BSICO DE INVESTIGACIN DE


MERCADOS
4.1 Anlisis estadstico exploratorio y descriptivo
4.1.1 Anlisis univariado y bivariado
4.1.2 Correlacin lineal
4.2 Inferencia estadstica bsica
4.2.1 Prueba de hiptesis para proporciones
4.2.2 Anlisis de tablas de contingencia
4.2.3 Hiptesis de independencia
4.2.4 Hiptesis de homogeneidad
4.3 Anlisis de regresin
4.3.1 Anlisis de regresin lineal simple
4.3.2 Anlisis de Regresin Lineal Mltiple
4.4 Anlisis de Segmentacin
4.4.1 Algoritmo de Segmentacin CHAID
4.5 Actividades de la unidad

69
69
69
70
71
72
74
78
80
81
82
87
91
93
100

REFERENCIAS

101

ANEXO

103

Introduccin
La investigacin de mercados, hoy en da, se ha constituido como la
herramienta ms poderosa del mundo empresarial. Su fin esencial, est
enmarcado en la bsqueda de los niveles de aceptacin de un producto y de los
aspectos que se deben considerar a futuro en su diseo y fabricacin. Si tomamos
en cuenta que vivimos en una sociedad rodeada de productos, podremos
comprender la importancia que tiene investigar cul es el mercado para dichos
productos, y cmo este mercado se comporta.
Por esto, se requiere de todo un instrumental tcnico y del manejo de una teora
que habilite al estudioso en tal disciplina. Significa entonces que la investigacin
de mercados no es slo un desarrollo cuantitativo, sino que requiere de un
tratamiento especial en la ciencia Estadstica para el manejo de informacin.
Ciertamente, la Estadstica ha provisto a sus seguidores dentro de la investigacin
de mercados, de elementos necesarios que sustentan la base de la Mercadotecnia
en su esfera cuantitativa. Cada necesidad de la Mercadotecnia es respondida por
un cuantioso nmero de alternativas (tcnicas y mtodos) que le corresponden a
la Estadstica. Tales alternativas van desde la elaboracin de una encuesta,
pasando por su diseo, aplicacin y valoracin, muestreo, pruebas de hiptesis,
tabulacin cruzada, hasta el anlisis de regresin y el uso de tcnicas
multivariadas.
De esta manera, para la investigacin de mercados el Estadstico es el profesional
que la lleva a sus fines ulteriores; y para este significa desarrollarse como tal y
ampliar el campo de trabajo junto con las perspectivas de desarrollo de la misma
ciencia, ya que ante todo, existe una retroalimentacin entre la ciencia y la
investigacin, aun cuando esta ltima no sea pura. Cuando hablamos de
desarrollo, nos referimos a un gran reto, no significa solamente extenderse y
abarcar indistintamente cualquier aspecto de la Mercadotecnia (entendida esta
como el conjunto de tcnicas, procedimientos y teoras para el estudio del
mercado), sino ms bien debemos referirnos al desarrollo como un mejoramiento
en todos los sentidos de las tcnicas estadsticas que optimicen los fines de la
Mercadotecnia. Es decir, debemos ampliar el horizonte de la Estadstica y
adecuarlo a la expansin del mercado conforme este va desarrollndose.
Este desarrollo slo puede tener un indicativo tanto para investigadores como para
aquellos que requieren de estos ltimos; es decir, los empresarios: motivar la
bsqueda de actualizacin y aportacin en la Investigacin de Mercados. Estudiar
al mercado, encierra en s mismo un sin nmero de implicaciones que deben
culminar en la puesta en prctica de recomendaciones y acciones especficas.
Si se orienta la investigacin de mercados hacia campos de lucro, y si se hace
persiguiendo un fin social, en ambas formas tendramos que aceptar la
generalizacin del uso de la Estadstica. Cada da la extensin geogrfica y
1

poblacional exige adaptaciones generales en la que por supuesto los objetivos de


la empresa estn inmersos. El Estadstico apoyado en las categoras de
investigacin de mercados ofrece una respuesta ante estas interrogantes. Cabe
sealar que ni la investigacin de mercados es un rea absolutamente de la
ciencia Estadstica como tampoco la ciencia Estadstica lo es de la investigacin
de mercados. Sin embargo, debemos recalcar que dadas las caractersticas que
hay por investigar en el mercado, lo que se requiere es de la ciencia Estadstica, lo
que mejor responde a las necesidades del estudio de la evaluacin de gustos,
preferencias, necesidades, aspiraciones, etc.
Cabe notar el vnculo entre la Mercadotecnia y la Estadstica, por lo que el
presente trabajo abarca aspectos concretos de aplicacin de la Estadstica a la
Mercadotecnia.

Objetivos
Objetivo General
Que los estudiantes adquieran las competencias bsicas para el diseo y
desarrollo de la investigacin de mercado y de estudios de satisfaccin del cliente
en el marco de la gestin de la calidad.

Objetivos particulares
1. Que el estudiante conozca los diferentes mtodos para la obtencin de
informacin en la investigacin de mercado y la satisfaccin del cliente.
2. Que el estudiante aprenda a construir y validar instrumentos para evaluar la
satisfaccin del cliente.
3. Que el estudiante sepa como establecer la forma y el tamao de la muestra a
tomar en la investigacin de mercado y la evaluacin de la satisfaccin del
cliente.
4. Que el estudiante conozca mtodos estadsticos para el anlisis de la
informacin obtenida en la investigacin de mercado y evaluacin de la
satisfaccin del cliente.
5. Que el estudiante aprenda a elaborar reportes de estudios de mercado y
satisfaccin del cliente.

UNIDAD 1. ESTUDIOS DE MERCADO Y SATISFACCION


DE CLIENTES
1.1 Desarrollo histrico
El desarrollo de la investigacin de mercados inicia en la primera mitad del
Siglo XX. El comienzo formal fue entre los aos de 1910 y 1920. En este tiempo la
filosofa gerencial se fue definiendo en trminos de la promocin del consumo.
Entre los aos 1900 y 1930, el inters estaba enfocado hacia los problemas y
oportunidades asociadas con la produccin; entre 1930 y los ltimos aos de los
40 este concepto fue cambiando; la idea que se tena era que los problemas y
oportunidades estaban asociadas con la distribucin. Despus de la dcada de los
cincuentas la atencin se enfoc hacia las necesidades y deseos de los
consumidores.
Uno de los pioneros de la investigacin de mercados fue George Frederick, que en
1911 fund una firma de investigaciones llamada The Business Bourse. En este
mismo ao Charles Coolidge fue gerente de la Divisin de Investigaciones
Comerciales de la compaa Curtis Publishing. El xito que tuvo este investigador
fue la pauta para que muchas firmas industriales y medios de comunicacin
publicitarios crearan divisiones de investigacin de mercados. Es as como
muchos acadmicos son atrados por las empresas para dedicarse a desarrollar y
promover este tipo de estudios. Desde 1940 se publicaron un sinfn de libros de
investigacin de mercados. Despus de 1948 en Estados Unidos se formaron ms
de 200 organizaciones de investigacin de mercados.
El primer libro que se public en el campo de la investigacin comercial fue el del
profesor C. S. Duncan, de la Universidad de Chicago. En 1912 se public el libro
El Anlisis de Mercados de Percival White. Este tuvo mucho xito, se edit varias
veces. En 1937 se public La Investigacin y el Anlisis de Mercados de
Loyndon O. Brow; este libro fue el ms popular de ese tiempo (Kinner y Taylor,
1981).
El objetivo de la investigacin de mercados es el estudio de los problemas
relativos a los planes de produccin, publicidad y distribucin, con el propsito de
aumentar las ventas y disminuir los costos. Esta disciplina utiliza diversos cuerpos
de conocimientos tericos y metodolgicos, que incluyen la matemtica, la
estadstica, la informtica, la psicologa, la economa y la administracin. Debido a
la aceptacin de una visin amplia y multidisciplinaria, se pas a la mercadotecnia,
que ampli el papel de la investigacin poniendo nfasis en el contacto entre los
investigadores y el proceso de gerencia de mercados.
Los adelantos en la metodologa de la investigacin de mercados fueron paralelos
al desarrollo de la metodologa de la investigacin de las ciencias sociales. Los
psiclogos, economistas, estadsticos y administradores tuvieron gran influencia
4

en la metodologa de la investigacin de mercados; por tal motivo, su historia va


ligada al desarrollo histrico de las ciencias sociales. La investigacin de
mercados ha incorporado y aprovechado los conocimientos y la experiencia
adquirida en una gran variedad de disciplinas. La estadstica, la psicologa, la
sociologa, la economa y la administracin son las que han dado mayores
aportaciones a la investigacin de mercados. La estadstica es la que ofrece a las
investigaciones una base cientfica que permite obtener resultados tiles y con
slidos fundamentos cientficos. Junto a sta, las investigaciones de mercado han
usado el clculo de probabilidades, conceptos de economa poltica, tcnica
comercial, y, recientemente, los adelantos de la informtica.
Entre 1910 y 1920 se lograron los avances metodolgicos ms grandes: las
encuestas se hicieron muy comunes para la recopilacin de datos. Esta no es ms
que una de tantas tcnicas con las que cuenta la investigacin de mercados, pero
es muy importante ya que para casi todos los estudios de mercados se utilizan las
encuestas.
Durante la dcada de los treinta, el muestreo se convirti en un asunto
metodolgico muy serio. A medida que el anlisis estadstico se desarroll ms
all de la estadstica descriptiva (clculo de medias, varianzas, correlacin simple
y construccin de nmeros ndice de precios) hasta alcanzar un nfasis en la
estadstica inferencial, los procedimientos probabilsticos fueron dominando el
escenario. El muestreo probabilstico fue aceptado poco a poco en este periodo.
Durante las dcadas de los cincuenta y sesenta ocurri un cambio importante: la
aparicin de la computadora y su utilizacin a gran escala. Este hecho aument la
innovacin metodolgica, especialmente en el rea de la investigacin
cuantitativa. En respuesta a esto, aparecieron revistas especializadas de
mercadotecnia e investigacin publicitaria. En estos aos, los investigadores
empezaron a publicar sobre tcnicas experimentales y se fue configurando una
metodologa ms cientfica para contestar las preguntas de la investigacin en
mercadotecnia.
Entre 1960 y 1970 se concedi mayor importancia a la construccin de modelos
para facilitar la toma de decisiones y se incluyeron aplicaciones de la computadora
en el anlisis de la informacin. En 1966, los profesores Paul Green y Donald Tull
publicaron un libro que enfatizaba los avances metodolgicos que se haban
logrado en la investigacin de mercados. Entre 1970 y 1986 se perfeccionaron los
conceptos y mtodos de la investigacin cualitativa para explicar y pronosticar el
comportamiento de los consumidores. En 1974 apareci una revista sobre
investigacin del consumidor, auspiciada por una lista de organizaciones de las
ciencias sociales. Esta publicacin refleja el creciente nfasis en la investigacin
del comportamiento del consumidor en el comercio, el gobierno y la academia.

1.2 Naturaleza de la investigacin de mercados.


Antes de dar una definicin de investigacin de mercados, es importante
aclarar la definicin clsica de mercado: Es el conjunto de personas o unidades
de negocios que consumen/utilizan un producto o servicio, o las que se pueden
inducir a que lo consuman/utilicen.
De esta forma, a continuacin se mencionan algunas definiciones de investigacin
de mercados:
Un enfoque sistemtico y objetivo del desarrollo y la provisin de informacin
aplicable al proceso de toma de decisiones en la gerencia de mercadeo. (Kinnear
y Taylor)
Reunin, registro y anlisis de todos los hechos acerca de los problemas
relacionados con la transferencia de bienes y servicios del productor al
consumidor. (Boyd)
Anlisis sistemtico de problemas, construccin de modelos y hallazgos de
hechos que permiten mejorar la toma de decisiones y el control en el mercado de
bienes y servicios. (Kotler)
Recoleccin, tabulacin y anlisis sistemtico de informacin referente a las
actividades de mercadotecnia, que se hace con el propsito de ayudar al ejecutivo
al ejecutivo a tomar decisiones que resuelvan sus propsitos de negocios.
(American Marketing Association).
Las cuatro definiciones mencionadas coinciden en tres aspectos importantes:
Registro sistemtico, es decir, un proceso ordenado en etapas.
Obtencin de informacin del mercado.
Importancia para la toma de decisiones.
La investigacin de mercados, es una de las funciones de marketing consistente
en la obtencin sistemtica de informacin con el objeto de poder tomar
decisiones de carcter comercial acertadas. Por lo tanto, la investigacin de
mercados est integrada en el sistema de marketing de la empresa.
Podemos definir la investigacin de mercados, como la tcnica comercial que
tiene como finalidad el estudio analtico de la problemtica que hace referencia a
la planificacin de la fabricacin, produccin, distribucin y apoyo promocional y
publicitario de los productos o servicios de una empresa con el objeto de reducir al
mximo el riesgo comercial e incrementar las ventas lo mximo posible.

Integracin de la investigacin de mercados dentro del sistema de marketing


de la empresa
Entorno
Son todas aquellas variables sobre los que la empresa no puede ejercer un control
y no podr utilizarlas para alcanzar sus fines comerciales. A pesar de no poder
ejercer un control, la empresa debe estudiarlas as como analizar su evolucin.
Marketing mix
Est compuesto por las variables sobre las que la empresa puede ejercer un
control. La empresa tendr que tomar sus decisiones sobre los distintos
componentes del marketing mix: poltica de producto, poltica de precios, poltica
de distribucin, promocin y publicidad.
Respuesta del mercado
Las acciones de la empresa sobre el mercado, as como su estrategia comercial
produce efectos sobre los componentes del mercado: consumidores,
distribuidores, prescriptores, competencia. As pues, el resultado de las acciones
de la empresa influir sobre la intencin de compra, conocimiento del producto,
imagen de la empresa, etc.
Resultados de la empresa.
La aplicacin de la estrategia comercial de la empresa, unida a la respuesta del
mercado en un entorno del mercado determinado, permitir obtener unos
resultados los cuales se miden a travs de: volumen de ventas, margen, beneficio,
cash flor, etc.
Investigacin de mercados.
La investigacin de mercados contribuye a la planificacin, ejecucin y control de
las funciones del marketing. En la fase de planificacin debe aportar la informacin
necesaria sobre el mercado, para establecer la estrategia a ejecutar. En la fase de
ejecucin debe definir las acciones a llevar a cabo para lograr las estrategias
comerciales establecidas. Y por ltimo, en la fase de control realizar el
seguimiento de las acciones comerciales realizadas y la determinacin del grado
de cumplimiento de los objetivos comerciales prefijados.

ESQUEMA DE LA INTEGRACIN DE LA INVESTIGACIN COMERCIAL EN EL


MARKETING MIX DE LA EMPRESA Y EL PROCESO DE TOMA DE
DECISIONES.
ENTORNO

INFLUYEN

Situacin econmica
Tecnologa
Aspectos legales y polticos
Publicidad
Aspectos sociolgicos
Competencia
Ventas
Etc.

ELEMENTOS DEL
MIX
Precio
Producto

Promocin
Distribucin

Proceso de decisin en la investigacin comercial:


1. Anlisis de alternativas
2. Aplicacin
3. Control de resultados
RESPUESTA DEL MERCADO

Ventas, cuotas de mercado, costes, beneficio

La investigacin de mercados dentro del proceso planificador de la empresa


La investigacin de mercados al constituir la base del plan de marketing y
este del plan de la empresa constituye un elemento fundamental en la
planificacin de la empresa. La empresa antes de lanzar un producto necesita
conocer las necesidades del consumidor, para ello se utilizan tcnicas de
investigacin de mercado.
Si la decisin es fabricar un producto, se llevar a cabo una fabricacin piloto. El
mismo se someter a tests de mercado, para obtener informacin sobre el
rechazo o no del producto en el mercado o las modificaciones necesarias para su

aceptacin. Una vez elaborado el producto final se elaborar el plan de marketing


definitivo, que agregar todas las polticas comerciales.
Por lo tanto, si la investigacin comercial nos hubiera proporcionado informacin
errnea sobre los productos/mercados, el plan de marketing tambin estara
equivocado as como el plan de la empresa. Lo que indica la importancia clave de
la investigacin de mercados sobre el plan de la empresa.
En cuanto al mbito de aplicacin de la investigacin de mercados, los estudios de
mercado tienen su mbito de aplicacin en las reas definidas a continuacin. Si
bien los objetivos buscados son variados en cada una de las reas: mercado,
producto/servicio, precio, consumidor, publicidad, promociones, distribucin.
Ventas, cuotas de mercado, costos, beneficio
Tipos de estudio de mercado en funcin del componente de marketing mix a
estudiar.
Estudios sobre el mercado.
Las tcnicas de investigacin de mercados pueden utilizarse para delimitar el
mercado real y el potencial. Para ello se suele utilizar dos metodologas: Anlisis
basado en series estadsticas y anlisis basado en encuestas.
Para el anlisis de las penetraciones de mercado y ventas reales los mtodos que
se utilizan son ndices Nielsen o Shop Audit.
Estudios sobre el producto.
Los fines fundamentales son determinar la aceptacin que tienen los
productos/servicios en el mercado, la marca con la que se comercializar, los usos
que darn los consumidores al producto. Para ello se utilizan los paneles o
barmetros de marcas.
Por otra parte tambin se pueden realizar estudios para determinar el aspecto del
producto: tamao, forma, packaging. Se suelen utilizar tcnicas de
experimentacin comercial.
Estudios sobre los precios.
El anlisis sobre los precios a los que se puede vender el producto en el mercado,
suele estudiarse mediante las tcnicas de experimentacin comercial. Los
estudios sobre precios no deben realizarse a travs de encuestas puesto que no
tienen gran valor, ya que el encuestado no se encuentra ante una situacin real de
9

compra y por lo tanto podra estar dispuesto a pagar un precio diferente al


manifestado en la encuesta.
Estudios sobre el consumidor.
Es de vital importancia conocer las necesidades del consumidor, sus costumbres,
hbitos de compra, etc. Para analizar las costumbres de compra se puede utilizar
como tcnica de investigacin de mercados la observacin directa; y el panel o
el barmetro de marcas para conocer los hbitos del consumidor.
Si lo que queremos es conocer las opiniones del consumidor sobre un producto o
las necesidades, la mejor tcnica a utilizar sera la encuesta: personal, telefnica,
postal.
Estudios sobre la publicidad/promocin.
Existen dos tipos de estudio, por un lado estaran los estudios pretest que
seran previos a la campaa para analizar las motivaciones de los clientes y los
estudios postest que mediran la eficacia de las campaas publicitarias. Las
tcnicas son muy variadas y las ms utilizadas son la encuesta telefnica Day
alter recall.
Estudios sobre la distribucin.
El objetivo puede ser analizar la eficacia del canal de distribucin y su rentabilidad,
se suelen utilizar estudios documentales o bien analizar la opinin de los
componentes del canal, mayoristas, minoristas utilizando tcnicas como la
encuesta o delphis.
Si el inters del investigador es analizar la colocacin del producto en el punto de
venta para trabajos de merchandising, se pueden utilizar tcnicas como los ndices
de presencia en el punto de venta.

1.3 La estadstica en los negocios y la mercadotecnia


Existe alguna discrepancia acerca de las tcnicas estadsticas que forman
parte de la metodologa de la investigacin de mercados. Mientras que, por un
lado, se afirma que sin muestreo, la investigacin de mercados tal como la
conocemos actualmente no existira. Por el otro, se dice que un estudio de
mercado puede limitarse a una investigacin sin dar lugar a ningn estudio
muestral. La primera afirmacin est basada en la idea de que cada estudio de
mercado necesita de una muestra representativa de la poblacin objetivo. Tal es el
10

caso cuando se decide lanzar un nuevo producto al mercado, ponindose a


prueba en las unidades familiares cuya seleccin debe ser realizada con una
metodologa precisa. Se debe mencionar que un estudio de mercado no se limita
solamente a sondeos con muestras, sino que adems debe estar complementado
por diversos estudios que implican uso de diversas fuentes de datos y diferentes
tcnicas y mtodos.
Con un estudio estadstico se determinan las dimensiones del mercado potencial,
o se estudia la variacin de ventas de la empresa, o se caracterizan los clientes
por sus percepciones sobre el producto o el servicio. Para resolver estos
problemas es necesario contar con datos estadsticos internos y externos de la
empresa. Tambin se necesita tomar en cuenta algunos factores econmicos y
asumir ciertas hiptesis sobre la empresa. Para tal fin se necesita de
conocimientos en ciencias econmicas, administracin y sobre tcnicas y mtodos
de la estadstica; tambin es necesario el conocimiento y manejo de estrategias de
gestin para conducir una empresa al camino de los logros. Por esta razn, si el
dirigente no dispone de tiempo para realizar estos estudios, debe de consultar a
un experto, pero ste no slo debe ser un economista o un estadstico, sino que
adems debe tener conocimientos sobre negocios, ya que su consejo econmicoestadstico no ser de gran utilidad si nicamente se basa en clculos de medias,
de correlaciones mltiples, de coeficientes de variabilidad, etc., sino que debe de
estar cerca del gerente, y de los jefes de distribucin, de los empleados y de los
obreros; debe hablar con los agentes, con quien dirige el servicio de ventas,
compras y almacn; en pocas palabras debe de involucrarse en la vida de la
empresa y del mercado. Viviendo esta experiencia y hablando con personas clave
obtendr ideas, hiptesis y explicaciones que le harn conocer ciertas causas y
ciertas soluciones que podr analizar y explotar al mximo valindose de su
preparacin tcnica. Pero su habilidad y conocimientos no deben hacerle perder
de vista las necesidades de su empresa y de su mercado.
La necesidad de tener buenas estadsticas empresariales lleva a la utilizacin de
datos contables. La fuente principal de las estadsticas internas de una empresa
debera estar constituida por la contabilidad. En otras palabras, los datos
contables adems de servir para cuadrar balances y diversos documentos
administrativos y justificar cada uno de los gastos e ingresos, deberan servir para
suministrar las series estadsticas sobre las ventas, productividad de los varios
agentes, rendimiento de publicidad, etc. Utilizar estos datos como series
estadsticas, quiere decir realizar y presentar tales datos de manera que den por s
mismos un significado y un valor para las decisiones. Para tal motivo, se deber
de recurrir a medias, a proporciones, a nmeros ndices, a representaciones
grficas, a medidas de variabilidad, etc. Aunque los datos contables deben ser
exactos, los resmenes estadsticos se proporcionan como aproximaciones
razonables, que permiten tomar decisiones. Hay que garantizar que estos datos
estn al da. La cultura estadstica es muy til en todos los niveles de la empresa u
organizacin.

11

No se trata solamente de sobrecargar a una empresa con registros, informes y


elaboraciones de cifras y tablas que respondan a registros estticos, sino de
instrumentar metodologas para que las oficinas que reciben y recogen datos
puedan utilizarlos y obtener de ellos los elementos estadsticos que les sean
indispensables.
A la recopilacin de datos estadsticos se le da el nombre de extracontables. Estos
datos tienen el carcter de sntesis, de anonimato; son producto de elaboraciones,
mientras que los datos contables son analticos, individuales, nominativos. Pero
poco importa distinguir entre un dato contable y un extracontable. Lo que
realmente tiene sentido es el hecho de conjuntar datos tiles, cuyas caractersticas
contribuyan a un mejor conocimiento de la empresa, la manera en que sta viene
actuando, su eficiencia, sus posibilidades futuras y el rendimiento que proporciona.
En conclusin, la recopilacin de datos de cualquier tipo es una estrategia que
ayuda a controlar, a medir y a realizar investigaciones en el mbito empresarial,
creando con esto una mejor operatividad en la empresa.
Debido a que las necesidades varan de empresa a empresa, es necesario tener
un mtodo propio de recopilacin de datos, que cumpla con las especificaciones y
requerimientos particulares. Es por esto que no existen indicaciones rgidas, pero
si hay una serie de lineamientos para el manejo de estadsticas empresariales. En
este sentido, hay una serie de datos que pueden ser comunes a todas las
empresas, entre los que destacan:
Estadsticas de la clientela final. La clientela final se clasifica en clientes fieles,
clientes nuevos y clientes potenciales. Tambin se puede incluir una distribucin
territorial de clientes y productos. Para consumo, la clasificacin tendr que
hacerse por factores econmicos, sociales y considerando el sexo y la edad, entre
otras variables. Clasificar los clientes por montos de ventas es de gran utilidad.
Este tipo de estadsticas son necesarias como base de la poltica empresarial, si
se considera que el primer objetivo de una organizacin est en satisfacer a los
clientes.
Estadsticas de prdidas. Se refiere a cifras bien definidas, comparando la
demanda con rdenes de pedido que se han transmitido a la empresa. As, es
posible investigar las prdidas y los motivos de stas.
Estadsticas de los pedidos. Esta no es otra cosa que un estado de situacin en
cuanto a los productos con que se cuenta. La estadstica se elabora por la
cantidad y valor de los productos, clasificacin de clientes, su distribucin
territorial, y la periodicidad. Aqu se incluye los motivos por los cuales ciertos
pedidos se dejan de surtir.
Estadstica de las ventas. Esta es una de las estadsticas fundamentales para
cada empresa, donde los datos por cantidad y valor se anotan con cierta
periodicidad determinada.
12

Estadstica de pagos. Aqu se especifica el tipo de pago. Este puede ser al


contado, diferido, con intereses, a plazos, con notificacin, etc.
Estadsticas de los precios de ventas. Aqu se incluyen los precios de catlogos,
los documentos y el precio neto de cada artculo.
Estadstica de las reclamaciones. Es una numeracin y caracterizacin de
reclamaciones, cambios o reposicin de mercancas especificando los motivos. La
mejora del servicio se puede lograr tomando en cuenta estas estadsticas.
Estadsticas de produccin. Es una caracterizacin del estado de los productos, de
acuerdo con los meses y con los destinos. Adems de especificar los
establecimientos que los ordenaron.
Estadsticas de los costos de produccin. Aqu se considera el costo de cada
producto, separndolo segn su fase de elaboracin.
Estadsticas de rendimiento. Estas cifras refieren a la produccin de los
empleados en cada departamento; las ventas que se tienen por cada vendedor y a
su vez un volumen de ventas de la empresa.
Estadsticas de costos de nuevos clientes: Es una evaluacin de las captaciones y
mantenimiento de nuevos clientes, localizando nuevos puntos de ventas, para
lanzar nuevos productos. Adems considera una comparacin de las ventas y los
costos de los nuevos productos con respecto a los ya existentes.
Estadsticas de la competencia. Es una enumeracin, distribucin territorial y
categorizacin de los competidores.
Estadstica publicitaria. Es una elaboracin de los gastos que implican los distintos
medios publicitarios por meses, productos rendimientos segn las formas de
publicidad.

1.4 Caracterizacin de los clientes y usuarios


Muchas veces los gerentes de una empresa necesitan o desean conocer
cmo es que los clientes ven las cosas, ya que esto es muy importante, porque
permite entender al marco de referencia de una persona y de esta manera se ve la
realidad tal cual es. Para que un gerente vea su negocio desde el punto de vista
del cliente, se requiere de ciertas herramientas y tcnicas; un reconocimiento de
factores demogrficos y psicogrficos, y un conocimiento bsico de los mtodos y
herramientas de investigacin. Los factores demogrficos son tiles para analizar
la percepcin de los clientes. Pensemos en los factores demogrficos como las
13

estadsticas vitales sobre los clientes. Por ejemplo, cuando salimos a comprar
ropa, aunque el vendedor rene cierta informacin demogrfica sobre nosotros,
como estatura, peso, medidas, etc., el vendedor an no sabe cules son nuestros
gustos, colores preferidos; slo tiene datos generales sobre nosotros. Los datos
demogrficos son datos sobre perfiles reales de los diferentes segmentos de
clientes a quienes se pretende llegar con algn producto o servicio; incluyen
informacin sobre caractersticas fundamentales de los clientes, tales como edad,
sexo, estado civil, ingresos, etc. Permiten conocer el tamao, densidad y
distribucin de diferentes grupos de clientes. Debido a que los factores
demogrficos suministran el perfil de los clientes, stos constituyen la primera
fuente de informacin. Estos datos son el medio ms comn para identificar
nuevos objetivos para algn producto o servicio; es decir, ayudan a conocer
quines son los clientes. Los datos demogrficos se pueden obtener de censos
estatales y locales, si es que se necesitan datos generales. Muchas
organizaciones cuentan con departamentos que se encargan de recoger perfiles
demogrficos de clientes. Si algn negocio no lo tiene, puede recurrir a una fuente
externa para que le proporcione esta informacin.
Sin embargo, los datos demogrficos no dirn por qu compran los clientes, cmo
lo hacen, ni acerca de qu los motiva, irrita, los hace venir o alejarse. Para esta
informacin se necesitan datos psicogrficos. Con estos datos se responde a
preguntas que le inquietan al gerente, como: qu les viene a la mente a los
clientes cuando piensan en su negocio?, qu les motiva?, qu pasa por su
cabeza en el momento de la verdad?, etc. Es decir, estos datos son tiles cuando
nos queremos meter en la cabeza del cliente para saber qu es lo que piensa o
siente acerca de algn producto o servicio. Los datos psicogrficos explican en
gran parte los factores crticos en las evaluaciones hechas por los clientes; y
permiten conocer los acontecimientos significativos asociados a la satisfaccin con
algn producto o servicio. Estos datos son importantes porque nos dan un
conocimiento y una idea sobre qu motiva e influye en los clientes en sus
relaciones con el negocio. Muchos negocios pueden cometer errores en este
punto. Creer que saben de antemano lo que motiva a los clientes hace que se
diseen sistemas y mtodos que pueden no ser apropiados para elevar la
satisfaccin.
Existen diferentes tipos de clientes, dependiendo de lo que ellos quieren y cmo
salen a conseguir lo que quieren. Algunos clientes estn ms orientados hacia el
proceso que hacia el contacto con la gente; es decir, hacia los empleados
encargados del servicio. Generalmente se interesan ms por cmo funcionan las
cosas que por el componente relaciones humanas. Otros le dan ms importancia a
la relacin humana.
Dependiendo de cmo salen los clientes a conseguir lo que quieren, algunos
operan con un nivel alto de exigencia y otros se conforman con niveles bajos de
atencin. Los clientes exigentes generalmente quieren lo mejor, piden que las
cosas funcionen bien desde la primera vez y tienen poca tolerancia para las fallas
14

de los sistemas. Estos clientes tienen una necesidad de status y reconocimiento;


quieren que los atiendan bien, exigen y pueden pagar por lo mejor.
Los clientes poco exigentes son ms pasivos que agresivos, ellos confan ms en
la gente que en los sistemas. Necesitan orientacin y desean que siempre los
lleven de la mano cuando pasan por todos los procesos de la organizacin; tienen
una gran necesidad de contacto humano y hacen mucho hincapi en cmo los
tratan.
Los datos psicogrficos los podemos obtener por medio de entrevistas personales
y grupos foco, por encuestas telefnicas o aplicando cuestionarios personalmente.
Hay que recordar que los grupos foco y las entrevistas ayudan a identificar
factores potenciales de los clientes, pero se debe verificar si lo que han dicho es
verdad para una muestra representativa de la poblacin de clientes. Se pueden
obtener datos psicogrficos sobre clientes tpicos con base a perfiles de
mercadeo. Existen servicios comerciales disponibles, que suministran perfiles de
clientes en este sentido.
Existen mtodos de investigacin para obtener informacin sobre los clientes.
Los mtodos ms utilizados son los mtodos cualitativos y cuantitativos. Los
mtodos cualitativos nos permiten evaluar la forma como el cliente organiza su
mundo: nos permiten ver a travs de los anteojos del cliente. Estos datos no se
utilizan para probar algo estadsticamente. Con este mtodo podemos obtener una
imagen ms clara de sus valores, expectativas, etc. En cambio, las tcnicas
cuantitativas son fundamentalmente las de evaluacin estadstica, nos permiten
verificar las tendencias subjetivas y factores que surgen en la investigacin
cualitativa. Aqu se utilizan encuestas y cuestionarios cuidadosamente diseados y
ejecutados. Es recomendable empezar con los mtodos cualitativos y despus
continuar con los cuantitativos para verificar si lo que encontramos con los clientes
frente a frente es generalizable. Los datos cualitativos se obtienen mediante
entrevistas a fondo, frente a frente, entrevistas telefnicas, entrevistas con grupo
foco, etc. Y los datos cuantitativos mediante encuestas. El mtodo fundamental
para medir la satisfaccin del cliente se orienta a la entrevista personal por la va
de la aplicacin de un instrumento (cuestionario), cuidadosamente diseado y
validado.

1.5 Necesidades y satisfaccin de clientes


Los cuestionarios para evaluar la satisfaccin del cliente tienen el propsito
de determinar las percepciones y actitudes de la clientela en relacin con la
calidad del servicio o producto recibido. El conocimiento de las percepciones y
actitudes de los clientes acerca de las actividades comerciales de una
organizacin brinda ms oportunidades de tomar mejores decisiones comerciales.
Para tal fin, es preciso que los instrumentos de satisfaccin del cliente midan con
15

exactitud estas percepciones y actitudes. Si los instrumentos se formulan con


deficiencias y no representan con exactitud las opiniones de los clientes, las
decisiones basadas en esta informacin podran ser perjudiciales para la
organizacin.
Los aspectos de medicin de la satisfaccin del cliente, como parte de los criterios
de premiacin de la garanta de calidad de la organizacin, continan siendo un
aspecto importante. Por ejemplo, en el Premio Malcolm Baldrige la satisfaccin del
cliente destaca la importancia de entender a stos. Se identifican tres categoras
de evaluacin; en la categora 1, las compaas se evalan, en parte, con base en
el mtodo que emplean para determinar las necesidades, expectativas y
preferencias de los clientes. Las empresas tienen que demostrar: 1. Cmo se
determinan los grupos de clientes y la manera en que los enfoques para escuchar
y aprender varan entre estos grupos; 2. Cmo se determinan las caractersticas
de los productos y servicios, y 3. Cmo el enfoque de la compaa hacia la
atencin de sus clientes y mercados se evala y perfecciona. En la categora 2,
las empresas se evalan con base en el mtodo empleado para determinar y
aumentar el nivel de satisfaccin de su clientela. Especficamente, se pide a las
empresas que demuestren: 1. El mtodo que emplea la compaa para determinar
las necesidades de contacto con sus clientes y cmo se comunican stas a todos
los empleados, as como la manera en que la empresa evala y mejora el
desempeo de contacto con los clientes; 2. El proceso de manejo de las quejas; 3.
Cmo la compaa realiza el seguimiento para que los clientes reciban
retroalimentacin rpida; 4. Cmo se determinan los niveles de satisfaccin de la
clientela y cmo los usa la compaa, y 5. Cmo obtiene los datos sobre la
satisfaccin referentes a sus competidores. En la categora 3, se evala a las
empresas con base en los resultados de satisfaccin del cliente y se les pide
resumir de manera especfica dichos resultados.
Debe mencionarse que el uso de cuestionarios para evaluar la satisfaccin del
cliente resulta muy apropiado para las organizaciones del sector de servicios y
otros campos no manufactureros. Debido a que la calidad se determina, en parte,
por el grado en que los productos satisfacen las necesidades de los clientes, la
medicin de la calidad en escenarios no manufactureros probablemente se indexe
mejor a travs de las percepciones de los clientes sobre el servicio recibido. Por
otro lado, aunque la percepcin de los clientes sobre la calidad de los productos
probablemente est correlacionada con los ndices objetivos de la calidad, pueden
y deben usarse las mediciones de satisfaccin del cliente para evaluar las
percepciones de stos. Por tanto, los cuestionarios de evaluacin de la
satisfaccin del cliente se emplean tanto en el sector manufacturero como en el no
manufacturero. El uso de tales cuestionarios ofrece a las compaas otro enfoque
en la evaluacin de la calidad de sus productos. Concentran la atencin de la
empresa en los clientes y en cmo stos perciben los productos y servicios de la
organizacin.
El deseo de medir las actitudes de la clientela debe ser igual al conocimiento para
disear cuestionarios de satisfaccin del cliente; es preciso mantener el mismo
16

ritmo que este inters siempre creciente en las cuestiones relativas a la


satisfaccin del cliente. Lo que no debe perderse de vista es que las necesidades
de los clientes definen la calidad de los productos o servicios. El conocimiento de
las necesidades de los clientes es esencial por dos razones. En primer lugar,
proporciona un mejor entendimiento de la manera en que los clientes definen la
calidad de los servicios y productos. Si uno comprende esas necesidades estar
en una mejor posicin para saber cmo satisfacer a la clientela. En segundo
trmino, el conocimiento de las necesidades de la clientela facilitar la elaboracin
del cuestionario de satisfaccin del cliente.

1.6 Preguntas de repaso


Conteste las siguientes preguntas con sus propias palabras
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.

Construye una definicin de investigacin de mercados


Cul es el objetivo de la investigacin de mercados?
Qu es el marketing mix?
Qu tipos de estudio de mercado hay en funcin del componente de
marketing mix?
Cul es la importancia de los datos demogrficos y sociogrficos en la
caracterizacin de clientes?
Cmo explica usted el papel de la mercadotecnia en las organizaciones
contemporneas?
Qu impacto tiene la mercadotecnia en los procesos de calidad de una
organizacin?
Cul es la fuente principal de informacin para establecer los objetivos de la
investigacin de mercados?
Explique brevemente las 3 categoras de los criterios del premio Malcom
Baldrige que destacan la importancia de la satisfaccin del cliente.
Para qu es necesaria la identificacin de las necesidades de los clientes de
una empresa?
Para qu le sirve a una empresa evaluar la satisfaccin de sus clientes y
cmo impacta en sus procesos?
Por qu hoy en da los estudios de mercado deben enfocarse de manera
ms contundente a la satisfaccin del cliente?
Cul es el rol que juega el cliente dentro de las fuerzas que mueven un
mercado?

17

UNIDAD 2. DISEO DE ESTUDIOS DE MERCADO Y


SATISFACCION DE CLIENTES
2.1 Aspectos generales
La investigacin de mercados ha tenido un auge y un desarrollo acelerado en
los ltimos 50 aos. Las organizaciones manejan diferentes conceptos; algunas la
definen simplemente como la recopilacin de datos y otras especifican bien las
responsabilidades; otras ms consideran que la investigacin de mercados provee
informacin para la toma de decisiones.
La investigacin de mercados es un enfoque sistemtico y objetivo hacia el
desarrollo y provisin de informacin aplicable al proceso de toma de decisiones
en la gerencia de mercadeo (Kinner y Taylor, 1991). Sistemtico dado que el
proyecto de investigacin debe de estar bien elaborado; se debe de establecer el
tipo de anlisis que se va a utilizar, qu datos son los que se van a ocupar, etc.
Objetivo dado que se tiene que observar la realidad tal y como est expuesta,
adversa a la subjetividad que implica una inclinacin personal para interpretar la
misma.
La informacin y el proceso de toma de decisiones, diferencian a la investigacin
de mercados de la investigacin de otros campos. Como ya se mencion
anteriormente, la investigacin de mercados proporciona informacin, no datos, al
proceso de la toma de decisiones.
La definicin de investigacin de mercados no se puede explicar totalmente con la
experiencia y el criterio; se requiere la informacin y seguir el proceso de
decisiones, ya que las caractersticas de la experiencia y criterio aparecen de
manera informativa (que es una ventaja de la investigacin de mercados); no
como simples conjuntos de datos.
Los trminos sistemtico y objetivo no es aplicable, el primero significa que debe
de haber una organizacin y procesamiento de datos, ya que el criterio y la
experiencia se basan en la adquisicin de conocimientos sobre el sistema de
mercados a travs de experiencias personales; y el segundo dice que la
investigacin de mercados debe enfocarse a la realidad.

2.2 Tipos de investigacin de mercados


Los estudios que se realizan en la investigacin de mercados pueden
clasificarse en investigacin bsica y en investigacin aplicada. La primera busca
abarcar ms los conocimientos en algn aspecto del sistema de mercadeo, en
cambio la investigacin aplicada busca ayudar a los gerentes para que tomen
mejores decisiones; esto es, hacerles ms fcil la toma de decisiones; tales
18

estudios estn dirigidos a situaciones especficas de la organizacin y


determinados por las necesidades del proceso de la toma de decisiones; la
investigacin bsica es menos especfica, son ms amplios sus propsitos, y son
guiados por las hiptesis y teoras de mercados. Estudios de caracterizacin de
clientes son investigaciones bsicas mientras que un estudio de preferencia de
marca es aplicado. Los dos tipos de investigaciones se pueden diferenciar muy
fcilmente, ya que mientras que la investigacin bsica se realiza de una manera
ms detenida y completa, la investigacin aplicada se realiza de acuerdo con las
necesidades de informacin que requiere la persona que va a tomar la decisin.
La investigacin de mercados puede clasificarse en: 1) investigacin exploratoria,
2) investigacin concluyente, e 3) investigacin de desempeo o de seguimiento.
La investigacin exploratoria se realiza en las primeras etapas del proceso de la
toma de decisiones; es un estudio preliminar de la situacin con gasto mnimo en
dinero y tiempo. Es apropiada cuando la gerencia busca oportunidades, nuevas
ideas o hiptesis relacionadas con la situacin; esto es, el objetivo es ampliar las
alternativas que van a evaluarse para elegir la ms conveniente. Por otro lado, la
investigacin concluyente proporciona informacin para evaluar y elegir la lnea de
accin adecuada. Finalmente, la investigacin de desempeo o seguimiento se
realiza una vez que ya se eligi la lnea de accin y ya est en marcha el
programa de mercadeo; es un estudio para saber qu est pasando con el
programa, si est funcionando de acuerdo con los planes establecidos. En otras
palabras, este tipo de investigacin nos permite controlar los programas de
mercadeo.

2.3 Proceso de la investigacin


El proceso de investigacin se compone de una serie de pasos. Hay
mltiples versiones de este proceso. Aqu presentamos una versin de este
proceso basada en nueve pasos.
1) Las necesidades de informacin. Aqu se pone de manifiesto las necesidades
que existen para realizar la investigacin de mercados. En pocas ocasiones,
cuando el gerente pide ayuda especifica claramente la necesidad de
informacin. Es tarea del investigador entender las razones por las cuales se
necesita informacin. El gerente tiene la obligacin de explicar la razn por la
cual ha solicitado ayuda y poner en claro que la informacin de la investigacin
facilitar la toma de decisiones. La investigacin exploratoria debe de clarificar
la situacin de decisin, para poder determinar un proyecto formal de
investigacin.
2) Objetivos de la investigacin y necesidades de informacin. Cuando ya se
especific la necesidad de informacin, el investigador debe de enumerar los
objetivos de la investigacin y enumerar las necesidades de informacin para
delimitar y establecer con precisin los objetivos propuestos. Aqu el gerente
19

debe de estar colaborando para proveer la informacin que necesita el


investigador.
3) Fuentes de datos. En este punto se determina si los datos pueden considerarse
actualizados; adems de conocer las fuentes de datos internas o externas de la
organizacin. Las fuentes internas son investigaciones que se hicieron
anteriormente, los archivos que existen en la compaa, etc. y las fuentes
externas son informes gubernamentales u otro tipo de estudios no realizados
por la organizacin. Si se encuentran datos que cumplan con las necesidades
de informacin, el investigador debe de analizar cmo fue realizada esa
investigacin, para verificar si es confiable y precisa; si los datos no se obtienen
de estas fuentes, entonces hay que hacer la recopilacin de datos, ya sea por
telfono, por correo, usando una encuesta, un sondeo, etc.
4) Formatos para la recopilacin de datos. Para la recopilacin de datos el
investigador debe de tomar en cuenta las necesidades de informacin, las
preguntas que se harn y las observaciones que deben registrarse; los datos se
pueden recopilar por medio de entrevistas, por medio de observacin; si se
hace por medio entrevista, sta es ms complicada, debido a que se deben
elaborar las preguntas, analizar la secuencia que deben llevar; y por
observacin los formatos deben disearse para facilitar el registro de los
eventos o caractersticas a observar.
5) Diseo de la muestra. Se debe tener en cuenta qu es lo que se va a incluir en
la muestra: es decir, se debe tener bien definida la poblacin de la cual se va a
tomar la muestra de acuerdo a la situacin que se est planteando, as como
tener bien definida la unidad de estudio. La determinacin de la poblacin
objetivo y la poblacin a muestrear son aspectos fundamentales que un
profesional estadstico puede ayudar a clarificar.
6) Recopilacin de datos. El proceso de recoleccin de datos es crtico, debido a
que abarca gran parte del presupuesto que est diseado para la investigacin,
y un gran porcentaje del error total en los resultados de investigacin. El error
se debe a gran parte a las entrevistas, ya sea porque el encuestado no
seleccion bien la unidad de estudio, o por una realizacin incorrecta de las
preguntas, o por trampas, entre otros.
7) Procesamiento de datos. En esta parte se utilizan las funciones de edicin y
codificacin; la primera revisa los formatos con los cuales se recopilaron los
datos; es decir, que sean legibles y consistentes; y la segunda funcin trata de
determinar las categoras por respuesta; con el fin de que se puedan enumerar
y se puedan manejar de forma fcil. Es entonces cuando los datos estn listos
para la captura en algn sistema computarizado. Previo al anlisis de los datos
se debe verificar la calidad de los mismos, detectar errores de captura e
identificar aspectos de estructura de la base de datos.
8) Anlisis de datos. El anlisis de datos se realiza de acuerdo a las necesidades
de informacin que se requieran: el anlisis puede ser univariado, bivariado o
20

multivariado; el primero consiste en el estudio de una sola variable; es decir, de


manera individual, el objetivo de realizar este anlisis es hacer una descripcin
ms profunda del grupo de datos; el segundo anlisis se utiliza para ver la
relacin que existe entre dos variables y el tercero se refiere al anlisis de tres o
ms variables. La estadstica nos dota de tcnicas, procedimientos y mtodos
para realizar anlisis que cumplan con los objetivos de la investigacin.
9) Presentacin de los resultados. Generalmente los informes de la investigacin
se dan a conocer al gerente por escrito y tambin por medio de una charla
personal, adems este informe debe de presentar los resultados claves de la
investigacin, ya que muchas veces los gerentes revisan cuidadosamente el
resumen y slo le dan una hojeada al contenido del reporte. Es fundamental
poder traducir los resultados importantes en imgenes (grficas) y pocas
palabras. Una presentacin bien elaborada ayuda a potenciar el valor de la
investigacin.

2.4 Levantamiento de datos


La investigacin de mercados utiliza por lo menos dos mtodos para la
recopilacin de datos: la observacin y la encuesta.
Debemos tener en cuenta que tanto el mtodo de observacin como la encuesta
estn expuestos a un margen de error. Debido a que los estudios por medio de
cuestionarios estn ms generalizados que los estudios por observacin, en esta
antologa se aborda ms el tema de la construccin de cuestionarios.
2.4.1 La observacin
En la recopilacin de datos por medio de observacin, como su nombre lo
indica, los investigadores sin establecer comunicacin con los sujetos de estudio,
se limitan a observar las acciones y hechos que les interesan. En algunas
ocasiones son personas las que se encargan de hacer las observaciones y en
otras se utilizan dispositivos mecnicos para observar y registrar la informacin
deseada.
Un ejemplo de observacin con personal son las que realizan dentro de un
almacn para saber si la gente compra por impulso o se fija en el producto, si
verifica los precios. Algunos ejemplos de observacin mecnica son: el audmetro,
que registra el nmero de receptores de radio y televisin que estn sintonizados
en determinada estacin. Algunos dispositivos ms especializados son el
psicogalvanmetro, que mide las reacciones emotivas de las personas a travs de
los cambios en la sudoracin, y la cmara ocular, qu ltimamente ha tenido gran
xito pues registra cambios o movimientos de los ojos que pueden interpretarse,
por ejemplo, como agrado o desagrado por un producto.
21

Por las condiciones de su aplicacin, los estudios de observacin son de cuatro


tipos:
Observacin en situacin natural. Se puede llevar a cabo con el conocimiento
del observado o sin l, como en el caso de un audmetro. Un ejemplo de una
observacin en situacin natural es cuando al observador aparenta ser un
cliente de la tienda y observa a los verdaderos clientes; por ejemplo: qu
productos piden, cmo reaccionan ante ellos, etc. La desventaja de este
mtodo es que el investigador debe esperar a que ocurran los sucesos
deseados.
Observacin en situacin artificial. Se crean situaciones artificiales para obtener
en menor tiempo la informacin deseada, con la desventaja de que el
comportamiento del individuo puede variar al sentirse observado y falsear sus
actitudes.
Observacin no estructurada. Se coloca el observador en un lugar estratgico y
se van registrando los hechos y acciones que se juzgue convenientes para el
estudio. Este tipo de observaciones es muy subjetivo y puede inducir a errores
cuando el observador pasa por alto situaciones que podran ser de gran
importancia.
Observacin estructurada. Se debe planear y anotar con mucha precisin
cules son los hechos que se deben observar, para eliminar, en lo posible, los
errores subjetivos de los observadores.
Esta tcnica se emplea bsicamente para medir la conducta del consumidor en un
lugar determinado, que puede ser un centro comercial, una tienda departamental o
de autoservicio, una farmacia, zapatera, etc.
Se coloca a un observador en un lugar estratgico para registrar slo los
movimientos de sujeto observado. Se anota de manera descriptiva, sin
interpretacin, la conducta seguida por ste, antes de decidirse por determinado
producto; por ejemplo, si ley las instrucciones, si cotej tamao, precios o si llev
el producto sin racionalizar la compra, tomndolo del anaquel como si fuera una
conducta habitual o pidindolo al dependiente sin dudar en la marca, tipo o
tamao deseado.
2.4.2 La encuesta
La encuesta es uno de los mtodos ms utilizados en la investigacin
comercial. Es un mtodo que sirve para obtener informacin especfica de una
muestra de la poblacin por medio de preguntas que pueden ser de forma oral o
escrita.
22

2.4.2.1 Cuestionario
A la lista formal de preguntas se le llama cuestionario. La funcin del cuestionario
es la medicin: puede medir el comportamiento pasado (a menos que existan
registros, los eventos pasados no podran ser analizados ms que por el mtodo
de cuestionario); puede medir las actitudes, esto es, las actitudes, que no se
pueden medir de otra manera ms que por este mtodo; tambin puede medir las
caractersticas del perfil del encuestado, como edad, sexo, nivel socioeconmico,
etc.
Ventajas y desventajas del cuestionario
Una de las ventajas es su versatilidad, sta es quiz la ms importante, la
cual permite que casi todos los problemas de la investigacin de mercados
puedan ser analizados a partir de un cuestionario. Debido a que en todo problema
de mercado estn involucradas personas que pueden ayudar a ver dnde est el
problema y qu solucin es posible darle, y esto se logra por medio de un
interrogatorio.
Otra de las ventajas es la rapidez y costo; la encuesta es ms rpida y ms barata
que la observacin y proporciona a los entrevistadores un mejor control de sus
actividades comparado con los observadores, adems se pierde menos tiempo en
un estudio realizado por medio de un cuestionario.
Una de las desventajas que tiene el cuestionario es la posible renuncia de los
interrogados a proporcionar la informacin. En muchas ocasiones los
entrevistados se niegan a responder una lista de preguntas de un desconocido, ya
sea porque el tema de la entrevista tiene muy poco o ningn inters para el
entrevistado, aunque el entrevistador sea muy amable y tenga carcter para tratar
a las personas y lograr su cooperacin, el entrevistado se niega a ceder un poco
de su tiempo para la entrevista o a contestar algunas preguntas especficas,
especialmente como las que se refieren al ingreso, o aquellas que son de ndole
personal. Para superar esta apata por parte de los entrevistados, se han
desarrollado varios mtodos; el ms importante es el arte de vender por parte del
entrevistador. Las recompensas en efectivo muchas veces ayudan a conseguir la
cooperacin de la gente, asegurndole al entrevistado que sus respuestas van a
ser tratadas confidencialmente. Todas estas maneras ayudan a obtener la
cooperacin de la gente sobre todo cuando las preguntas son de ndole personal.
Otra parte de las desventajas es la incapacidad de los entrevistados para
proporcionar informacin. Muchas personas se encuentran en la mejor disposicin
de cooperar, pero estn incapacitadas para responder a las preguntas que son de
inters para el investigador de mercados, ya sea que no recuerdan los hechos
deseados, o porque nunca los han conocido; por ejemplo un entrevistador puede
preguntar Cuntas veces comi carne en el desayuno durante el mes pasado?,
pocas personas podrn responder con exactitud, ya que rara vez las personas se
23

percatan de tales datos o no lo recuerdan. La nica manera de solucionar este


problema, es realizar la encuesta cuando los eventos de inters estn an
recientes en la mente de los entrevistados. Es esa una recomendacin, tambin,
para redactar preguntas que pueden ser contestadas por cualquier entrevistado.
En algunas ocasiones se le puede ayudar al entrevistado para que recuerde, para
esto se utilizan tcnicas de facilitacin de memoria; por ejemplo si a una persona
se le pregunta Cules canciones ha odo recientemente en la radio? Dir unas
cuantas, pero no todas; sin embargo, si el entrevistador le comienza a mencionar
alguna en particular, puede recordar si la ha odo o no. Pero este tipo de ayuda
puede traer consigo peligros que deben de ser considerados cuando se va a
utilizar esta tcnica, ya que tal ayuda puede provocar que los entrevistados
piensen que han visto u odo el enunciado que se les mencion an cuando no lo
hayan hecho. Si a una persona se le pregunta algo que no puede contestar, ya
sea por ignorancia o porque no conoce la informacin deseada, se sabe, por
estudios realizados, que de todas maneras responde, ya sea porque quiere
impresionar al entrevistador o simplemente por contestar. Por esta razn se le
debe de hacer a las personas slo aquellas preguntas que tengan la capacidad de
contestar.
Otra de las desventajas es la influencia del proceso de cuestionar. Si la respuesta
a una pregunta es embarazosa o comprometedora, es casi seguro que los
encuestados no contestarn correctamente. Contestarn correctamente a
preguntas como le gusta el ftbol profesional? o qu marca de automvil
prefiere?, pero se requiere mucho mayor cuidado en el diseo y aplicacin de la
entrevista cuando se trate sobre ingresos o sobre una evaluacin para alguna
revista a la cual est suscrito, etc.
Componentes principales del cuestionario
Un cuestionario se puede aplicar por medio de entrevistas personales,
telefnicas o por correo; generalmente est compuesto por cinco secciones:
1) Informacin de identificacin de datos. Esta informacin ocupa la primera
seccin del cuestionario, es donde puede registrarse, en caso necesario, el
nombre del encuestado, la direccin y el nmero de telfono, tambin incluye el
tiempo y fecha de la entrevista, pero esta informacin es adicional.
2) Solicitud de cooperacin. Es un pequeo prrafo donde se identifica el
entrevistador y la organizacin en la cual trabaja; se explica adems el objetivo
de la encuesta y el tiempo que se requiere para terminar la entrevista; esto se
hace con el fin de obtener la cooperacin del encuestado.
3) Instrucciones. Se refiere a comentarios que se le hacen al encuestado o
entrevistador para informarles como deben de utilizar el cuestionario.
24

4) Informacin de clasificacin. Esta trata sobre las caractersticas del encuestado;


en el caso de las entrevistas por correo esta informacin es manejada por el
encuestado, en las entrevistas personales y telefnicas la informacin es
recopilada por el entrevistador. Esta informacin puede ser recopilada al final de
la entrevista, aunque puede incluirse al principio, siempre que no cause
desconfianza o invada la intimidad del entrevistado.
5) Informacin solicitada. Esta parte forma la porcin ms grande del cuestionario.
Diseo del cuestionario
En el diseo de un cuestionario no existen pasos o reglas que garanticen la
elaboracin eficiente. El diseo del cuestionario es una tcnica aprendida por el
investigador a travs de la experiencia. La nica forma de llevar a cabo un buen
cuestionario es revisar el cuestionario nuevamente hasta estar satisfecho. Sin
embargo, de acuerdo a la experiencia que han tenido algunos investigadores que
se han dedicado a sta rea, han surgido una serie de pasos para el diseo del
cuestionario, que pueden ser de gran utilidad a los investigadores principiantes, y
as evitar errores graves.
Sin embargo, aunque estas reglas son tiles, la calidad del cuestionario depende
de la capacidad y criterio del investigador; este debe de ser creativo para darle el
toque final al cuestionario.
Las consideraciones preliminares del cuestionario se basan en mtodos para
establecer una unin efectiva entre el proceso de la toma de decisiones y el
proceso de investigacin. Esto es, establecer los objetivos de investigacin y
enumerar las necesidades de informacin. Se debe de formular el diseo de la
investigacin, visualizar y planear los pasos en el proceso de investigacin, lo cual
quiere decir que se deben tomar muchas decisiones antes de que se disee el
cuestionario. El diseo del cuestionario est influenciado por las caractersticas del
grupo de encuestados, mientras ms heterogneo sea el grupo de encuestados
ms difcil ser realizar un cuestionario; generalmente el cuestionario debe
realizarse de tal manera que lo puedan comprender todos los encuestados, hasta
el menos capaz. Tambin se deben visualizar las etapas del procesamiento y
anlisis de la informacin, as como la naturaleza de los resultados de la
investigacin.
Antes de que se disee el cuestionario, el investigador debe tener una lista de
todas las necesidades de informacin y una definicin clara del grupo de
encuestados. Las preguntas que se incluirn en el cuestionario deben surgir de
esta lista, no se deben incluir preguntas innecesarias, a menos que facilite la
colaboracin del encuestado, ya que incluir estas preguntas aumenta el costo de
la encuesta. Se deben de incluir primordialmente las preguntas que nos ayuden a
obtener la informacin deseada.
25

El contenido de las preguntas tiene que ver con la habilidad o buena voluntad del
encuestado para responder con precisin. El investigador debe de estar
consciente de la capacidad del encuestado para proporcionar informacin. Mucha
informacin no se puede recopilar con exactitud, ya sea porque el encuestado no
est bien informado o porque sea olvidadizo, como se explic anteriormente. Una
vez que se han analizado los problemas que trae consigo el contenido de las
respuestas, se debe de analizar el tipo de preguntas que van a utilizarse. Estas
preguntas se basan en formatos de respuesta estructurados y no estructurados.
Las preguntas pueden ser de respuesta abierta, de eleccin mltiple o dicotoma.
En las preguntas de respuesta abierta, los encuestados tienen la libertad de
contestar lo que ellos piensen que es lo correcto, con sus propias palabras. En la
entrevista por correo se debe dejar un espacio para la respuesta, y en entrevistas
personales el investigador debe de apuntar en el cuestionario lo que el encuestado
conteste verbalmente. La ventaja de este tipo de preguntas es que permiten que
se expresen las actitudes generales y pueden ser de gran ayuda para interpretar
las preguntas ms estructuradas. Adems establecen una armona y logran
obtener la cooperacin del encuestado para que conteste preguntas ms
especficas estructuradas; estas preguntas son muy importantes como
introduccin en una entrevista por correo. Otra de las ventajas es que puede
proporcionar al investigador ideas, comentarios y razones tiles para darse una
idea de los resultados de la investigacin.
Una desventaja de las preguntas abiertas, es que muchas veces el entrevistador
no toma la respuesta tal y como se la da el encuestado, si no que escribe los
puntos que considera ms importantes; esto se debe a que los entrevistadores no
escriben rpido o estn limitados de tiempo y mientras ms resuman la respuesta
registrada menos se parecer a la respuesta real. Cuando los entrevistadores
utilicen este tipo de preguntas es conveniente utilizar una grabadora; otra
desventaja es el tiempo y el costo asociado con la codificacin de las respuestas,
ya que en una encuesta grande se necesitan procedimientos exhaustivos de
codificacin, para resumir las respuestas en un formato til para el anlisis y
presentacin de la informacin. El tiempo y costo del proceso de codificacin
puede ser muy significativo en el costo total de la investigacin. Las preguntas de
respuestas abiertas son apropiadas para el anlisis exploratorio de un problema.
Algunas veces se utilizan preguntas precodificadas con el fin de aprovechar las
ventajas de las preguntas abiertas y disminuir las desventajas en tiempo y costo.
Una pregunta precodificada es una pregunta de eleccin mltiple. En las
preguntas de eleccin mltiple el encuestado debe de elegir una respuesta de una
lista suministrada en la pregunta. El entrevistado puede elegir una o ms
alternativas que se le presenten. Estas preguntas superan muchas de las
desventajas de las preguntas abiertas; la ms importantes es que reducen el costo
y tiempo asociado con el procedimiento de la informacin. Pero tambin tiene sus
desventajas, una de ellas es que el diseo de preguntas efectivas de la seleccin
mltiple requiere de una cantidad considerable de tiempo y costo. Por lo general
se requiere un estudio exploratorio con base a preguntas abiertas, para poder
26

desarrollar alternativas de repuesta; otra es que este tipo de preguntas tiende a


parcializar la informacin de acuerdo con el orden en que se dan las alternativas
de respuesta al encuestado.
En general en las preguntas de respuesta mltiple se deben de tener muy
presentes dos puntos muy importantes: el nmero de alternativas y la parcialidad
en la posicin. En las alternativas de respuesta, deben de estar incluidas todas las
posibles respuestas, para cumplir con esto se debe de incluir la alternativa otro,
para que se escriba la alternativa que no fue incluida; es decir, las alternativas
deben de ser colectivamente exhaustivas y mutuamente excluyentes; esto es, los
encuestados deben de elegir una alternativa que represente claramente su
respuesta. Con respecto a la parcialidad de la posicin, el investigador debe de
alternar el orden de las alternativas, ya que cuando se trata de ideas, la primera
alternativa de la lista tiene una mayor probabilidad de ser escogida.
Las preguntas dicotmicas slo presentan dos posibles respuestas si o no;
cierto o falso, etc. Las ventajas que tienen estas preguntas son las mismas que
las preguntas de eleccin mltiple. Los entrevistadores consideran que las
preguntas pueden administrarse con rapidez y facilidad; es menos probable que
se presente una parcialidad por parte de del entrevistador, y adems, son ms
fciles de codificar y analizar. Pero tambin tienen sus desventajas; existe el
riesgo de suponer que los encuestados enfocan el tema de inters en trminos
dicotmicos, cuando en realidad los encuestados tienen deseos de opinar acerca
del tema o estn indecisos sobre qu respuesta elegir. Se puede analizar la
posibilidad de incluir una respuesta neutral; si no se incluye, el encuestado se ve
forzado a elegir una de las dos alternativas que se le presenten; si se incluye el
encuestado puede evitar tomar una posicin sobre el tema, eligiendo la alternativa
neutral. El problema consiste en decidir si se incluye la alternativa neutral o no. Si
la proporcin de respuestas neutrales es grande, es mejor incluir la alternativa
neutral; los resultados sern ms precisos, pero si es pequea es mejor no
incluirla y forzar a los encuestados a que seleccionen una de las dos alternativas.
La decisin sobre la formulacin de las preguntas es muy importante, ya que las
preguntas representan el vnculo entre la informacin y las necesidades de
informacin del estudio. Es muy importante que el investigador y el encuestado le
den el mismo significado a la formulacin de las preguntas, ya que si no es as,
ocasionar graves errores de medicin en los resultados. El investigador debe de
estar consciente del efecto que causa la formulacin de preguntas. Esto es, se
deben de formular las preguntas de manera que los encuestados las entiendan y
as de esta manera se puedan obtener los resultados deseados.
Existen nueve pautas que debe de considerar el investigador para disear las
preguntas:
1) Utilizar palabras sencillas. Es decir, las palabras que se utilicen en el
cuestionario deben de ser adecuadas al vocabulario de los encuestados; por
27

ejemplo, las preguntas que se le hagan a un nio deben de ser ms sencillas


que las preguntas que se le hagan a un mdico.
2) Utilizar palabras claras. Las palabras claras tienen un slo significado para
todos los encuestados; es decir, los investigadores deben estar seguros que los
encuestados entiendan el significado de las palabras; por ejemplo, la palabra
comida, para algunas personas la comida es al medio da, para otras es por la
tarde, por esta razn se deben de formular las preguntas de manera que lo que
se quiere preguntar est claro para obtener los resultados deseados.
3) Evitar preguntas que sugieran la respuesta. Es decir, stas son una clave sobre
qu respuesta debe contestar el encuestado; por lo general estas preguntas
reflejan el punto de vista del investigador, o de las personas que toman las
decisiones, adems originan un error de medicin en los resultados; una
pregunta de este tipo sera tiene usted televisor Sony?, el encuestado puede
creer que esta marca es la que est patrocinando la encuesta, y su respuesta
puede ser afirmativa, aun cuando no tenga televisor de esta marca.
4) Evitar preguntas tendenciosas. Una pregunta parcializada incluye palabras o
frases que sugieren un sentimiento de aprobacin o desaprobacin; con el slo
hecho de que una actitud o posicin est asociada con una persona o una
organizacin prestigiada o no, parcializara la respuesta del encuestado. Es
muy difcil evitar preguntas que sugieran la respuesta, ya que las palabras o
frases que parcializan la respuesta de un grupo de encuestados, pueden ser
neutrales para otro. Una manera de identificar a los grupos que creen que la
pregunta ha sido parcializada, es llevando a cabo una prueba piloto del
cuestionario.
5) Evitar alternativas implcitas. Es conveniente especificar claramente las
alternativas de repuesta; si se utilizan alternativas explicitas, stas deben de
estar donde les corresponden ya que si el nmero de alternativas es grande o
complejo, las que estn a lo ltimo tienden a ser ms elegidas.
6) Evitar suposiciones implcitas. Esto es, al formular un cuestionario deben de
hacerse explicitas las suposiciones para evitar que la respuesta tienda hacia
implicaciones lgicas propicias por haber hecho la pregunta de manera que los
supuestos queden implcitos.
7) Evitar clculos. Es decir, las preguntas no deben de disearse de tal manera
que los encuestados realicen clculos; por ejemplo, cuntas veces compra
huevos al mes? aqu el encuestado primero tiene que sacar la cuenta de
cuntas veces compra huevo a la semana y luego multiplicarlo por cuatro; la
pregunta estara mejor estructurada de la siguiente manera: cuntas veces
compra huevos a la semana?, despus el investigador puede multiplicarlo por
las semanas que considere conveniente.

28

8) Evitar preguntas de doble respuesta. Por ejemplo, cuntas veces compra y


come huevo a la semana?, cuando la pregunta incluye y el investigador debe
de analizarla muy bien para ver si no incluye dos respuestas.
9) Considerar el marco de referencia. El marco de referencia nos indica la ptica
bajo la cual el encuestado contempla la realidad de la pregunta. Sobre esto
puede hablarse de un punto de vista objetivo en el que se analiza la forma en
que se relaciona la generalidad humana ante una pregunta formulada con ese
carcter.
El otro punto se refiere al aspecto subjetivo, en el cual el pensar personal del
encuestado ser evaluado por el entrevistador. El marco de referencia va a estar
dado por los objetivos de la investigacin. Lo esencial es que el investigador debe
saber que se desea medir la opinin del encuestado y que hay muchos factores
que pueden alterar los resultados del estudio.
La decisin sobre las secuencia de las preguntas es muy importante, ya que de
sta dependen que se obtengan buenos resultados. La secuencia de las
preguntas puede influir en la naturaleza de las respuestas del encuestado y puede
ser la causa de un grave error en los resultados: la secuencia se debe ms que
nada a la capacidad del investigador experimentado. Algunas pautas tiles para un
investigador inexperto:
1) Utilizacin de una pregunta de introduccin sencilla e interesante. La primera
pregunta de un cuestionario debe de ser interesante para el encuestado; sta
no puede tener nada que ver con las necesidades de informacin; se hace con
el nico propsito de obtener la cooperacin del encuestado y darle confianza
para que responda a las dems preguntas.
2) Formulacin de preguntas generales primero. Es decir, para que no se
presente una parcialidad en la encuesta, primero se deben de poner las
preguntas generales y despus las preguntas especficas.
3) Colocacin de las preguntas poco interesantes y difciles al final de la
secuencia. Dado que los encuestados despus de haber contestado a varias
preguntas, sienten ms confianza con el entrevistador y se muestran menos
renuentes a contestar preguntas personales y embarazosas.
4) Colocacin de las preguntas en orden lgico. Es decir, las preguntas que se
diseen deben de llevar una lgica, ya que si se cambia un tema
repentinamente puede ocasionar confusin en los encuestados y adems
crear indecisin.
La decisin sobre las caractersticas fsicas del cuestionario es importante; el
cuestionario debe estar bien presentado, en un papel de calidad y buena
tipografa, ya que esto puede influir en el logro de la cooperacin del encuestado,
particularmente en las entrevistas por correo. Es muy importante que aparezca en
la primera pgina el nombre de la institucin que est realizando la entrevista y el
nombre del proyecto; en las entrevistas personales o por telfono, los
cuestionarios deben de enumerarse en serie, ya que esto facilita el control del
29

cuestionario en las operaciones de campo y durante el procesamiento de la


informacin.
Por ltimo, se lleva a cabo una prueba piloto, una revisin y una copia final, con el
fin de llegar a la aplicacin final del cuestionario.
Prueba preliminar del cuestionario (prueba piloto).
Una vez elaborado el cuestionario la prueba preliminar se hace necesaria, y
se debe probar en una submuestra, con el objeto de comprobar el grado de
eficacia del mismo, ya que a travs de ella se podran encontrar errores y actuar
sobre ellos para modificarlos obteniendo as un cuestionario libre de confusiones.
La realizacin de la prueba preliminar requiere de investigadores bastante
capaces para detectar reas en las que exista confusin y explicar el por qu de
esta confusin. Asimismo se debe de encontrar las palabras que sean poco claras
al entrevistado y encontrar todas aquellas dificultades en el manejo del
cuestionario por parte del encuestador y el encuestado.
Es recomendable que en la prueba preliminar se consideren entre 15 y 30
entrevistas. As mismo, la duracin aconsejable del cuestionario no debera ser
mayor a treinta minutos, aunque lo bsico es la fluidez del mismo ya que hay
cuestionarios muy largos que tienen xito.
Cuando la prueba preliminar indique que deben realizarse cambios y estos se
hayan realizado, se deber hacer otra prueba preliminar hasta que los cambios
sean menores, tenindose as un cuestionario listo para aplicarse en el campo.
El grado de dificultad del cuestionario ser fcilmente detectable si existe un gran
nmero de respuestas en blanco o con respuestas de no sabe o no contesta. Por
lo tanto se deber realizar las correcciones oportunas, la reformulacin de algunas
cuestiones, hasta dar el visto bueno final al cuestionario definitivo.
Por ltimo comentar la necesidad de precodificar las respuestas del cuestionario
con el fin de poder procesarlo con rapidez en el ordenador y llevar a cabo la
tabulacin de los datos. Por ello ser necesario asignar a cada pregunta un cdigo
a cada respuesta y que aparezca en la impresin del cuestionario.
2.4.2.2 La entrevista
La entrevista se utiliza para recabar informacin en forma verbal, a travs
de preguntas que propone el entrevistador a un entrevistado. La entrevista es un
intercambio de informacin.

30

Existen tres alternativas de entrevistas: personal, postal o telefnica. No existe un


mtodo mejor que otro, lo importante es utilizar el que mejor se adapte a nuestras
exigencias y requerimientos. Es decir, hay que escoger el mtodo correcto para
cada caso porque de no hacerlo, se corre el riesgo de obtener informacin no
vlida y desperdiciar recursos econmicos.
Entrevista personal
Consiste en realizar una entrevista
encuestador a otra denominada encuestado.

por una persona denominada

Existen varios tipos:


Entrevistas estructuradas. Las cuales se realizan utilizando un cuestionario
elaborado previamente. El entrevistador por tanto se limita a pasar
secuencialmente el cuestionario a la persona que proceda.
Entrevistas semiestructuradas. El entrevistador utiliza como herramienta un
cuestionario no muy extenso y tiene cierta libertad en la confeccin del mismo
en funcin del entrevistado.
Entrevista libre o en profundidad. No existe un cuestionario previo aunque s un
guin para evitar perderse y no alcanzar los objetivos buscados cuando los
temas de debate se hayan alejado en exceso de los deseados. El entrevistado
puede libremente expresarse sobre los temas que se plantean.
Este tipo de entrevistas requiere una gran experiencia del encuestador. La
duracin de las mismas es mayor.
Si la clasificacin es en funcin del lugar donde se realiza la encuesta personal
tenemos dos tipos de entrevistas personales: las entrevistas personales puerta a
puerta, estas se suelen utilizar para investigaciones de tipo general y tienen que
responder en un contexto que no influye a sus respuestas. Por otro lado, estn las
encuestas in situ las cuales se realizan en lugares relacionados con el objetivo del
estudio, con el fin que la informacin se obtenga en un mbito ms real.
En cuanto a las ventajas que aporta podemos destacar:
La flexibilidad y versatilidad. Se puede elaborar como uno quiera en longitud,
formato, contenido. Pudiendo realizar cualquier tipo de pregunta por lo que en
muchas ocasiones es la mejor forma de obtener informacin sobre opiniones y
actitudes del consumidor.

31

El alto grado de respuestas. Son pocas las personas que declinan responder al
ser un contacto tan directo y muchas menos las que lo abandonan una vez
iniciado.
Se puede realizar a cualquier persona independientemente de su status social,
cultural, etc.
En las respuestas del entrevistado se evita la influencia de terceras personas.
Mediante las explicaciones de las preguntas y de las posibles respuestas del
entrevistador se eliminan las respuestas evasivas No sabe (NS)/ No contest
(NC).
Se puede mostrar o entregar cosas al entrevistado, tales como anuncios,
paquetes, productos, etc., Por lo que si se requiere hacer alguna demostracin
en el estudio se debe usar la encuesta personal.
Se puede obtener informacin adicional del entrevistado a travs de la
observacin por el encuestador, por ejemplo forma de vestir, nivel cultural,
social, etc.
La rapidez, dividiendo la muestra en distintos mercados y realizando entrevistas
en varios mercados es factible determinar estudios grandes en un perodo de
tiempo relativamente corto. Si bien sera ms largo que realizar encuestas por
telfono.
Las desventajas que surgen son:
En primer lugar est el costo por entrevista, especialmente las entrevistas
puerta a puerta tienen un coste por entrevista varias veces superior a las
investigaciones realizadas por correo o telfono. De manera que slo en
aquellas ocasiones que sea estrictamente necesario el contacto personal se
utilizarn las mismas dado que los fuertes costes suponen un elemento en
contra.
Es una metodologa lenta en obtener la informacin puesto que depende del
nmero de entrevistas que se realicen y de su duracin.
Existe la posibilidad de que el entrevistador incorpore distorsiones en la
obtencin de la informacin debido a las explicaciones, la forma de preguntar,
etc. Lo que puede originar que las respuestas no sean las que libremente dara
el entrevistado por lo que esto representa una importante dispersin en el
proceso de obtencin de informacin.
Los entrevistadores deben ser controlados para que la informacin que
presentan sea veraz y comprobar que realmente procede de las personas
entrevistadas que conforman la muestra. Para comprobar todo ello es necesario
incorporar muchos controles de seguridad.
En cuanto a las tendencias sobre las entrevistas personales a pesar de los
inconvenientes anteriormente mencionados debemos decir que existen algunos
tipos de investigaciones comerciales: publicidad, packaging, por mencionar
algunas, en las que es necesario contactar personalmente con los entrevistados,
de ah que han surgido un nuevo tipo de entrevistas, que son las entrevistas por
detencin, que consiste en detener a los entrevistados en zonas de gran afluencia
32

de pblico, como centros comerciales. Esta modalidad est teniendo un fuerte


crecimiento en las investigaciones actuales. Una de las grandes ventajas es que
es ms efectivo que los entrevistados se aproximen al entrevistador que enviar a
los entrevistadores a los hogares.
Una de las limitaciones que tiene es que la muestra no puede ser tan
representativa de la poblacin como las entrevistas puerta a puerta, y deben
limitar su tiempo a no ms de 30 minutos por entrevista. Aunque dado las grandes
dificultades que existen para la obtencin de informacin en las entrevistas puerta
a puerta y su progresiva prdida de eficiencia en muchas ocasiones estas
entrevistas por detencin son mucho ms representativas.
Entrevistas por correo
Consiste en seleccionar una muestra determinada de personas a quienes se
enva un cuestionario por va postal o electrnica con el propsito de que por el
mismo medio, lo devuelva ya resuelto. Este cuestionario debe ir acompaado de
un escrito en la que se explique al destinatario el objetivo de la entrevista y se le
invita, en forma amable, a resolverlo y devolverlo en el menor tiempo posible.
Las ventajas que tiene este mtodo es que llega a un pblico numeroso. La
entrevista puede ser ms objetiva porque el entrevistado tiene tiempo para meditar
las respuestas.
Las desventajas es que requiere de algn incentivo para ser contestada, falta de
cooperacin de los destinatarios, las listas de direcciones son difciles de recopilar.
Este mtodo ha perdido popularidad debido a la falta de cooperacin, el alza de
las tarifas lo cual tiende a disminuir la precisin de la entrevista.
Entrevistas por telfono
Suele utilizarse especialmente para medir el nivel de audiencia de las
emisiones telefnicas y televisivas; sirve para determinar las preferencias del
pblico respecto a los diversos problemas. Asimismo permite medir el grado de
retencin de los radioescuchas y telespectadores.
Las ventajas de este mtodo es que proporciona resultados con mayor rapidez, si
se trabaja con un cuestionario breve pueden efectuarse hasta 30 llamadas por
hora y es uno de los mtodos ms econmicos.
Por otra parte, las desventajas que presenta es que slo se puede entrevistar a las
personas que disponen de telfono, adems no todas las que tienen telfono
aparecen en el directorio. Adems no se tiene la certeza si la persona que se
desea entrevistar es la que contesta el telfono, tampoco se est seguro de la
autenticidad de las respuestas.
33

2.5 Confiabilidad y validez


Los instrumentos de medicin nos ayudan a comprender mejor nuestro
entorno y a hacer pronsticos sobre ste. Por ejemplo, si se quiere medir el nivel
de satisfaccin de los clientes para descubrir problemas con los productos o
servicios y modificarlos, se necesita conocer el actual nivel de satisfaccin para
darse cuenta as del cambio de opinin del cliente. Es por esto, que se necesita
una medicin que evale con exactitud las actitudes de la clientela. De esta
manera, cuando se formulan cuestionarios, es importante cerciorarse de que los
datos obtenidos de ellos reflejen informacin confiable y vlida, que son los dos
grandes problemas de medicin que deben enfrentarse y cumplirse.
Ahora bien, alguna vez se ha preguntado cul es la confiabilidad del instrumento
de medicin? Cul es su validez? Si no se conoce la confiabilidad ni la validez
del instrumento creado, es posible que se tenga poca fe en los resultados y en las
conclusiones obtenidas a partir de los datos generados por el cuestionario. Cabe
mencionar que es posible tener confiabilidad sin validez, pero no a la inversa.
2.5.1 Confiabilidad
Sinnimos de confiabilidad son estabilidad, fiabilidad, consistencia,
reproducibilidad, predictibilidad o falta de distorsin. Por ejemplo, las personas
confiables son aquellas cuyo comportamiento es consistente, predecible y fiable
(aspecto importante en un estudio de mercado); lo que hacen maana y la
siguiente semana ser consistente con lo que hacen hoy y con lo que hicieron la
semana pasada; se dice que son estables. Por otro lado, las personas poco
confiables son aquellas cuyo comportamiento es mucho ms variable; son
impredeciblemente variables. En algunas ocasiones hacen algo; y en otras, algo
distinto; carecen de estabilidad. Se dice que son inconsistentes.
Lo mismo sucede con las mediciones en investigacin de mercado: las personas o
consumidores son ms o menos variables de una ocasin a otra. O son estables o
relativamente predecibles, o son inestables y relativamente impredecibles; son
consistentes o no lo son. Si son confiables, entonces se puede depender de ellas;
si no son confiables, no se puede depender de ellas.
La definicin de confiabilidad se enfoca de tres maneras:
Un enfoque se sintetiza con la pregunta: si se mide el mismo conjunto de objetos
una y otra vez, con el mismo instrumento de medicin o uno comparable, se
obtendrn iguales o similares resultados? La pregunta implica una definicin de
confiabilidad en trminos de estabilidad, fiabilidad y predictibilidad. Es la definicin
que se ofrece en discusiones elementales del tema.
Un segundo enfoque se sintetiza con la pregunta: las medidas obtenidas a partir
de un instrumento de medicin son las medidas verdaderas de la propiedad que
34

se mide? sta es una definicin de falta de distorsin. Comparada con la primera


definicin, se aleja ms del sentido comn y de la intuicin; sin embargo, es
tambin ms fundamental. Estos dos enfoques o definiciones se resumen en las
palabras estabilidad y falta de distorsin. Sin embargo, como se ver ms
adelante la definicin sobre la falta de distorsin implica la definicin de
estabilidad. La confiabilidad se refiere al grado en que la medicin concuerda
consigo misma. Con frecuencia los trminos confiabilidad y validez se
confunden, no obstante existe una clara distincin entre ellos. La confiabilidad no
tiene nada que ver con la veracidad de la medicin. Algunos autores se han
referido a la confiabilidad como precisin. Esto es verdad, pero con frecuencia se
confunde con el significado de precisin en trminos de validez. La validez
tambin tiene que ver con la precisin, pero de una manera diferente que la
confiabilidad. La confiabilidad se relaciona con la precisin con la que un
instrumento de medicin mide aquello que se desea. La palabra clave aqu es
aquello.
Si se tiene una prueba que se considera mide la habilidad matemtica, no se sabe
si la prueba mide en realidad, habilidad matemtica. Si la prueba es altamente
confiable, solamente se sabe que esta midiendo algo con precisin. El
asegurarse de que la prueba de habilidad matemtica en realidad mide habilidad
matemtica, implica involucrarse con aspectos de validez.
Existe un tercer enfoque en la definicin de confiabilidad, desde un punto de vista
ms estadstico, el cul no slo ayuda a lograr una mejor definicin y a resolver
problemas tericos como prcticos, sino que tambin implica otros enfoques y
definiciones. Se puede investigar qu tanto error de medicin existe en un
instrumento de medicin. Recuerde que existen dos tipos generales de varianza:
sistemtica y por el azar. La varianza sistemtica se inclina hacia una direccin
las puntuaciones tienden a ser todas positivas o todas negativas, o todas altas o
todas bajas. En este caso el error es constante o esta sesgado. La varianza por
el azar o del error se autocompensa las puntuaciones tienden a inclinarse ahora
hacia este lado, ahora hacia ese otro. Los errores de medicin son errores
aleatorios; que representan la suma de diversas causas. Entre dichas causas
estn los elementos comunes del azar o aleatorios presentes en todas la
medidas debido a causas desconocidas, la fatiga temporal o momentnea, las
condiciones fortuitas que en un momento en particular afectan al objeto medido o
al instrumento de medicin, las fluctuaciones en la memoria y en el estado de
nimo, y otros factores que son temporales y cambiantes. Dependiendo del grado
en que los errores de medicin estn presentes en un instrumento de medicin, el
instrumento ser poco confiable. En otras palabras, la confiabilidad puede
definirse como la ausencia relativa de errores de medicin en un instrumento o
cuestionario.
Por lo tanto, para que los datos obtenidos con diferentes tipos de instrumentos de
medicin puedan usarse en situaciones prcticas, stos deben satisfacer ciertas
condiciones. Primero, el instrumento de medida que se usa en un caso y con un
propsito dado debe realmente medir el rasgo que se intenta medir. Segundo, el
35

instrumento debe de dar medidas confiables, de manera que se obtengan los


mismos resultados al volver a medir el rasgo, bajo condiciones similares del objeto
o individuo en cuestin. Los datos deben ser confiables desde dos puntos de vista:
deben ser significativos y reproducibles.
Para el primer requisito impuesto al instrumento de medida, no representa
problema cuando se miden propiedades fsicas de las personas; es
completamente evidente que si usamos una cinta mtrica de manera correcta,
medimos su altura, pero ya no es tan claro cuando usamos un cuestionario de
cierto tipo para medir el grado de satisfaccin de ste. No podemos convencernos
de inmediato de que los datos obtenidos con este instrumento realmente expresen
el grado de satisfaccin del individuo. Es necesario, por consiguiente, probar
empricamente que el instrumento mide la variable que se intente medir en cada
caso especfico. A esto se le llama investigar la validez del cuestionario. El
segundo requisito de los instrumentos de medida, mencionado al principio de esta
seccin, fue reproducible, que tiene que ver con la exactitud del instrumento de
medida. La confiabilidad es la exactitud de la medicin, independientemente de
que uno est realmente midiendo lo que ha querido medir. Por ejemplo en los
servicios hoteleros, la medida que uno obtiene de la prueba emprica de la
confiabilidad, es una medida de la capacidad del test para dar los mismos
resultados en repetidas pruebas, sin importar si este resultado tiene que ver o no
con la caracterstica de cliente satisfecho o no con los servicios recibidos.
Como el caso de la validez, la confiabilidad debe ser investigada empricamente
para cada instrumento. El conocimiento de la confiabilidad es necesario para que
los datos obtenidos con los instrumentos puedan usarse correctamente.
Por todo lo anteriormente mencionado, la confiabilidad es la falta de distorsin o
precisin de un instrumento de medicin. Recordemos que una medida altamente
confiable slo indica que est midiendo algo con precisin o de forma consistente.
Puede ocurrir que no est midiendo lo que se cree que mide. Un ejemplo para
ilustrar lo anterior es la bscula que tenemos en nuestros hogares. Suponga que
esta bscula siempre sobrestima el peso de una persona por cinco kilogramos. Si
alguien se coloca sobre esta bscula 50 veces durante el periodo de una hora,
encontrar muy poca fluctuacin del peso registrado en la bscula. La bscula es
precisa en el sentido de que indica consistentemente el mismo peso. Sin embargo,
es imprecisa en el sentido de que siempre da un peso equivocado por cinco
kilogramos. La bscula sera considerada confiable, pero no vlida.
Existen tres mtodos comunes para obtener estimadores del coeficiente de
confiabilidad:
1. Mtodos de las formas paralelas (Confiabilidad de formas equivalentes)
2. Mtodos de repeticin del test o test-retest (Confiabilidad prueba-contraprueba)
3. Mtodos basados en una sola aplicacin (Consistencia interna). Dentro de estos
se encuentra los siguientes coeficientes:
El coeficiente alfa de Cronbach
36

Los coeficientes de Kuder-Richardson


Coeficientes L1, L2, L3 de Guttman
Se dar una breve explicacin de los tres mtodos:
Mtodos de las formas paralelas: Son dos versiones del mismo test, los tems son
distintos pero se pretende medir lo mismo. Se espera que un sujeto saque en
ambos test las mismas puntuaciones verdaderas.
Mtodos de repeticin del test o test-retest: Los sujetos responden dos veces al
mismo test dejando un intervalo de tiempo entre ambas. Se refiere a que si el test
se aplica hoy o dentro de un tiempo, siga siendo vlido y fiable, es decir, que se
encuentre una relacin entre lo que se obtiene hoy y lo que se obtiene ms
adelante.
Mtodos basados en una sola aplicacin: Expresa hasta qu punto las respuestas
son suficientemente coherentes y relacionadas para concluir que todos los tems
miden lo mismo y son sumables en una puntuacin nica que representa o mide
un rasgo.
Dentro de los mtodos basados en una sola aplicacin destaca el coeficiente de
alfa de Cronbach que se describe a continuacin.

Coeficiente alfa de Cronbach


El alfa de Cronbach (1951) o coeficiente de alfa es ampliamente utilizado
para evaluar la consistencia interna o fiabilidad de instrumentos compuestos de
mltiples tems. Un instrumento con mltiples tems, que mide un constructo
fundamental, o una variable implcita, ser internamente consistente si los tems
estn fuertemente correlacionados. El alfa de Cronbach mide esta consistencia
interna.

k
k 1

i2

i2

Donde:
k es el nmero de tems

i2 es la suma de las varianzas de todos los tems


i2 es la varianza de las puntuaciones totales

El rango terico del coeficiente alfa es de 0 a 1. Las siguientes son algunas


sugerencias para la interpretacin del coeficiente alfa: valores <0.60 inaceptable,
37

0.60 a 0.70 poco aceptable, 0.70 a 0.80 respetable, 0.80 a 0.90 muy bueno y
valores >0.90 se debe considerar una reduccin del nmero de tems en la escala.
Ejemplo, suponga, que tenemos 5 tems y que estos son altamente consistentes
con un coeficiente alfa observado de 0.80. Donde cada tem tiene respuestas de 1
hasta 5 (Respuesta tipo Likert). La suma de la escala es la suma de las cinco
respuestas a los tems. Tericamente los valores mnimo y mximo son 5 y 25
respectivamente. La suma de la escala no debera ser hecha cuando los tems no
son internamente consistentes es decir, si hay tems con coeficientes alfa bajos, o
si son muy pocos los tems o tienen muy poco en comn.
Un coeficiente de confiabilidad de 0.85 significa que 85% de la varianza en las
puntuaciones de la prueba depende de la varianza verdadera en el rasgo medido y
que el 15% depende de la varianza del error.
La interpretacin ms clara sigue siendo la que se limita a expresar lo que dice la
misma frmula: es la proporcin de co-variacin, que si es grande implica
relaciones claras entre los tems. Consistencia interna parece un trmino
adecuado en este caso.
Sobre el valor mnimo que debe tener el coeficiente no hay normas especficas,
ni tampoco puede hablarse de una prctica comn; es un valor que est entre 0 y
1 y hay que evaluar teniendo en cuenta ms datos y el uso previsible del
instrumento. Algunos autores proponen un mnimo de 0.70 para investigaciones
bsicas, algunos otros ponen el lmite en 0.85 si van a tomar decisiones sobre
individuos y de 0.60 para otros usos. Se trata, por supuesto, de valoraciones
orientadoras.
2.5.2 Validez
La definicin de validez en un sentido general menciona que un cuestionario
es vlido si mide lo que se pretende medir con l. Por lo tanto, la validez de los
instrumentos de medicin tiene que ver con lo que miden y con qu tan bien lo
hacen; nos indica qu se puede inferir a partir de sus resultados, es decir, un test
es vlido cuando est demostrado que mide aquello que se presupona o se
pretenda midiese.
El anlisis factorial es esencialmente un mtodo para encontrar aquellas variables
que tienen algo en comn. Si algunos reactivos de una prueba de personalidad
estn diseados para medir satisfaccin, entonces en un anlisis factorial, dichos
reactivos deben cargarse mucho hacia un factor y poco hacia los otros, por lo
tanto el anlisis factorial constituye un mtodo que indica en qu medida miden la
misma cosa y en qu grado miden aquello que miden.
El anlisis factorial es particularmente relevante para los procedimientos de
validacin del cuestionario dicho anlisis contribuye directamente a aclarar dos
puntos fundamentales en la explicacin de los cuestionarios o constructos 1) su
38

estructura interna y 2) sus relaciones con terceras variables. Se trata de un


mtodo para reducir un gran nmero de medidas a un nmero ms pequeo,
llamadas factores, al descubrir cules van juntas (por ejemplo, cuales miden la
misma cosa) y las relaciones entre los grupos de medidas que van juntas, por lo
tanto, reduce el nmero de variables con las que el investigador debe enfrentarse.
Tambin ayuda al investigador a ubicarse, identificar unidades o propiedades
fundamentales que subyacen a pruebas y medidas. Por ejemplo, se pueden
aplicar 20 pruebas a un grupo de individuos, suponiendo que cada una mide algo
diferente. Sin embargo, quiz se encuentre que estas 20 pruebas son lo
suficientemente redundantes como para ser explicadas con slo cinco medidas o
factores.
El anlisis factorial es una tcnica multivariante que se presenta y utiliza bajo dos
tipos:
Anlisis factorial exploratorio (AFE)
Anlisis factorial confirmatorio (AFC)
En el primero (AFE) no se conocen los factores a priori, sino que se determinan
mediante el anlisis factorial, es decir, permite explorar la validez y adecuacin de
las propuestas realizadas por el cientfico acerca de la aceptabilidad de las
variables tericas que pretende construir y, por el otro lado, en el segundo (AFC),
se propone a priori un modelo, segn el cual hay unos factores que representan
a las variables originales y se somete a comprobacin el modelo. En este curso se
trabajara con el anlisis factorial exploratorio (AFE).
El anlisis factorial es un procedimiento de anlisis multivariante que intenta
explicar mediante un modelo lineal (como el de regresin mltiple), un conjunto de
variables observables (que pueden ser escalas, tems o reactivos u otras
variables, etc.) mediante un nmero menor de variables hipotticas (Caldern
2006), latentes o no observables, denominadas factores. As, todo factor es una
nueva variable que no es directamente medible sino que se infiere a travs de
variables que si pueden ser observadas.

Figura 1. Factores o variables latentes construidos a partir de variables empricas.

39

En la Figura 1 se observa que se tiene un conjunto de p variables observables o


empricas (x1, x2, x3, ..., x13) representadas en los rectngulos del diagrama, las
que dan origen o constituyen 3 factores o variables latentes (F1, F2 y F3) no
observables, representadas mediante elipses. Tambin se observa que todas la
variables contribuyen (cargan) a cada uno de los factores, pero no todas ejercen la
misma influencia sobre ellos siendo a stos mayor o menor segn los casos ,
por lo tanto, slo se seleccionan como integrantes de un factor aquellas que lo
hacen de manera predominante.
Entonces podemos afirmar que cada factor est compuesto por la aportacin
ponderada de la varianza que cada variable comparte (varianza comn) con el
resto de aquellas que junto con ella, configuran el factor. Esa ponderacin se
establece segn el peso o carga (tambin conocido como saturacin) de cada
variable en el factor.
En el caso hipottico de la Figura 1, las variables x1, x2, x3, x4 y x5 constituyen el
Factor 1 por que sus pesos o cargas en dicho factor son mayores que los pesos o
cargas de las mismas variables en el resto de los factores (los pesos de las
variables que construyen el factor se representan mediante un trazo grueso
continuo, mientras que los pesos -irrelevantes, en el modelo- de las dems
variables se representan mediante un trazo de puntos); de la misma manera el
Factor 2 est constituido por las variables x6, x7, x8 y x9, por que los pesos o
cargas de dichas variables son mayores que sus pesos o cargas para los Factores
1 y 3, por ltimo el Factor 3 queda compuesto por las variables x10, x11, x12 y
x13, ya que los pesos o cargas de dichas variables son mayores que sus pesos o
cargas para los Factores 1 y 2.
En el anlisis factorial exploratorio AFE y en el anlisis factorial confirmatorio AFC
se llevan a cabo tres pasos bsicos:
1. La obtencin de la matriz de correlaciones entre las variables empricas, base
del modelo lineal de prediccin.
2. Extraccin de factores, para establecer qu variables tericas son construidas a
partir de qu variables empricas.
3. Rotacin de factores, como mtodo de clarificacin de las soluciones
propuestas, cuya finalidad es siempre proporcionar un significado terico o
sustantivo a los factores extrados.

Figura 2. Pasos principales de los estudios que utilizan anlisis factorial


40

El modelo de AFE tiene como datos un conjunto de p variables aleatorias


(variables observables) x1, x2, ..., xp. Los valores de las p variables nos determinan
el estado de un conjunto de n individuos en relacin con cierta problemtica, el
resultado es una matriz de datos n p como la siguiente:

Donde:
n es el nmero de individuos u
objetos. p es el nmero de variables.
X ij es la observacin sobre el i-simo individuo u objeto en la j-sima variable

La matriz anterior, por ejemplo, podra representar las puntuaciones de 145


consumidores a un test de satisfaccin, medido a partir de p variables, entonces
X ip sera la respuesta numrica del consumidor i-simo a la cuestin X p .
Como ya se ha mencionado, el anlisis factorial, tratara de reducir el conjunto de
las p variables a un conjunto de menor dimensin, entonces podemos afirmar que
se trata de agrupar la informacin que producen muchas variables empricas
observables en unas pocas variables tericas, o variables latentes, o factores,
independientes entre s (requisito del AFE, pero no del AFC).
Evidentemente, para que cada una de las variables pueda aportar informacin,
tiene que establecerse una correlacin entre ellas. Por tal motivo el anlisis
factorial exploratorio AFE parte del anlisis de la matriz de correlaciones entre las
variables empricas (observables). Si no estuviesen correlacionadas, las variables
empricas no compartiran variabilidad entre ellas. Al estar correlacionadas,
comparten una porcin que se conoce como valor propio, es decir, la variabilidad
del factor o variable latente.
Como se ha sealado lneas arriba, el anlisis factorial descansa sobre las
relaciones que mantienen entre s las variables de un estudio. De este modo,
conviene estudiar primero la matriz de correlaciones para decidir despus si
resulta apropiado someterla a un proceso de factorizacin. Si encontramos que las
correlaciones observadas entre grupos de variables son muy bajas, es probable
41

que esas variables sean casi independientes entre s y, por tanto, no tenga sentido
buscar otras dimensiones ortogonales (independientes) que nos definan
elementos o aspectos independientes.
A partir de la matriz de datos n p se obtiene la matriz de correlaciones entre
todas las variables, de dimensiones p p , y simbolizada como R (matriz de
correlaciones de todas las variables entre s).
Despus de que se ha calculado la matriz de correlaciones R (s es que existen
correlaciones altas), el paso siguiente en el anlisis factorial consiste en elegir la
matriz factorial que resuelva el problema de la explicacin de la informacin de la
matriz de correlaciones R, es decir, determinar el menor nmero de variables
hipotticas, constructos o factores comunes de tal manera que reproduzcan
satisfactoriamente las correlaciones entre las variables. Esto se hace a travs de
un proceso llamado extraccin de factores.
En la literatura existe una gran variedad de mtodos para la extraccin de factores
a partir de una matriz de correlacin: componentes principales, mxima
verosimilitud, centroide, alfa, entre otros. No es posible analizar aqu todos estos
mtodos, por lo que la explicacin se limitar a uno de los mtodos. El mtodo
ms utilizado actualmente y que est fcilmente disponible en las instalaciones
computacionales es el mtodo de componentes principales, sin que esta
valoracin excluya otros tipos de anlisis factorial.
A continuacin se presenta una breve descripcin de los principales mtodos de
factorizacin:
Componentes principales: sigue un principio de extraccin que supone maximizar
la varianza explicada, es decir, conseguir que la contribucin del factor a alguna de
las comunalidades de las variables del estudio sea mxima. De ah que el factor
que mejor explique una dimensin analizada (el que represente mayor
variabilidad) se convierta en el primer componente principal, el que mejor explique
la segunda dimensin (el que represente mayor variabilidad en la matriz de
residuales) ser el segundo componente principal y as sucesivamente. Su
aplicacin supone transformar directamente un conjunto de variables
correlacionadas en otro conjunto de variables no correlacionadas.
Mxima verosimilitud: considera la mejor estimacin posible de la matriz de
correlacin reproducida en la poblacin como principio de extraccin. Es decir,
busca la solucin factorial que mejor se ajustara a las correlaciones observadas.
Utiliza chi-cuadrado como estadstico para determinar el grado de ajuste entre lo
observado y lo estimado, lo que permite determinar el nmero de factores
necesarios para que no haya una desviacin significativa de los datos observados.
La fijacin de las comunalidades se realiza por un procedimiento iterativo que
converge en el mejor valor.

42

Tabla 1. Matriz factorial sin rotar de datos hipotticos

Al utilizar alguno de los mtodos de extraccin factorial el resultado que se


obtendr es la matriz llamada matriz factorial que es una tabla de coeficientes que
expresa la relacin entre las variables y los factores subyacentes. En la Tabla 1 se
presenta la matriz factorial producida con el mtodo de componentes principales
(uno de los diversos mtodos disponibles).
Cada una de las columnas de la matriz de componentes de la Tabla 1 es un factor
o una variable latente (como se ve el numero de filas coincide con el nmero de
variables de R. Los elementos de cada factor (columna) pueden interpretarse
como coeficientes de correlacin entre ese factor y cada una de las variables: son
los llamados pesos, o cargas, o saturaciones factoriales. As, los datos que
aparecen en las tres primeras columnas pueden escribirse como aij , lo que
significa la carga a de la prueba i sobre el factor j . As, por ejemplo, en la
primera fila, .579 es la carga factorial (peso o saturacin) de la variable VISPER en
el primer factor. La variable CUBOS tiene las siguientes cargas: .37332 en el factor
1, .03575 en el factor 2 y .36812 en el factor 3.
Las cargas factoriales no son difciles de interpretar. Oscilan entre 1.00 y +1.00,
como los coeficientes de correlacin. Adems se interpretan de manera similar. De
hecho, expresan las correlaciones entre las variables y los factores. Por ejemplo,
la variable SINONI tiene las siguientes correlaciones con los factores 1, 2 y 3
respectivamente .73337, -.32068 y -.25203. Evidentemente, la variable SINONI
tiene una fuerte carga en el factor 1, pero muy poca en el factor 2 y 3.
2

Las cifras de la penltima columna se llaman comunalidades ( h ), las


comunalidades son iguales a las sumas de los cuadrados de las cargas (pesos o
2
saturaciones) de las variables en los tres factores. Esto es, la comunalidad h ,
para la variable VISPER, por ejemplo, viene dada por
2

.45588= .579000 + .12040 + .32580 .


Las comunalidades representan la magnitud del solapamiento entre las variables y
estos cuatro factores. Si la comunalidad para una variable fuera tan alta como 1.0,
43

ello indicara que la variable se solapa totalmente con los tres factores, en lo que
mide. Si una variable tuviera una comunalidad de 0, por otra parte, los pesos de
los tres factores para esta variable seran cero y la variable no tendra nada en
comn con ninguno de ellos. Los valores de comunalidad entre 1.0 y 0 indican
solapamientos parciales entre las variables y los factores en lo que miden.
Por lo tanto las comunalidades debern ser ciertos valores tales que:

0 h2 1
Esta solucin permite aceptar el cumplimiento del objetivo fundamental del AFE:
explicar mediante tres factores ortogonales, las correlaciones existentes entre 9
variables.
Como se ha mencionado el anlisis factorial implica cierto nmero de pasos, entre
ellos se encuentra la extraccin de factores. Muchos de los mtodos producen
factores que no son interpretables. Por consiguiente, dichos factores sin rotacin
se rotan con propsitos de interpretacin, ya que si se intenta interpretar la matriz
sin rotar de la Tabla 1, se enfrenta un problema. Se puede decir que todas las
pruebas se cargan de forma sustancial sobre un factor 1. Lo anterior equivale a
decir que todas las pruebas miden lo mismo (factor 1).
Por lo tanto el anlisis factorial no termina con la extraccin de los factores y la
preparacin de una tabla de pesos o cargas factoriales no rotados. Aunque esta
tabla da una solucin factorial basada en construcciones representadas
aceptables matemticamente, estas construcciones representadas en una matriz
factorial no rotada son raramente usadas en el trabajo cientfico.
Existen grficos que sirven de apoyo importante la hora de valorar tanto el nmero
de factores que se han de elegir como la composicin de cada uno de ellos en
funcin de las saturaciones de las variables.
Para tomar la decisin acerca del nmero de factores puede recurrirse al llamado
scree test o scree plot tambin llamado grfico de sedimentacin. Este grfico
reproduce los autovalores de los distintos factores, los factores importantes deben
explicar la mayor parte de varianza y tener autovalores grandes. En este grfico se
representan en el eje de ordenadas los valores de los autovalores y en el de
abscisas los sucesivos factores. Habr un punto en el que la pendiente de la curva
tiende a ser 0, es decir, los autovalores comienzan a ser casi iguales. En este
punto se establece el punto de corte para el nmero de factores.
La interpretacin del grfico de sedimentacin se realiza as: se aceptan los
valores, comenzando por el primero, cuya lnea de unin con el siguiente se
inclina (en mayor o menor grado), rechazando aquellos factores cuya unin con
los siguientes sea una lnea horizontal (en mayor o en menor grado de
aproximacin a la horizontalidad).
44

Figura 3. Grfico de sedimentacin


En la Figura 3 se presenta el scree test para los datos. Puede observarse como la
solucin de tres factores parece la ms adecuada.
En cuanto a la composicin de los factores, resulta til acudir a la representacin
espacial de los factores rotados. Este grfico muestra nubes de puntos que se
encuentran claramente diferenciados entre s. En el grfico cada una de las cargas
de los tems se trata como una coordenada y se grfica.
En ocasiones, la solucin que se ofrece tras un AFE propone la constitucin de
unos factores cuyas cargas o saturaciones en determinadas variables son muy
parecidas, por lo que arrojan, cuando menos, una sospecha de ambigedad.
Afortunadamente, es posible rotar la matriz factorial a otra forma que es
equivalente matemticamente a la matriz original no rotada, pero que representa
construcciones factoriales que son frecuentemente mucho ms tiles para los
fines cientficos que las construcciones factoriales no rotadas, es decir, con la
rotacin factorial buscamos una solucin factorial menos ambigua. Lo que se
pretende con la rotacin es repartir la varianza de los factores significativos, esto
es, de los factores que se van a tener en cuenta en la continuacin del anlisis, de
forma que cada factor no contenga cargas significativas ms que en un nmero
adecuado de variables. Es, por tanto, una apuesta por encontrar cargas factoriales
muy altas en unas variables para un factor, y cargas muy bajas de estas variables
en el resto de los factores. Con ello se consigue una nueva estructura factorial fcil
de interpretar, ms sencilla y menos ambigua.
En la Figura 4 (idea original de Fenelon, 1981), se observa de forma grfica como,
en un sencillo espacio tridimensional, es muy diferente la informacin que se
obtiene en funcin de la proyeccin elegida (el objeto tridimensional puede
representarse sobre un plano, extendiendo lneas de mira imaginarias desde el
45

objeto hasta donde se sita el ojo del observador. Cada superficie que
observamos es la interseccin de un plano con esas lneas de mira).

Figura 4. Ejemplo grfico, original de Fenelon (1981), de la


informacin diferente que se obtiene en funcin de la
proyeccin que se realice.

Para dirigir las rotaciones, se establecen cinco principios o reglas de estructuras


simple. Los principios de la estructura son los siguientes:
1. Cada fila de la matriz factorial debe tener por lo menos una carga cercana a
cero, y algunas cargas factoriales altas o fuertes. Esto significa que cualquier
columna de la matriz factorial debe tener muchos de sus elementos prximos a
0, y el resto lo ms altos posible.
2. Por cada columna de la matriz factorial debe haber por lo menos tantas
variables con cargas iguales o cercanas a cero como factores.
3. Por cada par de factores (columnas) de la matriz factorial debe haber diversas
variables con cargas en un factor (columna), pero no en el otro.
4. Cuando haya cuatro o ms factores, una gran proporcin de las variables debe
tener cargas insignificantes (cercanas a cero) en cualquier par de factores.
5. Por cada par de factores (columnas) de la matriz factorial debe haber slo un
pequeo nmero de variables con cargas sustanciales (diferentes de cero), en
ambas columnas.
Los criterios expuestos anteriormente, demandan que cada variable est cargada
en el menor nmero de factores posibles y que haya la mayor cantidad de ceros
posibles en la matriz factorial rotada. De esta forma, es posible lograr la
interpretacin ms simple posible de los factores. Por lo tanto, en su lmite ideal, la
46

matriz factorial que cumpliera con los cinco principios propuestos por Thurstone
tendra la configuracin siguiente (en un caso de 3 factores obtenidos a partir de 9
variables empricas.

Por supuesto, el modelo que representa la matriz D resulta por muchas razones
exagerado, ya que dichas estructuras factoriales perfectas son poco frecuentes.
Sera ms realista reemplazar los valores 1 por el Mximo y los valores 0 por el
mnimo (ya que nunca se darn valores 1 y 0 en una matriz factorial).
Del mismo modo en que existen muchos mtodos de extraccin de factores,
tambin existe una serie de mtodos de rotacin. Los dos tipos principales de
rotacin son: ortogonal y oblicua. A continuacin se dar una breve explicacin
de cada uno.
1. MTODOS DE ROTACIN ORTOGONAL: en esta rotacin los ejes o factores
se mantienen perpendiculares, los nuevos factores son no correlacionados, es
decir, los factores son independientes. Esto se ilustra en la Figura 5, en donde
se supone un anlisis factorial con 7 variables, en que se definen dos factores
F1 y F2. En la Figura 5 se observa que el primer factor est conformado por tres
variables, mientras que el segundo lo constituyen cuatro variables.

Figura 5. Rotacin ortogonal de los factores F1 y F2


47

1.1. Mtodo Quartimax. Su fundamento es la idea que cada variable est cargada
significativamente slo en un factor. Por ejemplo, si se tiene una variable con
dos factores, si la variable se encuentra sobre un factor, su carga en el otro
factor sera igual a 0, con lo que el producto cruzado de estas dos cargas sera
igual a 0. Por lo tanto, si se consigue minimizar la suma de los productos
cruzados de los cuadrados de las cargas de las variables en dos factores,
significa que las variables que estn significativamente cargadas en uno de los
factores lo estn mnimamente (lo ms cercano a 0 posible) en el otro.
1.2. Mtodo Varimax. Mtodo ideado por Kaiser. Este mtodo est orientado a
limpiar los factores, produciendo factores que tienen altas correlaciones con
un conjunto pequeo de variables y pequea o nula correlacin con el resto de
las variables.
1.3. Mtodo Equimax. En este mtodo se minimizan tanto el nmero de variables
que saturan alto en un factor como el nmero de factores necesarios para
explicar una variable.
2. MTODOS DE ROTACIN OBLICUA. Este tipo de rotaciones se admite que
los nuevos factores resultantes estn correlacionados. Una solucin factorial
oblicua es la que proporciona factores no ortogonales, es decir, correlacionados
entre s. De acuerdo con Garca et al (2000). Una rotacin oblicua es ms
general que una solucin ortogonal puesto que no se impone la restriccin de
que los factores tengan correlaciones nulas entre s. Su ventaja sobre la
rotacin ortogonal es que, despus de llevar a cabo las rotaciones oblicuas, si
los factores resultantes son ortogonales, se tiene la seguridad de que la
ortogonalidad no ha venido impuesta por el mtodo de rotacin. Lo anterior se
ilustra grficamente en la Figura 6, donde se supone un anlisis factorial con
siete variables, en el que se definen dos factores F1 y F2.

Figura 6. Rotacin oblicua de los factores F1 y F2

48

Tabla 2. Matriz factorial rotada. Rotacin ortogonal (rotacin Varimax)

Cabe sealar, que las soluciones ortogonales y oblicuas no modifican las


comunalidades de las variables ni determinan cambios en la cantidad de varianza
explicada por ellas, slo realizan una mejor distribucin de los valores de la matriz
de correlaciones original. Si comparamos entre s los dos tipos de rotaciones el
resultado no difiere significativamente y no se producen modificaciones en la
interpretacin de los factores apoyada en estas rotaciones.
Un factor se interpreta examinando las saturaciones que en l muestran las
variables.
Cuando los factores son ortogonales, la matriz factorial rotada proporciona toda la
informacin. Si examinamos los resultados de la Tabla 2 en nuestro ejemplo, el
factor 1 es un factor claramente verbal, el factor 2 es de rapidez perceptiva y el
factor 3, de visualizacin espacial. La variable MAYUS, contar las letras
maysculas tiene tambin un componente viso-espacial, ya que supone la
diferenciacin previa de ciertos patrones, de ah su saturacin en dos de los
factores.
Por ltimo, se debe mencionar que para darle un nombre al factor o constructo, es
necesario contar con especialistas en el rea del constructo. Y que al considerar el
valor cientfico del anlisis factorial debe prevenirse al lector de no atribuir
realidad a los factores. Resulta sencillo nombrar un factor y despus creer que
existe una realidad. Los nombres de los factores son meros intentos de
comprender la esencia del mtodo.

49

2.6 Actividades de la unidad


De acuerdo al escenario especificado de Pizza Healthy realice un estudio de
mercado detallando lo siguiente:
Introduccin (antecedentes y problema que se aborda).
Objetivos del estudio (general y particulares).
Indicar el tipo de investigacin de mercado que se aborda.
Especificar el mtodo que utilizar para recolectar los datos.
Proponer un cuestionario apropiado y editarlo tanto en Word como en DYANE.
Utilizando DYANE, validar el cuestionario (con al menos 20 casos) y hacer las
correcciones pertinentes si se amerita.
Nota: Si alguien quiere realizar su estudio de mercado acerca de algn otro
escenario puede hacerlo.

50

UNIDAD 3. ESQUEMAS BSICOS DE MUESTREO


3.1 Introduccin
La investigacin de mercados frecuentemente implica la estimacin de una
caracterstica de alguna poblacin. Por ejemplo, el nivel promedio de uso de un
parque por residentes de una comunidad podra ser de inters, o las actitudes de
estudiantes hacia una propuesta de instalacin dentro de los terrenos de la
universidad. En cualquier caso, sera poco probable que todos los miembros de la
poblacin fueran incluidos en la encuesta. El contactar al conjunto de la poblacin,
es decir, a la totalidad de la lista del censo, sencillamente no valdra la pena desde
el punto de vista costo-beneficio. Sera costoso y, en casi la totalidad de los casos,
innecesario, puesto que una confiabilidad adecuada generalmente puede ser
obtenida de una muestra. Adems, con frecuencia, sera menos exacto puesto que
los errores no muestrales como la no respuesta, el fraude y los errores de
codificacin de datos son ms difciles de controlar. Si el nmero total de errores
no muestrales y errores muestrales de una muestra es menor que los errores no
muestrales de un censo, entonces la muestra es ms precisa.
Hay muchas formas de obtener una muestra, algunas son informales y causales.
Por ejemplo, los peatones pueden ser interrogados en cuanto a la opinin de un
nuevo producto. Si la respuesta de todos en la poblacin es uniforme todos ellos
lo odian o lo aman-, tal enfoque puede ser satisfactorio. Si se quiere determinar si
el agua de una alberca es demasiado fra, no es necesario tomar una muestra
aleatoria; slo tiene que probar el agua en cualquier lugar, porque la temperatura
ser constante en todas las partes.
Sin embargo, en la mayor parte de los casos, la situacin es ms compleja, ya que
hay varias preguntas a ser contestadas y una amplia variabilidad en las
respuestas. Entonces, es necesario obtener una muestra representativa de la
poblacin que consista en ms de un grupo de unidades. Es posible, y aun
necesario en algunos casos, obtener una muestra representativa de la poblacin
empleando slo el juicio y el sentido comn. Sin embargo, el enfoque preferido es
usar muestreo probabilstico para obtener una muestra representativa.
Existen varios problemas bsicos que se deben tomar en cuenta en el muestreo.
El primero de ellos es definir la poblacin que se va a estudiar, dependiendo de los
objetivos de la investigacin. El segundo problema es definir las variables que se
van a medir, y por ltimo, el tercer problema es el diseo de la muestra, que se
divide en tres partes:
1) Seleccin de las unidades de muestreo, que son las unidades de las cuales se
va a tomar la muestra. Por ejemplo, si se quiere saber la proporcin de tiendas
en Xalapa que venden cierta marca de producto, las tiendas son las unidades a
observar.
51

2) Seleccin de la muestra, existen dos mtodos de seleccin de muestras, los


mtodos de seleccin probabilsticos, que son aquellos en que cada elemento
de la poblacin tienen una probabilidad conocida de ser seleccionados para la
muestra; es decir, los casos son escogidos al azar, mediante un mecanismo
ajeno al arbitrio de alguien, y los mtodos de muestreo no probabilsticas, que
son aquellos en que los individuos no tienen una posibilidad conocida de ser
incluidos en la muestra.
3) Estimacin de las caractersticas de la poblacin a partir de los datos de la
muestra.
Los investigadores de mercados generalmente desean saber de manera resumida
las propiedades particulares de una poblacin dada, por ejemplo la media
aritmtica de las observaciones que describen una determinada caracterstica. El
objetivo de tomar una muestra es hacer inferencia acerca de una poblacin de
acuerdo a la informacin contenida en ella.
En esta antologa se presentan algunos mtodos probabilsticos y no
probabilsticos de muestreo que pueden ser utilizados.

3.2 Muestreo probabilstico


Los mtodos probabilsticos son aquellos en los que cada elemento de la
poblacin tiene la misma oportunidad de ser elegido. A continuacin se revisan
cuatro tipos de muestreo probabilstico: Muestreo Aleatorio Simple, Muestreo
Sistemtico, Muestreo Estratificado y Muestreo por Conglomerados. De una
manera muy breve, se presentan los aspectos generales de cada uno de estos
planes; es slo una introduccin a los diseos bsicos.

3.2.1 Muestreo aleatorio simple


El Muestreo aleatorio simple (m.a.s.) es el mtodo ms sencillo del muestreo
probabilstico y se recomienda en los casos de relativa homogeneidad de las
unidades de la poblacin bajo estudio; es este el esquema ms simple, y es
fundamental en el estudio de la teora del muestreo.
El m.a.s. es un mtodo que consiste en seleccionar una muestra de n unidades de
una poblacin finita de tamao N , con la condicin de que cada una de las CnN
muestras posibles tenga la misma probabilidad de ser elegida. En la Figura 7, se
muestra el esquema de un muestreo aleatorio simple.
El nmero de muestras diferentes de tamao n que pueden formarse de una
poblacin de N unidades, como se menciona en el prrafo anterior es:
52

C nN

N!
(N n)!n!

(3.1)

Debido al tamao de las poblaciones que se manejan en


N

muestreo, resulta poco prctico construir cada una de las Cn

la encuestas por
posibles muestras,

con el propsito de obtener una de ellas. Este problema se resuelve extrayendo en


sucesin, aleatoriamente y sin reemplazo, las n unidades; es fcil mostrar que este
mtodo de seleccin proporciona a cada muestra la misma probabilidad de

ser elegida, es decir Cn

1 .

P o b l a c i n fi n i ta d e ta m a o

N -3

....

N -2

N -1

5
N

Seleccin

aleatoria

M u e s t r a a le a t o ria
s im p le d e t a m a o

4
2

..

n.

.
n

Figura 7. Esquema de un muestreo aleatorio simple.


A continuacin un ejemplo para comprender el proceso que se sigue. Suponga
que se desea seleccionar una muestra aleatoria simple de dos piezas de pan de
una poblacin de tamao 6 (A,B,C,D,E,F); por consiguiente usando la frmula 3.1,
tenemos 15 posibles muestras: AB, AC, AD, BC, etc., tomando en cuenta que la
muestra AB es la misma que BA; para darle una probabilidad igual a cada una de
las muestras, el primer paso es enumerar las muestras del 1 al 15 (con el fin de
que sea identificada la muestra) de la siguiente manera:
53

El segundo paso sera poner en papelitos todos los nmeros de las muestras,
depositarlos en un recipiente y mezclarlos de tal manera que pueda ser escogido
un papelito sin ver, cuyo nmero identifica una muestra al azar de 2 piezas de pan.
Si el proceso se realiza un gran nmero de veces y cada vez que se tome un
papelito se regresa al recipiente antes de que se efecte la siguiente seleccin, a
la larga cada papelito y por consiguiente cada muestra se extraer con la misma
frecuencia y con una probabilidad conocida de 1/15.
El proceso de seleccin de una muestra aleatoria simple asegura que cada
elemento de la poblacin tiene la misma probabilidad de ser seleccionado. Para
seleccionar una muestra se puede proceder escogiendo los elementos de la
poblacin uno por uno al azar o escogiendo una muestra completa como se ilustr
con el ejemplo. Es claro que este procedimiento resulta poco prctico, por lo que
para seleccionar muestras aleatorias simples se utilizan tablas de nmeros
aleatorios en lugar de seleccionar papelitos de un recipiente, o bien generadores
de nmeros aleatorios en una calculadora o computadora.
Una tabla de nmeros aleatorios es un conjunto de enteros generados de modo
que la tabla contendr los diez dgitos enteros (0,1,2,....,9), en proporciones
aproximadamente iguales, sin tendencias en el patrn en que se generaron los
dgitos; es decir, el nmero que se seleccione de la tabla puede ser cualquiera de
los dgitos entre 0 y 9, ya que todos tienen la misma probabilidad de ser
seleccionados.
La seleccin de nmeros por medio de tablas de nmeros aleatorios es anloga a
la seleccin por medio de papelitos.
La pregunta es Cmo seleccionar esos nmeros de la tabla? Una manera de
hacerlo es apuntando con un lpiz hacia un punto inicial de la tabla y decidir tomar
el ltimo o primer dgito del nmero seleccionado. Antes de iniciar se define si los
siguientes nmeros a obtener van a ser los de abajo o los de un lado del punto
inicial; si un nmero se repite, lo ignoramos puesto que ya ha sido seleccionado;
tambin se omite si aparece un nmero mayor que los que contiene la poblacin, y
se selecciona el siguiente nmero. Esto ltimo es muy raro que suceda ya que
generalmente se manejan poblaciones grandes. De esta manera obtenemos una
muestra aleatoria simple por medio de tablas.
54

3.2.2 Muestreo sistemtico


El muestreo sistemtico (m.s.) implica esparcir sistemticamente la muestra
a lo largo de lista de miembros de la poblacin. Es decir, consiste en dividir la
poblacin de N elementos en n subpoblaciones, a partir de los cuales se
selecciona una muestra de tamao n , extrayendo una unidad de cada
subpoblacin. La Figura 8 muestra el esquema de un muestreo sistemtico.
Poblacin de tamao N

.
4

.
...

.
n

Muestra sistemtica de tamao n


Figura 8. Esquema de un muestreo sistemtico.
El procedimiento de seleccin de la muestra, considerando que N es mltiplo de n
, es el siguiente: se divide N (nmero de unidades en la poblacin) entre n (nmero
de unidades que componen la muestra) y el resultado se denota por k , esto es, k
N n . Luego se elige un nmero aleatorio entre 1 y k , el cual se
denota por r; siendo r el primer elemento que forma parte de la muestra. El
segundo elemento resulta ser r k , el tercero r 2k y as sucesivamente hasta
completar la muestra de tamao n .
Para mostrar la comodidad y rapidez del presente esquema, se presente el
siguiente ejemplo: supngase que se tiene un poblado de 15,500 viviendas y se
desea hacer un estudio por muestreo para estimar algunas caractersticas de las
viviendas, tales como, si se cuenta con servicio de agua, luz, telfono, etc. Para tal
fin, se considera una muestra sistemtica de 500 viviendas. Para tal propsito,
primero la poblacin se subdivide en 500 subpoblaciones de tamao k 15,500 500
31 viviendas, luego, como las viviendas de la primera subpoblacin
estn supuestamente etiquetadas con los nmeros comprendidos en el intervalo
1-31, se selecciona aleatoriamente un nmero comprendido en dicho intervalo,
indicando ste la primer vivienda incluida en la muestra; supngase para fines de
ilustracin que dicho nmero es r 8 . Posteriormente, a partir de r, se contina
con cada 31a vivienda hasta completar la muestra. De esta manera una muestra
sistemtica est compuesta por las viviendas etiquetadas con los nmeros
8,

8 31 39, 8 2(31) 70, 8 3(31) 101, 8 4(31) 132, ...

55

Note que para llevar a cabo el procedimiento anterior, lo nico que se requiere es
la posibilidad de recorrer fsicamente la poblacin, de tal manera que dicho
recorrido comprenda todas las viviendas, y no los tome en cuenta ms de una vez.
Para el caso en que N no es mltiplo de n se tendra, por ejemplo con N 15,600
y n 500 , k 31.2 , entonces podra tomarse alguna de las siguientes dos
alternativas: k 31 o k 32 .
El muestreo sistemtico es de uso frecuente. La ventaja principal de este mtodo
de muestreo es su simplicidad, ya que a partir de una lista se escoge un elemento
al azar y se contina seleccionando cada elemento n-simo, y es ms sencillo que
elegir una muestra aleatoria simple. Est menos expuesto a errores y
frecuentemente proporciona mayor informacin que el muestreo aleatorio simple
por unidad de costo. Una muestra sistemtica por lo general se extiende por toda
la poblacin, es decir, los elementos de la muestra estn ms distribuidos en ella y
por lo tanto puede dar ms informacin acerca de la poblacin que se est
analizando que una muestra aleatoria simple con la misma cantidad de elementos.
A manera de ilustracin, suponga que tenemos una lista de 100 archivos de los
alumnos de la Facultad de Estadstica y queremos seleccionar una muestra
sistemtica para determinar la proporcin de archivos incorrectos. Suponga
adems que los primeros 50 archivos han sido archivados correctamente y los
otros 50 incorrectamente por diversas razones. El muestreo sistemtico incluir la
misma cantidad de archivos correctos e incorrectos y dar una estimacin ms
precisa de la proporcin de archivos almacenados incorrectamente. En cambio el
muestreo aleatorio simple podra seleccionar un gran nmero de archivos
incorrectos o quiz todos y dar una estimacin muy diferente de p. Si los archivos
incorrectos hubieran sido distribuidos aleatoriamente, la ventaja del muestreo
sistemtico se perder, ya que la precisin de las estimaciones de este muestreo
depende del orden de las unidades de muestreo en el marco.
El muestreo sistemtico se utiliza en muchas reas, por ejemplo, los auditores
utilizan el muestreo sistemtico al muestrear una lista de cuentas para verificar
cantidades o para comprobar que los procedimientos de contabilidad se cumplan.
Tambin es utilizado por los investigadores de mercado y por encuestadores que
muestrean personas en movimiento.
Este tipo de muestreo tambin tiene sus dificultades. Una de ellas es que no se
puede obtener una estimacin sin sesgo del error de muestreo atribuido a la media
estimada sin recurrir a algunas suposiciones, debido a que este muestreo solo
identifica a un conglomerado y para poder evaluar el error de muestreo se
necesitan cuando menos dos conglomerados. Sin embargo, se podra obtener una
estimacin sin sesgo del error de muestreo si en lugar de obtener una muestra
sistemtica de 100 elementos, se obtuvieran 5 muestras sistemticas de 20
elementos cada una, ya que la variacin entre estas muestras permite la medicin
del error de muestreo.
56

Otra dificultad que existe es la periodicidad de un listado de una poblacin; para


ilustrar considere el ejemplo de los archivos de los estudiantes, suponga que cada
archivo incorrecto est colocado en la lista en cada mltiplo de 2 y queremos
seleccionar una muestra de tamao 10, entonces el intervalo muestral es 10, que
coincide que es un mltiplo de 2, suponga adems que el punto inicial para la
muestra es 4 (elegido al azar), la muestra va a contener slo archivos incorrectos
y esta muestra no representara a la poblacin, causara una parcialidad en los
resultados.
En el muestreo sistemtico los marcos ordenados no siempre son malos. Si el
marco est ordenado en forma de estratos, la seleccin de una muestra
sistemtica automticamente necesitar de una muestra estratificada y se
obtendrn resultados ms eficientes que en el muestreo aleatorio simple. Si el
investigador est consciente de que existe estratificacin dentro del muestreo
sistemtico, puede utilizar formulas del muestreo estratificado ya sea para calcular
una media o el error estndar.
3.2.3 Muestreo aleatorio estratificado
El Muestreo aleatorio estratificado (m.a.e.) es ms complejo que el Muestreo
aleatorio simple. Pero aunque este ltimo tiene la ventaja de su simplicidad, no es
el ms adecuado para resolver muchos de los problemas planteados en la
investigacin de mercados. El m.a.e. generalmente se presenta en el estudio de
poblaciones que presentan heterogeneidad con respecto a la(s) variable(s) de
inters.
Este esquema de muestreo consiste en fraccionar la poblacin original en estratos
(o subdivisiones) de tal forma que todos ellos formen una particin como se
muestra en la Figura 9. En estas condiciones cada unidad pertenece a uno y slo
uno de los estratos y la unin de todos ellos conduce a la poblacin total.
En trminos generales, el muestreo aleatorio estratificado se lleva a cabo
mediante los pasos siguientes:
La poblacin de N elementos se divide en L estratos (o subgrupos) lo ms
homogneos posibles con respecto a la(s) variable(s) de inters. Se denota el
tamao de la poblacin en el estrato i por Ni , por lo que N N1 N2 N L .
Establecidos los L estratos, se selecciona independientemente en cada uno de
ellos una muestra aleatoria simple. Indicando el tamao de la muestra en el
estrato i por ni, por lo que n n1 n2 nL .
Considerando cada estrato como una poblacin por s sola, se calcula en cada
uno de ellos el estimador correspondiente, mismo que se pondera
57

apropiadamente para obtener un estimador del parmetro poblacional


correspondiente.

n1 n2 nL =n
Figura 9. Esquema de un muestreo aleatorio estratificado.
El muestreo aleatorio estratificado es ampliamente utilizado por varias razones:
Permite estudiar en forma independiente a cada uno de los estratos.
La estimacin de los parmetros correspondientes tienden a ser ms precisos
que los obtenidos mediante la utilizacin de un m.a.s.
Permite resolver muchos problemas de coordinacin en la obtencin de la
informacin en el trabajo de campo.
Ahorra dinero, tiempo y esfuerzo, es decir, se puede ahorrar el costo, el tiempo
y traslado del entrevistador, ya que las muestras pueden ser tomadas por reas
geogrficas y el entrevistador no andara de un lado a otro consumiendo tiempo
y dinero. El investigador con este ahorro de capital podra tomar una muestra de
mayor tamao que la que se podra tomar en un Muestreo Irrestricto Aleatorio
del mismo costo.

58

3.2.4 Muestreo por conglomerados


El muestreo por conglomerado se caracteriza por que las unidades de
muestreo son un conjunto de elementos, los cuales son conocidos como
conglomerados.
Dependiendo de la complejidad de la poblacin en estudio, este esquema de
muestreo puede llevarse a cabo en una en varias etapas, sin embargo, en este
trabajo se presenta nicamente el caso de una etapa.
Descripcin del muestreo por conglomerados en una etapa
Generalmente los conglomerados o agrupamientos se forman reuniendo
unidades que se encuentren prximas entre s, en sentido fsico. Cuando no
pueden realizarse este tipo de agrupaciones es recomendable incluir en el mismo
grupo unidades diferentes. As, si cada agrupamiento es una representacin de la
poblacin, sin duda se lograrn buenas estimaciones seleccionando unos cuantos
conglomerados.
El muestreo por conglomerados es una tcnica en donde se analizan
conglomerados de elementos y en cada conglomerado los elementos se estudian
en su totalidad, es decir, cada conglomerado seleccionado en la muestra ser
censado.
Para ilustrar el esquema que nos ocupa se presenta a continuacin el siguiente
ejemplo: supngase que se desea estudiar la calidad de cierta marca de leche que
viene empaquetada en cajas de 12 litros cada una. La poblacin en estudio est
compuesta por todos los litros de leche que va recibir un gran supermercado. En
este caso se presenta el problema de construir un marco de unidades (litros de
leche), el cual resultara muy tedioso de elaborar. Para solucionar este problema,
se define como unidad de muestreo a cada caja, que contiene 12 litros de leche,
resultando ms prctico construir un marco de cajas (conglomerados) que un
marco de unidades (litros de leche).
Considerando ahora, una poblacin de cajas, se listan y se enumeran de 1 a N
(siendo N el nmero de cajas y cada caja un conglomerado de 12 litros de leche).
Luego, se elige una muestra n de cajas y se efecta el estudio de los 12 litros de
leche de cada caja seleccionada, para que posteriormente se haga la estimacin
correspondiente. De esta manera, mediante el uso del muestreo por
conglomerados, se ha ahorrado el trabajo de construir un marco de litros de leche
y se ha efectuado el estudio requerido.
En la Tabla 3 se presentan algunos ejemplos de conglomerados que pueden
disponerse en una poblacin bajo estudio.

59

Tabla 3. Ejemplos de conglomerados.


Poblacin

Conglomerados
de Elementos
unidades de muestreo

1 Ciudad A

Manzanas

2 Ciudad B

Viviendas

3 Aeropuertos

Vuelos

Escuela
Secundaria

Variables

Caractersticas de
vivienda
Personas
Grado de estudios
Pasajeros que Informacin acerca
salen
viajes

la

Viviendas

Salones de clase

5 Trnsito anual Intervalos de 40 minutos


en un puente
6 Fbrica
Cajas de artculos

Estudiantes

Planes de carreras

Vehculos

Origen y destino

Artculos

Calidad del artculo

de

El esquema de conglomerados en una etapa se muestra en la Figura 10, para


ilustrar la forma en cmo funciona.

Poblacin finita de

N conglomerados
2

.
4

..

N
Seleccin Aleatoria
de conglomerados

3
1

. .
n

Muestra aleatoria simple de

conglomerados

Figura 10. Esquema de conglomerados en una etapa.


El muestreo por conglomerados en una etapa, en la prctica se reduce a la
aplicacin de muestreo aleatorio simple, pero tomando como unidades de
muestreo agrupaciones y no individuos.

60

Pasos para seleccionar una muestra por conglomerados en una etapa


El primer paso a seguir en el muestreo por conglomerados es especificar
apropiadamente los conglomerados, comnmente las unidades que conforman un
conglomerado se encuentran cercanos entre s, lo que ocasiona que entre ellos
sean similares con respecto a la caracterstica de inters, en estos casos
seleccionar un conglomerado de gran tamao puede no resultar muy til, ya que
observar ms unidades posiblemente muy correlacionadas con otros elementos no
aportara gran informacin acerca del parmetro poblacional y en cambio se
incrementaran los costos originados en su estudio. Sin embargo, pueden
presentarse situaciones en las que los elementos del conglomerado sean muy
distintos entre s, en estos casos es ms til seleccionar pocos conglomerados de
gran tamao, sin que la estimacin del parmetro poblacional deje de ser bastante
buena.
Por ejemplo, supngase que los conglomerados estn formados por paquetes que
contienen cajas de cereal y se desea conocer el peso promedio de llenado por
cada caja. Las cajas de cereal vienen saliendo de una lnea de produccin en
donde se supone que todas las lneas tienen aproximadamente la misma
variabilidad en el llenado de las cajas, entonces cada conglomerado (paquete de
cajas), es aproximadamente tan variable con respecto al llenado de las cajas
como la poblacin misma. Entonces un estimador del peso promedio de llenado
de las cajas sera bastante bueno, utilizando uno o dos conglomerados.
Por el contrario, supongamos que en una ciudad se desea conocer la proporcin
del gasto semanal en alimentacin familiar y que los conglomerados estn
formados por manzanas. Como las manzanas tienen muchos hogares y los
recursos no permiten muestrear muchas manzanas, supongamos que se
muestrean dos o tres. En este caso puede que seleccionemos conglomerados en
donde los hogares se encuentren en una cmoda situacin econmica y la
estimacin del gasto probablemente sera elevada, dando como resultado un mal
estimador, ya que no se tomaran en cuenta aquellos hogares en situacin
econmica ms precaria. En esta situacin puede obtenerse mayor informacin
muestreando un nmero grande de conglomerados ms pequeas.
Como puede observarse la eleccin del tamao correcto de los conglomerados no
puede determinarse mediante alguna regla, elegir el tamao de los conglomerados
debe de estudiarse dependiendo del problema que se trate, buscando encontrar el
justo equilibrio entre el nmero y el tamao de los conglomerados, pero sin duda
una encuesta piloto puede darnos suficiente informacin para hacer la eleccin
correcta.
Ntese que la diferencia principal entre el muestreo estratificado y el muestreo por
conglomerados es que los estratos deben de ser lo ms homogneos posibles
dentro de ellos, pero lo ms diferentes entre un estrato y otro con respecto a la
caracterstica de inters. Por otra parte los conglomerados deben de ser lo ms
heterogneos posibles dentro de ellos y a su vez lo ms parecido entre uno y otro.
61

Cuando los conglomerados han sido especificados, se debe realizar una lista que
contenga todos los conglomerados que conforman la poblacin. Entonces se
selecciona una muestra aleatoria simple de conglomerados.
Considerando la eficiencia econmica, es decir, el costo relativo de las
observaciones en cada uno de los mtodos, casi siempre veremos que el
muestreo por conglomerados es ms econmico que el muestreo aleatorio simple
y que el estratificado, si el costo por obtener un marco que liste todos los
elementos de la poblacin es muy alto o si el costo por obtener las observaciones
aumenta con la distancia que separa a los elementos, por ejemplo; suponga que
deseamos calcular el gasto promedio por familia de una ciudad. Si usamos
Muestreo Aleatorio Simple se necesita un marco que liste todos los hogares
existentes en la ciudad y esto puede ser muy costoso o imposible de lograr, no se
puede evitar esto utilizando muestreo estratificado ya que se necesita un marco
para cada estrato de la poblacin, lo que se podra hacer es dividir a la ciudad en
regiones tales como manzanas o conglomerados de elementos y seleccionar una
muestra aleatoria de ellos, esto se puede realizar con facilidad utilizando un marco
que liste todas las manzanas existentes, de esta manera se puede calcular el
gasto promedio de cada familia dentro de cada manzana. Adems si se selecciona
una muestra aleatoria de toda una lista de hogares en la ciudad resulta ser muy
costosa, debido a que la muestra elegida puede estar dispersa en toda la ciudad y
los entrevistadores pierden tiempo y dinero en gastos relativos. El muestreo
estratificado es el ms adecuado para reducir estos gastos de transporte, ya que
los elementos de un conglomerado deben de estar geogrficamente cerca uno del
otro.

3.3 Muestreo no probabilstico


Los mtodos de muestreo analizados anteriormente son todos
probabilsticos. En cada uno de ellos se cumplen los requisitos del muestreo
probabilstico, es decir, que cada elemento de la poblacin seleccionado tiene una
probabilidad conocida de ser seleccionado en la muestra. Ahora analizaremos
algunos mtodos de muestreo en donde no se cumple esta condicin, es decir,
que no se conozca la probabilidad de que se seleccione cada elemento, a estos
mtodos de muestreo se les conoce como de muestreo no probabilstico.
El muestreo no probabilstico incluye una gran variedad de tcnicas, cuya
complejidad va desde una muestra seleccionada sobre bases convencionales
hasta una muy elaborada muestreo por cuotas en donde se eligen los
entrevistadores de acuerdo a una serie de caractersticas socioeconmicas.
Cualquier procedimiento de muestreo en donde no se especfica la probabilidad de
seleccin de un elemento de la poblacin es un mtodo de muestreo no
probabilstico, sin importar que se haya incluido en las especificaciones.

62

3.3.1 Muestreo a conveniencia


Una muestra a conveniencia, como su nombre lo indica, es una muestra
seleccionada de acuerdo a la comodidad o conveniencia del investigador,
acudiendo a poblaciones accesibles como: voluntarios, pedir opinin a personas
en un supermercado, usar estudiantes y/o conocidos, conocer zonas donde
habitualmente se centra la informacin, etc.
Los elementos que conforman sta muestra son elegidos en forma simple porque
se tiene acceso a ellos, son claros o fcilmente medibles.
Este procedimiento permite obtener informacin rpida y econmica. Se utiliza
principalmente para:
Obtener informacin en una etapa inicial y determinar si merece la pena
continuar el estudio.
Generar hiptesis, es decir, sugerir investigaciones o preguntas del cuestionario
para disear un nuevo estudio.
En general, para desarrollar estudios en los que no se necesite mucha
exactitud.
El caso ms frecuente de este procedimiento es el de utilizar como muestra
individuos a los que se tiene fcil acceso. La ventaja de este tipo muestreo es que
se reduce el costo del muestreo y la toma de informacin, pero tiene la desventaja
de que los estimadores obtenidos de la muestra son poco precisos de los
parmetros poblacionales.
Ejemplos de este tipo de muestreo: Un grupo de actividad eclesistica, un saln
de clases de estudiantes, las mujeres en un centro comercial en un da en
particular, los primeros 50 receptores de cuestionarios por correo, o unos cuantos
amigos y vecinos.
A menudo este tipo de muestreo es usado para probar un cuestionario.
3.3.2 Muestreo por criterio o dirigido
En este tipo de muestreo los elementos son seleccionados a travs de un
juicio experto, es decir, los encargados de llevar a cabo un estudio, escogen la
muestra que creen es la mejor para ese estudio. Por ejemplo, los gerentes de
ventas podran seleccionar una muestra de tiendas de comestibles de una ciudad,
considerada para ellos como representativa en algn sentido. Una de las
dificultades que se ha encontrado a travs de la experiencia en este tipo de
muestreo, es que se producen resultados insatisfactorios, y no existe una manera
objetiva de evaluar la confiabilidad de la muestra. A pesar de esto, este mtodo
puede ser til cuando el tamao de la muestra es muy pequeo, lo que por lo
regular es muy frecuente.
63

Generalmente, el muestreo de juicio est asociado con una variedad de sesgos


obvios y no tan obvios. Por ejemplo, el uso de las entrevistas en los centros
comerciales puede sobremuestrear a personas que compran frecuentemente, que
parecen amigables, y que tienen tiempo de atenderlos. Lo que es peor, no existe
forma de cuantificar realmente el sesgo y la incertidumbre resultantes, porque el
marco de muestreo es conocido y el procedimiento de muestreo no est bien
especificado.
Hay situaciones en las que el muestreo de juicio es til y aun aconsejable.
Primero, hay ocasiones en las que el muestreo probabilstico no es factible o es
prohibitivamente costoso. Una muestra aleatoria de homosexuales puede ser
imposible de obtener, y una muestra de juicio de aquellos que frecuentan los bares
y a otros centros de reunin ser la usada. Una lista de vendedores ambulantes
podra ser imposible de obtener, y una muestra de juicio podra ser apropiada en
este caso.
Segundo, si el tamao de la muestra es muy pequeo (digamos, menos de diez),
una muestra de juicio generalmente ser ms confiable y representativa que una
muestra de probabilidad.
Tercero, algunas veces es til obtener una muestra deliberadamente sesgada. Si
por ejemplo, se tuviera que evaluar la modificacin de un producto o servicio,
podra ser posible identificar un grupo que, por su propia naturaleza, estuviera
dispuesto hacia la modificacin. Si se encontrara algn rechazo, entonces podra
suponerse que el resto de la poblacin sera igualmente negativa. Si les gustara,
desde luego, probablemente se requerira ms investigacin.
3.3.3 Muestreo de bola de nieve
Este muestreo parte de la premisa de que las unidades de la poblacin se
conocen entre s y consiste en seleccionar una muestra inicial de unidades y
establecer en cada entrevista qu nuevas personas de la poblacin en estudio han
de entrevistarse para pasar a formar parte de la muestra. En sentido muy amplio,
la primera unidad de la muestra puede seleccionarse de manera intencional o
estar constituida por voluntarios y las unidades siguientes quedan determinadas
por las anteriores.
El muestreo de bola de nieve tiene la ventaja de ser ms econmica, permite la
creacin de una muestra cuando no se dispone de un marco muestral, permite
ampliar la muestra inicial hasta obtener una muestra que se considere
representativa de la poblacin en estudio y se selecciona la muestra con
elementos que interesen al estudio.
Por otra parte, tiene las desventajas de tener poca representatividad de los
resultados, proporcionar estimadores sesgados y no se pueden hacer inferencias
a la poblacin bajo estudio.
64

El muestreo bola de nieve tiene sus aplicaciones en estudios: sociolgicos, de


mercado, de evaluacin de proyectos, de relaciones o redes para estudios
sociomtricos o de coaliciones, de lite o en estudios de poblaciones raras o
marginales.
En la Figura 11 se representa grficamente la idea del muestreo bola de nieve,
donde la unidad inicial es el elemento uno, quien al ser entrevistado, informa que
las personas dos y tres son candidatos para formar parte de la muestra. A su vez
la unidad dos, informa de las unidades cuatro y cinco, y la unidad tres, de las
unidades seis y siete, y as respectivamente hasta que el investigador considere
que ha reunido la informacin suficiente para llevar a cabo la investigacin.

Figura 11. Esquema de un muestreo bola de nieve.

3.3.4 Muestreo por cuotas


Es un tipo de muestreo ampliamente utilizado en encuestas de opinin
pblica e investigacin de mercado. Parte de la premisa de que la muestra debe
tener una buena distribucin geogrfica y que debe contener la cuota determinada
de individuos con ciertas caractersticas de la poblacin. Las caractersticas que
suelen tomarse en cuenta son el sexo, la edad, el nivel socioeconmico, el tamao
del lugar u otras caractersticas sociolgicas o econmicas.
La complejidad de ste es muy variable, pero siempre toma en cuenta tres pasos
bsicos que se mencionarn a continuacin:
1) La seleccin de las caractersticas de control y la determinacin de la
proporcin de la poblacin que tiene cada conjunto de caractersticas. Es decir, se
divide la poblacin en subconjuntos y es similar a la estratificacin, a estos
subconjuntos se les llama clulas y a los fundamentos de estratificacin se les
llama controles. Estos se eligen de acuerdo a que se cree que estn
65

relacionados con la caracterstica bajo estudio, y que se cuenta con informacin


actualizada acerca de su distribucin en la poblacin (resultados de un censo
reciente, de estadsticas oficiales o de estudios realizados previamente).
A manera de ilustracin suponga que se ha decidido realizar una encuesta a los
consumidores de la ciudad de Xalapa, utilizando dos caractersticas de control:
edad e ingresos por familia, suponga adems, que las clulas que se obtienen son
las siguientes:
Ingresos por familia
Menos $800,000
$800,000 o ms
Total

Edad del consumidor


Menor de 30 aos
30 aos o ms
18%
29%
15%
38%
33%
67%

Total
47%
53%
100%

La poblacin de la cual se tomar la muestra indica que el 18% de los


consumidores que son menores de 30 aos y perciben un ingreso menor de
$800,000 por familia y el 15% perciben un ingreso por familia de $800,000 o ms,
etc.
2) La distribucin de la muestra entre las clulas. Una vez que ya se tienen las
clulas, el siguiente paso es decidir de qu tamao se tomar la muestra de cada
una de ellas, por lo regular, aunque no siempre, se toma una muestra
proporcional. Tomando en cuenta el ejemplo anterior, si se desea una muestra
total de 500, la distribucin proporcional de entrevistas por clula sera: Para los
consumidores menores de 30 aos y con ingresos menores de $800,000, el
tamao de la muestra sera 90 que equivale al 18% de la poblacin; para los
consumidores mayores de 30 aos y con ingresos menores de $800,000 sera de
145 (29%), etc.
3) La seleccin de los elementos de la muestra. Ya que se defini el tamao de
muestra de cada clula, se le asigna a cada investigador una cuota, es decir, se
les dice que realicen un nmero X de observaciones con los elementos que
poseen caracterstica determinadas y Y observaciones con los elementos que
poseen otras caractersticas, es decir, se le pide a un entrevistador que realice 20
entrevistas a las personas que tengan menos de 30 aos e ingresos familiares
menores de $800,000 y 30 entrevistas a las personas que perciben ingresos
mayores de $800,000. As hasta que la muestra total haya sido cubierta. Este es el
origen del objetivo cuota. Las entrevistas se obtienen de la manera ms rpida
que sea posible.
Algunas dificultades inherentes al muestreo por cuotas.
El muestreo por cuotas y el muestreo estratificado son similares ya que en
los dos, la poblacin se divide en subconjuntos y en cada uno de ellos se toma un
nmero determinado de muestra para obtener la muestra total. Cabe mencionar,
66

que en el momento de tomar la muestra de cada subconjunto son diferentes,


debido a que en el muestreo estratificado estas muestras se toman al azar y en el
muestreo por cuotas no, ya que a los representantes de zona se les brinda
facultades de seleccin para que cubran sus cuotas.
Esta distincin entre los dos mtodos es importante, dado a que en ocasiones se
les considera errneamente como equivalentes. Adems, se trata a los datos
como si provinieran de una muestra estratificada al azar. Los dos muestreos
seran equivalentes si se pudiera suponer que las muestras dentro de cada clula
representan muestras aleatorias simples, pero la experiencia indica que esta
hiptesis no es correcta. Al utilizar el muestreo por cuotas la suposicin implcita
que surge casi siempre, es que la seleccin dentro de cada clula es aleatoria y
que la diferencia entre cada elemento de sta es muy pequea que incluso si se
sacarn los elementos de los extremos no se afectaran mucho las estimaciones.
Debido a esto, algunos investigadores aplican incorrectamente los mismos
principios en un muestreo por cuotas y en un muestreo probabilstico para
determinar el tamao de la muestra y el error de muestreo.
En el muestreo por cuotas, la seleccin de los entrevistadores que se incluirn en
una clula se deja a juicio de los representantes de zona, no est regida por una
seleccin aleatoria. Por lo regular las personas que pertenecen a una clula y que
sern los entrevistados con ms frecuencia son las que resultan de ms fcil
acceso y tienen facilidad de expresin.
En la mayora de los casos se encontrarn diferencias en las muestras por cuotas
y las muestras estratificadas al azar, en situaciones en que la naturaleza de las
muestras por estratos no tiene. Por ejemplo, las cuotas pueden basarse en
informacin obsoleta o imprecisa, lo que en el muestreo estratificado no suceder.
Otra dificultad, es que es difcil identificar a los entrevistados. Casi siempre es
difcil determinar en las entrevistas caractersticas de control como: edad,
ocupacin e ingreso, lo que trae como consecuencia que las entrevistas realizadas
para lograr una cierta cuota podran no tener las especificaciones de la cuota. Por
ejemplo, las entrevistas de los consumidores menores de 30 aos podran
contener a personas mayores.
3.3.5 Formas especiales del muestreo no probabilstico
Muestreo de entrevistas de grupo
Este muestreo como su nombre lo indica, se utiliza en los estudios enfocados
a grupos. Un grupo usualmente es una muestra por cuotas de cinco a diez
consumidores, a los cuales se les hace una entrevista conjunta de una a dos
horas, esta entrevista la realiza una persona especializada en la dinmica de
grupos.

67

Los grupos son pequeos debido a que son muy costosos y adems la
informacin que se tiene de cada grupo est poco estructurada debido a que la
entrevista es en forma libre y se realiza con varias personas a la vez. Por lo
general, este tipo de muestreo se utiliza en las investigaciones exploratorias con el
propsito de conocer las creencias y prcticas de los consumidores respecto al
producto en cuestin. Cada grupo no es un intento riguroso de estimacin de los
parmetros de alguna poblacin. Las muestras de grupo pueden aportar datos
importantes para el desarrollo de hiptesis, no se debe de considerar que aporta
pruebas de magnitud de algn parmetro debido a la dificultad que se tiene en
muestrear a la poblacin mediante esta tcnica, o debido a que cada entrevista es
en realidad una muestra de uno, consistente usualmente en un aglomerado poco
definido de respuestas. En la prctica es comn variar la forma y el contenido de
los interrogatorios de un grupo a otro. Dado que las personas de un grupo son
entrevistadas en conjunto, la respuesta de cada una de ellas est condicionada
por las dems. Los datos que se obtienen de tres grupos cada uno de ellos con
cinco personas, no son equivalentes a los datos que se obtienen de 15 entrevistas
individuales seleccionadas al azar, debido a que los grupos son muestras de
conglomerados por cuotas.
Muestras de intercepcin de centros comerciales
Este muestreo es otra tcnica del muestreo no probabilstico de uso
generalizado. Busca a los entrevistados, para realizarles entrevistas individuales
(utilizando cuotas asignadas) en sitios fijos de centros comerciales. En la prctica
es comn que en una investigacin se utilicen varios centros comerciales con
diferente nivel socioeconmico en varias ciudades.
Estas muestras son utilizadas frecuentemente en estudios de magnitud moderada
(100 a 200) carcter experimental. Se emplean, por ejemplo, para comparar las
respuestas de dos o ms centros comerciales, dos o ms conceptos del producto,
etc. y no para estimar los parmetros de una sola poblacin existente. Estas
muestras deben de ser de carcter informativo para tales propsitos, bajo el
supuesto de que las diferencias resultantes en el experimento no dependan en
gran parte de las caractersticas de la muestra.

3.4 Actividades de la unidad


Para el escenario planteado de Pizza Healthy (o su propio escenario) que
describi en la unidad 2, explique claramente el tipo de muestreo que es
conveniente utilizar para poder aplicar el cuestionario propuesto y el tamao de
muestra que debera usar.

68

UNIDAD 4. ANLISIS ESTADSTICO BSICO EN LA


INVESTIGACIN DE MERCADOS
4.1 Anlisis estadstico exploratorio y descriptivo
Las tcnicas del anlisis exploratorio permiten, antes de realizar cualquier
otro tipo de anlisis, verificar de manera preliminar el comportamiento de los datos
reunidos y de acuerdo con este comportamiento ajustar el modelo ms apropiado.
El objetivo principal de la exploracin de los datos, puede ser dividido en dos
reas:
Deteccin de errores. Es bastante comn que al manipular los datos reunidos se
cometan errores sin detectarse. Errores de registro, codificacin, captura, etc.,
muchos de estos errores se detectan en la exploracin de datos.
Exploracin de las caractersticas de los datos. El anlisis exploratorio de los
datos nos permite:
a) Exhibir caractersticas o patrones ocultos dentro de los datos.
b) Resaltar con claridad la tendencia o regularidades que conforman los datos.
c) Proponer hiptesis o modelos acerca del comportamiento de los datos.
Entre algunos de los mtodos exploratorios de datos ms usuales para destacar
las particularidades ms importantes de un conjunto de datos, podemos encontrar
los grficos (de puntos, de tallos y hojas, histogramas, ojivas, cajas y alambres) y
tablas de frecuencias. Sin embargo, tales mtodos no son suficientes para
caracterizarlos en forma resumida. Por ejemplo, si deseamos comparar dos
conjuntos de datos, resulta difcil confrontarlos por simple inspeccin de sus
grficos o de sus distribuciones de frecuencia: En tal caso, resulta conveniente
obtener medidas numricas que describan resumidamente los conjuntos de datos
conocidas como estadsticas descriptivas.
Existen fundamentalmente dos tipos de medidas descriptivas de inters para
cualquier conjunto de datos. Las de tendencia central y las de dispersin.
4.1.1 Anlisis univariado y bivariado
Generalmente, el primer paso en el anlisis de datos consiste en analizar
cada variable o medirla por s misma de forma individual, este anlisis se conoce
con el nombre de anlisis univariado. Posteriormente se procede a estudiar la
relacin entre dos o ms variables, en el caso de analizar las variables por parejas
se conoce con el nombre de anlisis bivariado y en el caso de ms de dos
variables se conoce como anlisis multivariado.
69

Dentro de las tcnicas de anlisis univariado se utilizarn grficos y tablas para


cada variable de inters. En el caso del anlisis bivariado se encuentra la
correlacin lineal.
4.1.2 Correlacin lineal
El objetivo central del anlisis de correlacin lineal es medir la intensidad de
una relacin lineal entre dos variables. La intensidad mencionada es medida por
medio del coeficiente de correlacin lineal r. El coeficiente refleja el grado de
relacin o efecto que tiene el cambio de una variable sobre otra.
El valor del coeficiente de correlacin lineal ayuda a contestar la pregunta: Existe
correlacin lineal entre las dos variables consideradas? El coeficiente de
correlacin lineal r siempre tiene un valor entre -1 y +1. Un valor igual a +1 indica
una correlacin perfecta positiva. Mientras que un valor igual a -1 indica una
correlacin perfecta negativa.
Si a medida que se incrementa X hay un incremento general en el valor de Y,
entonces r indica una correlacin lineal positiva para X y Y, ya que a medida que X
crece, Y tambin crece. Por ejemplo puede considerarse la antigedad de un
automvil como X y su valor relativo como Y. Conforme un coche se hace antiguo
su valor se deprecia. La correlacin entre estas dos ltimas variables es negativa,
ya que Y decrece al aumentar X.
El valor de r para una muestra se obtiene mediante la expresin (conocida como la
r de Pearson).
n

xi yi

xy

i 1

n
n

xi2

i 1

yi2
2 i 1
x
n

Una forma de observar grficamente la correlacin lineal es a travs de un


correlograma o diagrama de dispersin que es el grfico ms antiguo para
representar datos bivariados. Un correlograma es una grfica de puntos que nos
representa un conjunto de datos bivariados en un plano cartesiano. El
correlograma es una de las herramientas ms potentes para investigar la
dependencia de una variable Y sobre una variable X.
En la Figura 12 se ilustran algunos grficos que muestran diferentes tipos de
asociacin y niveles de intensidad de los mismos.
70

Figura 12. Diferentes tipos de asociacin entre dos variables X y Y


Se recomienda antes de analizar los datos mediante un esquema de Regresin
Lineal Simple, graficarlos en un correlograma, el cual permite explorar la
asociacin que hay entre la variable X y la variable Y. As mismo a comprender la
eficiencia y las posibilidades de aplicar los mtodos inferenciales en un futuro
anlisis. Tal exploracin tambin puede indicar la posibilidad de usar tcnicas
como regresin mltiple o regresin no lineal.

4.2 Inferencia estadstica bsica


La inferencia estadstica consiste en aquellos mtodos por los cuales se
realizan inferencias o generalizaciones acerca de una poblacin, Walpole et al
(1985), tambin es til en la mercadotecnia principalmente para obtener e
interpretar observaciones empricas de tal manera que se pueda tomar una
decisin racional ante la incertidumbre.
La inferencia estadstica se divide en dos reas: la estimacin y la prueba de
hiptesis. Analizaremos dos ejemplos para poder distinguir estas dos reas: 1)
considere que una fbrica desea lanzar al mercado un cereal de manera
industrializada, dicho cereal se sabe que es consumido por la poblacin en forma
natural, es decir, no industrializada, aunque no se sabe el dato exacto de su
consumo. As entonces, se desea estimar el nmero de personas que lo
consumen mediante una muestra aleatoria de 100 elementos, la fraccin de
personas que consume dicho cereal puede considerarse como la verdadera
proporcin de la poblacin. Este problema se incluye dentro del rea de
estimacin; 2) ahora considere que la fbrica desea saber cul de los dos tipos de
cereal (industrializado y el natural) es el mejor, la fbrica puede suponer que el
industrializado es el mejor, y despus se realiza las pruebas apropiadas, aceptar o
71

rechazar esta hiptesis, ntese que en esta segunda fase del ejemplo se pretende
llegar a una decisin correcta y no estimar un parmetro. Nuevamente se est
dependiendo de la teora estadstica para obtener as una medida que precise la
decisin a tomar.
En esta antologa se presentan de manera general algunas de las pruebas de
hiptesis tales como para proporciones, para probar independencia y
homogeneidad.
4.2.1 Prueba de hiptesis para proporciones
Las pruebas de hiptesis relacionadas con proporciones son utilizadas en
diversas reas. Por ejemplo, un candidato a diputado est interesado en conocer
la proporcin de personas que votarn a su favor; un fabricante de zapatos desea
saber la proporcin de artculos defectuosos cuando se realiza un envi; un
fabricante de un determinado producto desea saber la proporcin de personas que
prefieren su producto, etc. Analizaremos como se llevan a cabo estas pruebas de
hiptesis para proporciones.
Se probar la hiptesis de que la proporcin de xitos de un experimento binomial
sea igual a un valor especfico, es decir, la hiptesis nula ser p p0 , donde p
es el parmetro de la distribucin binomial y la hiptesis alterna ser cualquiera de
las siguientes p p0 , p p0 p p0 , bilateral o unilateral segn sea el caso.
El estadstico en el cual se basa el criterio de decisin es la variable aleatoria
binomial X = nmero de xitos observados en una muestra de tamao n.
Aunque tambin se puede utilizar el estadstico p X / n , valores de X lejanos de
la media np0 produce el rechazo de la hiptesis nula, debido a que X es una
variable binomial discreta, es muy poco probable que se establezca una regin
crtica exactamente igual al valor de , por tal motivo es preferible basar las
decisiones en los valores de P.
Cuando n es pequea se utiliza la tabla o la formula binomial real. Cuando n es
grande se utilizan aproximaciones, si el valor de p0 se encuentra muy cerca de 0
de 1 se puede usar la distribucin Poisson con parmetro np0 . Tambin puede
ser utilizada la distribucin normal con parmetros np0 y

np0 q0 , sta es

muy segura siempre y cuando p0 no se encuentre demasiado cerca de 0 y 1. En


esta distribucin, el valor de Z que prueba la igualdad p p0 es
Z0

x np0
np0 (1 p0 )
72

Se utiliza la tabla de distribucin Normal


La regin crtica para la hiptesis de dos colas para un nivel de significancia es
Z0 Z / 2 y Z0 Z / 2 , para p p0 es Z0 Z y para p p0 es Z0 Z .
Para probar la hiptesis:
H0 : p p0
H1 : p p0
Se utiliza la distribucin binomial para calcular P.
P = P( X x cuando p p0 )
Donde x es el nmero de xitos en la muestra de tamao n.
Si el valor de P es menor o igual a , la prueba es significativa con un nivel y se
rechaza H 0 aceptndose H1 .
Para probar las hiptesis
H0 : p p0
H1 : p p0
Con un nivel de significancia , se calcula
P = P( X x cuando p p0 )
Si este valor es menor o igual que , se rechaza H 0 y se acepta H1 .
Por ltimo para probar las hiptesis:
H0 : p p0
H1 : p p0
Con un nivel de significancia , se calcula
P = 2P( X x cuando p p0 )
Si x np0
P = 2P ( X x cuando p p0 )
Si x np0
Si P es menor o igual que se rechaza H 0 , aceptndose as H1
73

Ejemplo.
Una empresa refresquera distribuye dos marcas de refresco, marca A y marca B, y
afirma que el 20% de los consumidores en Xalapa prefieren la marca A. Para
probar esta afirmacin se tom aleatoriamente una muestra de 120 personas y se
les pregunt que marca prefieren. Si 36 de los 120 responden que prefieren la
marca A, qu conclusin puede obtenerse?, Con un nivel de significancia de
0.05.
Solucin
Las hiptesis que se plantean son:
H0 : p 0.20
H1 : p 0.20
Donde
n 120 , p0 0.20 , x 36
np0 120(0.20) 24
Como n es muy grande, se utiliza la distribucin normal.
La regin crtica z < -1.96 y z > 1.96

Z
0

x np0

np0 (1 p0 )

36 24

120(0.20)(0.80) 2.7386

Conclusin.
Se rechaza H 0 , es decir, que los consumidores de refresco en Xalapa que
prefieren la marca A no es igual al 20%.

4.2.2 Anlisis de tablas de contingencia


Cuando se analizan variables cualitativas, es habitual representar en tablas
las frecuencias de casos observados para cada una de las diferentes categoras
de las variables, las cuales se denominan tablas de contingencia.
Las tablas de contingencia son una herramienta fundamental para este tipo de
anlisis. Estn compuestas por filas (horizontales), para la informacin de una
variable y columnas (verticales) para la informacin de otra variable. Estas filas y
columnas delimitan celdas donde se vuelcan las frecuencias de cada combinacin
de las variables analizadas. En su expresin ms elemental, las tablas tienen solo
2 filas y 2 columnas (tablas de 2x2). En general, las tablas pueden abarcar varias
74

filas (M) y columnas (N). El anlisis puede ocasionalmente involucrar ms


variables.
Nos enfocaremos a las tablas de contingencia de dos dimensiones. Estas estn
compuestas por dos variables que representan las categoras o clases. La primera
variable tiene r categoras (filas), la segunda tiene c categoras columnas,
entonces las r c casillas representan las frecuencias de ocurrencia de las r c
combinaciones de niveles, categoras o clases de las dos variables. La notacin
utilizada es la siguiente:
Tabla 4.Tabla de contingencia
B1
B2
B3
B
A
A1
A2
:
:
Ai
ni1
ni2
:
:
Ar
n+1
n+2

...

Bj
N1j
n2j
:
:
nij
:
:
nrj
n+j

Donde n representa el total de la muestra y ni ,

...

...

Bc

nic

n+c

n1+
n2+
:
:
ni+
:
:
nr+
n++

n j representan los totales

marginales de la muestra por fila y por columna, nij


cruzada en la casilla de la tabla con fila i y columna j.

representa la clasificacin

Tambin a esta tabla se le puede agregar otra que represente las probabilidades
observadas.
Tabla 5.Tabla de probabilidades observadas
B1
B2
B3
B
...
A
A1
A2
:
:
Ai
Pi1
Pi2
:
:
Ar
P+1
P+2

Bj
N1j
n2j
:
:
Pij
:
:
Prj
P+j

...

...

Bc

Pic

P1+
P2+
:
:
Pi+
:
:
Pr+
1

75

Donde Pij es la proporcin total de la muestra que cae dentro de cada casilla, esto
es:
Pij nij / n ; por lo tanto i j Pij 1
A este conjunto de probabilidades se le denomina distribucin conjunta. A los
totales de las filas y de las columnas se le denomina distribuciones marginales, es
decir, Pi y P j , que se obtienen sumando las filas y las columnas, esto es:

P
i

ij

ij

Estas distribuciones se denotan por ( Pi ) ( P j ), observe que Pi ni / n y P j n


j

/ n y que Pi P j 1.

Ejemplo.
Suponga que mediante una tabulacin cruzada se discute el punto de que el
dueo de una rasuradora elctrica (variable dependiente) est con ms frecuencia
entre los hombres de menos de 40 aos que entre los que tienen 40 aos o ms
(variable independiente). Se tom una muestra de tamao 500. Los datos
observados se presentan a continuacin:
Tabla 6. Datos observados
Poseen rasuradora
elctrica
Si (B1)
No (B2)
Total

A1
40 aos o menos
50 (20%)
200 (80%)
250

Grupo de edad
A2
Mayores de 40 aos
25 (10%)
225 (9%)
250

A3
Total
75
425
500

La correspondiente tabla de probabilidades observadas


Tabla 7. Probabilidades observadas
Poseen rasuradora
elctrica
Si (B1)
No (B2)
Total

A1
40 aos o menos
0.1
0.4
0.5

Grupo de edad
A2
Mayores de 40 aos
0.05
0.45
0.5

A3
Total
0.15
0.85
1

La distribucin conjunta muestral es: Pij = 0.1, 0.05, 0.4, 0.45


76

La distribucin marginal por fila: Pi = 0.15, 0.85


La distribucin marginal por columnas: P j = 0.5, 0.5
Las probabilidades condicionales para las filas son:
P1(1) = P(A1/B1) = 50/75
P2(1) = P(A2/B1) = 25/75
P1(1) = P(A1/B2) = 200/425
P2(1) = P(A2/B2) = 225/425
Observe qu j Pj (1) j Pj (2) 1, pero que es obtenido de hacer la sumatoria
de las probabilidades en un espacio muestral distinto al obtenido con las
distribuciones marginales.

i Pi = 0.15+0.85 = j P j =0.5+0.5 = 1
La Tabla 6 refleja que un 20% de los hombres que tienen 40 aos o menos poseen
una rasuradora elctrica, un 10% de los hombres mayores de 40 aos poseen una
rasuradora elctrica, etc.
Puede suceder que estos resultados no sean satisfactorios para el analista y
desee encontrar una relacin mejor, supongamos que l piensa que el factor
ingreso puede explicar mejor la obtencin de una rasuradora.
La Tabla 6 se modificara de la siguiente manera:
Poseen
rasuradora
elctrica
Si
No
Total

Ingresos de $300,000 o ms
40 aos o
Ms de 40
menos
aos
30
15
70
85
100
100

Ingresos menores de $300,000


40 aos o
Ms de 40 aos
menos
15
8
135
142
150
1500

En este ejemplo se analizaron dos variables independientes, edad e ingresos. Se


tiene una informacin ms completa, ms detallada de las personas que poseen
rasuradoras.
Sin embargo, existe un lmite para utilizar variables independientes, ya que si se
incluyen ms variables, los investigadores crean ms agrupamientos. En el primer
ejemplo se crearon cuatro agrupamientos con una variable independiente, en el
segundo se crearon ocho agrupamientos con dos variables independientes;
adems si se utiliza una muestra pequea y se incluyen varias variables
77

independientes cada agrupamiento tendra resultados muy pequeos, por esta


razn las tabulaciones cruzadas generalmente no incluyen ms de tres o cuatro
variables.
Tambin la lgica entre las variables dependientes e independientes tiene mucho
que ver con la reduccin de las variables.
4.2.3 Hiptesis de independencia
La hiptesis de independencia se utiliza, como su nombre lo indica, cuando
se desea saber si existe suficiente evidencia respecto a la independencia entre
dos variables. Se dice que dos variables son independientes si todas las
probabilidades conjuntas son iguales al producto de las marginales.
Para probar las hiptesis de independencia en tablas de contingencia, se utiliza la
prueba ji- cuadrada ( 2 ). El estadstico que se utiliza es el siguiente:
o
e
2 i i

ei
Donde oi representa las frecuencias observadas y ei las frecuencias esperadas
que se obtienen multiplicando la probabilidad de cada celda por el total de
observaciones.

2 con v (r 1)(c 1) grados de libertad, se rechaza la hiptesis nula de


independencia con un nivel de significancia , de lo contrario se acepta.
Si

Ejemplo:
Tomando como referencia el ejemplo de las rasuradoras de la seccin anterior,
suponga que el investigador desea saber si la variable de uso de rasuradoras
elctricas es independiente de la edad de las personas. Las frecuencias
observadas se presentan a continuacin:
Tabla 8. Tabla de frecuencias observadas
Uso
de
A1
rasuradora
elctrica
< de 25
Si usan (B1)
50
No usan (B2)
65
Total
115

A2
25-39
75
60
135

Grupo de edad
A3
40-54
95
35
130

A4
> de 54
30
90
120

Total
250
250
500

Probar la hiptesis de independencia, con un nivel de significancia de 0.05.


78

Solucin:
H 0 : Existe independencia entre las variables
H1 : No existe Independencia entre las variables
Las frecuencias marginales son:
P(A1) = 115/500
P(A2) = 135/500
P(A3) = 130/500
P(A4) = 120/500
Si la hiptesis nula es verdadera y las dos variables son independientes se
debera tener:
P(A1,B1) = (115/500) (250/500) = 0.115
P(A1,B2) = (115/500) (250/500) = 0.115
P(A2,B1) = (135/500) (250/500) = 0.135
P(A2,B2) = (135/500) (250/500) = 0.135
P(A3,B1) = (130/500) (250/500) = 0.13
P(A3,B2) = (130/500) (250/500) = 0.13
P(A4,B1) = (120/500) (250/500) = 0.12
P(A4,B2) = (120/500) (250/500) = 0.12
= 1.00
Las frecuencias esperadas son:
e1= (0.115)(500) = 57.5
e2= (0.115)(500) = 57.5
e3= (0.135)(500) = 67.5
e4= (0.135)(500) = 67.5
e5= (0.130)(500) = 65
e6= (0.130)(500) = 65
e7= (0.120)(500) = 60
e8= (0.120)(500) = 60

La tabla de frecuencias observadas y esperadas, queda de la siguiente manera:


Tabla 9. Tabla de frecuencias observadas y esperadas
Uso
de
A1
rasuradora
elctrica
< de 25
Si usan (B1)
50 (57.5)
No usan (B2)
65 (57.5)
Total
115

Grupo de edad
A2
A3
25-39
40-54
75 (67.5)
95 (65)
60 (67.5)
35 (65)
135
130

A4
> de 54
30 (60)
90 (60)
120

Total
250
250
500

79

El estadstico 2 .

2 (50 - 57.5)2 /57.5 + (75 - 67.5)2 /67.5 + (95 - 65)2 /65 + (30 - 60)2 /60 + (65 - 57.5)2 /
57.5 + (60 - 67.5)2 /67.5 + (35 - 65)2 /65 + (90 - 60)2 /60

61.3155

v (2 1)(4 1) 3 ; 2 (0.05,3) 7.815


Conclusin. Como 22se rechaza la hiptesis nula con un nivel de
significancia de 0.05 y se concluye que el tener una rasuradora elctrica y la edad
no son independientes; es decir, existe alguna dependencia entre estas dos
variables, lo que se puede aprovechar para una campaa publicitaria.
4.2.4 Hiptesis de homogeneidad
En el ejemplo comentado en la seccin anterior, en donde se prueba la
independencia entre las dos variables, se tom una muestra de 500 hombres, en
donde los totales de las filas y columnas fueron determinados al azar. El
estadstico 2 tambin es utilizado cuando los totales de las filas y columnas estn
determinados. Esto sucede cuando se realiza un muestreo estratificado.
Estas hiptesis se utilizan cuando se desea saber si las proporciones de la
poblacin en cada rengln son iguales.
Ejemplo:
Una empresa refresquera desea saber si la nueva bebida que lanz al mercado
fue aceptada de igual forma en cuatro ciudades importantes (Xalapa, Veracruz,
Poza Rica y Crdoba). Para lo cual realiz una investigacin obtenindose los
siguientes resultados.
Opinin
A favor
En contra
Sin opinin

Xalapa
65
45
93

Ciudad
Veracruz
Poza Rica
66
40
30
33
54
54

Crdoba
34
42
24

Con un nivel de significancia de 0.01 probar la homogeneidad de opiniones entre


las cuatro ciudades relacionada con la nueva bebida.
Solucin:
Suponiendo homogeneidad, se calculan las frecuencias esperadas de igual
manera que en el ejemplo anterior.
80

H0 :Las opiniones entre las cuatro ciudades relacionadas con la nueva bebida son
las mismas.
H1 :Al menos una opinin entre las cuatro ciudades relacionada con la nueva
bebida no es la misma.
La tabla de frecuencias observadas y esperadas es la siguiente.

Opinin

Xalapa

A favor
En contra
Sin opinin
Total

65
45
93
200

Ciudad
Veracruz
Poza
Rica
66
40
30
33
54
54
150
127

Crdoba

Total

34
42
24
100

205
147
225
577

(65 - 71)2 /71 + (45 - 51) 2 /51 (93 - 77.98)2 /77.98 (66 - 53.3)2 /53.3 + (30 - 38.2) 2 /

38.2

(54 - 58.5)2 /58.5 (40 - 45.1)2 /45.1 + (33 - 32.4)2 /32.4 + (54 - 49.5)2 /49.5 + (34 - 35.5)2 /

35.5

+ (42 - 25.4)2 /25.4 + (24 - 38.9)2 /38.9


2

26.78
v (3 1)(4 1) 6 ; 2(0.01,6) 16.812
Conclusin.
Como 2 2 , rechazamos H 0 por lo tanto las opiniones no son homogneas.

4.3 Anlisis de regresin


En el anlisis de la informacin existe frecuentemente uno o un pequeo
nmero de variables claves que se convierten en el centro de atencin del estudio.
Cuando un nuevo concepto o producto est siendo explorado, por ejemplo, una de
las variables clave es generalmente la actitud del entrevistado o las intenciones
hacia l. Es algo que a los entrevistados les gustara comprar y/o usar? La meta
puede ser predecir el consumo ltimo del producto o concepto bajo una variedad
de condiciones. Otra meta podra ser entender qu causa las altas intenciones,
para que cuando el producto emerja el programa de mercadotecnia pueda ser
ajustado para mejorar la probabilidad de xito.
El anlisis de regresin proporciona una herramienta que puede cuantificar tales
relaciones. Adems, a diferencia de las tabulaciones cruzadas y otras medidas de
asociacin, que tratan nada ms con dos variables, el anlisis de regresin puede
integrar la relacin de intenciones con dos, tres, o ms variables simultneamente.

81

Algunos investigadores de mercados prefieren utilizar tcnicas que produzcan


resultados que se puedan evaluar objetivamente, como los de anlisis de
regresin y correlacin que se pueden utilizar cuando las variables dependientes e
independientes son continuas. El anlisis de correlacin sirve nicamente para
saber si existe relacin entre dos variables: cuando dos variables tienen un
coeficiente de correlacin muy alto, los investigadores sabrn que tienen datos
que establecen una fuerte relacin entre las variables. El anlisis de regresin
permite predecir el cambio de la variable dependiente si la variable independiente
se cambia en una unidad por decir algo, esto se realiza por medio de una
ecuacin lineal.
4.3.1 Anlisis de regresin lineal simple
El anlisis de regresin es una tcnica con la que se adecua una ecuacin
matemtica a un conjunto de datos, Boyd (1987). Los datos deben de consistir en
mediciones de dos o ms variables continuas y adems el tamao de la muestra
debe de ser cuando menos el doble o el triple del nmero de variables medidas.
La ecuacin matemtica es:
Y 0 1 x
Donde Y es una variable dependiente y X una variable independiente o
explicatoria, y 1 es un coeficiente que indica el efecto que tiene en Y un cambio
en una unidad en la variable X, 0 es la ordenada al origen o el valor promedio
cuando X 0 . Debido a que esta ecuacin tiene una variable independiente, se le
conoce como ecuacin de regresin simple. El hacer una regresin lineal a partir
de una poblacin es casi imposible, se recurre a la obtencin de muestras de la
poblacin y con estas se realiza el anlisis de regresin.
Por medio de las tcnicas de regresin y en base a una muestra es posible
estimar una ecuacin que se asemeje lo ms posible a la ecuacin poblacional. A
esta funcin que se estima se le llama funcin de regresin muestral (FRM). La
FRM har lo posible para estimar los valores medios poblacionales de Y dado un
valor de X, con cierto error. Para cada muestra existe un FRM, pero no se podr
saber cul es la que se asemeje mas a la FRP ya que sta es desconocida. Pero
lo que si se asegura es que las tcnicas de regresin en base a los datos de la
muestra harn posible la obtencin de FRM que ms se ajuste a ellos. La FRM se
puede expresar de la siguiente manera:
Y 0 1 x1
Donde:
Yi = es el estimador del valor E(Y X i
) 0 = es el estimador de 0

1 = es el estimador de 1
82

El procedimiento utilizado comnmente para calcular la lnea de regresin que


ms se ajuste a los datos, es el conocido como mtodo de mnimos cuadrados; el
cual reduce al mnimo la suma de cuadrados de los residuos, es decir, ste
mtodo permite obtener los estimadores que reducen al mnimo la sumatoria.

Yi

Yi 2

Donde Yi Y es el residuo de los errores muestrales ( ei ).


La estimacin del coeficiente 1 se obtiene mediante la siguiente frmula:

XY


n X i 2 X i 2
i

Donde xi y yi representan desviaciones con respecto a su media respectiva.


La estimacin del coeficiente 0 se calcula de la siguiente manera:

0 Y 1 X
Donde X y Y son medias muestrales de X i y Yi .
Siempre que se lleve a cabo un anlisis de regresin, los investigadores tendrn la
necesidad de saber que tan bueno es, es decir, si la ecuacin de regresin explica
adecuadamente la variacin observada de la variable dependiente (Y). Para esto,
se calcula el coeficiente de determinacin ( R2 ). Este coeficiente puede tomar
valores entre 0 y 1; si R2 1 indica que la ecuacin de la regresin explica al 100%
la variacin que se da en la variable dependiente con relacin a su media, y
por lo tanto todos los residuos deben ser iguales a cero. Cuando R2 0 la ecuacin
de la regresin no se ajusta a los datos, y algunos residuos sern mayores de
cero.
Varianza total en la Varianza "no exp licada"

var iable dependient e la ecuacin de regresin

por

var ianza total en la var iable dependient e

Si la recta de regresin explica totalmente la variacin de Y, todos los residuos y la


varianza no explicada por la ecuacin sern iguales a cero, y el coeficiente de
determinacin ser:

8
3

R2

var ianza total en la var iable dependient e 0


1
var ianza total en la var iable dependient e

Cuando el valor de R2 se encuentra entre 0.50 y 1, se considera que la ecuacin


de regresin explica satisfactoriamente la variacin en Y.
La frmula para obtener el coeficiente de determinacin es:
Y
i Y Yi Yi
2
2
2
R
Y
i Y 2
Para saber si la variable X explica significativamente el comportamiento de la
variable Y, se utilizan hiptesis empleando anlisis de varianza.
La hiptesis que se plantea es la siguiente:
H 0 : 1 0
H 1 : 1 0
Fuente de variacin
Debido a la regresin
Debido a los residuos
Suma total

Suma de
cuadrados
SCR
SCE
SCT

Grados de
libertad
1
n-2
n-1

Suma de
cuadrados medios
SCR/1
SCE/(n-2)

Donde:

SCR= 12 X i X 2
SCE= ei 2
SCT= Yi 2
El estadstico calculado es el siguiente:

F
c

2 X X 2 /1
1

ei

(n 2)

La variable Fc sigue una distribucin F de Fisher con (1, n 2) grados de libertad.


Si Fc F se rechaza la hiptesis nula y se afirma que la regresin que se est
haciendo es significativa, es decir, la variable X tiene influencia significativa en el
comportamiento de la variable Y.

84

Ejemplo.
Se entrevistaron a 10 familias de la ciudad de Coatepec, con el nico propsito de
estudiar la relacin entre el consumo de la leche y los ingresos, para saber si el
consumo familiar de leche aumenta o disminuye conforme se incrementan los
ingresos anuales. El consumo de leche es la variable dependiente, en los datos
que se obtuvieron se observa que sta vara en cada familia. Esta variacin
puede ser explicada por el ingreso?
Familia

Consumo mensual
de leche (litros)
4
8
10
5
6
7
12
11
9
13

1
2
3
4
5
6
7
8
9
10

Y
i
2

Familia
1

X
Y
Y
10
4
16

XY
40

85

145

14.5

8.5
2

X
100

Ingreso anual (millones


de pesos)
10
14
15
11
12
13
17
16
18
19

Y Y
i

Yi Yi

Yi

Yi

Xi X

Yi

X 2
i

-4.5

20.25

4.3272

-0.3272 0.10705984

-4.5

20.25

14

64

196

112

-0.5

0.25

8.0364

-0.0364 0.00132496

-0.5

0.25

15

10

100

225

150

1.5

2.25

8.9637

1.0363 1.07391769

0.5

0.25

11

25

121

55

-3.5

12.25

5.2545

-0.2545 0.06477025

-3.5

12.25

12

36

144

72

-2.5

6.25

6.1818

-0.1818 0.03305124

-2.5

6.25

13

49

169

91

-1.5

2.25

7.1091

-0.1091 0.01190281

-1.5

2.25

17

12

144

289

204

3.5

12.25

10.8183

1.1817 1.39641489

2.5

6.25

16

11

121

256

176

2.5

6.25

9.891

1.229881

1.5

2.25

18

81

324

162

0.5

0.25

11.7456

-2.7456 7.53831936

3.5

12.25

10

19

13

169

361

247

4.5

20.25

12.6729

0.3271 0.10699441

4.5

20.25

Suma

145

85

805

2185

1309

2185
2

X
i

Yi

Yi

X i Yi

11.56330

82.5

11.5636365

Yi

1309

1.109

82.5

Y 2 82.50

X i

X 82.50
85

10130914585 765 0.9273


102185 1452 825
1
0 8.5 0.927314.54.9458
Por lo tanto, la ecuacin de regresin es:
Yi 4.9458 0.9273X i
El coeficiente de determinacin:

R2

82.50 11.5633

0.86 82.50

0.8598

El investigador puede interpretar este resultado de la siguiente manera: la


ecuacin de regresin explica el 86% de la variacin total observada en la variable
del consumo mensual de leche por familia, o dicho de otra manera, el investigador
puede decir que el 14% de la variacin total del consumo de leche por familia no
est explicado por la ecuacin de regresin.
y

= -4.945 + .92727 * x

14

CONSUMO MENSUAL DE LECHE

12

10

10

12

14

16

18

20

INGRESO ANUAL

Figura 13. Grfico de regresin lineal simple


Para probar las hiptesis de que el ingreso por familia explica significativamente el
comportamiento del consumo de leche, se realiza el anlisis de varianza.
El juego de hiptesis que se plantea es:
H 0 : 1 0
H 1 : 1 0
86

SCR= 12 X i X 2 (0.9273)2 (82.50) 70.9405


SCE= ei 2 11.5595
SCT= Yi 2 82.50
Fuente de variacin
Debido a la regresin
Debido a los residuos
Suma total

Suma de
cuadrados
70.9405
11.5595
82.50

Grados de
libertad
1
8
9

Suma de
cuadrados medios
70.9405
1.4449

El estadstico calculado es el siguiente:


Fc

70.9405

1.4449 49.10

La F de Fisher con (1, 8) grados de libertad y un nivel de significancia de 0.05 es


F(1,8) 5.32 , entonces como Fc F(1,8) , se rechaza la hiptesis nula, esto nos indica
que la regresin es significativa, es decir, la variable X (ingreso) tiene influencia
significativa sobre la variable Y (consumo de leche).

4.3.2. Anlisis de regresin lineal mltiple


En la seccin anterior se analiz el anlisis de regresin lineal simple en
donde se utiliza slo una variable independiente. Sin embargo en un estudio de
campo es muy comn que los datos recopilados abarquen varias variables
independientes como: la edad del esposo, la edad de la esposa, los ingresos
anuales, los aos de educacin formal del esposo, el tamao de la familia, etc.
Estas variables se incluyen debido a las hiptesis de los investigadores que creen
que tanto la edad del esposo y los aos de educacin formal pueden ser tiles
para explicar porque algunas familias consumen ms un producto X, o que las
variables: edad del esposo, los ingresos anuales y el tamao de la familia son
necesarias para explicar el gasto que se realiza en un periodo de vacaciones, etc.
Cuando se estudian dos o ms variables independientes se le llama anlisis de
regresin lineal mltiple. Este anlisis permite realizar un estudio de regresin ms
realista debido a que una variable dependiente tiende a recibir la influencia que los
valores de diferentes variables independientes.
La regresin lineal mltiple se utiliza para describir la naturaleza de una relacin
lineal entre una variable dependiente y varias independientes, y se utiliza tambin
para predecir el valor de la variable dependiente a partir de los valores conocidos
de las variables independientes.
87

El tamao de la muestra que se utilice en este tipo de anlisis debe de ser cuando
menos el doble o el triple de las variables medidas.
En el anlisis de regresin lineal mltiple tratamos de encontrar la recta que mejor
se ajuste a un conjunto de datos. En este caso se trata de tres dimensiones y la
expresin que mejor se ajuste ser un plano bidimensional.
La ecuacin de regresin mltiple que se utiliza es:
Y 0 1 X1 2 X 2 3 X 3 pXp
Donde Y es la variable dependiente y X1 , X

, X

, , X

son las variables

independientes, 0 es un coeficiente estructural necesario para complementar la


ecuacin, generalmente tiene poca importancia; los coeficientes 1 , 2 , 3 , , p
indican cmo Y tiende a cambiar con cada cambio de X, a condicin de que las
otras X permanezcan constantes. En ocasiones a estos coeficientes se les llama
coeficientes de regresin parcial y se calculan de la misma manera que en anlisis
de regresin simple.
Con el fin de hacer ms sencillos los clculos, es conveniente expresar a las
variables como desviaciones de sus respectivas medias, es decir, en lugar de
utilizar en los clculos Y , X1 , X 2 , X 3 , , X p se utilizaran las variables:
Y yi y
X1 x1 x1
X 2 x2 x2
X p xp xp
Para calcular 1 cuando se utilizan dos variables se emplea la siguiente frmula:

YX 1 X 2 2 YX 2 X1 X
X12 X 2 2 X1 X 2

YX 2 X12 YX 1 X1 X
X12 X 2 2 X1 X 2

para

Para calcular el coeficiente 0 se utiliza la siguiente ecuacin:

0 y 1 x1 2 x2
88

El tratamiento de la regresin lineal mltiple se puede realizar de manera matricial,


pero el objetivo de esta monografa es la simplificacin para que otros
profesionales la comprendan.
Ejemplo.
Considere un grupo de datos de 8 pizzeras hipotticas. En cada una de ellas
tenemos tres mediciones: 1) el nmero de clientes que hace poco acudieron un
viernes a la pizzera, 2) el precio de una pizza grande de jamn y 3) el cupo de las
pizzeras. Al realizar el anlisis de regresin mltiple nos gustara determinar la
relacin lineal que mejor describa al nmero de clientes (y) en funcin del precio
(x1) y el cupo (x2).
Pizzeras
1
2
3
4
5
6
7
8

729

y 91.125
Pizzera

Y=

X 1= x

X12
1

220

x1 27.5
X 2= x
2

x2
Cupo
50
34
42
42
45
22
30
24

289

x 2 36.125
X22

YX1

YX2

X1X2

13.875

4.5

20.25

13.875

192.516

62.4375

192.516

62.4375

-4.125

-5.5

30.25

-2.125

4.51563

22.6875

8.76563

11.6875

-1.125

-4.5

20.25

5.875

34.5156

5.0625

-6.6094

-26.4375

18.875

7.5

56.25

5.875

34.5156

141.5625

110.891

44.0625

15.875

1.5

2.25

8.875

78.7656

23.8125

140.891

13.3125

-11.125

-1.5

2.25

-14.125

199.516

16.6875

157.141

21.1875

-31.125

-5.5

30.25

-6.125

37.5156

171.1875

190.641

33.6875

-1.125

3.5

12.25

-12.125

147.016

-3.9375

13.6406

-42.4375

728.875

439.5

807.875

117.5

Suma

174

YX 1 X 2 2 YX 2 X1 X 2
1

x1
Precio
32
22
23
35
29
26
22
31

y
# de clientes
105
87
90
110
107
80
60
90

X X X
1

2 2

X2

(439.5)(728.875) (807.875)(117.5)
(174)(728.875) (117.5)2

1.994

89

YX 2 X1 2 YX 1 X1 X

(807.875)(174) (439.5)(117.5)

X X X
1

X2

(174)(728.875) (117.5)2

0.7869

0 y 1 x1 2 x 2 91.125 1.994(27.5) 0.7869(36.125)


La ecuacin de regresin mltiple que ms se ajusta a los datos:
Y 7.863 1.994x1 0.7869x2
Los coeficientes de regresin parcial (1.994 y 0.7869) indican como se espera que
Y cambie cuando se incrementa el precio o el cupo. Por ejemplo, para un
determinado cupo se espera que el nmero de clientes aumente en 1.994 con
cada incremento de un peso en el precio de una pizza grande de jamn. De la
misma manera para un precio determinado se espera que el nmero de clientes
aumente en 0.7869 por cada asiento que se aada a la pizzera.
El coeficiente de determinacin ( R2 ) se calcula de la siguiente manera:
yi y yi Yi
2
2
2
R
yi y 2
Pizzera
1
2
3
4
5
6
7
8
Suma

x
32
22
23
35
29
26
22
31
220

yi 91.125

x
50
34
42
42
45
22
30
24
289

y
105
87
90
110
107
80
60
90
729
2

R2

Y2

Y
111.016
78.4856
86.7748
110.7028
101.0995
77.0188
75.338
88.5626
728.9981

y 1912.88
1912.88 400.6069

1912.88

192.516
17.0156
1.26563
356.266
252.016
123.766
968.766
1.26563
1912.88

yi

Yi

36.192256
72.49500736
10.40191504
0.49392784
34.81590025
8.88755344
235.254244
2.06611876
400.6069227

400.6069

0.7906

Este coeficiente le dice a los investigadores en qu medida se ajusta la ecuacin a


los datos. El R2 0.7906 indica que la ecuacin de regresin se ajusta bastante
bien a los datos y que explica ampliamente la variacin observada en la variable
dependiente (en este caso el nmero de clientes). Explica ms o menos el 79% de
la variacin total observada en la variable dependiente.
90

4.4 Anlisis de Segmentacin


En la prctica estadstica suele presentarse el problema de la descripcin
parsimoniosa de un conjunto numeroso de datos que constituyen la
caracterizacin de un gran nmero de individuos, segn un gran nmero de
variables. En muchas ocasiones se presenta la situacin especial en la cual una
de ellas en particular juega un papel primordial, siendo nuestro objetivo tratar de
explicar mediante el resto de las variables. Denotaremos por Y a la variable a
explicar (variable dependiente o criterio), y por X 1, X2,, Xk a las variables
explicativas (variables independientes o predictoras).
Pngase como ejemplo que se desee describir en un pueblo pequeo quien lleva
un determinado tipo de ropa. Para simplificar, tmese una prenda muy fcil de
segmentar como es la falda. Entre las posibles variables que mejor pueden
explicar quin la lleva y quien no, no es difcil reconocer que es el sexo el mejor
pronosticador, pues prcticamente ningn hombre usa este tipo de prenda. La
ejecucin de la segmentacin implicara no contentarse con una sola variable y
buscar otras que ayuden a distinguir mejor a los distintos usuarios de estas ropas.
Es evidente que si ningn hombre la usa, este grupo es totalmente homogneo en
esta variable, y por tanto, no procede seguir con la segmentacin. Pero en el caso
de las mujeres, si se pueden encontrar nuevas variables que nos distingan grupos
diferentes en uso de ropa. Parece claro que la edad juega un papel importante: es
bastante difcil ver a mujeres mayores con pantalones, mientras que entre las
jvenes el uso de estos es muy habitual. Por tanto, si no se introducen nuevas
variables, la poblacin del pueblo quedara segmentada en tres grupos: el de los
hombres donde nadie usa falda; el de las mujeres jvenes con n porcentaje
medio de portadoras de esta prenda, y el de la mujeres mayores cuya probabilidad
de verlas con falda es muy alta.
Otro ejemplo de la segmentacin es el de un pastel que hay que repartir entre
varias personas. Imaginando que es un pastel con dos sabores: nata y chocolate,
por ejemplo una segmentacin adecuada sera que se partiera en dos trozos de
gusto homogneo. Se tratara, por tanto, de realizar un corte que permitiera dar a
uno de los comensales el trozo con sabor a nata y a otro el de chocolate. En
resumidas cuentas la segmentacin permite dividir una muestra de modo que
queden grupos de contenido uniforme muy distintos entre ellos.
En el caso de variables de tipo cualitativo, los anlisis estadsticos usuales se
limitan a producir y examinar las tabulaciones cruzadas que se consideran de
inters lo que en ocasiones solo sirve para identificar relaciones que ya eran
evidentes. El anlisis de segmentacin (AS) reduce la complejidad del problema,
rechazando tabulaciones cruzadas no significativas, detectando automticamente
los mejores predictores y creando subgrupos potencialmente explicativos de la
variable dependiente.

91

En la actualidad, los mtodos de segmentacin son muy requeridos en diversas


reas, como por ejemplo la Sociologa, la Medicina o en la Mercadotecnia. En esta
ltima rea, cuando una compaa va a incorporar al mercado, un nuevo producto,
debe considerar en su planeacin, a que perfil de posibles consumidores va a
dirigir su propuesta. En otras palabras, es necesario que desarrolle un adecuado,
modelo de segmentacin, entendiendo este trmino, como dividir una poblacin en
segmentos o partes, que difieren con respecto a un criterio diseado.
Los beneficios de segmentar una poblacin o muestra son muchos, entre los
principales podemos citar:
Segmentar, permite construir un perfil ms preciso de los individuos, que
componen un colectivo bajo estudio.
Segmentar, permite agrupar para conocer mejor un subgrupo poblacional.
Segmentar, permite obtener mejores pronsticos, sobre el comportamiento de
grandes grupos de datos.
Por tanto, los mtodos de segmentacin, son una de las reas que compete
atender a la Estadstica, ya que el trmino segmentar significa dividir una
poblacin en segmentos homogneos, en relacin a una o varias caractersticas
(que no son otra cosa que variables estadsticas).
El AS una tcnica que a partir de la informacin que suministran, ciertas variables
independientes o explicativas, clasifica un conjunto de objetos en grupos, capaces
de describir de la mejor manera posible la variable dependiente.
El AS pertenece a una familia de mtodos denominados AID (Automatic Interaction
Detection), propuesta inicialmente por James Morgan y John Sonquist en 1963, el
objetivo bsico de estos mtodos era detectar la existencia de interaccin en un
modelo de prediccin. Actualmente el AS se utiliza fundamentalmente con fines
exploratorios y descriptivos. Adems puede utilizarse como un paso previo para la
aplicacin de otras tcnicas estadsticas especializadas para datos cualitativos,
como el anlisis de correspondencia y los modelos loglineales.
En el AS las variables independientes o predictoras son de tipo categrico
(nominales u ordinales) y resulta muy conveniente que tengan pocas modalidades.
En el caso de predictores cuantitativos estos pueden someterse previamente a un
proceso adecuado de modificacin para convertirlos en categricos.
KOTLER (1988) describe las fases de un estudio de Segmentacin en las etapas
siguientes:
1. Identificacin de las variables para realizar la segmentacin.
2. Desarrollo de los perfiles de cada segmento obtenido.
3. Evaluacin de los segmentos obtenidos.
92

4. Seleccin del segmento o los segmentos objetivo.


5. Identificacin de posibles motivos para posicionarse en los segmentos
seleccionados.
6. Seleccionar y desarrollar estrategias para aprovechar de manera optima las
potencialidades del los segmentos bajo estudio.
Como puede observarse, la contribucin de pruebas y modelos estadsticos, para
alcanzar mejores propuestas de segmentacin, es importante.
En la actualidad, se proponen diversas tcnicas de segmentacin, en donde en
alguna forma, todas ellas convergen en el objetivo, de proporcionar elementos
para un adecuado agrupamiento de objetos.
4.4.1 Algoritmo de Segmentacin CHAID
Existen otros mtodos de segmentacin, con un amplio desarrollo, y cuyas
propuestas de anlisis, son cada vez ms utilizadas, desde una perspectiva
estadstica, adems de tener un mayor fundamento matemtico y extensa
aplicacin en muy diversas reas, hacindolos atractivos para su utilizacin. Tales
mtodos son: CHAID (Chisquare Automatic Interaction Detection), propuesto por
KASS (1980), el cual forma parte de una de las versiones de los mtodos AID de
MORGAN y SONQUIST (1963), o el mtodo CART (Clasification And Regression
Trees) rboles de clasificacin y Regresin, propuesto por BREIMAN, FRIEDMAN,
OLSHEN y STONE (1984), son ejemplos de mtodos de segmentacin, de cierto
desarrollo en los ltimos aos.
El Algoritmo de Segmentacin CHAID, es considerado un algoritmo general de
segmentacin, se utiliza con fines exploratorios y descriptivos, con el objetivo
fundamental de encontrar la particin de una muestra de objetos en grupos,
capaces de describir de la mejor manera posible la variable dependiente. Supone
que la variable dependiente es categrica y utiliza la prueba Chi-cuadrada, para
contrastar independencia, en distintas fases del proceso.
El nombre de la familia de mtodos, a la que pertenece el mtodo CHAID
(tcnicas AID: Deteccin Automtica de la Interaccin), sugiere que una de las
funciones principales, es descubrir si en el modelo de estimacin de la respuesta,
estn consideradas variables o factores que expliquen la respuesta.
CHAID segmenta la muestra en dos o ms grupos, en donde se busca que los
objetos que pertenecen al mismo grupo, sean lo ms homogneo posible y objetos
de diferente grupo sean heterogneos. Tomando como base las categoras del
mejor predictor (variable independiente), de una variable dependiente, divide cada
uno de estos grupos en subgrupos ms pequeos, en base a otras variables
independientes. Este proceso iterativo de particin contina, hasta no encontrar
ninguna variable independiente estadsticamente significativa. CHAID muestra los
segmentos finales, en forma de diagrama de rbol. Los segmentos que CHAID
93

construye, son mutuamente exclusivos y exhaustivos, es decir los segmentos no


se sobreponen, y cada objeto de la muestra est contenido exactamente en un
segmento.
Un algoritmo general de segmentacin, plantea un proceso secuencial
multietpico, que puede representarse en un esquema como el diagrama de la
Figura 14, correspondiente al algoritmo CHAID.

Figura 14. Etapas del Algoritmo General de Segmentacin CHAID


Como se observa en el diagrama del algoritmo, se consideran cuatro etapas, que
consisten en lo siguiente:
Etapa 1. En esta etapa del algoritmo, debe realizarse el agrupamiento de
categoras, de cada predictor que produzca la mayor discriminacin de los
individuos, con respecto a la variable dependiente. Para ello, se define un
estadstico cuya significacin, presente una medida de tal discriminacin. Esta
etapa es muy importante, ya que si el objetivo es, encontrar una agrupacin
ptima de categoras, el proceso de agrupamiento de las categoras, debe ser lo
mejor posible, ya que este paso, constituye una base fundamental, para una
segmentacin adecuada.

94

El algoritmo propone para la primera etapa cruzar cada par de categoras de la


variable predictora con la variable dependiente, y agrupar el par que tenga un
valor p mayor, siempre y cuando, ste no sea significativo. El proceso se repite
con las categoras colapsadas, para valorar si las nuevas categoras producen
nuevas fusiones, hasta que no existan valores no significativos. Es decir, el
proceso termina, cuando todas las categoras son significativamente diferentes, o
bien cuando se han colapsado todas.
El agrupamiento de las categoras de las variables, est en relacin con el tipo de
predictor o variable independiente de que se trate. La Tabla 10 muestra los tipos
de predictores que considera el algoritmo.
Tabla 10. Tipos de predictores que considera el algoritmo CHAID
Tipo de
Predictor
MONTONO

LIBRE

FLOTANTE

Caractersticas
Un predictor es montono, si sus categoras pertenecen a una escala
ordinal, lo que en otras palabras quiere decir, que slo dos categoras
contiguas pueden ser colapsadas.
Si tenemos un predictor con categoras en escala nominal, este es un
predictor libre, ya que se puede agrupar cualquier par de categoras del
predictor. Se utiliza, cuando las categoras del predictor no tienen una
ordenacin natural.
Cuando todas las categoras del predictor, pertenecen a una escala ordinal
menos una de ellas, de las que se desconoce la posicin en la escala
ordinal, entonces tendremos un predictor flotante. En otras palabras, un
predictor flotante, es un predictor montono con una categora flotante de la
cual, no se conoce su posicin.

El procedimiento para agrupar categoras, es utilizado en muchos otros algoritmos


de segmentacin, en este captulo utilizamos como referente al algoritmo CHAID,
sin embargo, los mtodos aqu aplicados, pueden ser extendidos a otros
algoritmos semejantes.
Etapa 2. Seleccin del mejor predictor, de todos los predictores seleccionados en
la fase anterior, se escoge el que produce mayor discriminacin. Esto es, una vez
seleccionadas las categoras portadoras de una mayor informacin, tendremos
una serie de predictores potencialmente explicativos, cuyas categoras son
significativamente diferentes respecto de la variable dependiente. El mejor
predictor ser aquel que presente una mayor asociacin, con la variable
dependiente, es decir, aquel que tenga el valor p ms pequeo o el mayor valor
para el coeficiente de asociacin elegido.
Etapa 3. Fase de segmentacin, si el predictor escogido es significativo a un
determinado nivel previamente establecido, se realiza la segmentacin del grupo,
considerado en tantos grupos, como categoras o niveles tenga el predictor.
Etapa 4. Evaluacin sobre iteracin del proceso. Para cada segmento formado en
el paso 3, se repite el proceso desde la primera etapa y se realizan sucesivas
95

segmentaciones, hasta que no haya predictores significativos, en ninguno de los


grupos restantes.
Existen algunas reglas para la finalizacin del proceso, si no se pusieran algunas
limitantes, ste terminara nicamente cuando no hubiera predictores significativos
en ninguno de los grupos, y en este caso, se cometera un error importante, ya
que el estadstico chi-cuadrada se obtendra a partir de tablas poco ocupadas, lo
cual generara una nueva problemtica. Por ejemplo, podramos encontrar una
gran cantidad de grupos terminales, de tamao muy pequeo, los cuales sera
muy complicado interpretar. Por ello se considera importante limitar el proceso de
segmentacin utilizando ciertos controles denominados filtros.
Algunos filtros a utilizar son los siguientes:

Significacin de Categora (SC). Se refiere al nivel de significacin, utilizado en


la fase de agrupacin de categoras. Para verificar si dos categoras tienen un
perfil semejante, esto es, no son significativamente diferentes, se compara su
nivel de significacin, con la SC. En CHAID se lleva a cabo cruzando la variable
dependiente, con las dos categoras del predictor, se calcula el chi-cuadrado, y
se compara su valor p correspondiente con la SC.

Significacin del Predictor (SP). Es el nivel de significacin utilizado en la fase


de seleccin del mejor predictor, es decir, para verificar que un predictor es
significativo, se compara su significacin con SP. En CHAID se lleva a cabo
cruzando la variable dependiente con el predictor ya agrupado, se calcula el chicuadrado y se compara el valor p correspondiente con SP.

Filtros de Asociacin (FA). Se trata de fijar una asociacin mnima, entre la


variable dependiente y el predictor, esto para considerarlo como un potencial
candidato, para realizar la segmentacin. Esto plantea el problema de escoger
un coeficiente de asociacin, entre una gran cantidad de ellos. Si el coeficiente
de asociacin elegido entre la variable dependiente y el predictor, es menor que
FA, ste es descartado. Entre algunos de los indicadores ms utilizados estn
el Coeficiente de Contingencia (CC):

CC

2
n2

del cual se dice que es igual a cero, cuando hay independencia absoluta entre
las variables, pero no es igual a 1 cuando hay dependencia total (su valor
mximo depende del nmero de categoras de las variables)
CC max r 1
r
donde: r es mnimo entre el nmero de filas y de columnas.
96

Tamao Antes (TA). Se establece un tamao mnimo, para que un grupo pueda
segmentarse, es decir, si un grupo G cualquiera, es menor que TA en
individuos, el grupo no se segmenta y se declara terminal.
Tamao Despus (TD). Se establece un tamao mnimo para que un subgrupo
pueda formarse, es decir, si algn grupo formado en la segmentacin de G,
digamos Gj, tiene menos de TD individuos, la segmentacin es descartada.
Filtro de Nivel (FN). Se establece un mximo de nmero de niveles de
segmentacin, tambin denominados niveles de profundidad. Una
segmentacin con un solo nivel resulta demasiado simple, pero por otro lado
una segmentacin de muchos niveles puede resultar compleja de manejar.
Un resultado de aplicar el mtodo CHAID es el denominado, Diagrama de rbol,
como el que se muestra en la Figura 15.

Figura 15. Esquema de rbol de segmentacin, obtenido tras


aplicar el algoritmo CHAID
El algoritmo divide la muestra en dos o ms grupos distintos, en base a las
categoras de la variable independiente ms significativa, con respecto de la
variable dependiente i, en el caso del esquema de la Figura 15, el algoritmo divide
la muestra en base a las categoras, colapsadas o no, de la variable j. Contina
dividiendo recursivamente, en base a los segmentos definidos por la variable j.
Cada uno de estos grupos se divide en subgrupos ms pequeos, y si el proceso
lo permite, el rbol genera nodos adicionales. CHAID muestra los resultados de la
segmentacin en forma de un diagrama de rbol, cuyos nodos o ramas
corresponden a los grupos.
97

Cada nodo del diagrama de rbol, representa un subgrupo de la poblacin o


muestra, el rbol muestra en forma resumida, el predictor responsable de la
particin, el tamao del grupo y un indicador de la variable dependiente. Los
niveles de segmentacin quedan reflejados en lo que se denomina, nivel de
profundidad, que en el caso de la Figura 15 son los niveles 0,1 y 2.
El algoritmo de segmentacin CHAID, es un mtodo muy utilizado en diversas
reas de investigacin, quiz, esta popularizacin se debe en mucho, a que el
mtodo est incluido como un modulo anexo, en software estadstico de propsito
general.
Es claro que en la primera etapa del algoritmo CHAID, el agrupamiento de
categoras en las variables independientes, se hace sobre aquellas que son
homogneas, asumindose los riesgos de realizar un inadecuado agrupamiento
de las categoras.
Un mtodo alternativo a la fase de agrupamiento de categoras, en algoritmos de
segmentacin como CHAID es considerar la posibilidad de realizar pruebas de
asociacin, en base a los modelos de efectos columna C, cuando la variable
dependiente sea categrica ordinal. Es decir, si la variable dependiente es
nominal, realizar el procedimiento usual de comparar pares de categoras y probar
si se cumple la hiptesis de independencia. Si la variable dependiente es ordinal,
incorporar a la etapa de agrupamiento de categoras, pruebas de hiptesis
basadas en modelos de asociacin, con la finalidad de considerar el orden
subyacente, en las categoras de la variable dependiente.
El esquema de la Figura 16, presenta el procedimiento a seguir en la etapa de
agrupamiento de categoras, en algoritmos de segmentacin como los
anteriormente mencionados:

Figura 16. Esquema de la fase de agrupamiento de categoras, segn tipo


de variable dependiente
98

De tal forma, que indistintamente del tipo de predictor, para variables dependientes
nominales, en el proceso de agrupamiento de categoras, los pares elegibles de la
variable predictora y la variable dependiente, realizan la correspondiente prueba
de independencia, como usualmente lo considera el algoritmo de KASS, es decir,
las frecuencias estimadas se plantean como

H0 : log f ij i j , si la hiptesis se rechaza, las frecuencias se consideran


provenientesde
unmodelolog-linealsaturadodelaforma:

H1 : log fij ij ij .
Por otra parte, si ahora suponemos que el modelo existe para una variable
predictora, es posible contrastar la hiptesis nula de independencia, contra un
modelo C de asociacin no saturado.

El modelo C de efectos columna, logf ij iR Cj jy , es un modelo que


considera tablas, en las cuales se tienen variables en escala nominal-ordinal,
incluso considera si ambas clasificaciones de objetos estn ordenadas, o bien, el
caso que solo sea relevante, usar la naturaleza ordinal de una de las variables
(generalmente la variable respuesta). Este modelo trata las categoras de la
variable predictora como nominal y las categoras de la variable dependiente como
ordinal. De esta forma, usamos un conjunto de puntajes y: y1 y2 y j que
comnmente son puntajes enteros, los cuales reflejan el orden de las categoras
de las filas.
AGRESTI (84), incorpora una modificacin al modelo de efectos columna, para
que los puntajes de las filas ponderen de manera ms adecuada los puntajes
latentes j . El modelo queda explicado de la siguiente forma:

logfij i j j yi y

donde se cumple:

i
R

C
j

0 , los j

(4.1)

son parmetros latentes

desconocidos.
El modelo
(4.1), tiene IJ 1 (J 1) (I 1) (J 1) (I 2)(J I ) grados de
libertad, y es no saturado cuando I 2 . El modelo de independencia, es un caso
especial de este modelo y considera todos los j 0 , de no cumplirse la
independencia, el trmino de asociacin refleja la desviacin de las frecuencias
esperadas, respecto del modelo de independencia. Los parmetros de efectos
columna j , pueden ser interpretados como sigue: dentro de una columna
cualquiera, la desviacin de las frecuencias esperadas de independencia, son una
funcin lineal de la variable ordinal, representada por un puntaje j . Si j 0 ,
entonces en la columna j, la probabilidad de clasificacin por arriba de y en i, es

99

mayor de lo que se esperara, si las variables fueran independientes. Si j 0 , las

observaciones en la columna j, son mas probables (respecto al caso de


independencia), a estar en la parte baja de la escala en la variable fila i.
Como sabemos, los j pueden ser interpretados en trminos de una razn de
productos cruzados, para un par arbitrario de columnas j e j y un par de filas
arbitrario c d
fcj

dj'

log

dj

cj '

j ' yd yc

Podemos evaluar la significacin estadstica de la asociacin entre las dos


variables,
para el modelo de efectos columna C (4.1), probando
H0 : 1 2 j 0 . Es decir si el modelo (4.1) se cumple, hay homogeneidad
de los efectos columna, y por tanto, esto corresponde a la independencia.

4.5 Actividades de la unidad


Retomando el cuestionario validado en la unidad 2, realice lo siguiente:
Aplicarlo nuevamente como mnimo a 40 casos y capturar los datos en DYANE.
Realizar el anlisis estadstico que considere pertinente a la base de datos del
proyecto y presentar resultados.
Conformar el reporte final del estudio de mercado en Word con los resultados
obtenidos, uniendo las actividades de las unidades 2, 3 y 4.

100

REFERENCIAS
A.Aaker, D. y S. Day, G. 1994. Investigacin de Mercados. Tercera Edicin.
Editorial Mc Graw Hill. Mxico.
Agresti, A. 1984, Analysis of Ordinal Categorical Data. Wiley and Sons.
Breiman, l., Friedman, j., Olsen, r. y Stone, C. 1984: Classification and Regression
Trees. Chapman and Hall.
Bovd. Westfall y Stasch, 1987, Investigacin de Mercados, texto y casos, Mxico.
Editorial UTHEA.
Caldern M. M. 2006, El Anlisis de tems: Comprobacin de la fiabilidad y
validacin del constructo. Tesis de Licenciatura. Facultad de Estadstica e
Informtica. Universidad Veracruzana.
Draper N.R. and Smith H. 1981, Applied Regression Analysis, New York. Editorial
Whiley and Sons Inc.
Frank R.E. Kuehn A. A., Masinv W. S., 1980, Anlisis de Mercados, tcnicas
cuantitativas Mxico, Editorial Trillas.
Fischer de la Vega, L. y Navarro, A.E.1996. Introduccin a la Investigacin de
Mercados. Tercera edicin. Editorial Mc Graw Hill. Mxico, D.F.
Garca E, et. al.. 2000, Anlisis Factorial. Madrid: La Muralla.
Hayes, B.E. 2003. Cmo medir la satisfaccin del cliente. Diseo de encuestas,
uso y mtodos de anlisis estadstico. Segunda edicin. Editorial Oxford. Mxico.
Jonhson R., 1991, Estadstica Elemental, Mxico, Editorial Trillas.
Kass, G. 1980, An Exploratory Technique for Investigating Large Quantities of
Categorical Data. Applied Statistics, 29, 2, 199-127.
Kinnear C. T. y Taylor R. J., 1981, Investigacin de Mercados, Mxico, Editorial
McGraw-Hill Latinoamericana, s.a.
Kotler, P. 1988, Marketing Management 6a ed. Prentice Hall. New Jersey.
Morgan, J. y Sonquist, J. 1963, Problems in the Analysis of Survey Data and A
Proposal. Journal of the American Satistical Association. 67, 768-772.
Scheaffer, Mendenhall, Ott, 1987, Elementos de Muestreo, Mxico, Grupo Editorial
Iberoamericana.
101

Taolicarne G., 1962-1963, Tcnica y Prctica de Investigacin de Mercados,


Barcelona, Espaa. Editorial Interamericana.
Walpole R. E., Mvers R.H., 1985, Probabilidad y Estadstica para Ingenieros,
Mxico. Editorial Interamericana
Walter B.W. 1981, Investigacin de Mercados Administracin y Mtodos, Mxico,
Editorial Trillas.

102

ANEXO

103

Tamao de muestra
La determinacin del tamao de muestra es un tema que ha dado origen a mucho
trabajo investigativo por parte de los estadsticos. Dado que el tamao de muestra
depende de muchos factores, varias soluciones tericas enfrentan dificultades
prcticas o restricciones de costo. Los factores ms importantes que deben tomarse
en cuenta para la determinacin del tamao de muestra son:
1)
2)
3)
4)

La(s) variable(s) a medir.


La variabilidad en la poblacin.
El tamao de la poblacin.
Los objetivos de inferencia.

Una manera muy simple de determinar el tamao de una muestra es cuando


podemos fijar el inters en una sola variable. As el tamao de muestra se obtendr
usando la frmula que corresponda, en la tabla siguiente se presentan formulas
generales.
TIPO DE MUESTREO

PARMETRO
DE INTERS

MUESTREO
ALEATORIO SIMPLE

Estimar

FRMULA PARA EL
TAMAO DE MUESTRA

z2 2 2

n
Estimar

B2
pq

z2 2

B2

ALEATORIO
ESTRATIFICADO

Ni

i1

wi

wi

/2

es un valor de

V (x

Ni i

st

ni
n
N

i1

si
N 2

i1

/2

s2 N

2 i
N

i1
L

i1

Ni2

pi qi
w

N D Ni pi qi
2

i1

Ni

Ni i2

ni

Estimar p

j 1

V (st )

i1

xij xi
L

Ni

ni

i1

1
1

2
2 si

n
i

Estimar

tablas que

determina un nivel de significancia o


confianza (90% Z=1.65; 95% Z=1.96;
99%, Z=2.34).
2 es la varianza de la poblacin, que
se puede sustituir por una estimacin
adecuada obtenida de estudios previos
o de la encuesta piloto.
B (error de estimacin) es la precisin
con la que se desea obtener la
estimacin.

z 2 N

n
Estimar

z2 2

B2

Estimar p

MUESTREO

DONDE:

1
V ( pst )

L
2
i1

N n

Ni

Ni

p q

n
i

104

TIPO DE MUESTREO

MUESTREO POR
CONGLOMERADOS

PARMETRO
DE INTERS

Estimar

FRMULA PARA EL
TAMAO DE MUESTRA

DONDE:

N c2

B2M

xi x Mi

sc

i1

n 1
n

M
m 1 i
n

Estimar
usando M x

N c2

B
Nz

sc2

2
c

xi

i1

i1

xM i

n 1

/2

estimar

usando N xt

N t2

B2
Nz2 / 2

Estimar p

2
t

N c

B M

z2

sc

ai pM i

i1

n 1

105

You might also like