Professional Documents
Culture Documents
Mtodos clsicos
Investigacin Comercial
NDICE
1.
1.1
1.2
1.3
1.3.1
LA OBSERVACIN .....................................................................................16
1.3.2
LA EXPERIMENTACIN..............................................................................16
1.3.3
1.4
DETERMINACIN DE LA MUESTRA.................................... 16
1.4.1
1.4.2
CASOS:......................................................................................................19
2.
2.1
2.2
2.3
2.3.1
2.3.2
2.3.3
2.3.4
2.3.5
Investigacin Comercial
2.3.6
2.4
2.5
2.6
2.7
EVALUACIN DE LA OBSERVACIN................................... 29
2.7.1
2.8
VALIDEZ .................................................................... 32
2.8.1
VALIDEZ DE CONTENIDO..........................................................................33
2.8.2
VALIDEZ DE CONSTRUCTO.......................................................................33
2.8.3
2.9
2.10
2.11
OBSERVACIN..................................................................... 34
3.
3.1
INTRODUCCIN........................................................... 35
3.2
CONCEPTOS GENERALES................................................ 35
3.3
Investigacin Comercial
3.4
METODOLOGA ........................................................... 37
3.5
3.6
3.6.1
3.7
INVESTIGACIN COMERCIAL................................................... 40
3.7.1
3.7.2
3.7.3
3.7.4
3.7.5
EXPERIMENTO FACTORIAL........................................................................41
3.8
3.9
3.9.1
3.10
3.11
3.12
CONCEPTO .............................................................. 46
3.13
CLASIFICACIN......................................................... 48
3.14
VENTAJAS Y LIMITACIONES.......................................... 48
4.
Investigacin Comercial
4.1
INCONVENIENTES................................................................. 49
4.1.1
4.1.2
4.1.3
4.2
4.3
4.4.1
4.4.2
4.5
ENCUESTA TELEFNICA................................................. 56
4.6
4.6.1
4.7
4.8
4.9
ENCUESTA MNIBUS..................................................... 63
4.10
EL PANEL................................................................. 64
4.10.1
PANEL DE CONSUMIDORES.......................................................................65
4.10.2
4.10.3
DUSTBIN-CHEK.........................................................................................68
Investigacin Comercial
4.10.4
4.10.5
PANEL DE DETALLISTAS............................................................................69
4.11
ENCUESTA ESTRUCTURADA.................................................... 71
5.
5.1
INTRODUCCIN........................................................... 72
5.2
5.2.1
5.2.2
5.2.3
5.2.4
5.2.5
5.2.6
5.2.7
5.3
5.4
TIPOS DE TABLAS......................................................... 78
5.4.1
5.4.2
5.4.3
5.4.4
5.4.5
5.4.6
5.4.7
Investigacin Comercial
5.4.8
6.
6.1
6.1.1
6.1.1.1
TIPOS DE ESTADSTICA.........................................................................83
6.1.1.2
MEDIR ...................................................................................................83
6.1.1.3
ATRIBUTO.............................................................................................83
6.1.1.4
VARIABLE ..............................................................................................84
6.1.2
6.1.2.1
ESCALA NOMINAL.................................................................................84
6.1.2.2
6.1.2.3
6.1.2.4
6.1.3
6.2
6.2.1
6.2.2
FRECUENCIA .............................................................................................88
6.2.3
6.2.4
6.2.4.1
6.2.4.2
6.2.4.3
6.2.4.4
6.2.4.5
6.2.4.6
6.2.5
Investigacin Comercial
6.2.5.1
DISTRIBUCIN ......................................................................................95
6.2.5.2
6.2.5.3
6.2.6
7.
7.1
CONCEPTOS GENERALES................................................ 99
7.1.1
HIPTESIS .................................................................................................99
7.1.2
PRUEBAS DE HIPTESIS.............................................................................99
7.1.2.1
7.1.2.2
HIPTESIS ALTERNATIVA....................................................................100
7.1.3
7.2
7.2.1
7.3
OBJETIVO ................................................................................................104
7.3.1
7.3.2
7.3.3
7.3.4
7.4
7.5
7.5.1
7.5.2
7.5.3
Investigacin Comercial
8.
8.1
8.1.1
8.1.1.1
TABLAS DE CONTINGENCIA....................................................................117
TABLA DE CONTINGENCIA : SEXO Y CONOCIMIENTO DE
INFORMTICA.....................................................................................................118
8.1.1.2
8.1.1.3
8.1.3
8.2
EJEMPLO..............................................................................................126
8.2.1.2
8.2.2
8.2.2.1
OBJETIVOS ..........................................................................................129
8.2.2.2
8.2.3
8.3
CORRELACIN ........................................................................................124
CUALITATIVA..................................................................... 132
8.3.1
8.3.1.1
8.3.1.2
95%)
135
Investigacin Comercial
8.3.1.3
8.3.2
9.
9.1
INTRODUCCIN.......................................................... 141
9.2
9.2.1
9.2.2
9.2.2.1
9.2.3
INDEPENDIENTES ....................................................................................................145
9.2.3.1
9.2.4
RELACIONADAS ......................................................................................................146
9.2.4.1
9.2.5
9.3
9.3.2
9.4
Investigacin Comercial
10
9.4.1
9.4.2
9.5
9.5.1
10.2
10.2.1
10.2.2
10.2.3
10.2.4
10.3
10.3.1
PRUEBA Z ................................................................................................159
10.3.2
PRUEBA T................................................................................................160
10.3.3
10.3.3.1
10.3.3.2
10.4
10.5
INDEPENDIENTES ....................................................................................................169
Investigacin Comercial
11
10.5.2
INDEPENDIENTES ....................................................................................................170
10.5.2.1
10.5.2.2
PORCENTAJES SOLAPADOS.............................................................171
10.6
11.2
11.3
11.3.1
INTRODUCCIN......................................................................................175
11.3.2
11.4
11.4.1
11.5
11.5.1
11.6
11.7
11.7.1
11.8
11.8.1
Investigacin Comercial
12
11.9
11.9.1
11.9.1.1
11.9.2
11.9.2.1
11.9.2.2
11.9.3
11.9.3.1
11.9.3.2
11.10
11.10.1
11.11
11.11.1
11.12
INTRODUCCIN..................................................................................206
INTRODUCCIN..................................................................................206
11.12.1
INTRODUCCIN..................................................................................207
Investigacin Comercial
13
1. CONCEPTOS BSICOS
1.1 QU ES LA INVESTIGACIN DE COMERCIAL?
Podemos afirmar que la Investigacin Comercial o de Marketing consiste en sentir y
escuchar al consumidor. Prcticamente todas las organizaciones buscan informacin que
les permita saber qu es lo que la gente quiere y por qu lo quiere, siendo los anlisis
ms profundos los que determinan que el consumidor sea el que mejor lo sabe.
La base de la Investigacin de Marketing descansa en el sentido comn. No hay nada de
paranormal ni en sus objetivos ni en sus mtodos.
Cualquier persona que va a tomar una decisin reflexiva, realiza una investigacin con
el fin de reducir al mnimo el riesgo de equivocarse y de no obtener la satisfaccin que
busca. Algunos ejemplos cotidianos son: la compra de un coche, un piso, un
electrodomstico, etc. En todos los casos, seguimos un proceso de investigacin previo
a la toma de decisin, con el fin de buscar la alternativa mas adecuada a nuestras
necesidades.
Podemos definir la Investigacin de Marketing como el conjunto de tcnicas enfocadas
a obtener informacin objetiva sobre el mercado, con el fin de facilitar la toma de
decisiones con el mnimo de incertidumbre (que resulten lo ms acertadas posibleS y
con el mnimo riesgo).
1.2 QU ES LA INVESTIGACIN CUANTITATIVA?
La Investigacin Cuantitativa de Marketing comprende un conjunto de tcnicas
destinadas a obtener informacin sobre los consumidores, centrada en su
comportamiento externo, siendo su resultado siempre cuantificable.
Para obtener la informacin, se acostumbra a escoger elementos representativos de la
poblacin que se utiliza en la investigacin. Al grupo de unidades representativas de la
poblacin que se quiere estudiar, y que se acostumbra a seleccionar segn criterios
estadsticos, se le denomina muestra, apareciendo siempre un margen de error que se
asume en toda investigacin muestral.
La investigacin cuantitativa aporta informacin sobre aspectos cuantificables del
mercado. Las tcnicas de Investigacin Cuantitativas responden a las preguntas qu?,
cunto?, dnde?, quin?, cundo?, cmo?, pero no a la pregunta por qu?
Investigacin Comercial
14
Frecuencias de compra
Investigacin Comercial
15
1.3.1 LA OBSERVACIN
Se trata de una tcnica de recogida de la informacin que, bsicamente, consiste en
observar y registrar las acciones, comportamientos, hechos y actuaciones de los
individuos objeto de estudio, tal y como lo hacen habitualmente, sin que conozcan que
estn siendo estudiados.
1.3.2 LA EXPERIMENTACIN
Es un procedimiento de contrastar, as como de descubrir hiptesis. Mediante la
experimentacin se puede analizar el efecto que una variable independiente produce
sobre otra variable dependiente. Para ello, se debe neutralizar y controlar la influencia
que otros factores pudiesen ejercer sobre la variable objeto de estudio.
1.3.3 LA ENCUESTA ESTRUCTURADA
La encuesta estructurada es un mtodo de obtencin de datos mediante entrevista
individual, en la que el entrevistado proporciona informacin de forma voluntaria y
consciente, como respuesta a una serie de preguntas planteadas en el cuestionario.
1.4 DETERMINACIN DE LA MUESTRA
En la investigacin comercial la poblacin objeto de estudio suele comprender un
numeroso grupo de elementos o individuos. Ante la imposibilidad de estudiar a todos
los componentes de esa poblacin o universo (N), lo que se hace es estudiar un nmero
limitado de elementos, los cuales se debern seleccionar adecuadamente.
Para dar respuesta a este problema existen tcnicas derivadas de las matemticas y
especialmente en la estadstica, las denominadas tcnicas de muestreo, que nos permiten
seleccionar adecuadamente a los elementos de la poblacin para que conformen la
muestra (n).
El nmero de individuos o elementos a seleccionar constituye el tamao de la muestra.
La muestra debe cumplir las siguientes condiciones:
Investigacin Comercial
16
Trabajar con muestras nos lleva a que el valor obtenido, tambin llamado valor
estimado, pueda no coincidir exactamente con el valor real de la poblacin. A la
diferencia existente entre ambos valores se le denomina error muestral.
Para disminuir este error absoluto deberemos trabajar con muestras suficientemente
grandes y elegir sus elementos con el mtodo de muestreo adecuado.
1.4.1 DETERMINACIN DEL TAMAO DE LA MUESTRA
En la determinacin del tamao de una muestra intervienen los siguientes aspectos:
Error de muestreo: Es decir, cual ser la diferencia mxima que se admitir entre
los valores estimados y los reales o parmetros de la poblacin. Este valor se
debe fijar a priori.
Pr ob [ m e ]= Pk
Pk depender de la distribucin estadstica del estimador.
El error muestral es la desviacin tpica del estimador.
En el caso de la media, viene dado por la siguiente frmula o ecuacin
N n S 2
m =
N 1 n
Siendo N el universo o poblacin, n el tamao de la muestra y S2 la cuasivarianza
poblacional.
N
S2 =
( x )
i =1
N 1
Para una mejor comprensin de la relacin existente entre estos tres conceptos y el
tamao de la muestra, vamos a considerar que queremos estimar el valo r medio y que la
Investigacin Comercial
17
Pr ob [ m e ]= Pk
se deduce fcilmente que el error absoluto, en el caso ms desfavorable, ser igual a K
veces la desviacin tpica del estimador (normalmente la media o la proporcin). Para el
caso de la media ser:
e = K m
Y para la proporcin ser
e = K p
Por consiguiente obtenemos que:
e=K
N n S 2
N 1 n
K2 N S2
N e2 + K 2 S 2
K2 N pq
e 2 (N 1) + K 2 p q
18
N n
tiende a 1
N 1
Con lo que las formulas para el tamao de la muestra en el caso de poblaciones infinitas
vienen dadas por las siguientes expresiones, segn nos refiramos a medias o
proporciones
n=
K2 S2
e2
y n=
K2 pq
e2
19
22 80 20 50.000
= 15504 = 1551empresas
(50.000 1)2 2 + 2 2 80 20
poblacin
porcentaje
387
195
63
123
08
224
1000
Muestra
porcentaje
379
196
71
146
04
204
1000
diferencia
- 08
01
08
23
- 04
-2
CONCLUSIN
Comparando los estadsticos obtenidos en la muestra con los de la poblacin, se aprecia
que en ningn caso la diferencia entre ambos supera el mximo error especificado
(578%), garantizando por consiguiente la representatividad de la muestra y la
extrapolacin de los resultados a la poblacin.
Investigacin Comercial
20
2. OBSERVACIN
2.1 DEFINICIN Y CONCEPTOS GENERALES
En el rea del marketing, la observacin es una tcnica de recogida de informacin que
consiste bsicamente en observar y recoger las actuaciones, comportamientos y hechos
de las personas, tal y como los realizan habitualmente.
Ante un problema, las personas buscan asesoramiento en diferentes mbitos,
normalmente pidiendo consejo a otras personas que puedan saber ms sobre aquello que
les preocupa. A travs de la tradicin oral y escrita, la humanidad ha ido acumulando
informacin acerca de s mismos y de la naturaleza. Este cmulo de experiencias
acumuladas a lo largo de la historia de cada cultura es lo que se denomina
conocimiento.
Para adquirir el conocimiento, el hombre utiliza diversos procedimientos, siendo el ms
antiguo y a la vez el ms moderno el de la observacin; podemos afirmar que la ciencia
comienza con la observacin. No se trata de una observacin superficial, sino de una
observacin cientfica. Se trata de conseguir un procedimiento o mtodo que permita la
replicabilidad, es decir un mtodo que seguido por un investigador haga posible que
cualquier otro colega, cuando estudie el mismo fenmeno, obtenga idnticos resultados.
Los mtodos utilizados son:
mtodo inductivo mtodo deductivo y mtodo hipottico deductivo
Mtodo inductivo. El mtodo inductivo se ha desarrollado desde la postura que valora la
experiencia como punto de partida para la generacin del conocimiento, es decir, se
parte de la observacin de la realidad para, mediante la generalizacin de la
observacin, formular la ley.
Mtodo deductivo. El mtodo deductivo parte de la ley general, a la que se llega
mediante la razn, y de ella se deducen consecuencias lgicas aplicables a la realidad.
Mtodo hipottico deductivo. El mtodo hipottico deductivo es una combinacin de los
dos anteriores. Trata de enfatizar el hecho de que el proceso de adquisicin de nuevos
conocimientos acta de forma tal que el investigador necesita tanto ir de los datos a la
teora, como de sta a los datos.
Investigacin Comercial
21
Es planificada sistemticamente
Esto significa que deben formularse unas hiptesis a partir de una exploracin emprica
de las situaciones que se tratan de esclarecer. Seguidamente, se verifican las hiptesis,
confrontndolas con el mayor nmero posible de hechos revelados por investigaciones,
llegando de esta forma a un diagnstico vlido de la situacin y a la elaboracin de una
teora aplicable a la generalidad de los fenmenos del mismo tipo.
2.2 FASES DE LA INVESTIGACIN POR OBSERVACIN
La aplicacin de la investigacin por observacin no se puede realizar de cualquier
manera, sino que deberemos plantearnos y decidir qu, cmo y cundo observar.
Investigacin Comercial
22
Para que la observacin sea vlida en marketing, se requiere que sea sistemtica, es
decir, deberemos realizarla de tal manera que d lugar a datos susceptibles de ser
reproducidos por cualquier otro investigador.
En primer lugar, hemos de partir del principio de que, para poder observar algo, primero
habr que tener en cuenta qu es lo que queremos conocer, es decir, los objetivos de la
investigacin.
El problema de qu observar viene derivado de los objetivos fijados en el proyecto de
investigacin.
El primer paso consiste en fijar el nivel de anlisis. Por nivel de anlisis se entiende el
grado con el que el observador define su unidad de anlisis en funcin de sus
necesidades tericas y metodolgicas.
A continuacin, y a modo de ejemplo, se presentan niveles de anlisis y posibles
alternativas, para la investigacin por observacin de un proceso de compra.
Tabla 1
Nivel de anlisis
Individuo
Establecimiento
Grupo
Diada
Proceso de compra
Cultura
Alternativa
nio, hombre, mujer, etc.
gran superficie, hipermercado, supermercado, tienda tradicional,
etc.
familia, amigos, etc.
pareja, madre hijo
reflexivo, impulso
latino, anglosajn, magreb, etc.
Investigacin Comercial
23
fenmeno bajo observacin slo pueden ser registrados dentro de una categora
de ese conjunto.
24
SE
REALICE
EN
CIRCUNSTANCIAS
NATURALES
ARTIFICIALES
Observacin artificial
El investigador manipula o altera deliberadamente el ambiente con el objeto de crear
una situacin particular y observarla. La aplicacin de esta tcnica es interesante cuando
algunos comportamientos no se presentan frecuentemente y el coste de esperar a que
ocurra es prohibitivo.
2.3.3 SEGN LA PARTICIPACIN DE LA MUESTRA
Es decir, si son conocedores o no de que se les est investigando.
Observacin encubierta
El observado no sabe que est siendo objeto de investigacin. Se recurre a ella siempre
que se considera que la persona a la que vamos a observar se comportara de forma
diferente si supiera que se la est observando.
Observacin no encubierta
Se solicita la participacin de la muestra. Por ejemplo: un panel de audimetros.
2.3.4 DE ACUERDO CON SU ESTRUCTURACIN
Segn sea estructurada o no
Observacin estructurada
Conocemos de antemano los tipos de actividades y las caractersticas que identificamos
y registramos.
Observacin inestructurada
El investigador registra cuanto estima pertinente del hecho investigado. Es buen
procedimiento como investigacin exploratoria.
Investigacin Comercial
25
26
1 Los psiclogos utilizan la terminologa qumica: molaridad y molecularidad, para referirse a niveles
generales (molar) o ms especficos sencillos (molecular)
Investigacin Comercial
27
Todas ellas hacen referencia al fenmeno que estamos registrando dentro de cada
categora. La eleccin del tipo de medida depende tanto de la naturaleza del fenmeno
bajo observacin como de los intereses del propio investigador.
Veamos en qu consiste cada una de estas mediciones.
Ocurrencia: Nos informa si determinado fenmeno o suceso aparece o no durante el
periodo de observacin.
Frecuencia: Es el nmero de veces que sucede un determinado dato de observacin
durante el periodo de observacin.
La frecuencia a su vez se divide en absoluta y relativa.
Latencia: tiempo que transcurre desde la aparicin de un estmulo y la reaccin ante el
mismo.
Duracin: tiempo durante el que se manifiesta el fenmeno objeto de la investigacin.
Intensidad: fuerza con la que el fenmeno que estamos observando aparece en un
momento dado de la observacin.
2.6 TCNICAS DE MUESTREO Y OBSERVACIN
En la investigacin por observacin, al igual que en el resto de las tcnicas de la
investigacin comercial, se nos plantea el problema de a quin observar. Podemos
observar a todos los componentes de la poblacin o universo objeto de estudio,
circunstancia que en la mayor parte de los estudios de mercado y de Marketing es
imposible o bien centrarnos en una muestra estadsticamente representativa de la
poblacin.
Para la seleccin de la muestra se aplican las tcnicas de muestreo en sus variantes de
muestreo aleatorio simple y sistemtico.
Una vez elegida la muestra que se va a estudiar, el paso siguiente es definir cundo
realizar la investigacin, esto es, hacerla continua durante todo el periodo de tiempo
(por ejemplo, todo el da), o en determinadas fracciones. Esta seleccin del tiempo
dedicado a observar es lo que en esta tcnica se denomina muestreo de tiempo.
Por muestreo de tiempo entendemos la accin de extraer muestras de una poblacin
compuesta por intervalos de tiempo.
Existen dos procedimientos para realizar el muestreo de tiempo: muestreo sistemtico y
muestreo aleatorio.
Investigacin Comercial
28
29
30
P0 =
n de. acuerdos
x100
n . de. acuerdos + n . de. desacuerdos
K=
P0 Pe
1 Pe
Donde
P0 =
n de. acuerdos
x100
n . de. acuerdos + n . de. desacuerdos
Pe representa la proporcin de acuerdos esperados por azar, y que viene dado por la
relacin siguiente:
Pe =
( p
i =1
i .1
. x. pi. 2 )
Intervalo
10
Observador 1 2
Observador 2 2
P0 =
n de. acuerdos
x100
n . de. acuerdos + n . de. desacuerdos
P0 =
8
. x.100. = 80%
8+2
Investigacin Comercial
31
luego, aparentemente, este estudio s que sera fiable, ya que existe un grado de acuerdo
del 80%. Ahora bien, si tenemos en cuenta la posibilidad de que algunos acuerdos sean
al azar, aplicaremos el factor de correccin del coeficiente de Kappa para paliar el
error.
El procedimiento que hay que seguir es el siguiente:
Con los datos de los observadores construimos la correspondiente matriz. El nmero de
acuerdos entre los dos investigadores aparece en la diagonal de la matriz; fuera de esta
diagonal quedan los desacuerdos.
En los mrgenes de la matriz aparecen los porcentajes de ocurrencia de cada uno de los
tres niveles segn cada investigador.
Observador 2
Nivel 1
Observador 1
Nivel 2
Nivel 3
Nivel 1
4 / 10
Nivel 2
3 / 10
Nivel 3
3 / 10
3 / 10
4 / 10
3 /10
K=
En este caso Po es 08
P0 Pe
1 Pe
Pe = (
4 3
3 4
3 3
x ) + ( x ) + ( x ) = 033
10 10
10 10
10 10
08 033
= 070
1 033
Luego K = 70%, es decir, en este estudio, el porcentaje debido al azar es del 10%.
Como no se alcanza el nivel del 80%, este estudio no sera fiable.
2.8 VALIDEZ
Se trata de establecer un criterio para la valoracin de un sistema de registro de datos
que nos informa del grado en el que el sistema consigue observar lo que pretenda.
Investigacin Comercial
32
33
Investigacin Comercial
34
3. EXPERIMENTACIN
3.1 INTRODUCCIN
En este tema se estudia cmo, a travs de la experimentacin, se puede analizar el
efecto que una variable independiente produce sobre otra variable dependiente. Para ello
es necesario controlar y neutralizar la influencia que otros factores puedan ejercer sobre
la variable objeto de estudio; con este fin, la experimentacin se traspasa a universos
aleatorios en los que el control es probabilstico y los resultados obtenidos se estudian a
travs del anlisis de la varianza.
3.2 CONCEPTOS GENERALES
Uno de los objetivos de la Investigacin de Marketing es el de tratar de definir las
relaciones que unen al mix de Marketing de la empresa con sus resultados.
Esta informacin es de suma importancia en el proceso de toma de decisiones, as como
en la planificacin estratgica y en los mecanismos de control de la misma.
Las relaciones que se identifican entre las variables del Marketing mix de la empresa y
sus resultados son de tipo causa efecto, constituyendo lo que se denomina relaciones de
causalidad.
El anlisis causal es el que pretende investigar las relaciones de influencia o causalidad
entre las diferentes variables.
Desde un punto de vista filosfico, se puede entender como causa aquello que hace ser a
algo que no es, o que venga a ser de forma distinta lo que es. Este concepto de causa
implica el que se diferencie entre la causa que produce algo nuevo de la que slo
modifica lo existente.
Teniendo en cuenta que la investigacin de Marketing no se ocupa de los consumidores
y productos en su conjunto, sino slo de las variables de stos en los estudios
descriptivos y de las relaciones entre las variables en los explicativos, es obvio que a la
investigacin de Marketing le interesa la causalidad no en el sentido que produce un
nuevo ser, sino en la modificacin de lo existente.
Cuando se dice que dos variables estn unidas por una relacin de causalidad, significa
que una variable influye en la otra, en el sentido de que una modificacin en la primera
conduce a una variacin en la segunda.
Investigacin Comercial
35
36
Fijacin de precios
3.4 METODOLOGA
En todo experimento habr que definir:
1 Factor principal: variable independiente estudiada con sus diferentes alternativas, a las
que se denomina tratamientos.
2 Factores externos: son los factores influyentes que es conveniente aislar y controlar.
En algunos diseos experimentales se estudian de forma individual y se denominan
factores bloque o rodeo.
Investigacin Comercial
37
2.
38
DR = DT - DF
4.- Se calcula el cuadrado medio total (CMT): dispersin total dividida por el nmero
de grados de libertad.
CMT = DT / gl
Investigacin Comercial
39
5.- Se calcula el cuadrado medio factorial (CMF): dispersin factorial dividida por el
nmero de grados de libertad.
CMF = DF / gl
dependiendo del tipo de experimento, pueden existir varias varianzas factoriales,
correspondiendo stas al factor principal y a los factores bloque.
6.- Se calcula el cuadrado medio residual (CMR): dispersin residual dividida por el
nmero de grados de libertad.
CMR = DR / gl
7.- Se realiza el test de la F: para cada factor estudiado se calcula el correspondiente
valor del estadstico F.
7-1.- Se calcula el estadstico F para cada factor objeto de estudio, la ecuacin
correspondiente es:
F = CMF / CMR
Si el valor de F es menor que uno, es decir, CMF < CMR, no existe un efecto
significativo del factor estudiado sobre la variable dependiente, y por tanto no es
necesario realizar la comparacin de F con el correspondiente valor de las tablas.
7-2.- Se determina el valor de F en las tablas estadsticas de la distribucin de la
F, en base a los grados de libertad del numerador y del denominador.
7-3.- Se comparan ambos valores.
La hiptesis nula H0 es: NO EXISTE EFECTO SIGNIFICATIVO DEL
FACTOR ESTUDIADO.
Entonces:
Si F > Ft (tabla), no se cumple H0 y por tanto el factor estudiado tiene una
influencia significativa sobre la variable dependiente.
Si F= Ft (tabla), no podemos rechazar H0.
3.7 TIPOS DE EXPERIMENTOS HABITUALMENTE UTILIZADOS EN
INVESTIGACIN COMERCIAL
Los tipos de experimentos que ms habitualmente se utilizan en la Investigacin
Comercial son:
Investigacin Comercial
40
41
Esta es una situacin muy habitual en el rea de Marketing, donde la aplicacin del
Marketing mix produce en el mercado unos resultados diferentes de los que se
obtendran por la suma de los efectos aislados de cada factor del mix de Marketing.
La tcnica estadstica que se utiliza se denomina ANOVA de va mltiple.
3.8 LIMITACIONES DE LA EXPERIMENTACIN COMERCIAL
Las aplicaciones de la experimentacin comercial presentan las siguientes limitaciones:
Aplicacin a corto plazo. La mayor validez de la experimentacin comercial es a corto
plazo, ya que en este perodo las condiciones y circunstancias bajo las que se realiza la
experimentacin sufren poca variacin.
No es una tcnica adecuada para estudiar productos de baja frecuencia de compra. En la
medida que los productos son adquiridos por los consumidores con gran asiduidad, la
experimentacin puede realizarse en periodos muy cortos, con lo que los resultados que
se obtienen son ms valiosos.
Dificultad de aislar el mercado de prueba. Cuando se realiza una experimentacin en
una zona, en diversas tiendas, etc., resulta difcil evitar que se produzcan distorsiones en
la zona de prueba, como consecuencia de las compras efectuadas por los consumidores.
Destruccin por actuaciones de la competencia. Esta tcnica puede hacer que la
competencia conozca la investigacin que se est realizando.
Coste. La experimentacin, por lo general, tiene un coste elevado.
3.9 CASO PRCTICO: EXPERIMENTO DE BLOQUE ALEATORIO
Recordemos que en este tipo de experimento comercial se controlan dos factores:
1 La variable independiente o factor principal
2 Un factor de control que se denomina factor bloque, tambin llamado de rodeo
CASO: Una empresa de refrescos va a lanzar al mercado un nuevo producto; para ello
realiza una prueba con tres envases diferentes:
P1 envase de 2l., P2 envase de 1l., P3 envase de 05l.
Adems, la empresa controla otro factor influyente, el tipo de establecimiento donde se
expenden los refrescos; para ello, definen el siguiente factor bloque:
B1 grandes superficies, B2 supermercados, B3 tienda tradicional y B4 autoservicio.
Cada envase se prueba en los cuatro tipos de tienda, durante un mes. Se obtienen los
resultados siguientes en miles de unidades de producto:
Investigacin Comercial
42
Tabla de resultados:
P1
P2
P3
B1
3
7
8
B2
4
8
12
B3
3
7
8
B4
2
6
4
SOLUCIN:
Factor principal: tratamientos P1, P2, P3, luego k=3
Factor bloque: las alterna tivas B1, B2, B3, B4, luego R = 4
Unidades experimentales 4x3 =12
Variable dependiente: unidades vendidas
Siendo
n el nmero de mediciones (12)
xij las unidades vendidas en los diferentes establecimientos
mj la media de ventas por tratamiento
mi la media de ventas por cada alternativa de bloque
m la media total
Clculos
B1
B2
B3
B4
mj
P1
12
P2
28
P3
12
32
18
24
18
12
mi
Luego m = 6
Dispersin total DT = 92
Dispersin factorial principal DF = 56
Dispersin bloque
DB = k ( mi m) 2
DB = 3(6 - 6)2 + 3(8 - 6)2 + 3(6 - 6)2 + 3(4 - 6)2 = 24
Dispersin residual
Investigacin Comercial
43
DR = DT - DF - DB
Sustituyendo, DR = 12
F=
CMF
CMR
F=
CMB
CMR
Investigacin Comercial
44
Casos
Excluidos
Incluidos
N
12
Porcentaje
100,0%
N
0
Total
Porcentaje
,0%
N
12
Porcentaje
100,0%
b,c
Medias de las casillas
Tipo de tienda
Total
1 litro
1/2 litro
Total
Total
Total
Gran superficie
Media
3,0000
Supermercado
Tienda tradicional
Autoservicio
Total
N
4
7,0000
8,0000
6,0000
8,0000
4
4
3
3
6,0000
4,0000
6,0000a
3
3
12
a. Media global
b. Ventas (miles de unidades) por Envase, Tipo de tienda
c. No se han calculado las medias de orden 2 o superior debido al
lmite en el orden mximo de interaccin.
ANOVAa
Suma de
cuadrados
80,000
56,000
24,000
80,000
12,000
92,000
Mtodo jerrquico
Media
gl
cuadrtica
5
16,000
2
28,000
3
8,000
5
16,000
6
11
2,000
8,364
Investigacin Comercial
45
F
8,000
14,000
4,000
8,000
Sig
,012
,005
,070
,012
1614
1995
2157
2246
2302
1851
19
1916
1925
1930
1013
955
928
912
901
771
694
659
639
626
661
579
541
519
505
599
514
476
4,53
439
559
474
435
412
397
532
446
407
384
369
512
426
386
363
348
10
496
410
371
348
333
11
484
398
359
336
320
12
475
389
349
326
311
13
467
381
341
318
303
14
46
374
334
311
296
15
454
368
329
306
290
Siendo m los grados de libertad del numerador y n los grados de libertad del
denominador.
3.11 MTODOS DE SIMULACIN
3.12 CONCEPTO
El mtodo de simulacin consiste en la creacin de una analoga o similitud de un
fenmeno autntico. Es una representacin incompleta de la realidad que trata de
duplicar el fenmeno, sin alcanzar la autntica realidad.
Lo podemos definir como una representacin incompleta del mercado y del mix de
Marketing de la empresa. Se realiza mediante aplicaciones informticas. Se utiliza
fundamentalmente para obtener ideas sobre la dinmica del mercado, manipulando las
Investigacin Comercial
46
47
3.13 CLASIFICACIN
La clasificacin ms usual es la basada en el propsito que cumple el modelo,
reconocindose los siguientes:
Descriptivo: es el que describe el sistema de Marketing que se est estudiando. Son
fciles de construir, su aplicacin es muy limitada ya que solo tiene utilidad para la
situacin que representa. Generalmente, no se pueden utilizar para reproducir
situaciones causales entre varias variables, sirviendo de base para el desarrollo de los
otros modelos.
Predictivo: se disea para hacer predicciones de Marketing cuando variamos las
variables del sistema. Su limitacin es el no permitir la manipulacin del sistema para
evaluar nuevos campos de accin.
Prescriptivo: permite al usuario experimentar cambios en el sistema.
3.14 VENTAJAS Y LIMITACIONES
El mtodo de simulacin exige que se conceptualice, desarrolle y manipule un modelo,
obtenindose resultados expresados en datos numricos. En cambio, los datos obtenidos
por encuestas, experimentacin e incluso por trabajo de gabinete, son el resultado
directo de la situacin objeto de estudio.
Como ventajas podemos citar las siguientes:
Menor coste. Es ms econmico que otros sistemas de recogida de informacin. Menor
tiempo para recoger y analizar la informacin. Permite la evaluacin de diferentes
estrategias de Marketing.
Es una buena herramienta de entrenamiento para directivos, tanto del rea de Marketing
como del resto de departamentos de la empresa. Sirve para hacer anlisis de
sensibilidad, esto es, determinar la sensibilidad de una opcin estratgica a desviaciones
de los supuestos iniciales.
Como limitaciones podemos resear las siguientes:
Su poca o nula viabilidad cuando la empresa no tiene antecedentes ni experiencia acerca
del fenmeno que se estudia.
Necesidad de personal especialista. Dificultad de desarrollar el modelo. Continua puesta
al da del modelo.
Investigacin Comercial
48
4. LA ENCUESTA ESTRUCTURADA
4.1 LA
ENCUESTA.
TIPOS.
DATOS
QUE
APORTA.
VENTAJAS
INCONVENIENTES
La encuesta constituye un procedimiento sistemtico de recoleccin de datos facilitados
por los entrevistados a travs de cuestionarios.
Para que las encuestas tengan xito, deben basarse en la correcta realizacin de un
documento escrito que recoja las preguntas que se realizarn, esto es, el cuestionario.
El cuestionario debe estar redactado en un lenguaje claro y directo, evitando las
preguntas ambiguas o contradictorias entre s, que puedan ocasionar errores en las
respuestas.
La encuesta estructurada recoge informacin sobre uno o varios temas. La informacin
obtenida corresponde, generalmente, a una muestra de la poblacin investigada
(universo). Para que los datos recogidos a travs de una encuesta puedan inferirse a toda
la poblacin o universo, se deber obtener la informacin mediante tcnicas de
muestreo.
Las encuestas permiten obtener informacin sobre caractersticas socioeconmicas,
opiniones, actitudes y motivaciones del pblico objetivo.
La encuesta puede ser diseada especficamente para el estudio que se va a realizar,
denominndose "ad hoc" o estndar, esto es, encuestas cuyo diseo ha sido previamente
establecido y el tipo de informacin es uniforme para todos los suscriptores.
Para definir la naturaleza de una encuesta, podemos utilizar el criterio de la finalidad de
la encuesta en relacin con el nivel general de conocimientos del investigador sobre el
tema que va a tratar.
Segn el criterio de finalidad, las encuestas se clasifican en:
encuestas exploratorias, encuestas descriptivas y encuestas explicativas.
Veamos brevemente en qu consiste cada una de ellas.
Encuestas exploratorias
El principal objetivo es la identificacin de los problemas y la reformulacin ms
precisa de los mismos. Normalmente sirven de fase preparatoria para los otros dos tipos
de encuestas.
Investigacin Comercial
49
50
51
qu le sugiere?
comprara?
52
Fijacin del plan de tabulacin que permita el anlisis de los datos obtenidos
53
54
Rapidez
Suele ser ms rpido que los estudios realizados por correo.
Se puede realizar en varios puntos geogrficos a la vez.
Muestra
Es de gran utilidad en la realizacin de estudios en las grandes ciudades, cuando la
unidad de la muestra es el hogar (mtodo de rutas aleatorias).
En contraposicin con las ventajas, las entrevistas personales presentan desventajas que
limitan su aplicacin. La ms importante es su elevado coste, debido fundamentalmente
a los gastos del entrevistador (viajes, dietas, repeticiones de visitas, barridos, etc.), al
tiempo de ejecucin, a la necesidad de una buena planificacin y al amplio trabajo
administrativo.
Por otra parte, no es el mejor mtodo para tratar temas personales, ntimos o de gran
sensibilidad.
Y como clara desventaja, podemos citar la inseguridad ciudadana. Debido a los horarios
de trabajo del pblico objeto de la muestra, nos encontramos haciendo el trabajo en
horarios nocturnos, encontrndolo reacio a abrir la puerta. De la misma forma, resulta
difcil reclutar entrevistadores dispuestos a trabajar en determinados barrios y,
especialmente, en horario de tarde-noche.
Sin embargo, para algunos tipos de investigacin es necesaria la entrevista personal. La
problemtica indicada con anterioridad ha originado nuevas formas de contacto
personal.
4.4.1 ENTREVISTAS POR DETENCIN
Su base es que es mucho ms eficaz dejar que los encuestados vengan al entrevistador
en un centro comercial, almacn, cuencas comerciales, etc., que enviar a los
encuestadores a los hogares. Lo que se hace es enviar a los encuestadores a localizar a
los encuestados en lugares donde sean accesibles y, una vez localizados, realizar la
encuesta.
La limitacin de este tipo de entrevistas es que no se genera una muestra tan
representativa de la poblacin como la obtenida en un estudio puerta a puerta. Tambin
est el problema de la duracin del cuestionario, pues resulta difcil que una persona nos
atienda durante mucho tiempo.
Investigacin Comercial
55
56
puesto de escucha, y por otro lado el sesgo del entrevistador tiende a ser menor que en
la entrevista personal.
El sistema ms desarrollado en encuestas telefnicas se denomina CATI, que
corresponde a las siglas de Computer Aided Telephone Interwing, que en espaol viene
a significar Encuestas Telefnicas Asistidas por Ordenador. Mediante este sistema, el
entrevistador, utilizando el telfono, lee el cuestionario en una pantalla de ordenador,
registrando las respuestas que recibe, incorporndolas a la correspondiente base de
datos. Este sistema permite, en cualquier momento, obtener la salida de los resultados,
lo que nos posibilita controlar continuamente el desarrollo del estudio.
El programa del sistema puede llevar a cabo una seleccin aleatoria de los nmeros de
telfono.
Los requisitos fsicos de los entrevistadores no son los mismos que para los de calle,
siendo lo importante la diccin, el tono de voz y la forma de decir, pudindose emplear
a personas con discapacidades fsicas. En todos los casos es conveniente la realizacin
de un diseo ergonmico del puesto de trabajo.
Las principales ventajas de la encuesta telefnica son:
Muestra: nos permite trabajar con muestras amplias y geogrficamente dispersas de una
manera fcil.
Las segundas llamadas pueden hacerse con mayor facilidad; sta es una limitacin
importante en la entrevista personal puerta a puerta, ya que es costoso realizar un
segundo contacto. En la entrevista telefnica es ms fcil encontrar a la persona que no
est disponible en ese momento y concertar la entrevista para otra hora; esto nos permite
aplicar buenos procedimientos de muestreo a base de llamadas subsiguientes.
Supervisin: al realizarse desde una instalacin telefnica central, el supervisor puede
controlar el trabajo de los diferentes entrevistadores para, de esta manera, asegurarse de
que el cuestionario se est utilizando de la manera correcta. Podemos hablar de control
inmediato.
Flexibilidad: aunque no con la misma amplitud que la entrevista personal cara a cara, la
investigacin telefnica puede utilizar cuestionarios complejos, debido a que el
encuestador puede controlar el interrogatorio.
Investigacin Comercial
57
Acceso a elementos de la muestra difciles de contactar. El uso del telfono nos permite
contactar con elementos ocupados y con los alejados, con mayor facilidad que otros
tipos de entrevista.
Rapidez: al utilizar un sistema centralizado, se consigue un mayor nmero de
entrevistas por jornada, ya que no existen tiempos muertos en desplazamientos.
Permite la prueba inicial del cuestionario con gran rapidez, y hace posible la puesta en
marcha en menos plazo del sondeo definitivo.
Sin embargo, la entrevista telefnica tiene una serie de limitaciones:
Tasa de respuesta: puede convertirse en un problema cuando la gente se da cuenta de
que el tema de estudio no es importante para l, colgando el telfono, cortando de esta
manera la entrevista, situacin sta mucho ms difcil en una entrevista personal vis a
vis.
Duracin de la entrevista: debe ser breve. La duracin mxima debe estar entre 5 y 15
minutos. Si no se puede obtener la informacin en este perodo de tiempo, la entrevista
telefnica no es la tcnica adecuada.
Demostraciones: por descontado, hasta que no se masifique la utilizacin del vdeo
telfono, no se puede pensar en el empleo de elementos grficos de apoyo, siendo
absolutamente imposible mostrar algo al entrevistado.
Limitacin en las preguntas: las preguntas deben ser sencillas y los cuestionarios cortos,
siendo muy difcil manejar escalas extensas por telfono.
La entrevista telefnica es un buen sistema para recoger opiniones, actitudes o hechos
de una muestra grande y dispersa, tambin para estudios de seguimiento, para realizar
segundas entrevistas con personas previamente contactadas de forma personal.
La entrevista telefnica es cada vez ms usada para la Investigacin de Marketing.
4.6 ENCUESTA POR CORREO
Esta tcnica consiste en que el investigador enva por correo el cuestionario junto con
una carta y un sobre franqueado, para que el encuestado enve la respuesta.
En ocasiones, los cuestionarios se envan por correo y se recogen personalmente.
En general parece una alternativa atractiva. Es fcil de elaborar y por regla general es el
sistema ms barato.
Investigacin Comercial
58
59
Otro factor que ayuda a vencer la apata y la falta de inters es, por ejemplo, dar
pequeos obsequios (participaciones de lotera, etc.) a cambio de los cuestionarios
recibidos.
En cualquier caso, el ndice de respuesta vara de unos pases a otros, e incluso dentro
del mismo pas, vara de unos territorios a otros.
Sesgo provocado por la no respuesta
Aparte de la pequea proporcin de personas que responden a la encuesta, nos
encontramos con que, a menudo, quines la devuelven diligenciada no son los
encuestados tpicos de la muestra total.
Tampoco se puede estar seguro de quin fue la persona que realmente cumpliment el
cuestionario.
Ejemplo: puede ocurrir que nos contesten las personas a las que les gust el producto o
bien aquellos que quieren manifestar su queja.
Como ancdota podemos citar la siguiente: en 1896, Harlow Gale, de la Universidad de
Minnesota, envi a 200 publicistas de Twin Cities un cue stionario postal para tratar de
averiguar sus opiniones de la publicidad. No pudo realizar el estudio, ya que despus de
todos los intentos slo alcanz un 10% de respuesta.
En resumen, podemos decir que la baja tasa de respuesta y las serias dudas sobre la
representatividad de los encuestados, hacen que la tcnica de entrevista por correo no
sea la adecuada para un gran nmero de estudios.
Control: al no conocer quin contesta el cuestionario, es prcticamente imposible
establecer un control adecuado.
Limitaciones: las limitaciones estn basadas en que el nmero de preguntas ha de ser
pequeo, y stas deben estar formuladas de una forma sencilla y clara. En caso
contrario, los posibles encuestados desecharn el cuestionario.
Otros inconvenientes son la lentitud con la que se obtienen las respuestas, as como la
imposibilidad de hacer pruebas previas o estudios piloto.
Hay que concentrar los esfuerzos de esta tcnica en conseguir la mayor respuesta
posible.
Por tanto, el primer paso es disear el envo que se ha de realizar a los encuestadores.
Las principales recomendaciones que hay que tener en cuenta son:
Investigacin Comercial
60
Tipo de correo
Si se enva un regalo, ste debe ir junto con el cuestionario, de manera que se valide con
el recibo del cuestionario
Todo el envo debe tener aspecto personalizado y profesional; nunca debe dar la
sensacin de un envo al por mayor
Imprimir el cuestionario en los dos lados de una pgina doblada de 43 x 28 cm. (parece
ms pequeo que cuatro pginas a una cara)
Hemos de aportarle creatividad para conseguir despertar el inters del encuestado
Ejemplo: una empresa utiliz una tcnica combinada de correo y telfono en un estudio
sobre altos ejecutivos. Se envi a cada uno de los encuestados una pequea caja de
seguridad que contena el material para la encuesta. Junto a ella se envi una carta en la
que se informaba al destinatario de que se le iba a llamar por telfono, se le dara la
combinacin de la caja y se le entrevistara acerca del contenido de la misma.
La entrevista por correo se utiliza en estudios en los que los encuestados tienen bastante
inters en el objeto del estudio, como es el caso de los estudios tipo panel.
En estos estudios hay generalmente una muestra pequea y dispersa.
Se han desarrollado procedimientos para aprovechar lo econmico del sistema y, al
mismo tiempo, evitar la baja tasa de respuesta. Estos sistemas utilizan encuestados que
de antemano han aceptado participar en los estudios. Son los paneles por correo.
4.6.1 MIXTAS COMBINACIONES TELEFNICA, CORREO Y PERSONAL
En ocasiones, se pueden reducir costos utilizando el telfono y / o el correo en partes del
estudio.
Por ejemplo, consideremos el caso de una prueba de producto.
1 Mediante entrevista personal seleccionamos a los participantes del estudio y les
entregamos la muestra de producto objeto de la prueba.
2 En vez de hacer una segunda visita personal para obtener la evaluacin, la podemos
obtener por telfono o por correo, e incluso por la combinacin de ambos.
Investigacin Comercial
61
Compras anuales
Estacionalidad de la compraventa
Investigacin Comercial
62
Hbitos de uso
Grado de conocimiento
Grado de aceptacin
Grado de preferencia
Participacin en compras
Participacin en el mercado
Grado de fidelidad
63
Al distribuirse los costes entre varios clientes los precios se reducen considerablemente,
siendo el coste mucho menor que para la realizacin de un estudio ad hoc.
Presenta algunas limitaciones, como que las preguntas son preferiblemente cerradas,
fciles de tabular y el tiempo por tema est a su vez limitado (unos 10 minutos). As
mismo, se deben evitar cuestiones que produzcan algn sesgo que pudiese afectar a
otras preguntas.
Por lo general, no se aceptan preguntas que evoquen marcas especficas. Las preguntas
suelen ser relativas a:
Experiencia de producto
Precios
Frecuencia de compra
No pueden unirse temas que se refieran a muestras distintas. Por ejemplo, si queremos
conocer la opinin de los usuarios de diferentes productos, tales como:
crema de afeitar, muestra hombres / tampax, muestra mujeres
Hay que vigilar el orden del cuestionario de manera que unas respuestas no condicionen
las de las preguntas siguientes.
4.10 EL PANEL
Panel es un trmino ingls que se utiliza par designar a un grupo de personas,
establecimientos u organizaciones representativas del universo del que fueron
Investigacin Comercial
64
65
Para facilitar la formacin del panel, los institutos de investigacin suelen ofrecer
estmulos en forma de obsequios, sorteos, retribucin econmica, etc. El instituto puede
eliminar a algunos panelistas, normalmente por retrasos en el envo de los datos;
asimismo, tambin se da el abandono voluntario de algunos miembros del panel. Esto
hace que la renovacin de la muestra sea continuada.
La precisin del panel se garantiza normalmente empleando muestras de gran tamao,
lo cual nos da como consecuencia errores de muestreo pequeos. Tambin se forma a
los panelistas acerca de cmo rellenar los diarios, y stos no se procesan por parte del
instituto de investigacin, hasta transcurrido un perodo de prueba, cuando se tiene la
garanta de su adecuada cumplimentacin por parte del panelista.
La principal ventaja de este tipo de panel es que a travs del diario se evitan los errores
que se pueden dar en las encuestas por fallos de la memoria, ya que en el diario se van
recogiendo todos los datos. Este sistema presenta el inconveniente de los registros de
compras de productos consumidos fuera del hogar (helados, cenas, copas, etc.), que con
frecuencia se dejan en la memoria y para el da siguiente.
La informacin recogida por el panel de consumidores vara en funcin del tipo de
panel. En la actualidad existen diferentes tipos de paneles. Los ms usuales son:
Paneles ms habituales
Nombre
Muestra
Panel de hogares
Amas de casa
Baby panel
Panel de jvenes
Panel de televisin
Panel de automovilistas
Panel de radio
66
Una vez recogidos los diarios de compras, el centro investigador recopila toda la
informacin teniendo en cuenta aspectos como: hbitat, unidad familiar, tipo de
establecimiento donde se realiz la compra, etc.
Normalmente, la informacin se registra semanalmente, envindose a los clientes los
resultados mensualmente, aportando datos sobre:
Tamao de mercado
Participacin de marcas
Ofertas especiales
Compradores de repeticin
Cambiadores de marca
Consumidores frecuentes
Pm = P x Tr x Fc
Pm representa la Participacin de marca P representa la Penetracin de
Investigacin Comercial
67
La principal crtica que tiene este panel es que provoca un efecto de condicionamiento.
As, puede ocurrir que consumidores veteranos (ms de un ao), tienden a mostrar ms
inters por los precios de los productos, que los que no son miembros, tendiendo a
comprar marcas ms baratas. Aunque este tipo de sesgo no est bien definido, lo que se
suele hacer es ir rotando a su miembros, por ejemplo un 25 % anual de rotacin, entre
bajas espontneas y sustituciones.
4.10.3 DUSTBIN-CHEK
Lo podemos denominar como comprobacin del recipiente de los desperdicios.
Se trata de una modalidad de panel de hogares. Consiste en depositar los envases y las
etiquetas de los productos comprados en unos recipientes especiales que posteriormente
son recogidos por personal del instituto de investigacin para realizar el correspondiente
estudio.
A travs de este mtodo se obtiene informacin de los productos consumidos. Evita la
escritura en el diario de todas las compras realizadas. Su limitacin es que slo se puede
utilizar para productos convenientemente envasados y etiquetados y que se consuman
en el hogar.
4.10.4 PANEL DE AUDIMETROS (T.V.)
Este panel recoge informacin sobre en qu cadena y momento del da est el televisor
conectado, por medio de un aparato que instala el instituto de investigacin en los
hogares que forman la muestra.
Antiguamente, para medir la audiencia de televisin se empleaban encuestas y los
televidentes deban ir anotando continuamente los programas y cadenas que vean.
En la actualidad, se emplean aparatos denominados audimetros. Son aparatos que
registran si el T.V. est encendido, as como el momento del da y la hora, sin ocasionar
molestia alguna a los componentes del hogar.
Los audimetros son de diferentes caractersticas. Los ms normales recogen la
informacin en un cassette que se analiza posteriormente en el instituto; otros estn
conectados a travs del telfono al instituto de investigacin, transmitiendo la
informacin directamente a un ordenador central.
Esta tcnica est en continua evolucin. Por ejemplo, se ha ensayado con aparatos que
determinan qu nmero de personas se encuentran congregadas ante el televisor.
Investigacin Comercial
68
Investigacin Comercial
69
Ofertas especiales
Precios
A pesar de que permite a las direcciones de las empresas, suscritas a estos datos,
gestionar aspectos tales como la distribucin, los stocks, los grados de aceptacin
comercial, el punto dbil de estos estudios es que no ofrecen ninguna informacin sobre
motivos de consumo, personas que consumen los productos y que los compran, o las
actitudes que tienen hacia los productos.
Los establecimientos que configuran el panel se comprometen a permitir realizar el
trabajo de los auditores a cambio de determinadas compensaciones.
El mayor exponente de este sistema es el Nielsen, que publica sus ndices de minoristas
a escala mundial.
En Espaa, las empresas que adquieren la informacin Nielsen (ndices Nielsen) reciben
peridicamente una informacin de tipo estndar.
Investigacin Comercial
70
4.11 DIFERENCIAS
ENTRE
LAS
DISTINTAS
MODALIDADES
DE
ENCUESTA ESTRUCTURAD A
En el esquema siguiente recogemos las principales diferencias existentes entre las
encuestas estructuradas ad hoc, mnibus y panel.
TIPO
AD HOC
MNIBUS
INICIATIVA
Cliente
Instituto
PANEL
de Instituto
investigacin
UNIVERSO
de
investigacin
por el Instituto
cliente
MUESTRA
Variable
Variable
Fija
ESTUDIO
Transversal
Transversal
Longitudinal
calificacin
y perodos temporales
clasificacin.
En
las
de contratacin
cuestiones
categricas diseado
en funcin de las
necesidades
del
cliente
MODALIDAD
Contratacin
estudio
temporal
Investigacin Comercial
71
72
Hombre
(1)
Mujer
(0)
2.- Consideremos una mltiple respuesta, tal como la edad medida en intervalos
Edad
18 a 25 aos
(1)
26 a 45 aos
(2)
46 a 65 aos
(3)
ms de 65 aos
(4)
En el primer ejemplo se trata de una variable nominal que toma el valor 1 cuando es
hombre y 0 cuando es mujer. En el segundo, la variable est clasificada en categoras,
asignndose un valor numrico a cada una de ellas.
Tambin podemos encontrarnos variables cualitativas como la siguiente:
73
5.- Indique la importancia que tienen para usted las siguientes caractersticas de un
frigorfico y si influyo en su decisin de compra:
Grado de importancia
Capacidad
Influy en la compra
Nada
Poco
Algo
Bastante
Mucho
No
(1)
(2)
(3)
(4)
(5)
(1)
(2)
Dos cuerpos
Diseo
Altura
S (1)
No (0)
Amigos y conocidos
S (1)
No (0)
S (1)
No (0)
Folletos publicitarios
S (1)
No (0)
Otros
S (1)
No (0)
Folletos publicitarios
Amigos y conocidos
Otros
Investigacin Comercial
74
V01 v02
v03
v04
v05
v06
v07
v08
v09
v10
1
2
...
n
5.2.3 ANLISIS DE CADA CUESTIN O TEM
Una vez que tenemos todos los datos en un fichero u hoja de clculo, se comienza el
anlisis, teniendo en cuenta los siguientes pasos:
Se estudia cada pregunta.
En las variables cualitativas, nominales o atributos, se estudia la distribucin de
frecuencias, los porcentajes y, como medida de tendencia central, la moda.
En las variables mtricas, aparte del estudio de las frecuencias y porcentajes, tomaremos
como medid as de tendencia central o posicin la moda, la mediana y la media; y como
medidas de dispersin, la desviacin tpica y el coeficiente de variacin.
5.2.4 ANLISIS DE LOS TEM S POR SUBGRUPOS.
Al realizar el anlisis individualizado de las cuestiones, podemos encontrar grupos de
poblacin que sean de inters (p. ej. votantes y no votantes, en un estudio electoral). En
este caso podemos establecer comparaciones entre los diferentes grupos.
Investigacin Comercial
75
TIPO DE VARIABLE
CUANTITATIVA
CUALITATIVA
Test t de medias
Regresin
Coeficiente alfa (a )
de
Cronbach
Tabla de contingencia (Chi
cuadrado)
CUALITATIVA
Correlacin
de
rangos
(Spearman)
Coeficiente de Cramer
76
v02
v03
v04
v05
v06
.....
...
...
vp
1
2
...
....
I
xij
...
n
filas y
p ,
p columnas. A
Investigacin Comercial
77
Edad
Ingresos
Gasto luz
Vivienda
Tfno.
...
40
200.000
4.000
55.000
8.000
...
....
n
A(1)
B(2)
C(3)
D(4)
E(5)
...
...
...
...
....
....
Investigacin Comercial
78
Encuesta
P1
P2
P3
...
...
...
...
...
...
...
...
...
...
...
...
...
Indiferente
No me gusta nada
La tabla ser
Encuesta
P1
P ...
...
...
...
...
...
...
...
79
...
...
...
...
...
...
...
= xji
Ejemplo:
Supongamos que comparamos las marcas A, B, C, siendo 1 la mnima semejanza y 10
la mxima.
La tabla correspondiente es:
Marca
10
10
10
80
Ao
PIB
1.990
100
1.995
107
2.000
115
Encuesta
Edad
Nivel estudios
...
45
...
52
...
31
...
....
...
...
...
...
...
...
Investigacin Comercial
81
Investigacin Comercial
82
La estadstica relacional utiliza los datos de una muestra para medir el grado de
relacin existente entre dos o ms variables. Al ser tambin una inferencia estar
sujeta a cierto error, con lo que tendr un determinado nivel de confianza.
6.1.1.2 MEDIR
Medir es asignar nmeros o categoras a objetos, sucesos o casos, siguiendo reglas
determinadas. De esta manera, en cada una de las unidades estudiadas se recoge
informacin sobre una serie de caractersticas que varan de una unidad a otra. A la serie
de caractersticas se les denomina variables o atributos. Cada variable toma un
determinado valor en cada caso (por ejemplo: edad, estado civil, sexo, etc.).
6.1.1.3 ATRIBUTO
Es el carcter de una poblacin no susceptible de ser medida numricamente. Las
diferentes formas que puede presentar el atributo se denominan modalidades, tambin
Investigacin Comercial
83
Investigacin Comercial
84
Sexo
Cdigo
Frecuencia
Porcentaje
Proporcin
Masculino
70
6087
06087
Femenino
45
3913
03913
Total
115
100
Cdigo
Alta
Media alta
Media
Media baja
Baja
Investigacin Comercial
85
Investigacin Comercial
86
Escala
Nominal
Equivalencia
Ordinal
Equivalencia
Mayor que
De intervalo
Equivalencia
Mayor que
Razn conocida entre cualesquiera intervalos.
Cero consensuado
De razn
Equivalencia
Mayor que
Razn conocida entre cualesquiera intervalos
Razn conocida entre cualesquiera de dos valores de la escala
Cero como ausencia de la caracterstica que se mide
Investigacin Comercial
87
3Para las muestras utilizaremos letras latinas, mientras que cuando nos refiramos al universo se utilizaran
griegas.
Investigacin Comercial
88
Por tanto, es el
89
Toda la informacin medida en una escala superior, se puede convertir en otra inferior.
Las medidas de posicin o de tendencia central son las siguientes:
La media, la moda y la mediana.
La media es el promedio aritmtico de los valores obtenidos por la variable.
xi
i =1 n
n
m=
Investigacin Comercial
90
Las medidas de tendencia central, la media, la mediana y la moda, slo facilitan una
parte de la informacin contenida en los datos. Para conocer mejor el comportamiento
de las observaciones es conveniente conocer tambin su dispersin o variabilidad
(cmo varan los valores de la variable o hasta qu punto son todos muy parecidos o
muy diferentes).
Investigacin Comercial
91
92
x
n
DM =
i =1
Si todas las observaciones fueran iguales, la DM sera cero. Cuanto mayor sea el valor
de la DM mayor ser el grado de dispersin.
Esta medida es poco utilizada debido a que no se puede manipular algebraicamente.
6.2.4.5 VARIANZA Y DESVIACIN TPICA O ESTNDAR
La varianza es una medida de dispersin de variables mtricas.
Si pretendemos evaluar exactamente cual es el error que cometemos al asignar el valor
de la media a todos los casos de la distribucin de la variable, hay que calcular el
promedio de las diferencias con la media de todos los valores.
Para poder hacer un promedio, necesitamos una unidad de medida; por consiguiente, la
variable deber estar, al menos, en escala de intervalo.
La varianza es el promedio de las diferentes desviaciones de variable respecto de la
media al cuadrado. Se representa mediante S2
(x
n
s2 =
i =1
m)2
n
93
hay que sumar y restar dos veces la desviacin tpica al valor de la media. Se representa
por:
2s
m 2s o bien
(x )2
2=
2=
( x x) 2
n1
94
Su frmula es:
s
100
m
CV =
Tiene que ser m 0.
El coeficiente de variacin tiene la ventaja de que pierde las unidades de medida, por lo
que puede servir para comparar las dispersiones relativas de dos variables que tienen
diferente unidad de medida.
6.2.5 MEDIDAS RELATIVAS A LA FORMA DE LA DISTRIBUCIN
6.2.5.1 DISTRIBUCIN
Una distribucin es una serie de valores separados, colocados u ordenados segn una
magnitud. Un conjunto de cdigos ordenados y sus frecuencias correspondientes se
llaman distribucin de frecuencias.
6.2.5.2 COEFICIENTE DE SESGO O ASIMETRA (SKEWNESS)
Con las medidas de asimetra se intenta medir si las observaciones estn dispuestas
simtrica o asimtricamente respecto a un valor central, generalmente la media
aritmtica.
El coeficiente ms utilizado es el de R. A. Fisher, que viene expresado por la siguiente
frmula:
(x
n
CA =
i =1
m) 3
ns3
Las distribuciones simtricas o insesgadas son aqullas que dejan el mismo nmero de
observaciones a la izquierda que a la derecha de la media.
La simetra se mide a travs del sesgo (skewness).
Investigacin Comercial
95
96
(x
n
m4 =
m)4
i =1
m4
CK = 4 =
s
(x
i =1
m) 4
ns4
(x
n
CK2 =
i =1
m)4
ns4
Una distribucin en
curtosis:
<0
=0
>0
Investigacin Comercial
97
Escala
Frecuencia
Prueba
Nominal
Absoluta,
Moda
Chi
relativa
cuadrado,
binomial
Ordinal
Absoluta,
Moda, Mediana
Desviacin intercuartil
relativa,
acumulacin,
percentiles
Intervalo
Absoluta,
Moda,
relativa,
Media 5
acumulacin,
desviacin
tpica
percentiles
Proporcin
Absoluta,
Moda,
razn
relativa,
Media
desviacin
acumulacin,
tpica Coeficiente de
percentiles
variacin
5 En ocasiones no tiene ningn significado, debido al desconocimiento de los intervalos de clase con
exactitud.
Investigacin Comercial
98
7. CONTRASTE DE HIPTESIS
7.1 CONCEPTOS GENERALES
7.1.1 HIPTESIS
La palabra hiptesis tiene su origen en los trminos griegos thesis, que significa lo
que se pone, e hipo, que equivale a debajo. Hiptesis es, por tanto, lo que se pone
debajo, es decir lo que se supone.
Desde el punto de vista de la investigacin comercial, las hiptesis se pueden definir
como soluciones probables previamente seleccionadas al problema planteado, que se
tienen que confirmar a travs del proceso de investigacin con los hechos.
La primera prueba a la que debemos someter una idea nueva es a la de su coherencia.
Una vez superado este primer paso, la idea o conjetura pasa a denominarse hiptesis y
deberemos contrastarla a travs de la denominada prueba de hiptesis.
7.1.2 PRUEBAS DE HIPTESIS
Para K. R. Popper en su obra El desarrollo del conocimiento cientfico (Ediciones
Paidos, 1967), una hiptesis es una conjetura expresada en trminos de alto contenido
informativo.
Para que la hiptesis se convierta en teora deber ser validada mediante pruebas de
hiptesis. Estas pruebas actan como un filtro, eliminando las hiptesis falsas y
manteniendo las verdaderas. Podemos afirmar que cuantas ms pruebas haya superado
una hiptesis, ms convencimiento tendremos acerca de su veracidad.
En la praxis se ha escogido que el nivel de filtro sea del 95%, es decir, se eliminan el
95% de las hiptesis falsas.
En el campo cientfico es de gran importancia la repeticin de la prueba de hiptesis por
diferentes equipos de investigadores y en diferentes partes del mundo. Esto significa
que cuantas ms oportunidades se han dado a una hiptesis de ser abandonada y ms
veces ha superado las pruebas, ms seguros estaremos de su veracidad.
Investigacin Comercial
99
Investigacin Comercial
100
Definir H0 y H1
Realizar el muestreo
Con el fin de comprender mejor los diferentes conceptos, vamos a realizar un ejemplo
sencillo y clsico.
Para nuestro estudio, utilizaremos una moneda cargada.
Las correspondientes hiptesis seran:
Hiptesis nula (H0 ). La probabilidad de que salga cara es 05, es decir, la moneda no
est cargada H0 : p = 05.
Hiptesis alternativa (H1 ). La moneda esta cargada. Esto es, H1 : p 05.
Para elegir una de las dos hiptesis lanzamos la moneda al aire 100 veces.
Si H0 fuera cierta el resultado que obtendramos sera 50 veces cara y 50 veces cruz.
Supongamos que obtenemos cara en 51 ocasiones y cruz en 49. Esta pequea diferencia
sera totalmente explicable por el azar o la suerte. Por consiguiente, nuestra conclusin
sera que no hemos encontrado nada que nos haga sospechar que la moneda est
cargada, luego no podramos decir que la hiptesis nula fuese falsa (no podramos
rechazar H0 ).
Supongamos que al lanzar 100 veces la moneda, obtenemos 97 veces cara y 3 cruz. La
diferencia es lo suficientemente significativa como para hacernos dudar de la validez de
Investigacin Comercial
101
la hiptesis nula y afirmaramos que la moneda est cargada o bien que abandonamos la
hiptesis nula H0 (se puede rechazar la H0 ).
Pero supongamos que despus de 100 lanzamientos de la moneda, hemos obtenido 68
caras y 32 cruces. En esta situacin unas personas no rechazaran la H0, considerando
que la desviacin es fruto del azar, mientras que otras s que rechazaran la H0
Con el fin de dar solucin a este tipo de situaciones se establece un criterio
homogeneizador. La estads tica propone como criterio rechazar la hiptesis nula H0
cuando la probabilidad de un resultado tanto ms extremo, ms pequea que un cierto
valor escogido a priori. Basndose en la experiencia se acepta que ese valor sea 005.
Una vez aceptado ese valor deberemos calcular las probabilidades de los diferentes
resultados muestrales suponiendo cierta la H0 .
Teniendo en cuenta que el producto de p * n es mayor que 5, la proporcin p obtenible
en las infinitas muestras sigue una distribucin normal de media p y desviacin tpica
p (1 p)
n
Sp =
siendo n el nmero de casos de la muestra.
En el ejemplo tenemos que H0 nos dice que p = 05. Si lanzamos la moneda 100 veces
tendramos que
Sp =
05(1 05)
= 005
100
102
Grfica
0402
0598
Esquema de decisin
Si el resultado se sita en la regin crtica se rechaza la hiptesis nula H0
Si el resultado no se sita en la regin crtica, no se rechaza la hiptesis nula H0 ,
rechazando entonces la hiptesis alternativa H1 .
Investigacin Comercial
103
Investigacin Comercial
104
6Siendo estrictos en vez de decir se acepta la hiptesis nula debemos decir no se rechaza la hiptesis
nula
Investigacin Comercial
105
106
En la praxis se ha escogido que el nivel de filtro sea del 95%, es decir, se eliminan el
95% de las hiptesis falsas.
En las pruebas de hiptesis se presentan cuatro situaciones que resumimos en la
siguiente tabla:
H0 es verdadera
1. Decisin correcta
No rechazar H0 Nivel de confianza
H0 es falsa
3. Error tipo II
Probabilidad p =
Probabilidad p= 1 -
2. Error tipo I
Rechazar H0
4. Decisin correcta
Probabilidad p = 1 -
Investigacin Comercial
107
Investigacin Comercial
108
MODELO ESTADSTICO
En el momento en el que identificamos la naturaleza del universo o poblacin (N) y la
tcnica de muestreo a aplicar, hemos establecido un modelo estadstico. Cada prueba
estadstica se asocia a un modelo y a un requisito de medida.
Todas las decisiones tomadas para el uso de cualquier prueba estadstica deben llevar
consigo la siguiente condicin.
Si el modelo utilizado es correcto y los requisitos de medida fueron cumplidos,
entonces.....
Cuanto ms pobres o dbiles sean las suposiciones que definen el modelo,
necesitaremos simplificar ms la decisin alcanzada por la prueba estadstica asociada
al modelo y, por consiguiente, ms generales sern las conclusiones.
Las pruebas ms potentes son aqullas que tienen las suposiciones ms fuertes o
extensas.
Las pruebas paramtricas (como la t, la Z o la F), tienen fuertes suposiciones
subyacentes a su uso. Si estas suposiciones son vlidas, las pruebas basadas en las
mismas son las que tienen mayor probabilidad de rechazar H0 cuando es falsa.
Hemos de resaltar que los requerimientos de los datos de investigacin deben ser
adecuados para la prueba.
EJEMPLO:
Las condiciones que debe satisfacer la prueba t para ser la ms potente y aceptar as
las conclusiones obtenidas con ella con el adecuado nivel de confianza, son:
1. Las observaciones deben ser independientes
2. Las observaciones deben derivar de poblaciones normalmente distribuidas
3. En el anlisis de dos grupos, las poblaciones deben tener la misma varianza
4. Las variables sern medidas al menos en una escala de intervalo
Todas estas condiciones son elementos del modelo estadstico asociado con la
distribucin normal. De ordinario, estas suposiciones no son probadas en el curso del
anlisis estadstico, sino que son presunciones aceptadas y su certeza o falsedad
determina la exactitud y significacin de la probabilidad establecida mediante la prueba
paramtrica.
Investigacin Comercial
109
Se
presupone que las hiptesis acerca de tales parmetros son idnticos a las hiptesis de
investigacin.
Cuando existen razones para creer que las condiciones se encuentran en los datos objeto
de anlisis, es posible elegir una prueba estadstica paramtrica.
Qu ocurre si estas condiciones no se encuentran?
Cuando no se encuentran las suposiciones que constituyen el modelo estadstico de una
prueba entonces esta no puede ser valida. Esto significa que el estadstico de prueba
puede caer en la regin de rechazo con una probabilidad mayor que alfa ().
EFICACIA
Cuando comparamos dos muestras de tamaos diferentes, la potencia de la prueba
aumenta conforme aumenta el tamao de la muestra estadstica. Por consiguiente,
podremos utilizar una prueba menos potente con un tamao de muestra ms grande.
El concepto de potencia-eficacia se relaciona con el tamao de la muestra que es
necesario para lograr que la prueba B sea tan potente como la A cuando el nivel de
significacin y el tamao de la muestra de la prueba A se mantienen constantes.
Si la prueba A es la prueba conocida ms potente de su tipo y en prueba es una prueba
para el mismo diseo de investigacin, entonces
Potencia eficacia de prueba B
PB =
100na
nb
PB = 100lim
na
na
nb
ESCALA DE MEDIDA
Las escalas de medidas utilizadas en la Investigacin Comercial son: nominal, ordinal,
intervalo y de razn. Resmimos en la siguiente tabla sus caractersticas y relaciones:
Investigacin Comercial
110
Escala
Nominal
Equivalencia
Ordinal
Equivalencia
Mayor que
De intervalo
Equivalencia
Mayor que
Razn conocida entre cualesquiera intervalos
De razn
Equivalencia
Mayor que
Razn conocida entre cualesquiera intervalos
Razn conocida entre cualesquiera de dos valores de la escala
Como conclusin, podemos decir que hemos de elegir el test ms potente. Como regla
general recordemos que:
Los test unidireccionales son ms potentes que los bidireccionales
Los test paramtricos son ms potentes que los no paramtricos
Las pruebas que usan datos mtricos son ms potentes que las que no los utilizan
7.3.4 INTERPRETACIN DE LA PRUEBA
La prueba o test elegido tiene una variable asociada a un estadstico cuya distribucin es
conocida y cuyo valor se obtiene mediante la correspondiente frmula con los datos de
la muestra.
Para el nivel de significacin conocemos el valor terico (valor de tablas) del test ,que
ser el que compararemos con el obtenido de aplicar la frmula a los datos obtenidos de
la muestra.
Esta comparacin es la que nos sirve como norma de decisin. En general
Si el valor calculado es mayor que el terico o de tablas para un determinado
nivel de significacin , se rechaza la H0. En caso contrario no se rechaza la H0 .
No rechazar la H0 supone que los datos obtenidos en una investigacin concreta son
compatibles con la hiptesis propuesta. La interpretacin ha de realizarse con prudencia
Investigacin Comercial
111
y criterio, recordando la frase de Henry Clay que dice: las estadsticas no son sustitutos
del criterio.
En algunas pruebas, es preciso conocer los grados de libertad o el nmero de
observaciones diferentes que obtenemos de una variable si descontamos el o los
estadsticos calculados. En el caso de una tabla de r filas y c columnas, los grados de
libertad son (r - 1) para las filas, (c - 1) para las columnas y (r - 1)(c - 1) para la tabla.
RESUMEN
La metodologa para realizar un contraste de hiptesis consiste en la realizacin de los
siguientes pasos:
1. Definir H0 y H1
2. Definir un parmetro de medida que relacione los parmetros mustrales y
poblacionales y la funcin de probabilidad
3. Establecer un criterio para juzgar si el valor calculado del parmetro es compatible
con H0
4. Realizar el muestreo
5. Obtener conclusiones de conformidad con lo expuesto
Segn realicemos el contraste sobre una muestra o sobre dos muestras, que a su
vez se pueden diferenciar en muestras independientes o relacionadas (pareadas),
aplicaremos diferentes tipos de test de hiptesis.
112
Contraste de hipotesis
Una muestra
pruebas paramtricas
Pruebas no paramtricas
Test Z
Test binomial
Test T
Dos muestras
Muestras independientes
Pruebas paramtricas
Muestras Pareadas
Pruebas no paramtricas
Pruebas paramtricas
Pruebas no paramtricas
Test F
Test de la mediana
Test de Mann-Whitney
Test de McNemar
Test de rachas
Test de Wilcoxon
Test de Kolmogorov-Smirnov
Test de Moses
Investigacin Comercial
113
Test de signo
Investigacin Comercial
114
Investigacin Comercial
115
2. Pruebas no paramtricas
Test de Mcnemar. Se aplica sobre dos variables dicotmicas relacionadas. El contraste
lo realiza a travs de la distribucin Chi cuadrado, analizando la probabilidad de
ocurrencia de las situaciones posibles (0 ,1) y (1, 0).
Test del signo. Se utiliza para contrastar la hiptesis de que las dos variables tienen
idntica distribucin. Si las dos muestras tienen la misma distribucin, la mitad de las
diferencias deberan ser positivas y la otra mitad negativas; por consiguiente el mtodo
que sigue se basa en la direccin (signo) de las diferencias entre las dos variables.
Test de Wilcoxon. Se utiliza para contrastar la hiptesis de que las dos variables tienen
idntica distribucin. Tiene en cuenta la magnitud de las diferencias dentro de los pares
y pondera con un valor mayor a los pares que presentan mayores diferencias.
Investigacin Comercial
116
8. ANLISIS BIVARIABLE
El anlisis bivariable trata de analizar la relacin entre dos variables. Este anlisis
permite comprobar si existe asociacin entre esas variables as como medir la fuerza de
esa asociacin. Esta asociacin no implica necesariamente causalidad (no es preciso que
se cumpla que la variable causa preceda a la variable efecto).
Como las variables a estudiar pueden ser de tipo cuantitativo y cualitativo, las
situaciones y principales tcnicas de estudio se recogen en la tabla siguiente
TIPO DE VARIABLE
CUANTITATIVA
CUALITATIVA
CUANTITATIVA
CUALITATIVA
Coeficiente de correlacin Anlisis de varianza (Test F)
(Pearson)
Test t de medias
Regresin
Coeficiente alfa (a) de
Cronbach
Tabla de contingencia (Chi
cuadrado)
Correlacin
de
rangos
(Spearman)
Coeficiente de Cramer
Investigacin Comercial
117
Ninguno
Poco
Bueno
Elevado
Experto
Exp Val
Row Pct
Row
Col Pct
Total
Tot Pct
Mujer
12
36
71
62
67
120
40
444%
250%
250%
333%
83%
83%
563%
643%
800%
111%
333%
111%
111%
148%
37%
37%
24
45
89
78
83
150
50
556%
156%
111%
67%
533%
133%
438%
357%
200%
889%
667%
86%
62%
37%
296%
74%
Column
16
14
15
27
81
Total
198%
173%
185%
333%
111%
1000%
Hombre
Chi-square
Value
DF
Significance
Pearson
2341527
00010
Likelihood Ratio
2580228
00003
00311
4000
1 OF
Investigacin Comercial
118
10 (100%)
119
Investigacin Comercial
120
Para calcular la primero hay que determinar el Valor esperado de una celda. Tal
como hemos indicado anteriormente, el Valor esperado es el nmero de casos que
deberan aparecer en una casilla si las dos variables fueran independientes.
El Valor esperado es igual al nmero de observaciones del total de la fila a la que
pertenece la casilla, multiplicado por el nmero de observaciones del total de la
columna y dividido por el nmero de observaciones vlidas. En nuestro ejemplo, para la
primera celda, el Valor esperado es igual a 7,1 obtenido con la siguiente operacin
matemtica: (36 x 16 ) / 81 = 7,1.
Tambin podemos obtener este valor si aplicamos el porcentaje del total de la fila al
nmero de observaciones total de la columna (44,4 % x 16 = 7,1) o el porcentaje del
total de la columna al nmero de observaciones total de la fila (19,8 % x 36 = 7,1). Con
estas nuevas frmulas se puede interpretar el Valor esperado de una manera ms simple.
Si las dos variables son independ ientes el nmero de mujeres con Ningn
conocimiento de informtica debera ser igual al porcentaje de personas que tienen
Ningn conocimiento de informtica (19,8%) multiplicado por el nmero de mujeres
de la muestra (36) o al porcentaje de mujeres (44,4%) aplicado al total de personas que
tienen Ningn conocimiento de informtica (16).
De forma genrica, si las dos variables son independientes, los porcentajes del total de
la fila (Row Total) deberan ser iguales en cada columna en los porcentajes sobre el total
de la columna (Col Pct), ya que la variable representada en las filas no influye en la otra
variable. De igual forma, los porcentajes del total columna (Column Total) deberan ser
los mismo en cada fila que los porcentajes sobre el total de la fila (Row Pct). En nuestro
ejemplo, el 44,4% de mujeres y el 55,6% de hombres debera repetirse para todas las
categoras de la variable Conocimiento de informtica. O bien, los porcentajes de
Conocimiento de informtica correspondientes a las personas (Total columna), deben
aparecer tanto para hombres como para mujeres.
La columna del ejemplo en la situacin terica de independencia entre las dos variables
quedara como sigue:
Investigacin Comercial
121
Mujeres 1
Hombres 2
Count
71
Exp Val
71
Row Pct
198
Col Pct
444
Tot Pct
88
Count
89
Exp Val
89
Row Pct
198
Col Pct
556
Tot Pct
110
nij E ( n ij )
E( nij )
i = 1 j= 1
donde los sumatorios recogen los valores de todas las celdas, siendo nij la frecuencia
observada (Count) y E(nij) el valor esperado (Exp Val) de cada celda.
La no puede utilizarse si cualquiera de las celdas tiene un valor esperado menor que 1
o si ms de un 20% de las celdas tienen un valor esperado menor que 5. En nuestro
ejemplo, podemos aplicarla, ya que el valor mnimo esperado es 4 y slo en un 10% de
las celdas (1 de 10) hay un valor esperado menor que 5.
Minimum Expected Frequency -
4.000
1 OF 10 ( 10.0%)
La ltima lnea del resultado de una tabla de contingencia nos indica el nmero de
observaciones missing, es decir, aqullas para las que el encuestado no ha contestado
a alguna de las variables cruzadas o a ambas. En el ejemplo, en 21 casos no se dispone
de informacin referida a las variables cruzadas.
Investigacin Comercial
122
2
mn
Donde m es el mnimo de los grados libertad de las filas y columnas. Por tanto
m = min. (h 1, k 1)
n es el tamao de la observacin (muestra) y ?2 es el estadstico Chi cuadrado.
8.1.3 CORRELACIN DE RANGOS DE SPEARMAN
Este coeficiente determina la correlacin entre dos variables cualitativas medidas en
escala ordinal. Este coeficiente vara entre 1 y +1; un valor positivo nos indica una
correlacin en el mismo sentido (directa), mientras que los valores negativos ponen de
manifiesto una relaci n inversa.
Para su determinacin se aplica la frmula de Spearman:
r =1
6 Di2
i =1
N ( N 2 1)
Investigacin Comercial
123
124
100
100
90
90
80
80
Grfica
70
60
50
40
30
40
60
80
100
120
140
70
60
50
40
30
-2
10
Correlacin positiva
Correlacin negativa
r=
r=
s ( x , y)
s(x ) s( y )
n xy x y
( n x 2 ( x ) 2 ) ( n y 2 ( y ) 2 )
Investigacin Comercial
125
8.2.1.1 EJEMPLO
Supongamos que queremos conocer la correlacin existente entre la inversin en
promocin de ventas (x) y la cifra de ventas (y), en miles de euros
Los datos los resumimos en la siguiente tabla
xy
x2
y2
50
100
2500
25
70
175
625
4900
75
225
5625
80
240
6400
85
340
16
7225
35
90
315
1225
8100
x = 18
y = 450
xy = 1395
x2 = 565
y2 = 34750
r=
6 1395 18 450
(6 566 182 ) (6 34750 4502 )
= 088
Por tanto, podemos suponer que existe muy buena relacin entre ambas variables.
Para concluir si la r de Pearson es significativa al 5% al 1%, deberemos consultar con
la correspondiente tabla.
Investigacin Comercial
126
0,01
0,005
0,02
0,01
0,999
0,999
0,900
0,195
0.980
0.990
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
0,805
0,729
0,669
0 622
0,582
0,549
0,521
0,497
0,576
0,458
0,441
0,426
0,412
0,400
0,389
0,378
0,369
0,360
0,352
0,344
0,337
0,330
0,323
0,317
0,311
0,306
0,301
0,296
0,275
0,257
0,243
0,231
0,211
0,195
0,183
0,173
0,164
0,878
0,811
0,784
0,707
0,666
0,632
0,602
0,576
0,553
0,532
0,514
0,497
0,482
0,468
0,456
0,444
0,433
0,423
0,413
0,404
0,396
0,388
0,381
0,374
0,367
0,361
0,355
0,349
0,325
0,304
0,288
0,273
0,250
0,232
0,217
0,205
0,195
0,934
0,882
0,833
0,789
0,750
0,716
0,685
0,658
0,634
0,612
0,592
0,574
0,558
0,542
0,528
0,516
0,503
0,492
0,482
0,472
0,462
0,453
0,445
0,437
0,430
0,423
0,416
0,409
0,381
0,358
0,338
0,322
0,295
0,274
0,256
0,242
0,230
0,959
0,917
0,874
0,834
0,798
0,765
0,735
0,708
0,684
0,661
0,641
0,623
0,606
0,590
0,575
0,561
0,549
0,537
0,526
0,515
0,505
0,496
0,487
0,479
0,471
0,463
0,486
0,449
0,418
0,393
0,372
0,354
0,325
Q303
0,283
0,267
0,254
Investigacin Comercial
127
1 =
o eje de la y
Investigacin Comercial
128
8.2.2.1 OBJETIVOS
Los objetivos que se pretenden con este tipo de anlisis son varios:
Determinar la forma de la relacin entre las dos variables, dependiente e independiente
Comprobar la hiptesis
Predecir los valores que tomar la variable dependiente
Para dar satisfaccin a estos objetivos nos interesa saber:
Cmo se calculan los coeficientes de regresin, 0 y 1
Cmo se interpretan
Cmo se determina si son o no estadsticamente significativos
Cmo se comprueban las hiptesis del modelo
Estimacin del modelo de regresin por mnimos cuadrados ordinarios
Con los datos de la muestra se pueden estimar los parmetros desconocidos del modelo
del siguiente modo:
y = 0 + 1 x +
$ 0
$ 1 x
y$ i = $ 0
$ 1 xi
y$
yi - y$ i = yi - ( $ 0 + $ 1 xi)
n
[ yi - ( $ 0 + $ 1 xi)]2
i =1
SSxy
$ 1 =
SSxx
Origen:
Investigacin Comercial
129
$ 0
y - $ 1 x
x) ( y)
(
x y
n
donde
SSxy =
i= 1
x )
(
x
i =1
SSxx =
i=1
2
i
i=1
i=1
n = tamao de la muestra
Los estimadores mnimos cuadrados son los mejores que se pueden conseguir
(insesgados, eficientes y consistentes) si se cumplen ciertas hiptesis sobre (las
perturbaciones).
8.2.2.2 EJEMPLO REGRESIN LINEAL
En los ltimos diez aos, las ventas de un fabricante respecto de un determinado
producto han sido las siguientes:
Ao
Ventas 40
10
42
50
49
47
50
52
51
55
60
y = n + x
x y = x + x
i
2
i
Investigacin Comercial
130
X
1
2
3
4
5
6
7
8
9
10
55
y
40
42
50
49
47
50
52
51
55
60
496
xy
40
84
150
196
235
300
364
408
495
600
2872
x2
1
4
9
16
25
36
49
64
81
100
385
+385
k
2
k
1 i 2
k 1 i =1 s
Investigacin Comercial
131
es la
Investigacin Comercial
132
F=
1- Dispersin total
Viene dada por la siguiente frmula:
( x
ij
S t2 =
ij
n 1
2- Dispersin factorial
Su expresin matemtica es:
S 2f =
(m
m)
K 1
133
3- Dispersin Residual
Su formulacin es:
( x
ij
S r2 =
mi
ij
n K
Cuando el valor de F es igual a la unidad o muy prximo a este valor, significa que las
dos dispersiones apenas difieren y, como consecuencia, se puede afirmar que los
diferentes tratamientos no han tenido eficacia.
Si el valor de F es muy superior a la unidad, se admite que el efecto de los tratamientos
ha sido eficaz.
Como el nmero de observaciones que se realizan es limitado, no podemos conocer el
valor exacto de la varianza. Por ello, el valor de F oscilar en torno a la unidad como
consecuencia de las variaciones del muestreo.
Este efecto se mitiga con la utilizacin de las tablas de Snedecor. De esta manera,
cuando el valor de F calculado es superior al valor crtico de F indicado en las tablas,
significa que los tratamientos aplicados son eficaces.
Si el valor calculado de F es inferior al valor obtenido en las tablas, esta diferencia se
debe a las variaciones de muestreo.
Investigacin Comercial
134
1614
1995
2157
2246
2302
1851
19
1916
1925
1930
1013
955
928
912
901
771
694
659
639
626
661
579
541
519
505
599
514
476
4,53
439
559
474
435
412
397
532
446
407
384
369
512
426
386
363
348
10
496
410
371
348
333
11
484
398
359
336
320
12
475
389
349
326
311
13
467
381
341
318
303
14
46
374
334
311
296
15
454
368
329
306
290
Siendo m los grados de libertad del numerador y n los grados de libertad del
denominador.
Investigacin Comercial
135
DR = DT - DF
136
S1
S2
S3
S4
S5
P1
65
50
30
40
65
P2
30
25
15
20
35
P3
15
10
10
25
50
SOLUCIN
Definiremos las siguientes caractersticas:
Factor principal: los diferentes tipos de promocin P1, P2, P3, luego K = 3
Investigacin Comercial
137
H 0 : p1 = p 2 = p 3
Nmero total de mediciones: n=15
Nmero de mediciones por cada tratamiento (promocin) nj=5
xij= unidades fsicas vendidas en cada sucursal
mj= media de unidades vendidas por tratamiento
m= media total
Partiendo del cuadro de resultados, obtenemos los valores de mj y m, los cuales son:
S1
S2
S3
S4
S5
P1
65
50
30
40
65
250 50
P2
30
25
15
20
35
125 25
P3
15
10
10
25
50
110 22
mj
Una vez obtenidos estos datos, pasamos a realizar los clculos de la tcnica ANOVA
Dispersin total:
D T
j = 1
i = 1
( x
ij
m )
(30
- 323)2 + (25 - 323)2 + (15 - 323)2 + (20 - 323)2 + (35 - 323)2 + (15 - 323)2 + (10
- 323)2 + (10 - 323)2 + (25 - 323)2 + (50 - 323)2 = 4.693333
Investigacin Comercial
138
Dispersin factorial:
DF =
n (m
j =1
m) 2
Sustituyendo obtenemos
DF = 5(50 - 323)2 +5(25 - 323)2 +5(22 - 323)2 = 2.363333
Dispersin residual:
DR = DT - DF
DF
DF
=
gl
k 1
DR
DR
=
gl
nk
Test de la F :
F=
CMF
CMR
Si buscamos el valor de F en tablas para un nivel del 95% y gl = 2 y 12, obtenemos que
F = 389
Como 60858 > 389, existe un efecto significativo de los diferentes tratamientos
estudiados para un nivel de confianza del 95%.
Investigacin Comercial
139
Contraste de hiptesis
Sueldo actual en
miles de ptas.
Experiencia
previa (en aos)
Hombre
Mujer
217
191
216
Media
5426,88
3361,17
1,7870
Desviacin
tp.
2729,35
1041,14
,6231
Error tp. de
la media
185,28
75,33
4,240E-02
191
1,7359
,5943
4,300E-02
F
Sueldo
actual en
miles de
ptas.
Experien
cia previa
(en
aos)
Se han
asumido
varianzas
iguales
No se han
asumido
varianzas
iguales
Se han
asumido
varianzas
iguales
No se han
asumido
varianzas
iguales
80,26
1,763
Sig.
,000
,185
gl
Sig.
(bilate
ral)
Diferenc
ia de
medias
Error tp
de la
diferencia
Intervalo de
confianza para la
diferencia
Inferior
Superior
9,847
406
,000
2065,71
209,78
1653,33
2478,10
10,328
284,482
,000
2065,71
200,01
1672,02
2459,40
,844
405
,399
5,1E-02
6,057E-02
-7,E-02
,1702
,846
402,675
,398
5,1E-02
6,039E-02
-7,E-02
,1698
Investigacin Comercial
140
8 Robert Jonson y Patricia Kuby Estadstica elemental Lo esencial. Editorial Thomson 1998
Investigacin Comercial
141
Y0
t 2 n2
(1 + )
gl
Donde Yo es una ordenada constante que depende del tamao n de la muestra, gl son los
grados de libertad n - 1, y t es la razn critica que viene dada por:
t=
estadstic o - parmetro
error tpi co
m
m
=
x n 1
s
s
n 1
Investigacin Comercial
142
s
gl
m =
s
n 1
m tC
s
n 1
Por consiguiente, dada una media (m) de una muestra, con el 95% de probabilidades de
acertar se cumple que:
t0 05
m
t
s n 1 005
m t 0 05
s
s
m + t0 05
n 1
n 1
Investigacin Comercial
143
CASO PRCTICO
Tomamos una muestra de 17 personas. Preguntados acerca de la cuestin, obtenemos
los siguientes resultados: para la media y la desviacin tpica, m =50 y s = 7. Queremos
saber si la verdadera media para la poblaci n puede ser 55, para un nivel de
significacin del 1 %.
Solucin:
En este caso, las hiptesis de trabajo sern: H0 : m1 = m2 y la alternativa H1 : m 55
El estadstico de contraste es:
t = (estadstico - parmetro) / error tpico
El error tpico es:
s
7
m =
=
= 17
17
1
gl
Por tanto la razn crtica t ser:
t = (50-55)/1'7 = - 2'857
Consultando en la tabla obtenemos que para 16 grados de libertad y un nivel de
confianza de 001, el valor de la razn crtica es:
t0'01 = - 2'583
Como el valor obtenido es mayor (en valor absoluto) que el de las tablas
2857 > 2583 Rechazamos la H0
Podemos afirmar con el 99% de probabilidades que no es posible que la media de la
poblacin sea 55.
Investigacin Comercial
144
n1s12 + n2 s22 n1 + n2
m m =
gl
n1n2
gl = n1 + n2 2
1
CASO PRCTICO
Realizamos un estudio de mercado sobre dos muestras diferentes, obtenindose los
siguientes resultados:
Muestra 1
Muestra 2
Tamao, n
14
Media, m
50
45
Error tpico, s
Queremos determinar si existe una diferencia significativa de las medias, para un nivel
de significacin del 5%.
Solucin:
La hiptesis nula ser H0 : m1 = m2 y la alternativa H1 : m1 m2
Investigacin Comercial
145
852 + 1442 8 + 14
12 =
= 204
20
814
Luego el valor de t ser:
t = ( 50 - 45 ) / 204 = 245
Como t 245 > t005 1725, podemos afirmar que s que hay una diferencia significativa
entre ambas muestras. Es decir, rechazamos la hiptesis nula.
9.2.4 SIGNIFICACIN DE LA DIFERENCIA DE MEDIAS DE MUESTRAS
PEQUEAS RELACIONADAS
Al estar las muestras relacionadas, el error tpico de las diferencias entre las medias es
menor que en el caso de muestras independientes.
Este tipo de relacin suele darse cuando se estudia una misma muestra en tiempos
diferentes. Por ejemplo, estudiamos la misma muestra antes y despus de una campaa
publicitaria (experimento). Tambin pueden ser grupos diferentes, en los que se han
emparejado previamente sus componentes, de manera tal que cada uno tiene una rplica
casi idntica en el otro grupo.
Vamos a ver cmo se resuelve esta cuestin mediante la solucin de un caso prctico.
CASO PRCTICO
Realizamos una investigacin de mercado, en una serie de establecimientos
comerciales, acerca de la evolucin de la venta del producto A, antes y despus de
realizarse una campaa publicitaria.
Los resultados obtenidos se resumen en la tabla 1.
Investigacin Comercial
146
Muestra n
Tabla Resultados
Ventas antes de la Ventas despus de la Diferencia d (d - md )2
campaa
campaa
18
22
25
30
17
15
-2
16
30
32
15
17
16
17
Total
121
133
12
30
Medias
m1 = 202
M2 = 222
md= 2
Solucin:
Las hiptesis de este supuesto sern:
H0 : m1 = m2 y la alternativa H1 : m1 m2
Procederemos realizando los pasos siguientes:
Sd =
( d md ) 2
n
30
6 = 224
d =
sd
224
=
=1
n 1
6 1
md
d
2
=2
1
Investigacin Comercial
147
4. Buscamos en la tabla
Para un nivel de significacin del 1% y 5 grados de libertad, obtenemos el siguiente
resultado: t001 = 3365
Como el resultado obtenido es 2 < 3365, NO podemos rechazar la hiptesis nula, por
consiguiente no podemos afirmar que la diferencia de medias sea significativa.
9.2.5 SIGNIFICACIN DE LA DIFERENCIA DE DESVIACIONES TPICAS
DE MUESTRAS RELACIONADAS
Cuando dos muestras, grandes o pequeas, estn relacionadas y se quiere conocer si sus
respectivas desviaciones tpicas tienen una diferencia significativa, es necesario
determinar la razn crtica t de Student. Se hace mediante la siguiente frmula:
t=
(s
s22 ) n 2
2 s1s2 1 r122
2
1
Donde n es el tamao total de las muestras, s1 y s2 son las desviaciones tpicas de las
muestras 1 y 2 respectivamente, y r12 es el coeficiente de relacin entre ambas muestras.
Si la razn crtica t calculada es mayor que la de las tablas, decimos que la diferencia s
es significativa al nivel de confianza utilizado.
CASO PRCTICO
Supongamos que trabajamos con una muestra de 51 personas a las que sometemos
inicialmente a un experimento, obtenindose un desviacin tpica s1 = 6. Un mes
despus se les somete al mismo experimento y se obtiene una s2 = 5. El coeficiente de
relacin es de r12 =06. Nivel de significacin del 1%.
Solucin: H0 : s1 = s2 y la alternativa H1 : s1 s2
t=
( 62 52 ) 51 2
265 1 062
= 1604
Investigacin Comercial
148
1 r2
r =
n2
rN = r tr
Si r >08 la distribucin es asimtrica y se trabaja en base a la Z de Fisher, para trabajar
de esta forma con las caractersticas de la normal. El error tpico en este caso vendr
dado por:
Z =
1
n3
CASO PRCTICO
Tenemos 20 pares de datos (n = 20), entre los cuales existe una correlacin r = 06. Hay
que determinar la fiabilidad de este coeficiente a un nivel de significacin del 5%.
Solucin:
Mirando en las tablas para un nivel del 5% y gl = 20 - 2 = 18 obtenemos t = 1734
1 r2
1 036
r =
=
= 0189
n2
18
rN = r tr = o6 17340189
= 06 033
La variabilidad del coeficiente est entre 093 y 027; como puede observarse es muy
amplia, esto nos indica que es recomendable trabajar con una muestra grande.
Investigacin Comercial
149
t=
(r
r13 ) n 3 1 + r23
2 1 r122 r132 r232 + 2r12 r13 r23
12
CASO PRCTICO
En un estudio sobre una muestra de 50 personas, encontramos una correlacin entre el
sexo y la lectura de un determinado peridico, con va lor r = 072, y entre el sexo y la
intencin de voto a un determinado partido poltico, r = 078, si la correlacin entre el
peridico y el voto al partido poltico es r = 06. Queremos conocer si hay diferencia
significativa entre r = 072 y r = 078, a un nivel de significacin del 5%
Solucin:
t=
( 072 078) 50 3 1 + 06
2 1 0722 0782 062 + 207207806
= 1958
Investigacin Comercial
150
0,600
0,325
0,289
0,277
0,271
0,267
0,550
0,158
0,142
0,137
0,134
0,132
6
7
8
9
10
3,707
3,499
3,355
3,250
3,169
3,143
2,998
2,895
2,821
2,764
2,457
2,365
2,306
2,262
2,228
1,943
1,895
1,860
1,833
1,812
1,440
1,415
1,397
1,383
1,372
0,906
0,896
0,889
0,883
0,879
0,718
0,711
0,706
0,703
0,700
0,553
0,549
0,546
0,543
0,542
0,265
0,263
0,262
0,261
0,260
0,131
0,130
0,130
0,129
0,129
11
12
13
14
15
3,106
3,055
3,012
2,987
2,947
2,728
2,681
2,650
2,624
2,602
2,201
2,179
2,160
2,145
2,131
1,796
1,782
1,771
1,761
1,753
1,363
1,356
1,350
1,345
1,341
0,876
0,873
0,870
0,868
0,866
0,697
0,695
0,694
0,692
0,691
0,540
0,539
0,538
0,537
0,536
0,260
0,259
0,259
0,258
0,258
0,129
0,128
0,128
0,128
0,128
16
17
18
19
20
2,921
2,898
2,888
2,861
2,845
2,583
2,567
2,552
2,539
2,528
2,120
2,110
2,101
2,093
2,086
1,746
1,740
1,734
1,729
1,725
1,337
1,333
1,330
1,328
1,325
0,865
0,863
0,862
0,861
0,860
0,690
0,689
0,688
0,688
0,687
0,535
0,534
0,534
0,533
0,533
0,258
0,257
0,257
0,257
0,257
0,128
0,128
0,127
0,127
0,127
21
22
23
24
25
2,831
2,819
2,807
2,797
2,787
2,518
2,508
2,500
2,492
2,485
2,080
2,074
2,069
2,064
2,060
1,721
1,717
1,714
1,711
1,708
1,323
1,321
1,319
1,318
1,316
0,859
0,858
0,858
0,857
0,856
0,686
0,686
0,685
0,685
0,684
0,532
0,532
0,532
0,531
0,531
0,257
0,256
0,256
0,256
0,256
0,127
0,127
0,127
0,127
0,127
26
27
28
29
30
2,779
2,771
2,763
2,756
2,750
2,479
2,473
2,467
2,462
2,457
2,056
2,052
2,048
2,045
2,042
1,706
1,703
1,701
1,699
1,697
1,315
1,314
1,313
1,311
1,310
0,856
0,855
0,855
0,854
0,854
0,684
0,684
0,683
0,683
0,683
0,531
0,531
0,530
0,530
0,530
0,256
0,256
0,256
0,256
0,256
0,127
0,127
0,127
0,127
0,127
40
60
2,704 2,423
2,660 2,390
2,021
2,000
0,255
0,254
0,126
0,126
Investigacin Comercial
151
ns2
= 2
2
CASO PRCTICO 1
De un universo normal con desviacin tpica 14 se toma una muestra de 20 elementos y
se obtiene una desviacin tpica de 17. Est bien tomada la muestra?
Solucin:
Aplicando la frmula
ns2 20172
= 2 = 142 = 2949
2
Investigacin Comercial
152
CASO PRCTICO 2
Una muestra de 25 elementos tomada de una poblacin normal, nos da una desviacin
tpica de s = 15. En qu intervalo encontraremos la desviacin tpica de la poblacin?
Intervalo de confianza 96%, es decir 2% a cada lado de la distribucin 2
Solucin:
Para el intervalo objeto de estudio se cumplir que:
2
ns 2
0 98
ns
2
002
2
ns 2
2
002
098
Sustituyendo:
25 15 2
11992
25 15 2
40270
Luego podemos afirmar que la desviacin tpica de la poblacin, con un error del 4%, se
encuentra entre 21657 y 11818.
Investigacin Comercial
153
0,100
0,01
0,21
0,58
1,06
1,61
0,050
0,00
0,10
0,35
0,71
1,15
0,025
0,00
0,05
0,22
0,48
0,83
0,010
0,00
0,02
0,12
0,30
0,55
0,005
0,00
0,01
0,07
0,21
0,41
6
7
8
9
10
18,55
20,28
21,96
23,59
25,19
16,81
18,48
20,09
21,67
23,21
14,45
16,01
17,53
19,02
20,48
12,69
14,07
15,51
16,92
18,31
10,64
12,02
13,36
14,68
15,99
5,35
6,35
7,34
8,34
9,34
2,20
2,83
3,49
4,17
4,87
1,64
2,17
2,73
3,33
3,94
1,24
1,69
2,18
2,70
3,25
0,87
1,24
1,65
2,09
2,56
0,68
0,99
1,34
1,73
2,16
11
12
13
14
15
26,76
28,30
29,82
31,32
32,80
24,73
26,22
27,69
29,14
30,58
21,92
23,34
24,74
26,12
27,49
19,68
21,03
22,36
23,68
25,00
17,28
18,55
19,81
21,06
22,31
10,34
11,34
12,34
13,34
14,34
5,58
6,30
7,04
7,79
8,55
4,57
5,23
5,89
6,57
7,26
3,82
4,40
5,01
5,63
6,26
3,05
3,57
4,11
4,66
5,23
2,60
3,07
3,57
4,07
4,60
16
17
18
19
20
34,27
35,72
37,16
38,58
40,00
32,00
33,41
34,81
36,29
37,67
28,85
30,19
31,53
32,85
34,27
26,30
27,59
28,87
30,14
31,41
23,54
24,77
25,99
27,20
28,41
15,34
16,34
17,34
18,34
19,34
9,31
10,09
10,86
11,65
12,44
7,96
8,67
9,39
10,12
10,85
6,91
7,56
8,23
8,91
9,59
5,81
6,41
7,01
7,63
8,26
5,14
5,70
6,26
6,84
7,43
21
22
23
24
25
41,40
42,80
44,18
45,56
46,93
38,93
40,29
41,64
42,98
44,31
35,48
36,78
38,08
39,36
40,65
32,67
33,92
35,17
36,42
37,65
29,62
30,81
32,01
33,20
34,38
20,34
21,34
22,34
23,34
24,34
13,24
14,04
14,85
15,66
16,47
11,59
12,34
13,09
13,85
14,61
10,28
10,98
11,69
12,40
13,12
8,90
9,54
10,20
10,86
11,52
8,03
8,64
9,26
9,89
10,52
26
27
28
29
30
48,29
49,64
50,99
52,34
53,67
45,64
46,96
48,28
49,59
50,89
41,92
43,29
44,46
45,72
46,98
38,89
40,11
41,34
42,56
43,77
35,56
36,74
37,92
39,09
40,26
25,34
26,34
27,34
28,34
29,34
17,29
18,11
18,94
19,77
20,60
15,38
16,15
16,93
17,71
18,49
13,84
14,57
15,31
16,05
16,89
12,20
12,83
13,56
14,26
14,96
11,16
11,81
12,46
13,12
13,78
40
60
66,77 63,69
91,95 88,38
59,34
83,30
55,76 51,81
79,08 74,40
39,34
59,34
29,05 26,51
46,56 43,19
24,43
40,48
22,16 20,71
37,43 35,58
Investigacin Comercial
154
( xi m1 )
s12
F= 2 =
s2
n1 1
2
( xi m2 )
n2 1
Investigacin Comercial
155
CASO PRCTICO
Los resultados correspondientes a dos muestras pequeas son los que se recogen en la
tabla siguiente. Pertenecen ambas muestras al mismo universo? Nivel de significacin
= 5%.
n1
n2
20
19
17
20
16
18
14
30
20
25
18
27
= 132
= 112
m1 = 1886
m2 = 224
(s1 )2 = 175
(s2 )2 = 269
s22 269
F = s2 = 175 = 1537
= 154
1
Como 154 es menor que 453, podemos decir que ambas muestras corresponden a una
misma poblacin.
Investigacin Comercial
156
1614
1995
2157
2246
2302
1851
19
1916
1925
1930
1013
955
928
912
901
771
694
659
639
626
661
579
541
519
505
599
514
476
4,53
439
559
474
435
412
397
532
446
407
384
369
512
426
386
363
348
10
496
410
371
348
333
11
484
398
359
336
320
12
475
389
349
326
311
13
467
381
341
318
303
14
46
374
334
311
296
15
454
368
329
306
290
Siendo m los grados de libertad del numerador y n los grados de libertad del
denominador.
Investigacin Comercial
157
Investigacin Comercial
158
Investigacin Comercial
159
Z=
S
n
n
S=
(xi m)2
i =1
n 1
m
Sm
con n 1 grados de libertad
t=
Investigacin Comercial
160
g.l.
1
2
3
4
5
0,995 0,990
0,975
Probabilidad p
0,950 0,900 0,800
0,600
0,550
6,314
2,920
2,353
2,132
2,015
3,078
1,876
1,638
1,533
1,478
1,376
1,061
0,978
0,941
0,920
0,750 0,700
1,000
0,816
0,765
0,741
0,727
0,727
0,617
0,584
0,569
0,559
0,325
0,289
0,277
0,271
0,267
0,158
0,142
0,137
0,134
0,132
6
7
8
9
10
3,707
3,499
3,355
3,250
3,169
3,143
2,998
2,895
2,821
2,764
2,457
2,365
2,306
2,262
2,228
1,943
1,895
1,860
1,833
1,812
1,440
1,415
1,397
1,383
1,372
0,906
0,896
0,889
0,883
0,879
0,718
0,711
0,706
0,703
0,700
0,553
0,549
0,546
0,543
0,542
0,265
0,263
0,262
0,261
0,260
0,131
0,130
0,130
0,129
0,129
11
12
13
14
15
3,106
3,055
3,012
2,987
2,947
2,728
2,681
2,650
2,624
2,602
2,201
2,179
2,160
2,145
2,131
1,796
1,782
1,771
1,761
1,753
1,363
1,356
1,350
1,345
1,341
0,876
0,873
0,870
0,868
0,866
0,697
0,695
0,694
0,692
0,691
0,540
0,539
0,538
0,537
0,536
0,260
0,259
0,259
0,258
0,258
0,129
0,128
0,128
0,128
0,128
16
17
18
19
20
2,921
2,898
2,888
2,861
2,845
2,583
2,567
2,552
2,539
2,528
2,120
2,110
2,101
2,093
2,086
1,746
1,740
1,734
1,729
1,725
1,337
1,333
1,330
1,328
1,325
0,865
0,863
0,862
0,861
0,860
0,690
0,689
0,688
0,688
0,687
0,535
0,534
0,534
0,533
0,533
0,258
0,257
0,257
0,257
0,257
0,128
0,128
0,127
0,127
0,127
21
22
23
24
25
2,831
2,819
2,807
2,797
2,787
2,518
2,508
2,500
2,492
2,485
2,080
2,074
2,069
2,064
2,060
1,721
1,717
1,714
1,711
1,708
1,323
1,321
1,319
1,318
1,316
0,859
0,858
0,858
0,857
0,856
0,686
0,686
0,685
0,685
0,684
0,532
0,532
0,532
0,531
0,531
0,257
0,256
0,256
0,256
0,256
0,127
0,127
0,127
0,127
0,127
26
27
28
29
30
2,779
2,771
2,763
2,756
2,750
2,479
2,473
2,467
2,462
2,457
2,056
2,052
2,048
2,045
2,042
1,706
1,703
1,701
1,699
1,697
1,315
1,314
1,313
1,311
1,310
0,856
0,855
0,855
0,854
0,854
0,684
0,684
0,683
0,683
0,683
0,531
0,531
0,530
0,530
0,530
0,256
0,256
0,256
0,256
0,256
0,127
0,127
0,127
0,127
0,127
40
60
2,704
2,660
2,423
2,390
2,021
2,000
1,684
1,671
1,303
1,296
0,851
0,848
0,681
0,679
0,529
0,527
0,255
0,254
0,126
0,126
Investigacin Comercial
161
EJEMPLOS:
Caso 1
Un panadero quiere lanzar un nuevo producto. Para que el proyecto sea viable, requiere
de unas ventas mnimas de 80 Kg. semanales por establecimiento. Realiza un estudio de
mercado seleccionando 10 establecimientos representativos de su clientela. Los
resultados del estudio son los relacionados en la siguiente tabla.
Cliente
Consumo en Kg Cliente
Consumo en Kg.
130
70
118
120
60
97
75
150
100
10
90
m
Sm
con n 1 grados de libertad
t=
Sustituyendo obtenemos
9 En los clculos utilizamos dos decimales. pasando de cinco aumentamos una unidad.
Investigacin Comercial
162
x
n
m = i =1n =
S
n
n
S=
(xi m)2
i =1
n 1
t=
m 101 80
Sm = 904 = 2323
Z=
m 97 80
= 185
= 92 = 18478
163
Investigacin Comercial
164
m mb
Z = a
ma mb
Siendo ma mb
a2 b2
= n +n
a
b
ma mb es el error estndar y a
y b
las correspondientes
Solucin:
m1 = 7.500
s m1 s m2 =
s1 = 15
n1 = 2.000
m2 = 7.000
s2 = 49
n2 = 1.000
15 2
49 2
+
= 159
2000 1000
165
Sm
a mb
= s +s
2
ma
2
mb
sa2 sb2
+
na nb
S=
(x
i =1
ia
nb
ma )2 + ( xib mb )2
i =1
na + nb 2
Sm
mb
sa2 sb2
1 1
== n + n = S 2 n + n
a
a
b
b
Para decidir si las varianzas son iguales o diferentes se aplica el test de la F con las
siguientes hiptesis:
H0 , las varianzas son iguales y H1, las varianzas son diferentes.
El estadstico F se calcula con la siguiente frmula:
sa2
F = s2
b
El terico se obtiene para los siguientes grados de libertad gl = (na -1) (nb - 1) mirando
en las correspondientes tablas. Para calcular el test de las diferencias de medias, si se
rechaza la H0
varianza conjunta. Ver tabla adjunta Distribucin F para un nivel de significacin del
5%
Investigacin Comercial
166
1614
1995
2157
2246
2302
1851
19
1916
1925
1930
1013
955
928
912
901
771
694
659
639
626
661
579
541
519
505
599
514
476
4,53
439
559
474
435
412
397
532
446
407
384
369
512
426
386
363
348
10
496
410
371
348
333
11
484
398
359
336
320
12
475
389
349
326
311
13
467
381
341
318
303
14
46
374
334
311
296
15
454
368
329
306
290
Siendo m los grados de libertad del numerador y n los grados de libertad del
denominador.
Investigacin Comercial
167
Z=
p
pq n
t=
p
pq n
Donde
n es el tamao de la muestra, p es la proporcin observada en la muestra, q = 1 - p y
10.5 TEST
DE
SIGNIFICACIN
PARA
POBLACIONES
El estadstico a calcular es el test Z, que viene dado en todos los casos por la frmula
siguiente:
Diferencia Observada
Error Estndar
Para que la diferencia tenga significacin al nivel del 5%, el cociente obtenido deber
ser mayor que 196. Para que la diferencia sea significativa a un nivel del 1%, el
cociente deber ser mayor que 258.
Investigacin Comercial
168
10.5.1 TEST
DE
SIGNIFICACIN
PARA
DIFERENCIAS
DE
PROPORCIONES INDEPENDIENTES
Este tipo de prueba se realiza para establecer si la diferencia existente entre dos
porcentajes independientes de muestras diferentes, es realmente significativa. Para ello
se compara la diferencia existente entre las proporciones y el error estndar de la
diferencia de esos porcentajes.
El estadstico que hay que utilizar en este caso concreto es:
p p2
Diferencia Observada
= 1
Error Estndar
s p1 s p2
Donde:
s p1 s p 2 =
1 1
pq +
n1 n2
p1 q1 p2 q2
s p1 s p 2 =
+
n2
n1
Siendo:
p=
n1 p1 + n2 p2
n1 + n2
y q = 100 p
Donde n1 y n2 son los respectivos tamaos de las muestras, y p1 y p2 son los porcentajes
observados.
Las hiptesis sern:
H0. No existe diferencia entre las proporciones, 1
H1. Existe desigualdad entre las proporciones,
- 2 = 0
1 - 2 0
EJEMPLO:
Realizado un estudio sobre una muestra de 1.000 hogares, se observ que el 75% de los
mismos carecan de horno microondas. La asociacin de fabricantes realiz una
campaa de comunicacin, con el objetivo de incentivar las ventas. Transcurridos seis
mese,s se realiz una nueva investigacin; se tom una muestra de 800 hogares,
obtenindose como resultado que el 70% de los hogares carecan del citado horno. Es
significativa la diferencia observada a un nivel del 5%?
Investigacin Comercial
169
Solucin:
p1 = 75
n1 = 1.000
p2 = 70
n2 = 800
1000 * 75 + 800 * 70
= 728
1000 + 800
q = 100 728 = 272
p=
1
1
S p1 s p2 = 728 * 272
+
= 211
1000 800
Diferencia Observada 75 70
=
= 24
Error Estndar
211
Como 24 196, la diferencia encontrada s que es significativa a un nivel del 5%
10.5.2 TEST
DE
SIGNIFICACIN
PARA
DIFERENCIAS
DE
PROPORCIONES NO INDEPENDIENTES
Esta prueba se utiliza para comprobar si la diferencia existente entre dos proporciones
relacionadas entre s es realmente significativa. Los porcentajes pueden estar
relacionados de dos formas diferentes:
1
( p q + p 2 q2 + 2 p1 p 2 )
n 1 1
Investigacin Comercial
170
EJEMPLO:
Supongamos que se quiere determinar si la diferencia de porcentaje de intencin de
voto, obtenida con una muestra de 1.000 ciudadanos con derecho a voto, respecto al PP
y PSOE, es significativa a un nivel del 5%. Los resultados obtenidos en la encuesta han
sido los siguientes:
Partido
PSOE
PP
PAR
IU RESTO
Porcentaje
32
24
16
10
18
Solucin
p1 =32
q1 = 100 - 32 = 68
p2 = 24
q2 = 76
1
(32 * 68 + 24 * 76 + 2 * 32 * 24) = 235
1000
Diferencia Observada 32 24
=
= 3 4
Error Estndar
235
s p1 s p2 =
s p1 s p2 =
1
( p q + p2 q 2 + 2( p1 p 2 p12 )
n 1 1
Investigacin Comercial
171
EJEMPLO:
En un estudio realizado sobre una muestra de 1.000 lectores de prensa dominical, se han
obtenido los siguientes resultados
Prensa
TOTAL
Porcentaje
32
43
22
10
12
133
q2 = 100 - 10 = 90
p12 = 15
1
(22 * 78 + 10 * 90 + 2( 22 *10 15) ) = 174
1000
Diferencia Observada 22 10
=
= 6 9
Error Estndar
174
Como 69 > 196, la diferencia observada s que es significativa a un nivel del 5%.
md D
sd n
Siendo
t=
di
i =1
n
md = n
(
di md )
i =1
n
D La diferencia esperada y sd =
n 1
Investigacin Comercial
172
Slo podemos disponer de una muestra pequea (no se puede aplicar el teorema
central del lmite).
Investigacin Comercial
173
1 Una muestra
Escala de medida
Test no paramtrico
Nominal
Ordinal
Kolmogorov Smirnov
2 Dos muestras
2.1 Independientes
Escala de medida
Test no paramtrico
Nominal
Chi cuadrado
Ordinal
2.2 Relacionadas
Escala de medida
Test no paramtrico
Nominal
McNemar
Ordinal
Signos, Wilcoxon
3 h muestras
3.1 Independientes
Escala de medida
Test no paramtrico
Nominal
Chi cuadrado
Ordinal
3.2 Relacionadas
Escala de medida
Test no paramtrico
Nominal
Q de Cochran
Ordinal
Friedman, Kendall
El principal inconveniente de los test no paramtricos es que no son tan potentes como
los test paramtricos, fundamentalmente porque el nivel de exigencia en su aplicacin
es menor. Esto puede corregirse aumentando el tamao de la muestra.
Investigacin Comercial
174
11.3 BREVE
DESCRIPCIN
DE
DIFERENTES
TEST
NO
PARAMTRICOS
11.3.1 INTRODUCCIN
En primer lugar explicaremos brevemente algunas pruebas estadsticas no paramtricas
que se utilizan para probar una hiptesis derivada de una muestra.
Se trata de dar respuesta a las siguientes cuestiones:
Investigacin Comercial
175
2 =
i
Oi j Ei j
Ei j
Donde
Oij son las frecuencias observadas de la categora i de una variable y de la categora j de
la otra variable
Eij son las frecuencias esperadas de la categora i de una variable y de la categora j de la
otra variable
Los requisitos para aplicar este prueba son: las frecuencias tericas han de tomar al
menos el valor 5 en menos de un 20% de las celdas y en ningn caso la frecuencia
esperada puede ser menor que 1. Cada observacin debe ser independiente de las otras,
no sirve con experimentos en los que se interroga antes y despus del tratamiento.
En tablas de un grado de libertad o del tipo 2 x 2, se aplica la siguiente frmula
n
n ad bc 2
2 =(
a + b)( a + c)( c + d )( b + d )
2
Investigacin Comercial
176
La distribucin de chi cuadrado est determinada por los grados de libertad, su media es
igual al nmero de grados de libertad y su varianza dos veces esa cifra. Cuando los
grados de libertad toman un valor alto la distribucin se aproxima a la normal.
(O
=
ij
Ei j
Ei j
177
CLSICO
NUEVO PRODUCTO
MUY SATISFECHO
30
31
BASTANTE SATISFECHO
35
40
MODERADAMENTE SATISFECHO
25
20
ESCASAMENTE SATISFECHO
10
Solucin
Las hiptesis de trabajo correspondientes son:
H0. No hay diferencia en la valoracin de la satisfaccin entre los consumidores del
producto clsico y del nuevo
H1. S que existen diferencias
Para un nivel de significacin del 5% y 4 - 1 = 3 grados de libertad el valor en tablas
para la chi cuadrado es 781.
Aplicando la frmula obtenemos
(O
=
ij
Ei j
Ei j
( 31 30) 2
30
( 40 35) 2
35
( 20 25) 2
25
( 9 10) 2
10
Como el valor obtenido 1847 es inferior al de tablas de 781, significa que no podemos
rechazar la H0, luego no existen diferencias en el nivel de satisfaccin entre los
consumidores del producto clsico y del nuevo.
Investigacin Comercial
178
= 1847
0,995 0,990
0,975
0,950 0,900
0,500
0,100 0,050
0,025
0,010 0,005
1
2
3
4
5
7,88
10,60
12,84
14,86
16,75
6,63
9,21
11,34
13,28
15,09
5,02
7,38
9,35
11,14
12,83
3,84
5,99
7,81
9,49
11,17
2,71
4,61
6,25
7,78
9,24
0,45
1,39
2,37
3,36
4,25
0,01
0,21
0,58
1,06
1,61
0,00
0,10
0,35
0,71
1,15
0,00
0,05
0,22
0,48
0,83
0,00
0,02
0,12
0,30
0,55
0,00
0,01
0,07
0,21
0,41
6
7
8
9
10
18,55
20,28
21,96
23,59
25,19
16,81
18,48
20,09
21,67
23,21
14,45
16,01
17,53
19,02
20,48
12,69
14,07
15,51
16,92
18,31
10,64
12,02
13,36
14,68
15,99
5,35
6,35
7,34
8,34
9,34
2,20
2,83
3,49
4,17
4,87
1,64
2,17
2,73
3,33
3,94
1,24
1,69
2,18
2,70
3,25
0,87
1,24
1,65
2,09
2,56
0,68
0,99
1,34
1,73
2,16
11
12
13
14
15
26,76
28,30
29,82
31,32
32,80
24,73
26,22
27,69
29,14
30,58
21,92
23,34
24,74
26,12
27,49
19,68
21,03
22,36
23,68
25,00
17,28
18,55
19,81
21,06
22,31
10,34
11,34
12,34
13,34
14,34
5,58
6,30
7,04
7,79
8,55
4,57
5,23
5,89
6,57
7,26
3,82
4,40
5,01
5,63
6,26
3,05
3,57
4,11
4,66
5,23
2,60
3,07
3,57
4,07
4,60
16
17
18
19
20
34,27
35,72
37,16
38,58
40,00
32,00
33,41
34,81
36,29
37,67
28,85
30,19
31,53
32,85
34,27
26,30
27,59
28,87
30,14
31,41
23,54
24,77
25,99
27,20
28,41
15,34
16,34
17,34
18,34
19,34
9,31
10,09
10,86
11,65
12,44
7,96
8,67
9,39
10,12
10,85
6,91
7,56
8,23
8,91
9,59
5,81
6,41
7,01
7,63
8,26
5,14
5,70
6,26
6,84
7,43
21
22
23
24
25
41,40
42,80
44,18
45,56
46,93
38,93
40,29
41,64
42,98
44,31
35,48
36,78
38,08
39,36
40,65
32,67
33,92
35,17
36,42
37,65
29,62
30,81
32,01
33,20
34,38
20,34
21,34
22,34
23,34
24,34
13,24
14,04
14,85
15,66
16,47
11,59
12,34
13,09
13,85
14,61
10,28
10,98
11,69
12,40
13,12
8,90
9,54
10,20
10,86
11,52
8,03
8,64
9,26
9,89
10,52
26
27
28
29
30
48,29
49,64
50,99
52,34
53,67
45,64
46,96
48,28
49,59
50,89
41,92
43,29
44,46
45,72
46,98
38,89
40,11
41,34
42,56
43,77
35,56
36,74
37,92
39,09
40,26
25,34
26,34
27,34
28,34
29,34
17,29
18,11
18,94
19,77
20,60
15,38
16,15
16,93
17,71
18,49
13,84
14,57
15,31
16,05
16,89
12,20
12,83
13,56
14,26
14,96
11,16
11,81
12,46
13,12
13,78
40
60
66,77
91,95
63,69
88,38
59,34
83,30
55,76
79,08
51,81
74,40
39,34
59,34
29,05
46,56
26,51
43,19
24,43
40,48
22,16
37,43
20,71
35,58
Investigacin Comercial
179
P (x = 0) = 1 - p = q
Y = xi
i =1
n
P( Y = k ) = k p k q n k
Investigacin Comercial
180
( ) = k !( nn! k ) !
n
k
EJEMPLO:
Supongamos que lanzamos un dado 5 veces. Cul es la probabilidad de que dos de las
tiradas sea un seis?
En esta situacin n = 5, k = 2, (nmero de observaciones que corresponden al seis),
p=
1
5
yq=
6
6
obtenemos:
n k n k
1x 2 x3x 4 x5 1 2 5 3
P( Y = k ) = k p q = ( )(
= 016
1x2 1x2 x 3) 6 6
En la praxis, cuando probamos una hiptesis la cuestin no suele ser cul es la
probabilidad de obtener exactamente los valores observados?, sino que la pregunta es
del tipo siguiente:
cul es la probabilidad de obtener valores tan extremos o ms extremos que los valores
observados?
La probabilidad deseada en este caso es:
P( Y k ) =
i p q
i
n i
i=k
Investigacin Comercial
181
5! 1 5
5! 1 5
P( Y = 0) = 0!5! 6 6 = 040 P( Y = 1) = 1! 4 ! 6 6 = 040 y
2
3
5! 1 5
P( Y = 2) = 2 ! 3! 6 6 = 016
182
ZY =
y y np
= npq
ZY =
( y 05) np
npq
Potencia eficacia
Debido a que para variables dicotmicas no existe una prueba paramtrica aplicable, no
tiene sentido el hablar de la potencia eficacia.
Si estudiamos una variable continua que es dicotomizada y se utiliza la prueba binomial
con los datos resultantes, la prueba puede perder informacin. En este caso, la prueba
tiene una potencia eficacia del 95% para n = 6 disminuyendo al aumentar la muestra
hasta producirse una eficacia asinttica del 63% (2/).
Investigacin Comercial
183
CASO PRCTICO
El responsable de una agencia de publicidad encargada de una campaa de imagen de
un Gobierno Autnomo asegura haber contactado con el 60% de la poblacin. Para
verificarlo se realiza un estudio sobre una muestra de 25 personas, a quienes se pregunta
si conocen la campaa. Cuatro de estas personas declaran conocerla. Se puede decir
que la proporcin del 60% ha sido contactada a un nivel del 55?
La probabilidad del resultado es
P(y 4) = P(0) + P(1) + P(2) + P(3) + P(4)
Calculamos las diferentes probabilidades aplicando la frmula
n
P( Y = k ) = k p k q n k
Sustituyendo obtenemos:
25!
25!
060 0425 P (1) =
061 0424
0!(25 0)!
1!(25 1)!
25!
25!
P (2 ) =
062 0423 P (3) =
063 0422
2 ! (25 2 )!
3!(25 3)!
25!
P (4 ) =
064 0421
4 ! (25 4 )!
P (0) =
184
P
0,6
Q
0,4
Intentos-N
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
P(N)
0,000000000
0,000000004
0,000000076
0,000000874
0,000007210
0,000045425
0,000227126
0,000924725
0,003120948
0,008842685
0,021222445
0,043409546
0,075966705
0,113950058
0,146507217
0,161157939
0,151085568
0,119979715
0,079986477
0,044203053
0,019891374
0,007104062
0,001937471
0,000379071
0,000047384
0,000002843
Investigacin Comercial
185
P(N) acum
0,000000000
0,000000004
0,000000080
0,000000954
0,000008165
0,000053590
0,000280715
0,001205441
0,004326388
0,013169073
0,034391518
0,077801064
0,153767769
0,267717827
0,414225044
0,575382982
0,726468550
0,846448265
0,926434742
0,970637795
0,990529169
0,997633231
0,999570703
0,999949773
0,999997157
1,000000000
En esta tabla se han omitido los decimales. Las entradas deben leerse como 00000.
Para valores p> 05 se usa la parte inferior para p y la columna derecha para k
Investigacin Comercial
186
Se calculan las frecuencias relativas acumuladas, tanto las observadas como las
esperadas
D 122
Para = 001
D 163
Para =005
Investigacin Comercial
187
136
Potencia eficacia
La prueba KS de una muestra trata las observaciones de forma individual (por separado)
y por ello no necesariamente pierde informacin al hacer la combinacin de categoras,
aunque puede ser conveniente usar agrupaciones de variables.
Cuando trabajamos con muestras pequeas, es una prueba exacta, mientras que la de
Chi cuadrado es slo aproximada. Para muestras grande, ambas pruebas, KS y Chi
cuadrado, dan resultados similares.
Resumen de la prueba KS
CASO PRCTICO
Un fabricante va a lanzar un nuevo producto con un alto componente ecolgico. Quiere
conocer la importancia que dan los consumidores al componente ecolgico en su
decisin de compra, por lo que realiza un estudio sobre una muestra de 100
consumidores potenciales.
La pregunta a los consumidores, acerca de la cuestin, se realiza mediante una escala
de cinco puntos (5), siendo 1 ninguna importancia y 5 mucha importancia. Queremos
conocer si hay diferencia significativa entre los valores observados y los esperados para
un nivel de significacin del 5%.
Los resultados se resumen en el siguiente cuadro:
Investigacin Comercial
188
Resultados de la encuesta
Observada
Categoria Frecuencia
Esperada
acumul
acumul
008
008
020
020
012
15
015
023
020
040
017
17
017
040
020
060
020
35
035
075
020
080
005
25
025
1`00
020
100
000
Total
100
1,00
100
Solucin:
Si el efecto ecolgico no existiera en la decisin de compra por parte del consumidor,
sta se repartira por igual entre las diferentes categoras de respuesta, siendo 100 : 5 =
20 % para cada categora.
La hiptesis nula ser H0 : no existe diferencia entre los valores observados y los
esperados.
Aplicamos la prueba KS para un nivel de significacin del 5%. El valor crtico viene
dado por:
D=
136 136
=
= 0136
n
100
D = max. Oi Ei = max 04 06 = 02
Conclusin:
Como el valor observado 0`20 es mayor que el terico 0136, se rechaza la hiptesis
nula. Es decir, el componente ecolgico s que tiene importancia en la decisin de
compra de este producto por parte de los consumidores.
Investigacin Comercial
189
0.2
0.15
0.10
0.05
0.01
.900
.925
.950
.975
.995
.684
.726
.776
.842
.929
.565
.597
.642
.708
.828
.494
.525
.564
.624
.733
.446
.474
.510
.565
.669
.410
.436
.470
.521
.618
.381
.405
.438
.486
.577
.358
.381
.411
.457
.543
.339
.360
.388
.432
.514
10
.322
.342
.368
.410
.490
11
.307
.326
.352
.391
.468
12
.295
.313
.338
.375
.450
13
.284
.302
.325
.361
.433
14
.274
.292
.314
.349
.418
15
.266
.283
.304
.338
.404
16
.258
.274
.295
.328
.392
17
.250
.266
.286
.318
.381
18
.244
.259
.278
.309
.371
19
.237
.252
.272
.301
.363
20
.231
.246
.264
.291
.356
25
.21
.22
.24
.27
.32
30
.19
.20
.22
.24
.29
35
.18
.19
.21
.23
.27
Mas de 35
1.07
1.14
1.22
Investigacin Comercial
190
1.36
1.63 n
Test de McNemar
DESPUS
NEGATIVO (-)
ANTES
POSITIVO (+)
POSITIVO (+)
NEGATIVO (-)
191
A+D
A+D
cambiaron
de
+
a
y
cambiaron de a +
2
2
Esto significa que si H0 es verdadera, la frecuencia esperada en cada una de las celdas
ser:
A+D
2
Esto significa que la distribucin obtenida lo hace como una 2 con un grado de
libertad.
Si aplicamos el correspondiente estadstico y sustituimos por los valores de la tabla
obtenemos:
A + D
2
A
k (
2
O E)
2 = i E i =
+
A+ D
i =1
i
2
2
A + D
D 2
( A D) 2
= A+ D
A+D
2
2
[ A D 1]
=
A+ D
192
aspectos de los datos son tales que es posible aplicar la prueba t, la prueba de Mcnemar
tiene una eficacia del 95% para A + D = ;, conforme disminuye A + D la potencia
eficacia va decreciendo, volvindose asinttica al 63%.
[ A D 1]
=
A+ D
CASO PRCTICO
Se quiere conocer la intencin de voto de una poblacin en relacin a un candidato
determinado. Para ello, se solicita sta intencin a una muestra formada por 100
ciudadanos con derecho a voto, obtenindose los siguientes resultados:
40
No le votara (-)
60
Total
100
Investigacin Comercial
193
Votara (+) 40
Votara (+) 38
No votara (-) 2
No votara (-) 60
Votara (+) 20
No votara (-) 40
Total 100
Total 100
Positivo (+)
38
Negativo (-)
40
20
Solucin:
La hiptesis nula correspondiente es: H0 no hay diferencia en la intencin de voto antes
y despus del debate televisivo.
Aplicamos la prueba de McNemar, cuyo estadstico es;
[ A D 1]
=
A+ D
[ A D 1] = [ 2 20 1]
=
2
A+ D
2 + 20
172
= 22 = 13136
`
Conclusin:
Como el valor de Chi cuadrado observado es mayor que el valor terico, se rechaza la
hiptesis nula. La diferencia de intencin de voto despus del debate televisivo s que es
significativa al nivel del 5%.
Investigacin Comercial
194
0,995
7,88
10,60
12,84
14,86
16,75
0,990
6,63
9,21
11,34
13,28
15,09
0,975
5,02
7,38
9,35
11,14
12,83
0,950
3,84
5,99
7,81
9,49
11,17
0,900
2,71
4,61
6,25
7,78
9,24
0,500
0,45
1,39
2,37
3,36
4,25
0,100
0,01
0,21
0,58
1,06
1,61
0,050
0,00
0,10
0,35
0,71
1,15
0,025
0,00
0,05
0,22
0,48
0,83
0,010
0,00
0,02
0,12
0,30
0,55
0,005
0,00
0,01
0,07
0,21
0,41
6
7
8
9
10
18,55
20,28
21,96
23,59
25,19
16,81
18,48
20,09
21,67
23,21
14,45
16,01
17,53
19,02
20,48
12,69
14,07
15,51
16,92
18,31
10,64
12,02
13,36
14,68
15,99
5,35
6,35
7,34
8,34
9,34
2,20
2,83
3,49
4,17
4,87
1,64
2,17
2,73
3,33
3,94
1,24
1,69
2,18
2,70
3,25
0,87
1,24
1,65
2,09
2,56
0,68
0,99
1,34
1,73
2,16
11
12
13
14
15
26,76
28,30
29,82
31,32
32,80
24,73
26,22
27,69
29,14
30,58
21,92
23,34
24,74
26,12
27,49
19,68
21,03
22,36
23,68
25,00
17,28
18,55
19,81
21,06
22,31
10,34
11,34
12,34
13,34
14,34
5,58
6,30
7,04
7,79
8,55
4,57
5,23
5,89
6,57
7,26
3,82
4,40
5,01
5,63
6,26
3,05
3,57
4,11
4,66
5,23
2,60
3,07
3,57
4,07
4,60
16
17
18
19
20
34,27
35,72
37,16
38,58
40,00
32,00
33,41
34,81
36,29
37,67
28,85
30,19
31,53
32,85
34,27
26,30
27,59
28,87
30,14
31,41
23,54
24,77
25,99
27,20
28,41
15,34
16,34
17,34
18,34
19,34
9,31
10,09
10,86
11,65
12,44
7,96
8,67
9,39
10,12
10,85
6,91
7,56
8,23
8,91
9,59
5,81
6,41
7,01
7,63
8,26
5,14
5,70
6,26
6,84
7,43
21
22
23
24
25
41,40
42,80
44,18
45,56
46,93
38,93
40,29
41,64
42,98
44,31
35,48
36,78
38,08
39,36
40,65
32,67
33,92
35,17
36,42
37,65
29,62
30,81
32,01
33,20
34,38
20,34
21,34
22,34
23,34
24,34
13,24
14,04
14,85
15,66
16,47
11,59
12,34
13,09
13,85
14,61
10,28
10,98
11,69
12,40
13,12
8,90
9,54
10,20
10,86
11,52
8,03
8,64
9,26
9,89
10,52
26
27
28
29
30
48,29
49,64
50,99
52,34
53,67
45,64
46,96
48,28
49,59
50,89
41,92
43,29
44,46
45,72
46,98
38,89
40,11
41,34
42,56
43,77
35,56
36,74
37,92
39,09
40,26
25,34
26,34
27,34
28,34
29,34
17,29
18,11
18,94
19,77
20,60
15,38
16,15
16,93
17,71
18,49
13,84
14,57
15,31
16,05
16,89
12,20
12,83
13,56
14,26
14,96
11,16
11,81
12,46
13,12
13,78
40
60
66,77 63,69
91,95 88,38
59,34
83,30
55,76 51,81
79,08 74,40
39,34
59,34
29,05 26,51
46,56 43,19
24,43
40,48
22,16 20,71
37,43 35,58
Investigacin Comercial
195
Investigacin Comercial
196
n
n
media = d = np = 2 y var ianza = d2 = npq = 4
El valor de la razn crtica ser:
n
x d 2 2d n
Z= =
=
n
n
2
Esta frmula se corrige por continuidad quedando:
Z=
( d 05) 2
n
2
2d 1 n
n
Investigacin Comercial
197
Potencia eficacia
La potencia eficacia deesta prueba para n = 6 es del 95%, disminuyendo al aumentar n
hasta hacerse asinttica al 63%.
CASO PRCTICO 1
En una reunin con 25 delegados sindicales se pide la opinin de todos acerca de las
nuevas medidas de seguridad en el trabajo. Sus opiniones se recoge a travs de una
escala de cinco puntos siendo 1 muy desfavorable y 5 muy favorable. Los
delegados reciben un curso de formacin despus del cual, se vuelve a pedir su opinin.
Los resultados obtenidos se recogen en la siguiente tabla.
Se quiere conocer si la diferencia observada es significativa para 005.
Solucin
Del anlisis de la tabla obtenemos: d(+) = 8, d(-) = 4. Sin diferencia 13. El tamao de
n = 12
Seleccionamos la menor, esto es d(-) = 4. La probabilidad de obtener 4 cambios en 12
ocasiones, la buscamos en tablas y obtenemos que es: 0194; para la prueba
Investigacin Comercial
198
bidireccional ser 0388. Este valor es superior al nivel de significacin 005 que hemos
seleccionado, luego no rechazamos la hiptesis nula.
Conclusin: no se producen cambios significativos en la opinin de los delegados
sindicales despus de recibir el curso de formacin.
Tabla de resultados
3
4
2
3
3
2
2
5
5
3
2
5
2
5
3
2
4
3
3
2
4
3
2
3
5
3
4
2
2
4
2
2
5
5
3
3
4
4
5
2
4
4
4
4
4
3
4
2
3
5
Investigacin Comercial
199
0
0
0
+
0
0
0
0
0
+
+
0
+
0
+
+
+
+
0
0
0
CASO PRCTICO 2
Supongamos que repetimos la experiencia anterior con una muestra de 150 elementos.
Los resultados obtenidos quedan resumidos en el siguiente cuadro:
No cambian
56
Cambio positivo
32
Cambio negativo 62
Al tratarse de una muestra grande, n = 94, aplicamos el estadstico Z, cuya frmula para
este caso es:
Z=
2d 1 n
n
Sustituyendo obtenemos
Z=
2d 1 n 2 x32 + 1 94 29
=
= 9695 = 2991
n
94
La probabilidad asociada al valor obtenido es: 00014; para dos colas sera 00028.
Como este valor es ms pequeo que 005, la decisin es rechazar la hiptesis nula.
Conclusin: se producen cambios significativos en la opinin de los delegados
sindicales despus de recibir el curso de formacin.
11.9.3 TEST DE RANGOS ASIGNADOS DE WILCOXON
Se trata de una prueba parecida a la anterior, con la diferencia de que en este test se
adjudica ms peso a los pares que muestran mayores diferencias entre las dos
condiciones que a los pares cuya diferencia es menor.
Esta prueba es de utilidad cuando se trata de emitir juicios del tipo mayor que. Con
esta prueba el investigador puede:
Determinar qu miembro del par es mayor que
Establecer rangos en las diferencias en orden de tamao absoluto
Se llega a considerar a las diferencias como si se correspondiesen con una medida de
intervalo (en realidad son diferencias de rangos).
Investigacin Comercial
200
Metodologa
La hiptesis nula es que la suma de rangos es nula. Esto es, que la diferencia entre un
sentido y otro es la misma.
Los tratamientos efectuados en el par se denominan X e Y, la diferencia de resultados
por d, esto es di = xi - yi
Se calculan todas las diferencias
Se ponen todas las diferencias en columna sin tener en cuenta el signo. Se adjudica el
rango 1 a la ms pequea. No se tiene en cuenta el signo. Se trabaja en valores absolutos
(en las diferencias negativas la ms pequea ser -1).
El rango se pone de acuerdo con los valores absolutos de di ; luego aplicaremos el signo
en funcin de que el valor de la distancia sea positivo o negativo. De esta forma se
pueden identificar los rangos de las diferencias negativas de los rangos de las
diferencias positivas e indicarlos.
Tal y como decamos anteriormente, la hiptesis nula es que los tratamientos X e Y son
equivalentes, es decir, tienen la misma mediana y la misma distribucin continua.
Si H0 es verdadera, la suma de los rangos de signo positivo ser la misma que la suma
de rangos de tipo negativo. Por consiguiente, si la diferencia es muy distinta podemos
deducir que el tratamiento X difiere del Y, y por tanto, rechazaramos H0.
Rechazaremos la H0 siempre que la suma de los rangos positivos o negativos sea muy
pequea.
Los estadsticos que se utilizan en esta prueba son:
+
201
T =
n( n + 1)
y T =
4
n( n + 1)( 2n + 1)
24
El valor de Z ser:
T + T
Z=
T
Si existen rangos con empates, se corrige la varianza, utilizando la frmula:
n( n + 1)( 2n + 1) 1 g
=
t j t j 1 t j + 1
24
2 j =1
2
T
)(
Investigacin Comercial
202
Se ordenan los rangos por valores absolutos (sin tener en cuenta el signo)
A las diferencias que tengan el mismo valor se les asigna el rango promedio
T + T
Z=
T
CASO PRCTICO
A un grupo de 10 consumidores potenciales se les pide que valoren, en una escala de 0 a
10 (0 como valor mnimo y 10 como mximo), dos refrescos A y B, respecto a un
determinado atributo.
Los resultados obtenidos son los de la tabla siguiente:
Consumidor 1
10
Refresco A
Refresco B
Diferencia
-4
-1
-2
-5
Investigacin Comercial
203
Solucin:
H0. La suma de rangos es nula
Hay 9 diferencias no nulas a las que les corresponden los siguientes rangos
Rango
1, 1, -1
(1 + 2 + 3) : 3 = 2 2, 2 -2
2, 2, -2
(4 + 5 + 6) : 3 = 5 5, 5,-5
-4
-8
-5
-9
T- = 2 +5 + 8 + 9 = 24
Investigacin Comercial
204
TABLA T DE WILCOXON
Test Unilateral
N
0025
001
005
Test Bilateral
N
005
002
001
10
11
11
12
14
10
13
17
13
10
14
21
16
13
15
25
20
16
16
30
24
20
17
35
28
23
18
40
33
28
19
46
38
32
20
52
43
38
21
59
49
43
22
66
56
49
23
73
62
55
24
81
69
61
25
89
77
68
Investigacin Comercial
205
Prueba de la mediana
206
disponer de pruebas estadsticas que nos indiquen la posible diferencia global entre las
k muestras. En las pruebas paramtricas se recurre al anlisis de la varianza (test F).
Los test no paramtricos ms utilizados son:
Prueba Q de Cochran
Estas pruebas son adecuadas cundo las mediciones de la variable estn en escala
ordinal.
Investigacin Comercial
207
208
209
INTEGRACIN
DE
LOS
MTODOS
CUANTITATIVO
INVESTIGACIN
CIENTFICA
DE
LOS
210
MEDIOS
DE
Roger D. Wimmer,
DE
PSICOLOGA
EXPERIMENTAL.
Metodologa
de
MULTIVARIANTES
PARA
LA
INVESTIGACIN
211
Investigacin Comercial
212