You are on page 1of 53

1

AULAS 22, 23 E 24
A lgica da amostragem
do survey
Ernesto F. L. Amaral

03, 09 e 10 de junho de 2011


Metodologia (DCP 033)

Fonte:
Babbie, Earl. 1999. Mtodos de Pesquisas de Survey. Belo Horizonte: Editora UFMG. pp.113158.
Triola, Mario F. 2008. Introduo estatstica. 10 ed. Rio de Janeiro: LTC. pp.2-31.

CONCEITOS BSICOS
Estatstica (como cincia) um conjunto de mtodos para:
Planejamento de estudos e experimentos.
Obteno de dados.
Organizao, resumo, apresentao, anlise,
interpretao e elaborao de concluses baseadas nos
dados.

Censo um conjunto de dados obtidos de todos os


membros da populao.
Amostra um subconjunto de membros selecionados de
uma populao.

POR QUE FAZER AMOSTRAGEM?


H duas razes para selecionar uma parcela (amostra) da
populao e fazer estimativas sobre toda a populao:
tempo e custo.

Muitas vezes surveys por amostragem so mais precisos do


que entrevistar todos componentes da populao, devido
logstica do survey.
Um grande nmero de entrevistas requer muitos
pesquisadores, os quais podem no ter boa qualidade.
A qualidade dos dados coletados se reduz com a menor
qualidade dos entrevistadores.
Uma pesquisa em menor escala permite procedimentos de
acompanhamento mais severos.

POR QUE FAZER AMOSTRAGEM? (cont.)


Se forem realizadas vrias entrevistas, o tempo aumenta,
dificultando especificar a data de referncia.
O ponto mdio da entrevista pode ser utilizado como data de
referncia.
Tambm possvel pedir aos entrevistados para responder
sobre uma data especfica no passado, mas isso introduz
problema de recordao imprecisa.
Geralmente recomendado que pesquisas de survey
tenham perodo de coleta de dados de no mximo 3 meses.
A superviso, relatrios e treinamento so muito mais
difceis em um grande survey, e a qualidade dos dados pode
ser menor do que aquela obtida com menos entrevistas.

DADOS POR AMOSTRAGEM SO REALMENTE EXATOS?


Se forem tomados procedimentos de amostragem bem
estabelecidos, surveys por amostragem podem permitir
estimativas muito precisas sobre as populaes.
Raramente possvel determinar com exatido o grau de
preciso dos achados de uma amostra.
Pesquisadores de opinio poltica e eleitoral representam
um grupo de analistas a quem dada a oportunidade de
verificar a preciso de seus dados (resultados reais da
eleio).

PROBLEMAS EM AMOSTRAGEM
Em grande parte, o objeto da estatstica o uso de dados
amostrais para se fazer generalizaes sobre uma
populao.
Os dados amostrais devem ser coletados de modo
apropriado, seno a amostra no ser representativa para a
populao da qual foi obtida.
Amostra de resposta voluntria (ou amostra autoselecionada) aquela em que os respondentes decidem,
eles mesmos, se sero ou no includos.
uma amostra tendenciosa e no deve ser usada para
fazer afirmaes de uma populao maior.
Censo americano tenta corrigir esse problema com visita
de recenseadores aps envio dos questionrios.
Pequenas amostras podem gerar resultados no
confiveis.

HOMOGENEIDADE E HETEROGENEIDADE
Homogeneidade: se todos os membros de uma populao
fossem idnticos uns aos outros em todos os sentidos,
qualquer tamanho de amostra seria suficiente. Na realidade,
bastaria um caso para estudar as caractersticas de toda
populao.
Heterogeneidade: se h variao na populao estudada, o
pesquisador deve usar procedimentos de amostragem mais
controlados.
Uma amostra de indivduos de uma populao deve
conter a mesma variao existente na populao, para
permitir descries teis dela.
A amostragem probabilstica um mtodo eficiente
para extrair uma amostra que reflita corretamente a
variao existente na populao como um todo.

VIS CONSCIENTE E INCONSCIENTE NA AMOSTRAGEM


preciso entrevistar pessoas com perfis diferenciados para
representarem a populao total.
Porm, sem mtodo de amostragem robusto, no
saberemos as propores adequadas dos tipos diversos de
indivduos que devem ser entrevistados.
H ento o perigo dos vieses pessoais do pesquisador
afetarem a amostra selecionada.
Esse vis pode acontecer de maneira consciente ou
inconsciente na coleta de dados.

REPRESENTATIVIDADE E PROBABILIDADE DE SELEO


Como vimos, as amostras de surveys devem representar as
populaes das quais so retiradas.
Alm disso, amostras necessitam ser representativas para
os interesses substantivos da pesquisa.
A representatividade vai depender se queremos fazer
anlises especficas por:
reas geogrficas.
Nvel de escolaridade.
Nvel scio-econmico.
Faixa etria.
Sexo...

CONCEITOS E TERMINOLOGIA DE AMOSTRAGEM

10

Elemento (unidade de anlise) a unidade sobre a qual a


informao coletada e que serve de base para a anlise
(pessoas, famlias, corporaes, pases...).
Universo a agregao terica e hipottica de todos
elementos definidos num survey. O universo no
especificado quanto a tempo e lugar.
Populao a agregao teoricamente especificada de
elementos do survey. a coleo completa de todos os
elementos a serem estudados. preciso definir o elemento e
o referencial de tempo da pesquisa. a especificao terica
do universo.
Populao do survey a agregao de elementos da qual
a amostra do survey de fato selecionada. Nem todos
elementos da populao tero chance de ser selecionados
para a amostra.

11

CONCEITOS E TERMINOLOGIA DE AMOSTRAGEM (cont.)


Unidade de amostra o elemento ou conjunto de
elementos considerados para seleo em alguma etapa da
amostragem.
Numa amostra simples, as unidades de amostra so o
mesmo que os elementos.
Em outros casos, uma amostra pode ter diferentes
unidades de amostra (setores censitrios, domiclios,
pessoas), mas s as pessoas so elementos.
Moldura de amostragem a lista de unidades de amostra
da qual a amostra selecionada.
Na amostra de etapa nica, a moldura de amostragem
a lista dos elementos compondo a populao de survey.
Muitas vezes, so as molduras que definem as
populaes de survey, e no o contrrio.

12

CONCEITOS E TERMINOLOGIA DE AMOSTRAGEM (cont.)


Unidade de observao (unidade de coleta de dados) um
elemento (ou agregao de elementos) do qual se coleta
dados.
Unidade de anlise (elemento) e unidade de observao
podem ser a mesma coisa (indivduo, por exemplo).
Mas em uma pesquisa podemos entrevistar chefes de
domiclio (unidades de observao) para coletar
informao sobre todos membros (unidades de anlise).
Varivel um conjunto de caractersticas mutuamente
excludentes, como sexo, idade, emprego...
Podemos descrever os elementos de uma populao com
base nas caractersticas individuais das variveis.

13

CONCEITOS E TERMINOLOGIA DE AMOSTRAGEM (cont.)


Parmetro uma medida numrica que descreve alguma
caracterstica de uma populao.
Estatstica uma medida numrica que descreve alguma
caracterstica de uma amostra.
Erro amostral: pesquisa de survey busca estimar
parmetros com base em amostras, o que gera erros.
Teoria da probabilidade permite estimar o grau de erro.
Nveis de confiana indicam o percentual de confiana de
que sua estatstica (amostral) est dentro de um intervalo
de confiana do parmetro (populacional).
Nvel e intervalo so estimados usando o erro amostral.

14

TIPOS DE DADOS
Dados so observaes coletadas de um determinado
grupo de interesse.
Dados quantitativos so nmeros que representam
contagens ou medidas (renda, anos de escolaridade...).
Dados discretos so aqueles em que o nmero de
valores possveis so finitos ou enumerveis (nmero de
cmodos em um domiclio...).
Dados contnuos resultam de infinitos valores possveis
em uma escala contnua (renda per capita...).

Dados qualitativos (ou categricos ou de atributos) podem


ser separados em diferentes categorias que se distinguem
por alguma caracterstica no-numrica (sexo, ideologia
poltica).

15

NVEIS DE MENSURAO DE DADOS


Nvel nominal de mensurao possui dados que informam
nomes, rtulos ou categorias:
Os dados no so ordenados e no devem ser usados
para clculos de mdias.
Raa e cdigo postal, por exemplo.
Nvel ordinal de mensurao engloba dados que podem ser
organizados em alguma ordem:
Sabemos que h diferenas relativas entre os valores dos
dados, mas no sabemos as magnitudes das diferenas.
Na escala de frequncia (pouco/mdio/muito), possvel
ordenar os dados, mas no sabemos se a diferena entre
pouco e mdio o mesmo que mdio e muito.

16

NVEIS DE MENSURAO DE DADOS (cont.)


Nvel intervalar de mensurao similar ao ordinal, mas
sabemos as magnitudes das diferenas entre dois valores:
Os dados no possuem um ponto inicial zero natural.
Sabemos as magnitudes das diferenas entre os anos
censitrios (1970, 1980, 1991 e 2000), mas o tempo no
comeou em zero.
Nvel de mensurao de razo similar ao intervalar, mas
h um ponto inicial zero natural:
Como h um zero que indica nenhuma quantidade,
possvel dizer que uma quantidade maior que outra em
X vezes (razes significativas).
30 anos de idade 6 vezes maior do que 5 anos de
idade, por exemplo.

17

RESUMO DOS NVEIS DE MENSURAO DE DADOS


Nvel

Resumo

Exemplo

Nominal

Apenas categorias. Os dados no


podem ser arranjados em um
esquema de ordem. H categorias ou
nomes apenas.

Municpio de
residncia.

Ordinal

As categorias so ordenadas, mas as Frequncia


diferenas no podem ser encontradas igreja: pouco,
ou no tm significado.
mdio, muito.

Intervalar

As diferenas so significativas, mas


no existe ponto inicial zero natural e
as razes no tm sentido.

Ano
censitrio
(no h
tempo zero).

Razo

H um ponto inicial zero natural e as


razes so significativas.

Taxa de
desemprego.

18

TEORIA DA AMOSTRAGEM PROBABILSTICA


A finalidade do survey selecionar um conjunto de
elementos de uma populao de modo que as estatsticas
descrevam com preciso os parmetros populacionais.
A amostragem probabilstica fornece mtodos para
ampliar a possibilidade de alcanar esta meta, bem como
mtodos para estimar o grau de sucesso provvel.
Em uma amostra com seleo aleatria, todos membros da
populao tm oportunidade igual de serem selecionados
para a amostra.
Os mtodos de seleo aleatria:
Diminuem os vieses conscientes ou inconscientes do
pesquisador.
Permitem utilizar a teoria da probabilidade para estimar
parmetros populacionais e erros amostrais.

DISTRIBUIO BINOMIAL DA AMOSTRAGEM


Queremos avaliar uma varivel binomial em nossa
populao, em que os valores possveis so zero e um.
A distribuio amostral a distribuio das estatsticas
das diferentes amostras selecionadas.
Se muitas amostras aleatrias independentes so
extradas de uma populao, as estatsticas amostrais
fornecidas por estas amostras estaro distribudas em torno
do parmetro populacional.
A teoria da probabilidade possui uma frmula para estimar
o quo prximo as estatsticas da amostragem esto
aglomeradas em torno do valor real.
O erro da amostragem ou erro padro (S) medido com
base nos parmetros (P, Q) e tamanho da amostra (n):

19

20

ERRO DA AMOSTRAGEM (ERRO PADRO)


O erro padro (S) indica em que medida as estimativas
amostrais esto distribudas em torno do parmetro
populacional.
Aproximadamente 34% das estimativas amostrais esto at
um erro padro (desvio padro) acima do parmetro da
populao, e outros 34% at um desvio padro abaixo do
parmetro.
Ou seja, 68% das amostras resultaro em estimativas
dentro de (mais ou menos) um erro padro.
Cerca de 95% das amostras estaro dentro de (mais ou
menos) dois erros padro do valor verdadeiro.
99,9% das amostras estaro dentro de (mais ou menos)
trs desvios padro.
A proporo de amostras dentro de 1, 2 ou 3 erros padro
do parmetro constante em amostragens aleatrias.

21

TEORIA DA PROBABILIDADE NA PRTICA


A teoria da probabilidade depende que se selecione
grandes nmeros de amostras aleatrias.
Se parmetro for conhecido e muitas amostras aleatrias
forem selecionadas, podemos predizer quantas amostras
cairo dentro de intervalos especficos a partir do parmetro.
No entanto, geralmente desconhecemos o parmetro e
selecionamos somente uma amostra.
Sabemos que uma amostra aleatria tem probabilidade de
68% de estar dentro da faixa de um erro padro.
Ou seja, temos 68% de confiana que a estimativa da
amostra est dentro de um erro padro do parmetro.
Como no temos parmetro, usamos a estimativa da
amostragem na frmula do erro padro.
Estamos x% confiante (nvel de confiana) de que o
parmetro est entre dois valores (intervalo de confiana).

22

POPULAES E MOLDURAS DE AMOSTRAGEM


preciso discutir as relaes entre as condies de
campo e os pressupostos tericos.
A moldura de amostragem a lista de elementos dos quais
selecionada uma amostra probabilstica.
O survey amostral representativo dos membros desta lista.
importante saber at que ponto h semelhana ou
diferena entre populaes e molduras de amostragem.
Se as molduras de amostragem so realmente
representativas da populao estudada, amostras
corretamente selecionadas fornecem informaes
apropriadas para descrever a populao.

23

SOBRE QUAL POPULAO ESTAMOS FALANDO?


Os resultados dos surveys por amostragem s podem ser
considerados representativos do conjunto de elementos que
compem a moldura de amostragem.

As listagens no incluem de fato todos os elementos da


populao, por isso preciso avaliar a extenso destas
omisses e corrigi-las, se possvel.
No caso de existir omisses, necessrio informar nos
relatrios de pesquisa, com o objetivo de expor corretamente
qual populao est sendo estudada.
Para poder generalizar a populao que compe a moldura
de amostragem, necessrio que todos elementos tenham
representao igual (apaream s uma vez).

24

MTODOS DE AMOSTRAGEM
Amostragem probabilstica: indivduos do universo tm
probabilidade conhecida e diferente de zero de serem
selecionados para amostra (mas no necessariamente a
mesma probabilidade).
Amostras probabilsticas so mais representativas do que
outros tipos, porque so evitados os vieses de seleo.
Alm disso, a teoria da probabilidade permite estimar a
preciso ou representatividade da amostra.
Amostragem no-probabilstica: no so estimadas as
probabilidades de seleo dos elementos da amostra.

AMOSTRAGEM ALEATRIA SIMPLES (AAS)


O desenho da pesquisa realizado com AAS quando toda
amostra possvel de ser obtida de tamanho n tem a mesma
chance de ser escolhida.
De posse da moldura de amostragem, voc enumera cada
elemento da lista, atribuindo s um nmero a cada um, sem
saltos.
Em seguida, usada uma tabela de nmeros aleatrios ou
um programa computacional para selecionar os elementos
da amostra.
AAS raramente realizada na prtica, pois necessrio
dispor de uma lista de elementos (moldura de amostragem)
bem definida a priori.
Mesmo de posse desta lista, geralmente os pesquisadores
usam o mtodo de amostragem sistemtica.

25

AMOSTRAGEM SISTEMTICA
Na amostragem sistemtica, h a escolha de algum ponto
inicial e a seguir selecionado cada k-simo elemento da
populao.
Por exemplo, se a lista tem 10.000 elementos e se deseja
uma amostra de 1.000, selecionado cada 10 elemento.
Amostra sistemtica de incio aleatrio: primeiro
elemento selecionado aleatoriamente.
Intervalo de amostragem a distncia padro entre os
elementos selecionados na amostra (10 no exemplo acima).
Razo amostral a proporo de elementos selecionados
da populao: diviso de 1 pelo intervalo de amostragem.
H perigo da periodicidade, se lista de elementos estiver
organizada com base em alguma informao da populao.
Resultados da AAS e da AS so idnticos, mas a AS mais
fcil e conveniente de ser realizada na prtica.

26

AMOSTRAGEM ESTRATIFICADA
AAS e AS so importantes para garantir grau de
representatividade e permitir estimativa de erro.
Na amostragem estratificada, intuito de garantir
representao das variveis de estratificao para aumentar
representao de outras variveis.
AE tem possibilidade de ser mais representativa em certas
variveis do que AAS, reduzindo erro amostral.
Como erro menor com populao homognea, idia de
selecionar amostra dentro de subconjuntos homogneos
(com heterogeneidade entre subconjuntos).
Populao dividida em subgrupos (estratos) diferentes
entre si. Sujeitos de um subgrupo possuem mesmas
caractersticas. Variveis de estratificao dependem do
interesse de estudo e disponibilidade de informao.
Com base na proporo relativa de cada subgrupo na
populao, elementos dos subgrupos so selecionados
na mesma proporo do tamanho da amostra.

27

ESTRATIFICAO NA AMOSTRAGEM SISTEMTICA


Se uma lista de elementos estiver agrupada por
caractersticas da populao, a amostragem sistemtica
realizar uma estratificao implcita.
Por exemplo, se alunos so organizados por turma, sexo e
notas em uma lista, uma amostra sistemtica selecionaria
nmeros adequados de cada subgrupo.
Uma lista ordenada de elementos pode ser mais til do que
uma lista no ordenada (aleatria).
Nestas condies, a amostragem sistemtica mais precisa
na representatividade dos subgrupos do que a amostragem
aleatria simples.
A lista s deve ser reordenada se o arranjo apresenta algum
problema de periodicidade.

28

29

AMOSTRAGEM POR CONGLOMERADOS


Muitas pesquisas no possuem listagens para fins de
amostragem, tais como populao de um municpio.
possvel realizar uma amostragem inicial de grupos de
elementos (conglomerados) e em seguida selecionar os
elementos de cada conglomerado.
Passos: (1) populao dividida em conglomerados
(sees); (2) so selecionados alguns dos conglomerados; e
(3) seus membros so listados e amostrados.
Um exemplo de amostragem por conglomerados em
mltiplas etapas :
Ao pesquisar um municpio, pode ser feita lista de bairros
(conglomerados) para amostragem AAS ou AS.
Aps selecionar bairros, pode ser feita lista de quarteires
(conglomerados) para amostragem AAS ou AS.
Aps selecionar quarteires, realizada listagem de
domiclios para nova amostragem AAS ou AS.

PRECISO NA AMOSTRAGEM POR CONGLOMERADOS


A amostragem por conglomerados recomendada pela
eficincia, embora no tenha muita preciso.
Como a amostragem por conglomerados geralmente
realizada em mltiplas etapas, ela ter um erro amostral
para cada etapa.
A amostra inicial dos conglomerados representa a
populao de conglomerados em uma faixa de erro amostral.
A amostra de elementos extrada de um conglomerado
representa todos elementos, com um erro amostral.
H o risco de selecionar uma amostra de quarteires
desproporcionalmente ricos, assim como amostra de
residncias ricas dentro dos quarteires.
Soluo pensar: (1) na quantidade de conglomerados
selecionados no incio; e (2) no nmero de elementos
selecionados em cada conglomerado.

30

AMOSTRA E HOMOGENEIDADE NOS CONGLOMERADOS


Sabemos que erro amostral menor com o aumento do
tamanho da amostra e com maior homogeneidade dos
elementos a serem amostrados.
Uma amostra por conglomerados representar melhor
todos conglomerados se um grande nmero for selecionado
e se todos eles forem bastante semelhantes entre si.
Uma amostra de elementos representar melhor todos
elementos de um conglomerado se um grande nmero de
elementos for selecionado do conglomerado, e se todos os
elementos forem bastante semelhantes entre si.
Dado um tamanho mximo de amostra, se o nmero de
conglomerados aumentar, o nmero de elementos num
conglomerado deve diminuir.
Ou seja, a representatividade dos conglomerados aumenta
custa da menor representao dos elementos de cada um,
e vice-versa.

31

DIRETRIZ GERAL DE AMOSTRA DE CONGLOMERADOS


Os elementos de um conglomerado natural dentro de uma
populao so tipicamente mais homogneos do que todos
os elementos da populao total.
Por exemplo, os moradores de um bairro so mais
semelhantes entre si do que todos os moradores do
municpio.
Podem ser necessrios poucos elementos para
representar adequadamente um conglomerado natural,
enquanto um nmero maior de conglomerados pode ser
necessrio para representar adequadamente a diversidade
dos conglomerados.
A diretriz geral (cientfica) no desenho de conglomerados
maximizar o nmero de conglomerados selecionados,
diminuindo o nmero de elementos de cada um.
Porm, um nmero menor de conglomerados pode ser
listado com mais agilidade e economia.

32

REGRA SIMPLES DE AMOSTRA DE CONGLOMERADOS


Pesquisadores populacionais convencionalmente
selecionam cinco residncias por zona ou quarteiro de
recenseamento.
Por exemplo, querendo entrevistar um total de 2.000
residncias, selecionamos 400 quarteires com cinco
entrevistas de residncias em cada um.
De todo modo, amostragem por conglomerados envolve
perda de preciso.
Desenho amostral em etapas mltiplas est sujeito a erros
amostrais em cada uma das etapas:
O erro amostral em cada etapa ser maior do que no
caso de uma amostra aleatria em etapa nica, porque o
tamanho da amostra menor em cada etapa.
Isso est relacionado com a frmula de clculo do erro
amostral:

33

AAS, AS E ESTRATIFICAO NOS CONGLOMERADOS


Discutimos a amostragem por conglomerados como se
fosse selecionada uma amostra aleatria simples a cada
etapa do desenho.
Informaes podem ser usadas para estratificar os
conglomerados:
Censo pode ser usado para estratificar quarteires de
recenseamento em termos de composio tnica, classe
social, valores das propriedades, qualidade de estruturas,
natureza da propriedade das construes e tamanho.
Aps estratificao das unidades primrias de amostragem
de acordo com as variveis disponveis, pode-se usar tanto
tcnicas de amostragem aleatria simples ou amostragem
sistemtica para extrair a amostra.
Conglomerados e estratificao: erro amostral ser mais
reduzido, quanto mais os conglomerados estiverem
combinados em estratos homogneos.

34

AMOSTRAGEM SIMPLES POR CONGLOMERADO


Para garantir a seleo de uma amostra representativa de
elementos, preciso dar a cada elemento da populao total
uma oportunidade igual de ser selecionada.
A forma mais simples de fazer isso numa amostra por
conglomerados dar a cada um a mesma chance de
seleo e selecionar uma determinada proporo de
elementos de cada conglomerado selecionado:
Temos 100.000 elementos agrupados em 1.000
conglomerados e queremos amostra de 1.000 elementos.
Selecionamos 1/10 dos conglomerados (100) com igual
probabilidade.
Depois selecionamos 1/10 dos elementos de cada
conglomerado escolhido.
Ou seja, cerca de 1.000 elementos foram selecionados e
tiveram a mesma probabilidade de seleo.

35

AMOSTRAGEM ANTERIOR SIMPLES E INEFICIENTE


A tcnica anterior simples, mas no a mais eficiente.
A maioria das amostragens por conglomerados envolve
conglomerados de tamanhos muito diversos.
Ao selecionar conglomerados com igual probabilidade,
retirando uma proporo fixa de elementos dos
conglomerados selecionados:
Seleciona-se um nmero relativamente pequeno de
conglomerados grandes na primeira etapa da
amostragem.
Os elementos selecionados para representar todos os
elementos dos grandes conglomerados so retirados de
poucos desses conglomerados.
No limite, toda populao da cidade residindo em dez
grandes quarteires poderia ser representada pelas
pessoas vivendo em apenas um deles.

36

AMOSTRAGEM PPT
Como vimos, a amostragem por conglomerados ter maior
eficincia se houver a seleo de muitos conglomerados,
com poucos elementos retirados de cada um.

Esse princpio utilizado pelo mtodo de amostragem de


probabilidade proporcional ao tamanho (PPT):
H seleo de maior nmero de conglomerados.
H garantia de representao dos elementos de
conglomerados grandes.
Cada elemento na populao recebe igual chance de
seleo.

37

PROCEDIMENTOS DA AMOSTRAGEM PPT


Na primeira etapa, dada a cada conglomerado uma
oportunidade de seleo proporcional ao seu tamanho.
Na segunda etapa, o mesmo nmero de elementos
escolhido de cada conglomerado selecionado.
Esses procedimentos igualam as probabilidades ltimas de
seleo de todos os elementos, j que:
Conglomerados com mais elementos tm maior
probabilidade de serem selecionados.
Elementos em conglomerados maiores tm menor
chance de seleo do que elementos em conglomerados
menores.

38

FRMULA E EXEMPLO DE PPT


A probabilidade de seleo de um elemento num desenho
de amostragem PPT :

Se 100 conglomerados so selecionados e 10 elementos


escolhidos de cada um, a partir de uma populao total de
100.000, a probabilidade geral de seleo de cada elemento
ser de 1.000/100.000 ou 1/100.
Exemplo 1: um conglomerado com 100 elementos:
Prob1 = 100 X (100/100.000) X (10/100) = 1/100
Exemplo 2: um conglomerado com 10 elementos:
Prob2 = 100 X (10/100.000) X (10/10) = 1/100
Independente do nmero de elementos num conglomerado,
cada elemento tem a mesma probabilidade de seleo.

39

SIMPLIFICANDO A FRMULA DE PPT


O tamanho do conglomerado cancelado:

Isso o tamanho da amostra dividido pelo tamanho da


populao:

40

MODIFICAES NO DESENHO PPT


Costuma-se fazer duas modificaes no desenho de
amostra PPT.
Primeiro, podemos achar necessrio representar
conglomerados muito grandes na amostra.
Selecionamos todos esses conglomerados (probabilidade
igual a 1) e seus elementos com a probabilidade geral.
Segundo, se um nmero padro de elementos for
selecionado de cada conglomerado escolhido,
conglomerados com menos elementos do que o nmero
padro representam um problema.
Soluo combinar pequenos conglomerados, de forma
que cada combinao tenha pelo menos o nmero padro
a ser selecionado.
Amostragem por conglomerados difcil, mas adequada
quando for impossvel obter uma lista de todos elementos da
populao.

41

AMOSTRAGEM PROBABILSTICA E PONDERAO


Sabemos que uma amostra probabilstica aquela em que
cada elemento da populao tem uma probabilidade
diferente de zero e conhecida de seleo, mesmo que
elementos diferentes tenham probabilidades diferentes.
A amostra ser representativa da populao se cada
elemento da amostra receber um peso igual ao inverso da
sua probabilidade de seleo.
No caso de todos os elementos da amostra terem a mesma
chance de seleo (amostra autoponderada), cada um
recebe o mesmo peso (1).

42

AMOSTRAGEM E PONDERAO DESPROPORCIONAIS


ainda possvel fazer amostragem e ponderao
desproporcionais:
Ou seja, amostramos subpopulaes
desproporcionalmente para garantir nmero suficiente de
casos de cada subpopulao para anlise.
Podemos sobre-amostrar uma primeira rea para analis-la
detalhadamente, ao mesmo tempo em que a segunda rea
ter uma amostra proporcionalmente menor:
Devemos analisar as duas amostras separadamente ou
comparativamente.
Se quisermos combinar as duas amostras para criar um
quadro composto de toda regio, devemos realizar um
procedimento de ponderao da amostra.

43

GRAUS DE PRECISO NA PONDERAO


Em um desenho complexo de amostra, podemos computar
pesos para cada elemento at vrias casas decimais, ou
atribuir pesos aproximados para corrigir uma eventual
amostragem desproporcional.
A preciso que buscamos na ponderao deve ser
comensurvel com a preciso que queremos nos nossos
resultados.
Se nossos objetivos de pesquisa permitem tolerar erros de
alguns pontos percentuais, no nos preocuparemos com
clculo de ponderaes exatas.
O grau de preciso da ponderao ter relao direta com o
grau de erro amostral e no amostral de nossa pesquisa.
No h uma frmula precisa para determinar qual a melhor
ponderao.
No entanto, devemos informar nos resultados se nossa
ponderao foi aproximada ou precisa.

44

45

MTODOS DE PONDERAO

Para a ponderao aproximada:


Primeiro criamos tabelas sem pesos de cada uma das
amostras das subpopulaes.
Depois multiplicamos as clulas da subpopulao que foi
subamostrada (segundo grau de subamostragem), antes
de adicion-la subpopulao que foi sobreamostrada.
Para uma ponderao mais extensa e rpida:
Dados para certos casos podem ser copiados. Inteno
de aumentar nmero de casos, como se tivssemos
aplicado uma maior quantidade de questionrios.
Para ponderaes previamente calculadas:
Podemos utilizar um banco de dados que j possui os
pesos de cada elemento. Neste caso, somente
informamos ao programa computacional qual varivel
contm a informao de peso.

46

PONDERAO E INFERNCIA ESTATSTICA

Os procedimentos de ponderao tm efeitos srios na


maioria dos clculos de inferncia estatstica.
Se finalidade da pesquisa exige inferncias estatsticas
precisas, feitas com base em dados cuidadosamente
ponderados, preciso consultar um estatstico de
amostragem antes da amostra ser desenhada.

47

PANORAMA DA AMOSTRAGEM PROBABILSTICA

O mtodo chave de amostragem usado na pesquisa de


survey a amostragem probabilstica.
Os elementos so escolhidos de uma populao, com base
na seleo aleatria e com probabilidades diferentes de zero
e conhecidas.
A amostragem probabilstica pode ser simples ou complexa,
dependendo da situao de campo.
o mtodo mais eficiente para seleo de elementos:
Evita o vis consciente ou inconsciente na seleo de
elementos por parte do pesquisador.
Utiliza mtodos controlados de seleo que permitem
estimar o grau de erro esperado (erro amostral).

48

DESENHOS DE AMOSTRAGEM NO-PROBABILSTICA


Apesar dos mtodos de amostragem probabilsticos serem
adequados generalizao, podemos decidir por utilizar
amostragem no-probabilstica:
Porque mais barata.
Porque talvez no seja necessrio ter representatividade
exata.
H alguns mtodos de amostragem no-probabilstica:
Amostragem intencional ou por julgamento.
Amostragem por cotas.
Amostragem por confiana em sujeitos disponveis.

49

AMOSTRAGEM INTENCIONAL OU POR JULGAMENTO


Na amostragem intencional ou por julgamento, pode-se
selecionar a amostra baseado no prprio conhecimento: (1)
da populao; (2) dos seus elementos; e (3) da natureza das
metas de pesquisa.
Pode-se realizar um pr-teste do questionrio com a seleo
de maior variedade de entrevistados para testar a
aplicabilidade geral das perguntas.
Este um pr-teste do instrumento e no um survey
propriamente dito.
Ou seja, h a seleo de indivduos-chave importantes para
os interesses da pesquisa.

50

AMOSTRAGEM POR COTAS


Na amostragem por cotas, sabemos qual a proporo da
populao que possui determinadas caractersticas (sexo,
idade, raa, local de residncia, ocupao):
So colhidos dados de pessoas com todas as
combinaes de caractersticas.
Todas pessoas recebem peso apropriado sua poro
na populao total.
Quando todos elementos da amostra estiverem
ponderados, os dados como um todo devem resultar
numa representao razovel da populao total.
H problemas na amostragem por cotas:
A moldura das cotas deve ser precisa.
Pode haver vieses na seleo de elementos com
determinadas caractersticas.

51

CONFIANA EM SUJEITOS DISPONVEIS


Na amostragem por confiana em sujeitos disponveis, h a
seleo de indivduos que so fceis de acessar.
Tambm chamada de amostragem de convenincia ou
amostragem a esmo.
Embora sirva finalidade de pr-testar um questionrio,
este mtodo de amostragem no deve ser usado para um
estudo que pretende descrever uma populao.

52

USOS NO-SURVEY DOS MTODOS DE AMOSTRAGEM


Na discusso sobre a lgica e os mtodos de amostragem,
foi dada maior ateno pesquisa de survey, em que h a
seleo de elementos de uma populao para entrevista ou
questionrios auto-administrados.
Mtodos de amostragem podem ter aplicao no-survey:
Anlise de contedo: volume de documentos para
analisar pode ser muito grande, o que exige uso de
tcnicas de amostragem de seleo de tais documentos.
Experimentos de laboratrios: sujeitos para
experimentos so geralmente voluntrios. Pode-se usar
mtodos de estratificao para satisfazer cotas.
Observao participante: ao utilizar mtodos de
amostragem de survey, um pesquisador pode obter um
conjunto mais representativo de observaes.

53

PENSAMENTO CRTICO
O sucesso em um curso introdutrio de estatstica
normalmente requer mais senso comum do que habilidade
matemtica. (Triola 2008, p.9)
importante interpretar os dados e resultados com mtodos
cientficos, e saber usar o senso comum.
H trs tipos de mentiras: mentiras, mentiras horrveis e
estatstica. (Benjamin Disraeli)
Nmeros no mentem, mas mentirosos manipulam
nmeros. (Autor desconhecido)
Algumas pessoas usam a estatstica como os bbados
usam os postes - para apoio mais do que para iluminao.
(Andrew Lang)
Estatstico um especialista que coleta nmeros e depois
os desvirtua. (Esars Comic Dictionary)

You might also like