Professional Documents
Culture Documents
Unidade I
O que o SPSS? O que uma pesquisa de survey? Passos de uma anlise estatstica;
Unidades de anlise; Nveis de medidas de variveis; Princpios bsicos para leitura de tabelas; Principais fontes de dados no Brasil.
O que o SPSS?
O SPSS um pacote de ferramentas para tratamento e anlise estatstica. Suas janelas principais so Data View e Variable View (*.sav), a Ouput (*.spo ou *.spv) e a Syntax (*.sps), possuindo tambm janelas para edio de tabelas, grficos e a janela de comandos de Script (*.sbs). Geralmente, antes do incio do processo de anlise estatstica de dados necessrio que estes dados sejam ordenados, combinados usando diferentes arquivos, selecionados em subgrupos de casos, recodificados em suas categorias, calculados outras variveis a partir das variveis existentes e etc.
O que o SPSS?
Somente depois da etapa de tratamento dos dados que a anlise estatstica desses dados ser possvel, podendo abordar desde a construo de tabelas de frequncias e contingncias anlises de modelos mais complexos como regresses lineares, loglineares, modelos logsticos, modelos fatoriais, modelos discrimintantes e etc. Frequentemente utilizamos o SPSS lanando mo de editores de textos como o MS Word, planilhas de clculo como o MS Excel e outros. Por esse motivo convm exportar os
1 2
3 (GB) (USA inspection) inspeo (de uma casa, etc. antes da compra)
1 2
[...] surveys so muito semelhantes a censos, sendo a diferena principal entre eles que um survey, tipicamente, examina uma amostra de populao, enquanto o censo geralmente implica uma enumerao da populao toda. (BABBIE, 1999, p. 78). Destacamos tambm que os dados de um survey so frequentemente chamados de microdados, quando expressam as informaes de cada questionrio no banco de dados, que o que geralmente ocorre.
[...] a pesquisa de survey s uma de muitas ferramentas de pesquisa disponveis para pesquisadores sociais. [...] mtodos de survey no so apropriados a muitos tpicos de pesquisa, nem oferecem necessariamente a melhor abordagem a assuntos aos quais podem ser aplicados. Mesmo assim, o survey pode ser usado vantajosamente no exame de muitos temas sociais e particularmente eficaz quando combinado com outros mtodos. (BABBIE, 1999, p. 82).
Pesquisa de survey se refere a um tipo particular de pesquisa social emprica, mas h muitos tipos de survey. (BABBIE, 1999, p. 95). O termo survey pode incluir pesquisas de opinio pblica, pesquisas eleitorais, estudos e diagnsticos de projetos e programas sociais, pesquisas de mercado, pesquisas de preos, estudos acadmicos, estudos epidemiolgicos e etc. Surveys podem diferir em termos de objetivos, custos, tempo e escopo. Vrios
Objetivos da pesquisa de survey: Descrio Surveys so freqentemente realizados para permitir enunciados descritivos sobre alguma populao, isto , descobrir a distribuio de certos traos e atributos. Nestes, o pesquisador no se preocupa com o porqu da distribuio observada existir, mas com o que ela . (BABBIE, 1999, p. 96). Este um dos objetivos mais comumente utilizados na anlise de dados de survey.
Explicao Apesar da maioria dos surveys visar, pelo menos em parte, descrio, muitos tm o objetivo adicional de fazer asseres explicativas sobre a populao. (BABBIE, 1999, p. 96). Explicar quase sempre requer anlise multivariada o exame simultneo de duas ou mais variveis. (BABBIE, 1999, p. 97). A anlise explicativa um dos objetivos mais difceis de se realizar. Pois, envolve a necessidade de conhecimento terico
Explorao Mtodos de survey podem tambm fornecer um mecanismo de busca quando voc est comeando a investigao de algum tema. (BABBIE, 1999, p. 97). Geralmente este mecanismo de busca realizado atravs de um estudo piloto. A utilizao de pesquisa qualitativa, seja por grupos focais, entrevistas em profundidade ou etc., oferece, frequentemente, muitas possibilidades de explorao. Aprimorando os objetivos de verificao descritiva ou at
O processo de pesquisa que se percorre at a etapa da anlise estatstica de dados, propriamente dita, implica em outras diferentes etapas anteriores. Essas etapas anteriores, por sua vez, implicam diretamente nas possibilidades de anlise, de tal modo que faz-se necessrio que as vrias decises tomadas, quanto a cada um desses estgios anteriores, sejam sempre confrontadas com os objetivos da pesquisa e portando com os objetivos de anlise. Estas etapas tambm diferem em termos da natureza de provenincia desses dados que podem ser
O que so dados primrios? Dados primrios so aqueles que se obtm por um processo de pesquisa de primeira mo. O prprio pesquisador realiza o clculo da amostra; o plano amostral (processo pelo qual se obter a seleo de cada elemento que ir pertencer amostra); a construo do questionrio; a fase de campo (aplicao do questionrio); a codificao (quando necessria); a digitalizao dos dados; o tratamento desses dados (ajustes diversos com o objetivo de preparar a base de dados
O que so dados secundrios? Dados secundrios so aqueles que se obtm de segunda mo. Constituem-se como bases de dados construdas por agncias de pesquisas em geral como o IBGE, DIEESE, FJP. Ou de informao cadastral como o Cadastro nico, cadastros de beneficirios do INSS ou de algum projeto social ou poltica pblica. As vantagens de se utilizar esses dados so claras: menor custo geral de pesquisa.
[...] a codificao das respostas do survey essencialmente uma instncia de anlise de contedo. Freqentemente, o pesquisador de survey far perguntas abertas que pedem resposta nas prprias palavras do respondente. Tais respostas, porm, devem sempre ser codificadas em tipos de respostas. Pode, ento, ser necessrio codificar um conjunto de respostas como apoiando ou opondo-se em geral a uma determinada lei. A esse respeito, os pesquisadores de survey tm muito a aprender com as experincias e mtodos dos analistas de contedo. (BABBIE,
Dados Primrios
Dados Secundrios
Viabilidade da Base Dados Tratamento dos Dados Anlise dos Dados Resultados Concluses
de
Unidades de anlise
Pesquisa de survey fornece tcnicas para se estudar quase todo mundo. Esse mundo estudado num survey so as unidades de anlise. Tipicamente, a unidade de anlise num survey uma pessoa, mas no necessariamente e, alis, muitas vezes no . Quaisquer que sejam as unidades de anlise, dados so colhidos para se descrever cada unidade individual [...]. As muitas descries, ento, so agregadas e manipuladas para descrever a amostra estudada e, por extenso, a populao representada pela
Unidades de anlise
Evidentemente, um determinado survey pode envolver mais de uma unidade de anlise. Um survey de residncias numa certa cidade pode tentar prover a seguinte informao: percentual de estruturas residenciais em condies deterioradas, distribuio racial dos chefes de famlia, renda familiar mdia anual, taxa de desemprego e distribuio etriasexual da populao residente. Nestes exemplos, as unidades de anlises seriam, respectivamente, estruturas residenciais, residncias, famlias, membros da fora de trabalho e residentes. (BABBIE, 1999, p. 99).
Unidades de anlise
Cabe distinguir pelo menos sete nveis de anlise sociolgica o individual, o de grupo, o de organizao, o ecolgico, o institucional, o cultural e o societrio. (ROSENBERG, 1976, p. 261) Unidade de Anlise Individual Diz respeito s informaes prprias aos indivduos.
Unidades de anlise
Unidade de Anlise Grupal Os grupos consistem de pessoas que interagem entre si, de acordo com padres estabelecidos, pessoas que se consideram elementos do grupo e que so identificadas como tal por outras pessoas. (ROSENBERG, 1976, p. 262).
Unidades de anlise
Unidade de Anlise Organizacional Seja a organizao uma fbrica, uma repartio pblica ou uma universidade, essa organizao possui uma estrutura, uma estabilidade e uma permanncia que independem de seus membros. Nas organizaes, as pessoas podem entrar e sair, os tempos podem mudar, mas a organizao permanece como entidade caracterstica. (ROSENBERG, 1976, p. 263).
Unidades de anlise
Unidade de Anlise Institucional A anlise institucional utiliza como unidades as instituies legais, polticas, econmicas, etc., da sociedade. Cabe examinar as relaes dos elementos intra e inter-institucionais. (ROSENBERG, 1976, p. 264). Unidade de Ecolgica) Anlise Espacial (ou
O [...] propsito bsico o de caracterizar os atributos de reas e examinar as associaes entre eles. (ROSENBERG, 1976, p. 266).
Unidades de anlise
Unidade de Anlise Cultural A cultura refere-se a normas, valores, prticas, tradies, objetos tecnolgicos, ideologias, etc., de um grupo de pessoas. possvel, assim, assinalar que certos elementos culturais esto caracteristicamente associados uns aos outros. (ROSENBERG, 1976, p. 267).
Unidades de anlise
Unidade de Anlise Societria Os elementos societrios incluem atributos tais como a natureza do sistema de estratificao, o grau de urbanizao, os traos geogrficos da unidade territorial, etc. (ROSENBERG, 1976, p. 267).
Os nmeros desempenham pelo menos trs funes importantes para os pesquisadores sociais, dependendo do nvel de mensurao particular empregado. Especificamente, as sries numricas podem ser usadas para: (LEVIN, 2004, p. 9) Classificar ou Categorizar ou, ainda, Rotular; Ordenar comparativamente as categorias; Atribuir um escore (de contagem ou mtrico).
1.
2.
3.
Alguns conjuntos de dados (como alturas) consistem em nmeros, enquanto outros so no-numricos (como sexo). Aplicam-se as expresses dados quantitativos e dados qualitativos para distinguir esses dois tipos. (TRIOLA, 2008, p. 3). Os dados quantitativos consistem em nmeros que representam contagens ou medidas. (TRIOLA, 2008, p. 3). Os dados qualitativos [...] podem ser separados em diferentes categorias que se distinguem por alguma caracterstica no-
Os dados quantitativos distinguem-se entre discretos e contnuos: Os dados discretos resultam de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores. (Ou seja, o nmero de valores possveis 0, ou 1, ou 2 etc.) (TRIOLA, 2008, p. 3). Os dados contnuos [...] resultam de um nmero infinito de valores possveis que podem ser associados a pontos em uma escala contnua de tal maneira que no haja lacunas ou interrupes. (TRIOLA, 2008, p.
Quando os dados representam contagens, so discretos; quando representam mensuraes, so contnuos. O nmero de ovos que as galinhas pem constitui dados discretos, porque representa uma contagem; j a quantidade de leite que as vacas produzem constitui dados contnuos, porque representa mensuraes que podem tomar qualquer valor em um intervalo contnuo. (TRIOLA, 2008, p. 3).
Os dados qualitativos distinguem-se entre nominais e ordinais: O nvel nominal de mensurao caracterizado por dados que consistem apenas em nomes, rtulos ou categorias. Os dados no podem ser dispostos segundo um esquema ordenado (como de baixo para cima). (TRIOLA, 2008, p. 3). O nvel ordinal de mensurao envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores dos dados no podem ser determinadas, ou no
ao
nvel
nominal
de
Como as categorias carecem de qualquer significado ordinal ou numrico, os dados precedentes no podem ser utilizados em clculos. Assim que no podemos tirar a mdia de 20 mulheres e 15 homens. Cuidado: Por vezes atribuem-se nmeros a categorias (mormente quando os dados so computadorizados), mas tais nmeros no tm qualquer significado para efeito de clculo, e a mdia calculada com base neles
ao
nvel
ordinal
de
Esse nvel ordinal d informaes sobre comparaes relativas, mas os graus de diferena no servem para clculos. Os dados em nvel ordinal no devem, pois, ser utilizados em clculos. (TRIOLA, 2008, p. 3).
Dados Quantitativos Discretos ou Contnuos Dados Qualitativos Ordinais Dados Qualitativos Nominais
Ao aplicarmos a estatstica a problemas reais, o nvel de mensurao dos dados um fator importante para determinarmos o processo a ser utilizado. Nossa compreenso dos quatro nveis de mensurao deve ser complementado pelo bom senso uma ferramenta indispensvel em estatstica. (TRIOLA, 2008, p. 4).
Por exemplo, no tem sentido calcularmos a mdia dos nmeros de inscrio de segurados no INSS, porque esses nmeros no medem nem contam qualquer coisa; tm por funo nica e exclusiva identificar as pessoas. Tais nmeros so, na verdade, nomes diferentes para as diversas pessoas e, como tais, no devem ser utilizados para clculos. De modo geral, no devemos calcular mdias de dados aos nveis nominal e ordinal de mensurao. (TRIOLA, 2008, p. 4).
obstante, auto-evidente. Importa que os dados sejam bons, mas igualmente importante o que se ir fazer com eles. Impe-se v-los dentro das linhas estruturais de uma lgica [...] o raciocnio que empresta apoio operao analtica. (ROSENBERG, 1976, p. 15). Vejamos agora sobre a leitura analtica que podemos fazer de tabelas de frequncias e tabelas de contingncias (tabelas de dupla entrada):
formao religiosa na populao (x). Informaes que podemos extrair: Qual grupo populao? tem tem maior
Tabela 1
distribuio distribuio N %
624 479 48 1151 54,2 41,6 4,2 100,0
na na
menor
preferncia poltico-partidria na populao (x). Informaes que podemos extrair: Qual grupo populao? tem tem
Tabela 2
maior
na na
Preferncia Poltico-Partidria
Qual Democrata
Outros Total
menor
religiosa da pessoa lhe afeta as preferncias poltico-partidria, o que a tabela 3 pode nos informar? Quais informaes podemos extrair?
Tabela 3 Preferncia Poltico-Partidria Grupo Scio-Religioso Democrata Republicano Outros N N N Brancos Protestantes 235 249 140 Brancos Catlicos 274 92 113 Judeus 32 1 15 Fonte: Adaptado de Rosenberg (1976) apud Lenski (1963).
numricas que aparecem nas vrias clulas. O fato de apenas 32 judeus serem democratas, em comparao com 235 protestantes, no quer dizer que os protestantes se inclinem mais a votar nos democratas do que os judeus. (SIMMONS,Tabela 3 p. 274) 1976,
Total N 624 479 48
Preferncia Poltico-Partidria Grupo Scio-Religioso Democrata Republicano Outros N N N Brancos Protestantes 235 249 140 Brancos Catlicos 274 92 113 Judeus 32 1 15 Fonte: Adaptado de Rosenberg (1976) apud Lenski (1963).
Princpios bsicos para leitura de tabelas [...] a coluna do total, ou marginal, registra
o fato de que a amostra contm um nmero muito menor de judeus do que protestantes (48, diante de 624); h, portanto, um nmero muito menor de judeus capazes de votar em qualquer dos partidos polticos. (SIMMONS, 1976, p. 274) Tabela 3
Total N 624 479 48
Preferncia Poltico-Partidria Grupo Scio-Religioso Democrata Republicano Outros N N N Brancos Protestantes 235 249 140 Brancos Catlicos 274 92 113 Judeus 32 1 15 Fonte: Adaptado de Rosenberg (1976) apud Lenski (1963).
Para exercer controle sobre essa desigualdade de Ns, impe-se computar as porcentagens. (SIMMONS, 1976, p. 274). O nmero total de casos, considerando cada categoria da varivel independente, a base para o clculo das percentagens (SIMMONS, 1976).
Princpios bsicos para leitura de tabelas Contudo, [...] com que base decide o analista
de levantamento de dados [sobre] qual a varivel determinante (independente) e qual a determinada (dependente)? O critrio bsico para apreender o sentido da determinao , aparentemente, suscetibilidade influncia. (ROSENBERG, 1976, p. 28). Dois fatores esto presentes no decidir a respeito do sentido de influncia das variveis: (1) a ordem temporal e (2) a fixidez ou alterabilidade das variveis. (ROSENBERG, 1976, p. 28).
determinao ou influncia no um aspecto estatstico. o modelo terico que nos informa a influncia de uma varivel sobre outra. Mas, ainda assim, no podemos afirmar causalidade entre as variveis. Na verdade, a causao no passa de um tipo de determinao. E a determinao envolve uma conexo necessria entre duas variveis; uma relao causal corresponde a apenas um dentre o nmero, muito maior, de tipos de conexo necessria entre variveis.
temporal e na condio de maior ou menor alterabilidade entre duas variveis, isto quer dizer que as variveis podem ser correlacionadas ou ser associadas (isto , so co-variveis, ou seja, variam juntas). Esta co-variao, empiricamente verificada e amparada teoricamente, nos corrobora que a varivel independente tende a possuir alguma influncia sobre a varivel dependente. Mas, isso no , necessariamente, uma relao causal.
em resumo, uma explicao por meio de leis no necessariamente uma explicao por meio de causas. (ROSENBERG, 1976, p. 28).
Sobre a questo da explicao por meio de leis nas Cincias Sociais, ver sobre a tese extensionalista e a tese heurstica em: WILSON, Thomas P. Sociologia e Mtodo Matemtico. In: GIDDENS, A.; THUNER, J. (Orgs). Teoria Social Hoje. So Paulo: Editora UNESP, 1999. (p. 553-582).
Princpios bsicos para leitura de tabelas Dessa forma, [...] o que se quer comparar
as diferentes propores de pessoas, dos vrios agrupamentos de varivel independente, inclinadas a dar certa categoria de resposta para a varivel dependente. (SIMMONS, 1976, p. 275). Tendo em vista este objetivo, computamos, na tabela 4, os valores percentuais a partir dos valores absolutos descritos na tabela 3. Esse computo levou em considerao que a varivel de grupo scio-religioso tm antecedncia temporal e menor alterabilidade
Princpios bsicos para leitura de tabelas A leitura da tabela 4 ser realizada, ento, a
fim de comparar as propores de cada categoria de grupo scio-religioso (independente) tendendo a se concentrar em uma categoria especfica da preferncia poltico-partidria (dependente).
Tabela Portando, a leitura deve 4ser feita comparandoPreferncia Poltico-Partidria Total se Scio-Religioso Democrata Republicano dentro das colunas. Grupo Outros % 22,4 23,6 31,3 N 624 479 48 % 100,0 100,0 100,0
N % N % N Brancos Protestantes 235 37,7 249 39,9 140 Brancos Catlicos 274 57,2 92 19,2 113 Judeus 32 66,7 1 2,1 15 Fonte: Adaptado de Rosenberg (1976) apud Lenski (1963).
na coluna uma questo de gosto. O que importa que a comparao seja feita no sentido oposto. De outra forma, sobre a tabela 4, o fato de 37,7 por cento dos protestantes preferirem o partido democrata, face a 39,9 por cento de protestantes que preferem o partido republicano, atesta que os protestantes votam quase que indiferentemente nos democratas e nos republicanos; com essa informao apenas no determinamos, entretanto, se a religio afeta a preferncia eleitoral. (SIMMONS,
Unidade II
Como criar seu banco de dados; Leitura de um arquivo de dados do Microsoft Excel pelo SPSS; Definindo as propriedades das variveis; A construo e a utilidade do livro de cdigos.
Data View
Variable View
Variable View
Definio Definio da da Definio dos dos Definio Definio do do Definio quantidade Definio do quantidade Definio da Definio do do Definio rtulos dos cdigos de nome tipo da da totalde casas de rtulo da largura da nvel de alinhamento valoresvalores varivelcaracteres da da varivel decimais varivel varivel mensurao da varivel cdigos ausentes varivel varivel
Output
Colunas = Variveis/Atributos
Linhas = Casos
O livro de cdigos
Cdigo das Categorias Rtulo das Categorias Nome da Varivel da Varivel Livro de Cdigos da PNAD 2007.RtuloVarivel (Value de cada de cada Varivel (Name) (Label) (Value) Label)
Unidade III
Abrindo uma base de dados em formato *.sav; Procedimentos para seleo de casos; Procedimento para ordenao de casos; Identificao de casos duplicados; Procedimentos variveis; para recodificao de
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Recodificao de variveis
Saindo do SPSS
Unidade IV
Procedimento variveis;
para
construo
de
novas
Procedimento para considerar os pesos das observaes; Criao de tabelas de frequncias; Criao de tabelas de contingncia de dupla entrada; Estatsticas descritivas e seus usos; Exportando as sadas do SPSS para Microsoft Excel e Microsoft Word.
Unidade V
USE ALL. COMPUTE filter_$=(Algoritmo de seleo dos casos). VARIABLE LABEL filter_$ Algoritmo de seleo dos casos (FILTER). VALUE LABELS filter_$ 0 Not Selected' 1 'Selected.
FILTER OFF. USE ALL. SELECT IF (Algoritmo de seleo dos casos). EXECUTE.
RECODE Varivel fonte (valor velho=valor novo) INTO Nova varivel. VARIABLE LABELS Nova varivel Label da nova varivel. EXECUTE.
Pesando os casos:
WEIGHT OFF.
Tabela de Frequncias:
CROSSTABS /TABLES=Varivel independente BY Varivel dependente /FORMAT=AVALUE TABLES /CELLS=COUNT ROW /COUNT ROUND CELL.
CROSSTABS
Bibliografia:
BABBIE, Earl. Mtodos de Pesquisas de Survey. Belo Horizonte: Ed. UFMG, 1999. IBGE - INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATSTICA. Pesquisa Nacional por Amostra de Domiclios, 2006 (Banco de dados). Rio de Janeiro: IBGE, 2007. In: Consrcio de Informaes Sociais, 2009. Disponvel em: <http://www.cis.org.br>. Acesso em 06/04/2010. IBGE - INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATSTICA. Pesquisa Nacional por Amostra de Domiclios, 2007 (Banco de dados). Rio de Janeiro: IBGE, 2008. In: Consrcio de Informaes Sociais, 2009. Disponvel em: <http://www.cis.org.br>. Acesso em 06/04/2010. JANUZZI, Paulo de Martino. Indicadores Sociais no Brasil : conceitos, fontes de dados e aplicaes para formulrios de polticas pblicas e elaborao de estudos socioeconmicos. 3.ed. Campinas Alnea, 2004. LEVIN, Jack; FOX, James Alan. Estatstica Para Cincias Humanas. 9. ed. So Paulo: Pearson Prentice Hall, 2004.
Bibliografia:
ROSENBERG, Morris. A Lgica da Anlise do Levantamento de Dados. So Paulo: Cultrix, 1976. SPSS 10.0: Mdulo Base : conceitos e recursos. So Paulo: SPSS Brasil, [19- ]. Volumes 1 e 2. TRIOLA, Mario F. Introduo Estatstica. Rio de Janeiro: LTC, 2008.
FIM!
Mini Curso Apresentado no XV Seminrio Conexo do Curso de Cincias Sociais da PUC Minas. Evento ocorrido de 26 a 30 de abril de 2010.