You are on page 1of 8

Eduardo Novaes Ramires

ESTATSTICA DESCRITIVA
NATUREZA E CAMPO DA ESTATSTICA Estatstica a cincia que diz respeito coleta, apresentao e anlise de dados quantitativos, de tal forma que seja possvel efetuar julgamentos sobre os mesmos. Ramos da Estatstica:
a) Estatstica descritiva trata da observao de fenmenos de mesma natureza, da

coleta de dados numricos referentes a esses fenmenos, da sua organizao e classificao atravs de tabelas e grficos, bem como da anlise e interpretao.
b) Probabilidade estatstica utilizada para analisar situaes que envolvem o acaso

(aleatoriedade).
c) Inferncia estatstica estuda as caractersticas de uma populao com base em

dados obtidos de amostras. O MTODO ESTATSTICO A realizao de uma pesquisa deve passar, pelas fases apresentadas abaixo:

Definio do problema

Planejamento

Coletas dos Dados

Crtica dos Dados

Apresentao dos dados

Tabelas e Grficos

Anlise e interpretao dos dados

POPULAO E AMOSTRA Inferncia Estatstica POPULAO: o conjunto de elementos (na totalidade) que tm, em comum, uma determinada caracterstica. Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, como o nmero de vezes que se pode jogar um dado. AMOSTRA: Obteno de resultados para uma populao com base em observaes extradas a partir de uma amostra retirada desta populao.

qualquer subconjunto da populao. A tcnica de seleo desse subconjunto de elementos chamada de Amostragem. NOES DE AMOSTRAGEM Populao (N) Amostra (n)

X: determinada caracterstica de interesse da populao;

: parmetro populacional;

Como j vimos, a inferncia estatstica tem como objetivo a estimao de parmetros para uma populao tendo como base as informaes extradas atravs de uma amostra. Neste contexto, o estudo dos mais diversos tipos de procedimentos de amostragem se faz necessrio. As tcnicas de amostragem podem ser classificadas em dois grandes grupos: a amostragem probabilstica e a amostragem no probabilstica.
a) Amostragem Probabilstica: neste grupo encontram-se os planos amostrais que utilizam

mecanismos aleatrios de seleo dos elementos da amostra, atribuindo a cada um deles uma probabilidade, conhecida priori, de pertencer a amostra.
b) Amostragem No Probabilstica: neste grupo encontram-se os planos amostrais que

no utilizam mecanismos aleatrios de seleo dos elementos da amostra, e dessa forma, no existe nenhuma probabilidade associada a seleo desses elementos. Ambos os procedimentos tm vantagens e desvantagens. A grande vantagem das amostras probabilsticas medir a preciso da amostra obtida. Tais medidas j so bem mais difceis para os procedimentos do outro grupo. Diante disso, amostras probabilsticas so comumente utilizadas na prtica. Os tipos de planos de amostragem probabilsticos so os seguintes:
1. Amostragem Aleatria Simples: cada elemento da populao tem a mesma chance (ou

probabilidade) de ser selecionado. Os elementos so escolhidos atravs de sorteio. Para isso, tabelas de nmeros aleatrios so freqentemente utilizadas. Por exemplo, selecionar 5 alunos de uma turma.
2

2. Amostragem Estratificada: a populao dividida em estratos (ou grupos)

homogneos, sendo selecionada uma amostra aleatria simples de cada estrato. Por exemplo, selecionar alunos de 5 a 8 srie de uma determinada escola. Neste caso, cada srie corresponde a um estrato, e de cada estrato uma amostra aleatria simples dos alunos extrada.
3. Amostragem Sistemtica: os elementos so selecionados segundo uma regra pr-

definida. bastante utilizada quando os elementos da populao esto arranjados uma ordem. Por exemplo, selecionar um aluno a cada 15 que forem sorteados. Variveis condio inerente uma populao natural existir variao quanto aos atributos que lhe podem ser estudados. Portanto, a variabilidade uma caracterstica comum a dados de observao e experimentos. Um atributo sujeito variao descrito em Estatstica por uma varivel. Nominal Qualitativa Ordinal Varivel Discreta Quantitativa Contnua Varivel Qualitativa: os dados podem ser distribudos em categorias mutuamente exclusivas. Por exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sangneo, etc.. Varivel Quantitativa: os dados so expressos atravs de nmeros. Por exemplo, idade, estatura, peso, etc.. MEDIDAS DE TENDNCIA CENTRAL Os dados quantitativos, apresentados em tabelas e grficos, constituem a informao bsica do problema. Mas conveniente apresentar medidas que mostrem a informao de maneira resumida. Medidas de Tendncia Central So medidas que tendem para o centro da distribuio e tm a capacidade de represent-la como um todo. Do o valor do ponto em torno do qual os dados se distribuem. As principais so: Mdia Aritmtica, Mediana e Moda e algumas.
3

Mdia, Mediana e Moda Mdia Aritmtica A mdia aritmtica pode ser definida em dois tipos: populacional ( ) e amostral ( X ). Nos dois casos existem trs situaes quanto aos clculos. 1. Dados apresentados em forma de rol: A mdia ser:
n

X=

i= 1

xi

soma de todos os elementos do rol nmero de elementos do rol X =

Ex.: Peso em gramas de ratos (50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74) 67 Anlise: o peso mdio dos 12 ratos observados de 67 gramas. Mediana

Valor que divide a distribuio em duas partes iguais, em relao quantidade de elementos. Isto , o valor que ocupa o centro da distribuio, de onde conclui-se que 50% dos elementos ficam abaixo dela e 50% ficam acima. Colocados em ordem crescente, a mediana (Med ou Md) ou valor que divide a amostra, ou populao, em duas partes iguais. 0 freqncia simples. Se "n" for mpar: Med = elemento central (de ordem [(n + 1)/2]) Se "n" for par: Med = mdia aritmtica dos dois elementos centrais (de ordem (n/2) e [(n/2) + 1]) Ex1.: Seja a amostra: 1, 2, 3, 4, 5 Ex2.: Seja a amostra: 1, 2, 3, 4 Moda o valor que ocorre com maior freqncia, ou seja, aquele que mais se repete. Ex.: Na srie 3, 4, 5, 7, 7, 7, 9, 9 Ex.: Na srie 3, 5, 6, 6, 6, 7, 8 Mo = 7 Mo = 6 Srie Unimodal (tem uma nica moda) Srie Bimodal (ocorrem duas modas)
4

Med

100%

a) Varivel Discreta: os dados esto dispostos em forma de rol ou em uma distribuio de

Med = 3 Med = (2 + 3)/2 = 2,5

Ex.: Na srie 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 Srie Trimodal (ocorrem trs modas) Ex.: Na srie 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 Srie Amodal (no existe moda) Ex.: Na srie 0, 1, 3, 4, 7, 8, no existe moda MEDIDAS DE DISPERSO Introduo

Mo1 = 5 e Mo2 = 9 Mo1 = 4, Mo2 = 7 e Mo3 = 9

Utilizaremos o termo disperso para indicar o grau de afastamento de um conjunto de nmeros em relao a sua mdia, pois ainda que consideremos a mdia como um nmero que tem a faculdade de representar uma srie de valores ela no pode por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compem o conjunto. O nosso objetivo construir medidas que avaliem a representatividade da mdia para isto usaremos as medidas de disperso. Uma breve reflexo sobre as medidas de tendncia central permite-nos concluir que elas no so suficientes para caracterizar totalmente uma seqncia numrica. Se observarmos as seguintes seqncias: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5, 15, 50, 120, 160 Calculando a mdia aritmtica de cada um desses conjuntos, obtemos: X= Y= Z=

xi n yi n zi

X= Y= Z=

350 = 70 5 350 = 70 5 350 = 70 5

Observamos, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 70. No entanto, so seqncias completamente distintas do ponto de vista da variabilidade de dados. Na seqncia X, no h variabilidade dos dados. A mdia 70 representa bem qualquer valor da srie.

Na seqncia Y, a mdia 70 representa bem a srie, mas existem elementos da srie levemente diferenciados da mdia 70. Na seqncia Z, existem muitos elementos bastante diferenciados da mdia 70. Conclumos que a mdia 70 representa otimamente a seqncia X, representa bem a seqncia Y, mas no representa bem a seqncia Z. Nosso objetivo construir medidas que avaliem a representatividade da mdia. Para isto, usaremos as medidas de disperso. Observe que na seqncia X os dados esto totalmente concentrados sobre a mdia 70, no h disperso de dados. Na seqncia Y, h forte concentrao dos dados sobre a mdia 70, mas h fraca disperso de dados. J na srie Z h fraca concentrao de dados em torno da mdia 70 e forte disperso de dados em relao mdia 70. Varincia a medida de disperso mais utilizada. definida como sendo o quociente entre a soma dos quadrados dos desvios e o nmero de elementos. classificada em dois tipos: Varincia Populacional ( )
2

(X
i

1 = N

X i2

( X )
i

N
2

Varincia Amostral (s )

(X =

n 1

1 = n 1

X i2

( X )
i

As notas de Antnio no variaram s2 = 0; As notas de Joo variaram menos que as notas de Jos; As notas de Pedro variaram mais que as outras.

ATENO: Desvantagem do uso da varincia No clculo da varincia, quando elevamos ao quadrado a diferena (x i x) , a unidade de medida da srie fica tambm elevada ao quadrado. Portanto, a varincia dada sempre no quadrado da unidade de medida da srie. Se os dados so expressos em metros, a varincia expressa em metros quadrados. Em algumas situaes, a unidade de medida da varincia nem faz sentido. o caso, por exemplo, em que os dados so expressos em litros. A varincia ser expressa em litros quadrados.
6

Portanto, o valor da varincia no pode ser comparado diretamente com os dados da srie, ou seja: varincia no tem interpretao.
Soluo: Utilizar o DESVIO PADRO como medida

Desvio Padro Medida de disperso que apresenta as propriedades da varincia e tem a mesma

unidade de medida dos dados. a raiz quadrada da varincia. Notaes: 1) Quando a seqncia de dados representa uma populao a varincia ser denotada por
2

e o desvio padro correspondente por

2) Quando a seqncia de dados representa uma amostra a varincia ser denotada por S 2 e o desvio padro correspondente por S .
Desvio Padro Populacional ( )

(X
i

Desvio Padro Amostral (s)

S =

(X

n 1

OBS: Quanto maior o valor do desvio padro significa que mais dispersos esto os elementos em torno da mdia. Interpretao do Desvio Padro O desvio padro , sem dvida, a mais importante das medidas de disperso. fundamental que o interessado consiga relacionar o valor obtido do desvio padro com os dados da srie. Quando uma curva de freqncia representativa da srie perfeitamente simtrica ( X = Md = Mo ), podemos afirmar que os intervalos

[ x , x + ] contm aproximadamente 68% dos valores da srie. [ x 2 , x + 2 ] contm aproximadamente 95% dos valores da srie.
7

[ x 3 , x + 3 ] contm aproximadamente 99% dos valores da srie. Quando a distribuio no perfeitamente simtrica, estes percentuais apresentam pequenas variaes para mais ou para menos, segundo o caso. Exemplo: Suponha uma srie com mdia x = 100 e desvio padro = 5 , podemos interpretar estes valores da seguinte forma: Os valores da srie esto concentrados em torno de 100. O intervalo [95, 105] contm aproximadamente 68% dos valores da srie. O intervalo [90, 110] contm aproximadamente 95% dos valores da srie. O intervalo [85, 115] contm aproximadamente 99% dos valores da srie.

Coeficiente de Variao (CV) Quando as medidas de duas ou mais variveis so expressas em unidades diferentes

como peso/altura, capacidade/comprimento, etc. no se pode compar-las atravs do desvio padro, por este ser uma medida absoluta de variabilidade. Usa-se ento o CV, que uma medida relativa, que expressa o desvio padro como uma porcentagem da mdia aritmtica. Quanto mais prximo de zero, mais homognea a distribuio. Quanto mais distante, mais dispersas. O CV mede a disperso em relao mdia. a razo entre o desvio padro e a mdia. O resultado obtido dessa operao multiplicado por 100, para que o coeficiente de variao seja dado em porcentagem.

CV =

s X

100

OBS.: um CV alto indica que a disperso dos dados em torno da mdia muito grande.

You might also like