You are on page 1of 19

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS EXATAS E DA TERRA


DEPARTAMENTO DE ESTATÍSTICA

Análise exploratória de dados

Lígia Magnólia Confessor Rocha

Natal/2016
CONCEITOS BÁSICOS
Basicamente a estatística pode se dividir em três áreas:

• Estatística Descritiva

• Probabilidade

• Inferência Estatística
DISTRIBUIÇÕES DE FREQUÊNCIAS
DISTRIBUIÇÃO DE FREQUÊNCIAS:
SIMPLES
• Série estatística para dados nominais, ordinais e discretos, organizados em uma
tabela.
• Ex.: dados nominais: Sexo, estado civil, etc.
• Ex.: dados ordinais: Desempenho escolar, ordem de chegada
• Ex.: dados discretos: Nº de cárie em crianças...

POR CLASSES
• Série estatística para dados contínuos.
• Ex.: dados contínuos: Peso, altura, etc.
• Pode ser utilizada para dados discretos se os mesmos forem em sua maioria
diferentes.
DISTRIBUIÇÕES DE FREQUÊNCIAS
Para a construção de uma distribuição de freqüências em classes são
necessários os seguintes componentes:

 Dados brutos,
 Rol,
 Amplitude total,
 Número de classes;
 Intervalo de cada classe.

Dados Brutos:.
Ex.: Massa corporal (kg) de 48 alunos de uma turma de Estatística

55 57 66 45 48 92 85 63 56 48 46 54 70 90 76 63 48 50 58 60 82 61 90 72 101

59 52 49 54 80 95 82 70 58 70 67 75 58 68 68 70 63 71 56 65 52 76 68
DISTRIBUIÇÕES DE FREQUÊNCIAS
Rol: São os dados apresentados em ordem crescente ou
decrescente
45 46 48 48 48 49 50 52 52 54 54 55 56 56 57 58 58 58 59 60 61 63 63 63 65
66 67 68 68 68 70 70 70 70 71 72 75 76 76 80 82 82 85 90 90 92 95 101

Amplitude Total - At: At = Ls - Li Onde:

Ls - Limite Superior
At = 101 – 45 = 56kg
Li - Limite Inferior
DISTRIBUIÇÕES DE FREQUÊNCIAS

Número de Classes - c
Corresponde à quantidade de classes, nas quais serão agrupados os
elementos do rol.

c = 1 + 3,333...log(n) Onde;

n corresponde ao número de elementos do rol.


c = 1 + 3,333 log 48
c = 6,59853332
c ≈7
DISTRIBUIÇÕES DE FREQUÊNCIAS
- Intervalo de cada classe – i

i = At/c i = 56/7  i = 8 kg

Tabela 1: Massa Corporal (Kg) dos alunos Do Curso de Estatística


Massa Corporal Nº de Alunos (f ) f%
45|– 53 9 18,8
53 |– 61 11 22,9
61 |– 69 10 20,8
45+8=53 69 |– 77 9 18,8 (9/48)*100=18,8
77 |– 85 3 6,2
85 |– 93 4 8,3
93 |–| 101 2 4,2
 48 100
Fonte: Pesquisa, maio/2003.
MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
MEDIDAS DE TENDÊNCIA CENTRAL
 As principais são: Média Aritmética, Mediana e Moda

1. Dados apresentados em forma de rol;


MÉDIA ARITMÉTICA
2. Dados apresentados em forma de:
• Populacional - µ (mi)
- distribuição de frequência simples;
• Amostral - (X-barra)
- distribuição de frequência com
classes.
1. Dados apresentados em forma de rol:
n

x i
soma de todos os elementosdo rol
X i1

n número de elementosdo rol
MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
Exemplo: Peso em gramas de 12 ratos

(50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74)  = = 804/12= 67
Análise: o peso médio dos 12 ratos observados é de 67 gramas.

2. Dados apresentados em formande distribuição de frequência simples:


 xifi
X  i1n
 fii 1

Exemplo: Número de cáries em crianças


X 0 1 2 3 4 Total
f 2 4 10 6 5 27
MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
n

x f i i
(0).(2)  (1).(4)  (2).(10) (3).(6)  (4).(5)
X i1
n
  2,3
27
f
i 1
i

Média para distribuição de frequência com classes


MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
Exemplo: Nascidos vivos segundo o peso ao nascer, em kg.
Classes fi Pm
1,5 |- 2,0 3 1,75
2,0 |- 2,5 16 2,25
2,5 |- 3,0 31 2,75
3,0 |- 3,5 34 3,25
3,5 |- 4,0 11 3,75
4,0 |- 4,5 4 4,25
4,5 |-| 5,0 1 4,75
Total 100 -
Fonte: Dados fictícios
n

P f
m i
(1,75).(3) (2,25).(16)    (4,75).(1)
X i1
n
 3
100
f i 1
i
MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
Mediana
Valor que divide a distribuição em duas partes iguais, em relação à quantidade de
elementos. Isto é, é o valor que ocupa o centro da distribuição, de onde se conclui
que 50% dos elementos ficam abaixo dela e 50% ficam acima.

0 Mediana=50% 100%
• Se "n" for ímpar:
Med = elemento central de ordem
MEDIDAS DE TENDÊNCIA CENTRAL E
DE DISPERSÃO
• Se "n" for par:
n n 
Med = média aritmética dos dois elementos centrais de ordens   e   1
2 2 
Exemplo (dados em forma de rol):
Seja a amostra: 8, 10, 12, 14, 16, 19
n 6
      3 elemento do rol
2 2
n  6 
  1    1  4 elemento do rol
2  2 

3 elemento  4 elemento 12  14
Med    13
2 2
Interpretação: a média aritmética do 3º e 4º elemento do rol (13) divide 50% da
distribuição dos dados à direita e à esquerda.
MEDIDAS DE TENDÊNCIA CENTRAL E
DE DISPERSÃO
Exemplo (dados em uma distribuição de frequência simples):
Suponha a seguinte distribuição de frequência simples.

X fi F↓ n = 42 (par)
82 5 5
Elemento mediano: (n/2) = 21º elemento
85 10 15
87 15 30 (n/2) + 1 = 22º elemento
89 8 38
3ª classe contém o 21º e o 22º elemento
90 4 42
Total 42 - Med=(87+87)/2=87
MEDIDAS DE TENDÊNCIA
CENTRAL E DE DISPERSÃO
• Mediana – Dados agrupados
• Primeiro encontra-se a posição e em seguida
identifica a classe da mediana. A posição é
calculada da seguinte maneira:
Fórmula para encontrar o valor da Mediana em
uma distribuição de frequência em classes
Med

Exemplo: Encontre o valor da Mediana na distribuição de frequência abaixo e


interprete o resultado.
Tabela 1: Massa Corporal (Kg) dos alunos Do Curso de Estatística

Massa Corporal Nº de Alunos (f ) f%


45|– 53 9 18,8
53 |– 61 11 22,9
61 |– 69 10 20,8
69 |– 77 9 18,8
77 |– 85 3 6,2
85 |– 93 4 8,3
93 |–| 101 2 4,2
 48 100
MEDIDAS DE TENDÊNCIA CENTRAL E
DE DISPERSÃO

Moda: É o valor que ocorre com mais frequência em determinada


amostra.

Exemplo: Na série: 3 5 6 6 6 7 8 8 9

Mo=6
Série Amodal
Não existe moda.
Ex: x = {2, 5, 3, 7, 1}
Série Bimodal é aquela onde há duas modas

Tipos de Moda
• Série Unimodal é aquela em que existe uma
moda:
Ex: x= {2, 3, 5, 3, 4, 6}
• Série Bimodal é aquela onde há duas modas
Ex: x = {1, 3, 4, 1, 2, 4, 6}
• Série Multimodal é aquela onde existe mais de
duas modas
Ex: x = {6, 4, 6, 5, 3, 3, 4, 1, 2}
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS EXATAS E DA TERRA
DEPARTAMENTO DE ESTATÍSTICA

Análise exploratória de dados

Lígia Magnólia Confessor Rocha

Natal/2016

You might also like