Professional Documents
Culture Documents
Modelagem Dimensional
Você está aqui
3. Arquitetura 5. Seleção de
Warehouse Tecnologia
6. Aplicação
Usuária
• Validade
• Qualidade
• Integração
• Atualidade
• Consistência
• Manutenção
O Problema
• Extensibilidade
• Flexibilidade
Fatores Chave de Sucesso: Resumo
• Validade • Consistência
• Correteza • Manutenção
• Integração • Extensibilidade
• Atualidade • Flexibilidade
Terminologia Básica
Loja
Loja_id
Código Produto
Endereço Produto_id
Cidade Título
Bairro Categoria
Tipo Aluguel Status
Ano
DIMENSÃO Data_id Qtde Cópias
Loja_id
Tempo DIMENSÃO
Produto_id
Data_id
Qtde Aluguel
Data
Custo
Dia da Semana
Lucro
Feriado
Mês FATO
Ano
Terminologia Avançada
Loja
Loja_id Exclusividade
Código Produto
Loja_id Produto_id
Endereço Produto_id
Cidade Título
Bairro Categoria
Tipo Aluguel Status
Ano
Data_id Qtde Cópias
Loja_id
Tempo
Produto_id
Data_id
Qtde Aluguel
Data
Custo Cópia
Dia da Semana
Lucro Produto_id
Feriado
Cópia_id
Mês
Idioma
Ano
SUB-DIMENSÃO
Terminologia
STAR SCHEMA
Dimensão 1
Dimensão 2 Dimensão 5
Fato
Dimensão 3 Dimensão 4
Terminologia
Tabela Auxiliar
SNOWFLAKED
Dimensão 1
Dimensão 2 Dimensão 5
Fato
Dimensão 3 Dimensão 4
Tabela Auxiliar
Terminologia
Mês FATO 1
Mês_id Mês_id
Nome Cliente_id
Cliente Número Telefone_id
Cliente_id Qtde ligações
Nome
Endereço
Cidade RELACIONADAS
Estado Telefone
FATO 2
Telefone_id
Mês_id
Ddd
Cliente_id
Número
Telefone_id
Tipo
Problema_id
Qtde Ocorrências
Problema
Custo Reparo
Problema_id
Nome
Terminologia
Mês FATO 1
Mês_id Mês_id
Cliente Nome Cliente_id
Cliente_id Número Loja_id
Nome
Produto
Endereço
Qtde Venda
Cidade
Valor Venda
Estado
AGREGADAS
Produto FATO 2
Loja Produto_id Mês_id
Loja_id Nome Loja_id
Endereço Produto_id
Depto Qtde Venda
Cidade Valor Venda
Enfoque da Modelagem Dimensional
DIMENSÃO MEDIDAS
Dia da semana Quantidade de locação
Dia do feriado Custo
Loja e Categoria Lucro
Título
Título e Categoria
Título e Idade
Estruturas Dimensionais
Dimensão Loja
Loja_id Dimensão Produto
Código Produto_id
Endereço Título
Cidade Categoria
Bairro Status
Aluguel Fact
Tipo Ano
Data_id
Loja_id Qtde Cópias
Dimensão Tempo Produto_id
Data_id Qtde Aluguel
Data Custo
Dia da Semana Lucro
Feriado
Mês
Ano
Tabelas Dimensão
• período de tempo
• organização
• produto
• cliente
• geografia
Característica de Esquemas
Dimensional
tipo
produto
venda
depto
item produto
vendido
marca categoria
mês dia hora
fornecedor sub-categoria
ESQUEMA NA 3A FORMA NORMAL
Fases da Modelagem
cidade
bairro
Loja
depto
tipo
venda produto
item marca
vendido fornecedor
sub-categoria
categoria
depto
ano
mês
dia
hora
ESQUEMA DIMENSIONAL
Fases da Modelagem
D mês
F Conta Cliente
mês_id
D cliente
cliente_id
telefone_id
total local
D telefone total interurbano
total serviço
total geral
FASE 1
Criar a conta do cliente
Modelagem Sutilmente Desnormalizada
D serviço
F Conta Cliente
D mês
F Serviço Cliente mês_id
mês_id cliente_id
cliente_id telefone_id
D cliente
telefone_id total local
serviço_id total interurbano
qtde vezes total serviço
D telefone total geral
FASE 2
Adicionar o histórico de serviço
Modelagem Sutilmente Desnormalizada
D serviço
F Conta Cliente
D mês
F Serviço Cliente mês_id
mês_id cliente_id
cliente_id telefone_id
D cliente
telefone_id total local
serviço_id total interurbano
qtde vezes total serviço
D telefone total geral
FASE 3
Adicionar novos atributos às entidades
Modelagem Sutilmente Desnormalizada
D serviço
F Conta Cliente
D mês
F Serviço Cliente mês_id
mês_id cliente_id
cliente_id telefone_id
D cliente
telefone_id total local
serviço_id total interurbano
qtde vezes total serviço
D telefone total geral
FASE 4: P R O B L E M A
Adicionar serviços de internet (granularidade diferente)
Modelagem Sutilmente Desnormalizada
F Conta Cliente
D serviço
mês_id
cliente_id
D mês telefone_id
F Serviço Cliente
total local
mês_id total interurbano
cliente_id D cliente total serviço
telefone_id total geral
serviço_id
qtde vezes
D telefone
F Internet Cliente
FASE 5: S O L U Ç Ã O mês_id
Criar outra tabela fato cliente_id
internet charges
Modelagem Normalizada
D tipo
D mês serviço
F Conta Cliente
D cliente
mês_id
cliente_id
telefone_id
D telefone total
FASE 1
Criar a conta do cliente
Modelagem Normalizada
D tipo
D serviço serviço
D mês
F Serviço Cliente
F Conta Cliente
mês_id
mês_id
cliente_id D cliente cliente_id
telefone_id
telefone_id
serviço_id
total
qtde vezes
D telefone
FASE 2
Adicionar o histórico de serviço
Modelagem Normalizada
D tipo
D serviço serviço
D mês
F Serviço Cliente
F Conta Cliente
mês_id
mês_id
cliente_id D cliente cliente_id
telefone_id
telefone_id
serviço_id
total
qtde vezes
D telefone
FASE 3
Adicionar novos atributos às entidades
Modelagem Normalizada
D tipo
D serviço serviço
D mês
F Serviço Cliente
F Conta Cliente
mês_id
mês_id
cliente_id D cliente cliente_id
telefone_id
telefone_id
serviço_id
total
qtde vezes
D telefone
FASE 4: P R O B L E M A
Adicionar serviços de internet (granularidade diferente)
Modelagem Normalizada
D tipo
D serviço serviço
F Conta Cliente
D mês mês_id
F Serviço Cliente
cliente_id
mês_id telefone_id
cliente_id D cliente total
telefone_id
serviço_id F Internet Cliente
qtde vezes
D telefone mês_id
cliente_id
internet charges
FASE 5: S O L U Ç Ã O
Adicionar serviços de internet (granularidade diferente)
Fases da Modelagem: Resumo
Lembretes:
Chaves artificiais:
• maior nível de isolamento dos sistemas
operacional
• melhora significativa na performance
de queries
• reduz significativamente o tamanho do
data warehouse como um todo
• possibilita armazenamento de mais
linhas por bloco de I/O em tabelas fato
Modelagem de Data Warehouse
Linhas artificiais:
Mês
Mês_id
Cliente Nome
Cliente_id Ano
Nome
Endereço
Fluxo Financeiro
Cliente_id
Mês_id
Valor Renda
Gasto Saúde
Gasto Supermercado
Gasto Combustível
Tratamento de Histórico: Dimensão
Cliente
Cliente_id
Nome
Endereço
Bairro
Salário Atual
Salário Anterior
Data Alteração Salário
Tratamento de Histórico
Histórico Cliente
Cliente_id
Data
Endereço Anterior
Fluxo Financeiro
Cliente Cliente_id Mês
Cliente_id Mês_id Mês_id
Nome Valor Renda Nome
Endereço Gasto Saúde Ano
Gasto Supermercado
Gasto Combustível
Modelagem de Data Warehouse
5) O esforço de normalização de
qualquer uma das tabelas dimensão,
visando minimizar espaço em
disco, será uma perda de tempo
Princípios de um Modelo
Dimensional