You are on page 1of 22

Wprowadzenie

Wprowadzenie do
do technologii
technologii
Business
Business Intelligence
Intelligence
ii hurtowni
hurtowni danych
danych

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Plan wykadu

' Wprowadzenie do Business Intelligence


' Hurtownie danych
' Produkty Oracle dla Business Intelligence

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Business Intelligence

Technologia
Technologia informatyczna
informatyczna suca
suca przeksztacaniu
przeksztacaniu duych
duych
wolumenw
wolumenw danych
danych w
w informacje,
informacje, aa nastpnie
nastpnie przeksztacaniu
przeksztacaniu
tych
tych informacji
informacji w
w wiedz
wiedz
Adresowana
Adresowana do
do pracownikw
pracownikw szczebla
szczebla
wspomagajca
wspomagajca podejmowanie
podejmowanie ich
ich decyzji
decyzji

kierowniczego,
kierowniczego,

Stawiajca
Stawiajca drastyczne
drastyczne wymagania
wymagania wydajnociowe,
wydajnociowe, przede
przede
wszystkim
wszystkim zz powodu
powodu ogromnych
ogromnych rozmiarw
rozmiarw danych,
danych, ktre
ktre
podlegaj
podlegaj przetwarzaniu
przetwarzaniu
Skupiona
Skupiona wok
wok technologii
technologii hurtowni
hurtowni danych,
danych, bdcych
bdcych
tematycznymi
tematycznymi bazami
bazami danych,
danych, gromadzcymi
gromadzcymi historyczne
historyczne dane
dane
o
o dziaalnoci
dziaalnoci przedsibiorstwa
przedsibiorstwa

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

rodowisko hurtowni danych

Model
Model podstawowy
podstawowy

Korporacyjna
hurtownia danych
(enterprise data warehouse)

Systemy starej generacji

Operacyjne bazy danych

Decydent

Aplikacje analityczne

Pliki zewntrzne

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

rodowisko hurtowni danych

Architektura
Architektura zz obszarem
obszarem skadowania
skadowania

Korporacyjna
hurtownia danych
(enterprise data warehouse)
Systemy starej generacji

Decydent

Operacyjne bazy danych

Aplikacje analityczne
Obszar
skadowania

Pliki zewntrzne

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

rodowisko hurtowni danych

Architektura
Architektura zz obszarem
obszarem skadowania
skadowania ii skadnicami
skadnicami danych
danych

Korporacyjna
hurtownia danych
(enterprise data warehouse)
Systemy starej generacji

Decydent

Operacyjne bazy danych

Aplikacje
analityczne

Obszar
skadowania

Pliki zewntrzne

Wydziaowe skadnice danych


(data marts)

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Hurtownia - system OLTP

Porwnanie HD z systemam OLTP


Cecha
Czas odpowiedzi aplikacji
Wykonywane operacja
Czasowy zakres danych
Organizacja danych
Rozmiar
Intensywno operacji
dyskowych

OLTP

Hurtownia

Uamki sekund

Sekundy - godziny

DML

SELECT

30-60 dni

2-10 lat

Wedug aplikacji

Tematyczna

Mae - due

Due - wielkie

Maa - rednia

Wielka

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Hurtownia - skadnica

Porwnanie HD ze skadniczami danych


Cecha

Hurtownia

Skadnica

Zasig wykorzystania

Przedsibiorstwo

Wydzia

Zakres tematyczny

Wielotematyczna

Jednotematyczna

Wiele

1 - kilka

Miesice - lata

Miesice

Liczba rde danych


Czas implementacji
i wdroenia

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Hurtownia - projektowanie

Metodyki projektowania i wdraania HD


'

Wieki wybuch

'

Od ogu do szczegu

'

Od szczegu do ogu

- budowa korporacyjnej hurtowni danych w ramach jednego


projektu
- globalna analiza wymaga, implementacja caociowej hurtowni
danych, implementacja aplikacji analitycznych
- dugi czas realizacji, pocztkowo wybrane technologie przestaj
by wspierane przez dostawcw
- iteracyjna realizacja hurtowni danych, po kolei dla kadego
obszaru tematycznego, konstrukcja zalenych skadnic danych
- realizacja niezalenych skadnic danych, z wizj ich przyszej
integracji w jedn hurtowni danych

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

ETL

ETL: Extraction, Transformation, Loading




Ekstrakcja - odczyt rdowych danych z operacyjnych baz


danych, systemw starej generacji, plikw zewntrznych

Transformacja - czenie danych, ich weryfikacja,


walidacja, czyszczenie i znakowanie czasowe

Wczytywanie - wprowadzanie danych do docelowej


hurtowni danych

Realizacja ETL jest najtrudniejszym zadaniem implementacji


hurtowni danych (pochania nawet 70% czasu)

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Tryby pracy hurtowni

Dwa tryby pracy hurtowni danych




adowanie danych
- zwykle wykonywane w regularnych odstpach czasu, w
porze niskiej aktywnoci uytkownikw

Realizacja zapyta analitycznych


- podstawowy rodzaj obcizenia systemu hurtowni danych

ETL

Zapytania

ETL

Zapytania

ETL

Zapytania

Czas

Powysza zmienno charakterystyki obcienia systemu


hurtowni danych stanowi powany problem konfiguracyjny
dla administratora bazy danych

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Implementacja BI

Kroki technicznej implementacji systemu


Business INtelligence







Analiza wymaga - zgromadzenie wiedzy o wymaganiach


biznesowych w zakresie przetwarzania analitycznego
Projekt logiczny hurtowni danych pojciowa definicja
wymaganych struktur danych
Implementacja struktur fizycznych hurtowni danych
tworzenie bazy danych, tabel, indeksw, materializowanych
perspektyw
Implementacja oprogramowania ETL konstrukcja moduw
programowych sucych do zasilania hurtowni danych
nowymi danymi
Realizacja aplikacji
analitycznych

implementacja
programw dla uytkownikw kocowych
Strojenie hurtowni danych rekonfiguracja serwera bazy
danych,
tworzenie
dodatkowych
indeksw
i
materializowanych perspektyw
2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

Technologie Oracle dla hurtowni danych




Implementacja hurtowni danych


- Oracle Database
- Oracle OLAP
- Oracle Warehouse Builder

Implementacja adowania danych


- SQL*Loader
- Replikacja
- Tabele zewntrzne
- ODBC/JDBC
- Oracle Gateways

Implementacja aplikacji analitycznych


- Oracle Discoverer
- Oracle Business Intelligence Beans
- Oracle Reports
- Oracle Data Mining
2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

Oracle Database 10g


- Serwer bazy danych
- Analityczne funkcje SQL
- Struktury fizyczne dla hurtowni danych
- Wielowymiarowy model danych
- Repozytorium metadanych OLAP
- Narzdzia ETL

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

Oracle Warehouse Builder


- Modelowanie i implementacja schematu hurtowni danych
- Modelowanie i implementacj aprocesw ETL
- Definiowanie metadanych OLAP

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

Oracle Enterprise Manager


- Administrowanie baz danych
- Definiowanie metadanych OLAP

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

Analytic Workspace Manager


- Przegldanie OLAP Catalog
- Automatyczne tworzenie analitycznych przestrzeni
roboczych
- Tworzenie i edycja obiektw wielowymiarowych
* wymiary
* zmienne
* formuy
* programy
* zbiory wartoci

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

OLAP Worksheet
- Wywoywanie komend SQL
- Podstawowy interfejs dla OLAP DML

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

Oracle Reports
- rodowisko budowy aplikacji raportujcych w oparciu o
zawarto bazy danych Oracle
- Przeznaczone do tworzeni aplikacji w rodowiskach OLTP

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

Oracle Discoverer
- Aplikacja wspomagajca procesy podejmowania decyzji
- Wykonywanie zapyta ad-hoc
- Analizowanie oraz formatowanie wynikw zapyta
- Przygotowanie danych do ich prezentacji
- Zarzdzanie danymi

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

BI Beans
- Komponenty Java umoliwiajace budowe aplikacji
analitycznych opartych na bazie danych Oracle
- Wykorzystywane w rodowisku Oracle JDeveloper
- Komponenty do wykorzystania w aplikacjach
samodzielnych Java i w aplikacjach JSP

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

Technologie Oracle

Oracle Data Miner


- Biblioteka Java dla rodowiska Oracla Jdeveloper
umoliwiajca budow aplikacji eksploracji danych
- Narzdzie klienckie suce do wydawania zapyta
eksploracyjnych ad-hoc
- Odkrywanie asocjacji
- Klasyfikacja

2006 Warszawska Wysza Szkoa Informatyki - Zakad Zarzdzania Zasobami Informacyjnymi

You might also like