You are on page 1of 17

Wprowadzenie do hurtowni danych dla studentw SGH - Jerzy Surma

Wprowadzenie
Systemy BI s budowane z wykorzystaniem hurtowni danych (ang. data warehouse).

Rysunek 2.1 Przykad architektury hurtowni danych


rdo: ( opracowanie wasne)
Rysunek 2.1 przedstawia standardow architektur hurtowni danych. Po lewej stronie przedstawione
s przykady rde danych np. system magazynowy w ramach systemw transakcyjnych. W rdach
danych s rejestrowane dane operacyjnie, czyli dane zwizane z pojedynczymi, konkretnymi
zdarzeniami gospodarczymi. W przypadku systemu magazynowego moe to by na przykad
informacja o tym, e dany towar zosta przyjty na magazyn. Dane te s przesyane do hurtowni
danych i tam odpowiednio przetwarzane i czone z innymi danymi. Z hurtowni dane s odczytywane
(patrz prawa strona rysunku 2.1) w celu realizacji odpowiednich analiz biznesowych. Na przykad
informacje o przyjciach i wydaniach towarw z caego miesica mog posuy, w ramach analizy
OLAP, do rozpoznaniu grupy towarw, ktre zalegaj w magazynie. Poczenie tych danych z
informacj o kosztach skadowania poszczeglnych towarw, pobran z systemu kontroligowego,
umoliwi na pen analiz kosztw magazynowania zalegajcych towarw. Istotne jest zrozumienie

uzasadnienia powodw budowania hurtowni danych. Mona wyrni co najmniej cztery takie
przyczyny. Hurtownia danych umoliwia:

Przeprowadzanie analiz biznesowych bez ingerencji w operacyjn prac systemw


transakcyjnych - OLTP 1. Analizy biznesowe wymagaj zazwyczaj zoonych i
czasochonnych oblicze. Realizacja tych zada nie moe wpywa na codzienn
operacyjn prac systemw zawierajcych dane rdowe. Na przykad analiza
sprzeday oparta o agregacje danych z faktur zarejestrowanych w systemie
transakcyjnym nie moe spowodowa opnienia w wystawianiu biecych faktur.

Caociowy wgld w dane firmy, tzn. moliwo integracji danych ze z rnych rde
umoliwiajcy peniejszy obraz zdarze gospodarczych zachodzcych w
przedsibiorstwie. Na przykad w firmie telekomunikacyjnej moe to by ustalenie
cakowitej sprzeday do klienta nie tylko na podstawie zarejestrowanych rozmw w
systemie bilingowym ale rwnie zakupionych przez klienta akcesoriw (te dane s
zarejestrowane w systemie sprzedaowym) w sklepach firmowych.

Dostp do danych historycznych, czyli efekt rejestracji momentu wystpienia danego


zdarzenia oraz przechowywania danych w dugich, nawet kilkunastoletnich okresach
czasu. Dziki danym historycznym moliwe jest wykonanie wikszoci podstawowych
analiz biznesowych.

Ujednolicenie posiadanych informacji. Poprawne wdroenie hurtowni danych


wymusza ujednolicenie poj i sprawia, e wynikowe wskaniki maj ta sam
interpretacj w rnych dziaach firmy i s w jednolity sposb obliczane. Niweluje to
tzw. problem wielu wersji prawdy firmy, w zalenoci kto jest twrc danego raportu.

OLTP (ang.On-Line Transaction Processing) przetwarzanie transakcyjne, ktre dostarcza rozwiza


dla dziaa operacyjnych firmy tj. efektywne i bezpieczne przechowywanie danych, transakcyjne
odtwarzanie danych, aktualizacja
danych, optymalizacja dostpu do danych, zarzdzanie
wspbienoci (Garcia-Molina, Ullman & Widom 2003).

Definicja hurtowni danych


Za oglnie przyjta definicj hurtowni danych przyjmuje si definicj Billa Inmona (Inmon 2005):
Hurtownia danych to:

uporzdkowany tematycznie (ang. subject oriented),

zintegrowany (ang. intergrated),

zawierajcy wymiar czasowy (ang. time variant) ,

nieulotny (ang. non-volatile)

zbir danych (baza danych) wspomagajcych podejmowanie decyzji

gdzie:

uporzdkowanie tematycznie, oznacza ograniczenie zbieranych danych do okrelonego


obszaru biznesowego np. sprzeday a nie dziaa czy procesw biznesowych. W praktyce
hurtownia danych moe obejmowa wiele obszarw biznesowych. Hurtownia danych
ograniczona do jednego obszaru biznesowego a nawet dziau zwykle jest okrelana jako tzw.
data mart, czyli lokalna hurtownia zwykle stanowica podzbir hurtowni korporacyjnej.

zintegrowany, oznacza ujednolicenie danych co do formatu, zakresu dopuszczalnych wartoci


oraz w szerszym znaczeniu powizaniu (ang.mapping) danych pochodzcych z rnych
rde.

zawierajcy wymiar czasowy, jak ju wspomniano wszelkie dane adowanie do hurtowni


danych dostaj tzw. stempel czasowy. Umoliwia to na ledzenie zmian oraz badania
analityczne w okrelonych interwaach czasu.

nieulotny, dane raz umieszczone w hurtowni zostaj zapamitane i nie podlegaj usuniciu.
Po zaadowaniu jedyn, przynajmniej formalnie, operacj jak mona na nich wykona jest
operacja odczytu.

Rysunek 2.2 Hurtownia danych koncepcji CIF


gdzie: EDW (enterprises data warehouse) hurtownia danych
rdo: ( http://www.inmoncif.com)

Technologicznie hurtownie danych s implementowane z wykorzystaniem systemw zarzdzania


baz danych i najczciej s to bazy danych wykorzystujce model relacyjny (Garcia-Molina, Ullman &
Widom 2006). Inmon rozwin swoj klasyczn ju definicj hurtowni danych w kierunku CIF (ang.
corporate information faktory), gdzie hurtownia danych skupia w sobie wszystkie zasoby
informacyjne przedsibiorstwa oraz dane pochodzce ze wiata zewntrznego patrz rysunek 2.2

Model logiczny - schemat gwiadzisty


Modelowanie dane w hurtowni danych odzwierciedla potrzeby w zakresie raportowania danych
biznesowych, gdzie wskaniki biznesowe zwane faktami np. wielko sprzeday, analizuje si w
rnych kontekstach zwanych wymiarami np. po produktach, klientach, w okrelonym okresie, itp.
Odzwierciedla to spostrzeenie Codda (Codd, Codd & Salley 1993):
Z reguy jest wiele rnych wymiarw, wedug ktrych mona analizowa pewien zbir danych. Ta
zoona perspektywa, czyli wielowymiarowy obraz pojciowy, wydaje si by sposobem, w jaki
wikszo ludzi biznesu z natury widzi swoje przedsibiorstwo.

W tabeli 2.1 przedstawiono przykadowy raport sprzeday komputerw w firmie dystrybucyjnej. W


raporcie tym wskaniki takie jak sprzeda wartociowo i koszty na produkt (np. koszty zakupu +
koszty logistyczne), analizowane s w wymiarze czasu: miesic maj oraz produktu: komputer ABC,
komputer XYZ oraz komputer QWE.
Tabela 2.1 Przykadowy raport sprzeday dla dystrybutora sprztu komputerowego
Okres: Maj 2008
Produkt

Sprzeda wartociowo [z]

Koszty [z]

Rentowno [%]

komputer ABC

1000000

700000

30

komputer XYZ

2000000

1800000

10

komputer QWE

2000000

1500000

25

PODSUMOWANIE:

5000000

4000000

20

gdzie: Rentowno = (Sprzeda wartociowo Koszty czne)/Sprzeda wartociowo [%]

Aby poprawnie okreli dane wygenerowania takiego raportu naley zdefiniowa trzy tabele:

Tablica faktw (sprzeda i koszty) patrz tabela 2.2

Tablica wymiaru Produkt patrz tabela 2.3

Tablica wymiaru Data (Okres) patrz tabela 2.4

Tabela 2.2 Przykadowa tablica dla faktw: Sprzeda2

ID_Produkt

ID_Data

Sprzeda_ilociowo

Cena

Koszty

P1

C5

500

2000

700000

P2

C5

400

5000

1800000

P3

C5

1000

2000

1500000

P1

C6

400

2500

800000

Tablica faktw ma charakter czysto ilustracyjny, fakt Koszty reprezentuje bazy wysoki stopie agregacji, ktry
w praktyce nie wystpowaby na poziomie tablicy faktw.

Tabela 2.3 Przykadowa tablica dla wymiaru: Produkt


ID_Produkt

Nazwa

Producent

Procesor

P1

komputer ABC

Beta

Gamma

P2

komputer XYZ

Delta

Gamma

P3

komputer QWE

Beta

Teta

Tabela 2.4 Przykadowa tablica dla wymiaru: Data (Okres) 3


ID_Data

Miesic

Kwarta

Rok

C4

Kwiecie

Q2

2008

C5

Maj

Q2

2008

C6

Czerwiec

Q2

2008

Istotne jest zrozumienie powiza pomidzy tablicami: Sprzeda, Produkt i Data tak aby moliwe byo
utworzenia raportu przedstawionego w tabeli 2.1. Naley zwrci uwag, e nie wszystkie dane z
trzech tablic zostay wykorzystane do zbudowania raportu oraz e obliczenie sprzeday wartociowo
wymaga odwoania si do tablicy Sprzeda (atrybut: sprzeda_ilociowo oraz atrybut: cena). Kady
wiersz w kadej z tablic ma jednoznaczny identyfikator, tzw. klucz wasny 4. W tablicy Produkt jest to
ID_Produkt, w tablicy Data jest to ID_Data, natomiast w tablicy Sprzeda jest to para (ID_Produkt,
ID_Data), czyli tzw. klucz zoony. Powizanie w tablicy Sprzeda z tablica Produkt jest wanie
poprzez ID_Produkt (ID_Produkt w Tablicy Sprzeda jest nazywany kluczem obcym5). I podobnie
powizanie tablicy Sprzeda z tablica Data jest poprzez ID_Data, gdzie ID_Data w tablicy Sprzeda jest
rwnie kluczem obcym. Warto zauway, e jednemu wierszowi w tablicy Produkt, moe
odpowiada dokadnie zero, jeden lub wiele wierszy w tablicy Sprzeda, w druga stron jednemu
wierszowi w tablicy Sprzeda moe odpowiada dokadnie jeden wiersz w tablicy Produkt. Dokadnie
taka sama relacja zachodzi pomidzy tablic Sprzeda i Data. Ten typ zwizku jest okrelany mianem
1:N (jeden do wielu) i podstaw modelowania danych na potrzeby hurtowni danych w ramach tzw.
schemat gwiazdy patrz rysunek 2.3. Kady prostokt reprezentuje odpowiednio tablic z danymi.

Tablica wymiaru Data ma charakter czysto ilustracyjny, najniszy poziom reprezentacji okresu czasu na
poziomie miesica nie wystpuje w praktyce
4
Formalna definicja klucza wasnego: (Ullman & Widom, 2001)
5
Formalna definicja klucza obcego: (Ullman & Widom, 2001)

Data

Sprzeda

Produkt

Rysunek 2.3 Przykadowy model wielowymiarowy - schemat gwiadzisty


rdo: (opracowanie wasne)

Diagram z rysunku 2.3 nazywany modelem wielowymiarowym albo potocznie gwiazd z tego
powodu, e wok tablicy faktw s powizane wok zwizkiem 1:N tablice wymiarw, co przy
odrobinie wyobrani przypomina wygldem ksztat gwiazdy. Formalnie schemat z rysunku 2.3
powinien by opisany:

Sprzeda(ID_Produkt, ID_Data, Sprzeda_ilociowo, Cena, Koszt)

Produkt(ID_Produkt, Nazwa, Producent, Procesor)

Data(ID_Data, Miesic, Kwarta, Rok)

gdzie: Sprzeda, Produkt i Data s nazywane zbiorami encji. Pojedycza encja w zbiorze
reprezentowanym w tablicy jest po prostu wierszem w tej tablicy. Wyraenia w nawiasach s opisami
atrybutw charakteryzujcych dany zbir encji. Atrybuty podkrelone reprezentuj klucz
(identyfikator) encji w zbiorze encji. Odwoujc si do tej konwencji diagram z rysunku 2.3 jest
nazywany diagramem zwizkw encji6 (ang. entity relationship diagram) i jest klasycznym sposobem
modelowania baz danych. W zasadzie wystarczy ju tylko okreli formaty danych dla
wyspecyfikowanych atrybutw i moliwe jest ju wygenerowanie odpowiednich struktur danych w
wybranym systemie zarzdzania baza danych. Model wyspecyfikowany w postaci diagramu zwizkw
encji nazywany jest modelem logicznym (konceptualnym), jego realizacja w konkretnej bazie danych
nazywana jest modelem fizycznym.

rda danych
Nawizujc do przykadu raportu z tabeli 2.1 kluczowe jest zrozumienie w jaki sposb zostaa
wypeniona danymi tablica faktw (patrz tabela 2.2) oraz pozostae tablice. Na przykad obliczenie
sprzeday ilociowo dla wybranego produktu wymaga:
1. Ustalenie w jakim systemie z danymi transakcyjnymi s skadowane dane rdowe tj.
faktury sprzedaowe lub zamwienia, na podstawie ktrych mona okreli poziom
sprzeday

http://en.wikipedia.org/wiki/Entity_relationship_diagram

2. Ustalenie poczenia (ang. interface) pomidzy systemem z danymi rdowymi a


hurtownia danych i zaadowanie odpowiednich danych. Informacja z dnia biecego
powinna by dodawana narastajco do wczeniejszych danych, rozszerzajc histori
sprzeday o kolejny dzie.
3. Agregacja danych z faktur, reprezentujcych pojedyncze zdarzenia gospodarcze do
poziomu wyniku na poziomie caego miesica patrz na przykad wiersz pierwszy
(sprzeda ilociowo w maju dla komputeraABC) w tabeli 2.2. Natomiast obliczenie
rentownoci wymaga integracji danych sprzedaowych z danymi o kosztach
zaadowanych np. z sytemu kontrolingu kosztw.

Ten uproszczony scenariusz obrazuje kluczowe zagadnienia zwizane z projektowaniem i


eksploatacja hurtowni danych. Generalnie mona wyrni nastpujce rda danych:

Pliki z danymi - mog to by zarwno zwyke pliki tekstowe jaki i np. pliki excelowe.

Systemy transakcyjne - systemy realizujc powtarzalne transakcje wspierajce


bazowe procesy biznesowe firmy. Najbardziej popularny przykady tej grupy to
informatyczne systemy zarzdzania:
o ERP (ang. enterprise resource planning) wspierajce zarzdzanie firm w
zakresie finansw, sprzeday i logistyki, gospodarki magazynowej, produkcji,
zakupw, zarzdzania kadrami, itp.
o Systemy bankowe obsugi kont klientw,
o Systemy bilingowe w firmach telekomunikacyjnych i energetycznych.
Technologiczne systemy tej klasy budowane s z wykorzystanie systemw zarzdzania baz
danych zapewniajcych odpowiednie bezpieczestwo i spjno przetwarzania transakcji
OLTP .

Zasoby Internetu mog to by dane pobierane ze stron WWW jaki i np. poczenie z
serwisami internetowymi automatycznie przekazujcymi odpowiednie informacje w formie
subskrypcji.

Inne hurtownie danych.

Istotne jest podkrelenie, e rda danych mog pochodzi z wntrza firmy (najbardziej znaczce
rdo informacji w wikszoci przypadkw) jak i z otoczenia zewntrznego.
Dane pochodzce ze rde danych s adowane do hurtowni. Ten pozornie trywialny proces zwykle
dzielony jest na trzy chronologicznie powizane fazy7:

http://en.wikipedia.org/wiki/Extract,_transform,_load

1. Okrelenie i pozyskanie danych (ekstrakcja) (ang. extract) ze rde danych. Identyfikacja


rde danych jest zoonym zagadnieniem. Precyzyjne okrelenie, ktre konkretnie
informacje naley pobiera aby uzyska odpowiednie dane do tablicy faktw i tablic
wymiarw wymaga odwoania si do jednoznacznych poj na poziomie biznesowym i
powizaniu ich z odpowiednimi danych w systemach rdowych. Niejednokrotnie
okazuje si, e nie wszystko potrzebne dane s rejestrowane. Implikuje to zwykle
dodatkowy, niejednokrotnie bardzo kosztowny, wysiek zwizany z przygotowaniem
potrzebnego rda.
2. Przeksztacenie - transformacja danych (ang. transform) do postaci umoliwiajcej
poprawne wykorzystanie biznesowe. Zagadnienie to obejmuje m.in. integracj danych
(Todman 2003):

Integracj formatw, czyli ujednolicenie formatw danych pochodzcych z


rnych systemw. Na przykad pe moe by zapamitywana na wiele
sposobw: m/k, M/K, mczyzna/kobieta, male/female, itp.

Integracj semantyczn, czyli uzgodnienie jednolitej interpretacji danych.


Profesjonalna analiza wymaga biznesowych pozwola na przykad doprecyzowa
czy raportowana sprzeda jest na obliczana na podstawie wystawionych faktur
czy zamwie. Jeli zamwie to czy przyjtych czy zrealizowanych, itp. Brak
precyzji w tym miejscu i jednoznacznej definicji pojcia Sprzeda implikuje
omawiany ju wczeniej problem kilku wersji prawdy. Podobnie z tablicami
wymiarw zwaszcza jeli system rdowy nie jest zintegrowany i tym samy nie
posiada jednolitych danych podstawowych (ang. master data). Zwykle to
zagadnienie uzgodnionych jednoznacznych definicji dla wszystkich poj
uywanych w hurtowni jest zagadnieniem reprezentacji tzw. meta danych (ang.
meta data).

Ponadto wszelkie dziaania dodatkowe w tym m.in. poprzedzenie finalnego fizycznego


zaadowania danych do hurtowni:

weryfikacj jakoci danych, czyli weryfikacja czy dane speniaj wczeniej


zdefiniowane kryteria. Mona na przykad weryfikowa czy dane osobowe
zawierajce dat urodzenia pracownikw zawieraj si w racjonalnym zakresie
wartoci.

wstpnym agregowanie danych, czyli przykadowo adowanie nie pojedynczych


transakcji z kasy fiskalnej sklepu tj. paragonw ale podsumowa sprzeday na
poszczeglnych produktach za cay dzie.

3. Fizyczne zaadowanie danych (ang. load) do hurtowni. Standardowo adowanie hurtowni


danych nie jest procesem jednorazowym ale powtarzalnym, gdzie dane s dopisywane do
hurtowni w cile okrelonych interwaach czasowych w zalenoci od potrzeb
biznesowych: raz na dzie, raz na tydzie, itd. Dziki temu hurtownia zawiera histori
zdarze gospodarczych umoliwiajce skrupulatne badanie ich zmian w czasie.

Wszystkie te zagadnienia dotykaj niezwykle istotnego zagadnienia zwizanego z


administrowaniem hurtowni danych. Podsumowujc naley zwrci uwag na istotn
rnic pomidzy charakterem danych rdowych a danymi zapisywanymi w hurtowni.
Pierwszy rodzaj danych dotyczy przetwarzania operacyjnego w zakresie codziennych
dziaa w przedsibiorstwie. Drugi rodzaj danych dotyczy informacji zarzdczej, czsto
nawet na poziomie strategicznym, umoliwiajcej wgld w funkcjonowanie
przedsibiorstwa w szerokiej perspektywie czasu i wielu wymiarach.

Wybrane aspekty projektowania


Proces projektowania hurtowni danych powinie by bezwzgldnie ukierunkowany na spenienie
potrzeb biznesowych. Specyfikacja potrzeb biznesowych jest najczciej specyfikowana poprzez
okrelenie jaka informacj biznesowa jest potrzebna do zarzdzania okrelonym obszarem. To
determinuje potem model logiczny hurtowni (patrz model gwadzisty) i potem finalnie jakie dane
rdowe s potrzebne. To podejcie okrelane czsto podejciem z gry na d (ang. top down)
zostao pierwszy raz sformuowane , w kontekcie projektowania hurtowni danych, przez Ralpha
Kimballa jako projektowanie modelu wielowymarowego (ang. dimensional design mode) (Kimball &
Ross 2002). Projektowanie w tym paradygmacie skada si z czterech krokw:
1. Okrelenie wymaga biznesowych zrozumienie celw i potrzeb biznesowych w
kontekcie posiadanych zasobw na dane rdowe. Jest to okrelane poprzez
zdefiniowanie jakie s najbardziej kluczowe pytania biznesowe w rozpatrywanym
obszarze. Patrz np.tabela 2.1 decyzje o utrzymaniu bd rezygnacji z
utrzymywaniu w ofercie produktw na podstawie znajomo ich rentownoci i jej
zmian w czasie.
2. Zdefiniowanie poziomu szczegowoci (ang. grain) okrelenie na jakim
poziomie szczegowoci dane powinny si pojawi w modelu wielowymiarowym
na poziomie tablicy faktw. Rekomendowany najczciej poziom szczegowoci,
to poziom najniszy nie podlegajcy ju dalej podziaowi. Daje to zdecydowanie
najwiksza elastyczno analityczn, niemniej moe by okupione
ponadnormatywnym zapotrzebowaniem na pami zewntrzn. Dla
omawianego przykadu dystrybutora sprztu komputerowego oznaczaoby to
adowanie do hurtowni pozycji pojedyczych z wszystkich faktur oraz wszystkich
kosztw przypisanych do sprzeday danego produktu
3. Okrelenie wymiarw okrelenie poziomu szczegowoci determinuje tablice
wymiarw. W omwionym przykadzie mamy wymiar PRODUKT okrelony na
poziomie konkretnego indeksu produktu (patrz tabela 2.3) oraz wymiar DATA
okrelony na poziomie miesica (patrz tabela 2.4 ).
4. Okrelenie faktw dokadne okrelenie jakie jakie fakty powinny zosta ujte w
tablicy faktw. Fakty maja charakter ilociowy i mog podlega rnym operacj
matematycznym jak np. najwiksza warto, uporzdkowanie, rednia, suma, itp.
Fakty czasami s nazywane wskanikami (ang. key figure) albo miarami (ang.
measure). W naszym przykadzie jest to Sprzeda_ilociowo i Koszty (patrz tabela

2.2). Natomiast wskanik obliczony: Sprzeda_wartociowo i Rentowno, patrz


raport w tabeli 2.1, pojawia si ju w raporcie, wyprowadzonym dla uytkownika
poprzez odpowiednie narzdzie do raportowania, jako wynik odpowiedniej
operacji na faktach z tabeli faktw.
Po realizacji czterech krokw projektowania modelu wielowymiarowego otrzymujemy efekt w
postaci schematu gwiadzistego taka jak na rysunku 2.3. Na tej podstawie, a dokadniej na podstawie
definicji zbiorw encji rozszerzonych o okrelenie formatw danych dla atrybutw, mona ju atwo
utworzy odpowiednie kwerendy w jzykach baz danych (np. SQL) w celu utworzenia odpowiednich
struktur danych w bazie danych hurtowni.

Rekomendowana literatura

Hurtownie danych:
o Inmon W.H., Building the Data Warehouse (4th Edition), John Wiley and Sons, 2005
o Todman Ch., Projektowanie hurtowni danych. Zarzdzanie kontaktami z klientami
(CRM) WNT, 2003
o Jarke M., Lenzerini M., Vassiliou Y., Vassiliadis P., Hurtownie Danych Podstawy
organizacji i funkcjonowania, WSiP, Warszawa, 2003

Projektowanie baz i hurtowni danych:


o Kimball R., Ross M., The Data Warehouse Toolkit: The Complete Guide to
Dimensional Modeling (Second Edition), John Wiley and Sons, 2002
o Ullman J. D., Widom J., Podstawowy wykad z systemw baz danych, WNT, Warszawa
2001
o Imhoff C., Galemm N., Geiger J., Mastering Data Warehouse Design. Relationa and
Dimensiona Techniques, Willey 2003.
o Poe V., Klauer P., Brobst S., Tworzenie hurtowni danych. Wspomaganie
podejmowania decyzji, WNT 2000.
o Booch G., Rumbaugh J., Jacobson I., UML przewodnik uytkownika, WNT, warszawa
2002
Studium przypadku (wielowymiarowy model danych dla sieci handlowej)
o Kimball R., Ross M., Retail Sales w The Data Warehouse Toolkit: The Complete Guide
to Dimensional Modeling (Second Edition), John Wiley and Sons, 2002

rda wiedzy na WWW


1. www.dwinfocenter.org
2. www.teradatauniversitynetwork.com

3. www.tdwi.org
4. http://en.wikipedia.org/wiki/Data_warehouse
5. www.ralphkimball.com
6. www.billinmon.com
7. www.dmreview.com
8. http://en.wikipedia.org/wiki/Common_Warehouse_Metamodel

STUDIUM PRZYPADKU
Wdroenie systemu BI rozpoczto od analizy wymaga biznesowych. W obszarze sprzeda rozpoczto
analiz wymaga kontekcie nastpujcych analiz:
Obszar

Rodzaj dostarczanej informacji i/lub analizy

Sprzeda

analizy ilociowo-wartociowe w podziale na czas, obszar sprzeday i


rodzaj produktu ( indeksu towarowego

Zgodnie z wytycznymi w zakresie modelowania modelu wielowymiarowego zrealizowano:


1. Okrelenie wymaga biznesowych
W ramach analizy wymaga biznesowych wyspecyfikowano nastpujcy raport sprzeday
wartociowo i procentowo w wybranych grupach produktowych (w przykadzie cztery grupy
produktowe) w okresie za dany okres (w przykadzie miesic stycze w roku 2007) w sklepach
w okrelonych lokalizacjach (w przykadzie dla sklepw we Wrocawiu):

Sprzeda wartociowo:

i sprzeda procentowo:

2. Zdefiniowanie poziomu szczegowoci - okrelono nastpujcy poziom szczegowoci:

Data: 1 dzie

Produkt: indeks towarowy

Sklep: pojedynczy sklep

3. Okrelenie wymiarw - zdefiniowano nastpujce wymiary8:

Data:

Wszystkie schematy maj charakter uproszczony i wycznie ilustracyjny

Produkt:

i przykadowe dane:

Sklep:

i przykadowe dane:

4. Okrelenie faktw zdefiniowano nastpujca tablic faktw - Transakcja (rysunek zawiera


te wyspecyfikowane wczeniej wymiary schemat gwiadzisty):

Generowanie wyspecyfikowanego wczeniej raportu ze schematu gwiadzistego wyglda w


nastpujcy sposb:

Suma za dany miesic

W uzyska dane dla implementacji schematu gwiadzistego w hurtowni danych okrelono


nastpujce rda danych:

Kasy fiskalne rejestrujce sprzeda na poziomie pojedynczej transakcji (paragon),

System ERP zawierajcy dane podstawowe (do wymiarw).

Podczas caociowej analizy wymaga biznesowych okrelono ponadto nastpujce rda danych:

System ERP zawierajcy dane o kosztach sprzeday, zakupw i logistycznych,

Serwis WWW udostpni jacy dane benchmarkingu branowego,

Pliki:
o sprzeda planowana (raz na miesic)
o dane lokalizacyjne: pooenie, najblisza konkurencja, itp.

You might also like