You are on page 1of 298

Zarzdzanie wiedz

Wykad 15 godzin
Laboratoria 15 godzin

Bogdan Rbiasz pok. 420
Zarzdzanie wiedz - literatura
G. Probst, S. Raub, K. Romhardt: Zarzdzanie wiedz w
organizacji, Oficyna Ekonomiczna, Krakw, 2002.
M. Morawski: Zarzdzanie wiedz, Organizacja-System-
Pracownik. Wydawnictwo Akademii Ekonomicznej we
Wrocawiu, Wrocaw 2006.
D. Hand, H. Mannila, P. Smyth: Eksploracja danych. WNT
Warszawa,2005.
P. Cichosz.: Systemy uczce si.Wydawnictwa Naukowo-
Techniczne. Warszawa 2000.
T. Larose Daniel: Metody i modele eksploracji danych.
Wydawnictwo Naukowe PWN. Warszawa 2008.
J. Surma: Business Intelligence. Systemy wspomagania
decyzji biznesowych. PWN. Warszawa 2009.
Zarzdzanie wiedz - tematy zaj
Historia i aktualny stan dziedziny
Dane, informacje, wiedza
Zasoby wiedzy organizacji
Zarzdzania wiedz-definicje
Kluczowe procesy zarzdzania wiedz
Mierzenie wartoci zasobw wiedzy
Business Intelligence. Systemy wspomagania
decyzji biznesowych
Pozyskiwanie wiedzy menederskiej, metody
eksploracji danych



Zarzdzanie wiedz-historia
Kiedy Kto Co
1980 Digital Equipment
Corporation, Carnege
Melon University
Jeden z pierwszych komercyjnych systemw eksperckich XCON-
konfigurujcy podzespoy komputerowe
1986 Dr Karl Wiig Uy pojcia zarzdzanie wiedz w wystpieniu w ONZ
1989 Due firmy doradcze Zaczynaj prby stosowania zarzdzania wiedz
1989 Price Waterhouse Jako jedna z pierwszych firma wcza zarzdzanie wiedz do swojej
strategii
1991 Harvard Business Review
(Noaka, Takeuchi)
Jeden z pierwszych artykuw naukowych na temat zarzdzania
wiedz
1993 Dr Karl Wiig Jedna z pierwszych ksiek powiconych zarzdzaniu wiedz
(Knowledge Management Fundamentals)
1994 Knowledge Management
Network
Jedna z pierwszych konferencji naukowych na temat zarzdzania
wiedz
1994 Due firmy doradcze Jako pierwsze oferuj usugi w zakresie zarzdzania wiedz klientom
1996+ Rne firmy i praktycy Wzrost zainteresowania

Zarzdzanie wiedz-historia

Ikujiro Nonaka. W 1995 r. wsplnie z Hirotaka
Takeuchi opublikowa ksik The
knowledge - creating Company -
How Japanese Companies Create
the Dynamics of Innovation.
Geneza koncepcji zarzdzania wiedz
Niezadawalajca efektywno takich koncepcji jak: TQM, benchmarking,
reengineering,
Konkurencyjno postrzegana jako umiejtno cigego doskonalenia si,
wprowadzania nowych pomysw, produktw i usug, nowoczesnych technologii
i rozwiza organizacyjnych,
rdem zainteresowania problematyk wiedzy w organizacji byy prace
autorytetw w dziedzinie zarzdzania. Peter Drucker w latach 80. i 90.
popularyzowa takie pojcia jak gospodarka bazujca na wiedzy, przywdztwo
pod wzgldem wiedzy itp..
Gwatowne zmiany w warunkach funkcjonowania przedsibiorstw w latach 80. i
90. w tym liczne fuzje i przejcia,
Restrukturyzacja przedsibiorstw, dua liczba zwolnie z pracy,
Odejcie od tradycyjnych (biurokratycznych) rozwiza organizacyjnych na
rzecz elastycznych sieci wirtualnych, zastpienie tradycyjnych systemw
nakazw i kontroli systemem partycypacyjnym, decentralizowanie duych
jednostek produkcyjnych i ich podzia na mniejsze, autonomiczne, stworzenie
kultury organizacyjnej opartej na zaufaniu oraz wdroenie nowoczesnych
rozwiza informatycznych umoliwiajcych efektywn prac grupow i
byskawiczn wymian informacji,
Prby opracowania nowych standardw rachunkowoci, ktre nie traktoway
nakadw na rozwj potencjau intelektualnego pracownikw wycznie w
kategoriach kosztw ale w kategoriach inwestycji.
Dane, informacje, wiedza
Sownik jzyka polskiego mwi, e wiedza to
zesp przekona zgodnych
z rzeczywistoci, og umiejtnoci
ludzkich albo danego umysu, ale te
zasb wiadomoci z jakiej
dziedziny.

Wiedza to og wiadomoci i
umiejtnoci wykorzystywanych przez
jednostki do rozwizywania
problemw. /Probst G./

Dane, informacje, wiedza
E. Skrzypek charakteryzuje wiedz jako
uporzdkowane odzwierciedlenie stanu
rzeczywistoci w umyle czowieka, postawy
twrczej kreowania nowych rozwiza oraz
procesw,
ale rwnie: traktuje wiedz jako poczenie
dowiadczenia, wartoci odpowiednio
dobranych informacji i eksperckiego wgldu
w jakie zagadnienie, ktre zapewnia ramy
oceny i wczenia nowych dowiadcze i
informacji.
Dane, informacje, wiedza

Definiujc wiedz posugujemy si
czsto popularn piramid, na
ktrej wiedza znajduje si na
szczycie, ponad informacjami, a te
z kolei ponad danymi.

Dane, informacje, wiedza

Hierarchia wiedzy



Dane, informacje, wiedza
Pojedyncze znaki, zestawione zgodnie
z reguami okrelonej skadni, tworz
dane.
Dane zinterpretowane w konkretnym
kontekcie dostarczaj informacji.
Natomiast informacje, ktrym zostanie
nadana struktura, mog by ju
wykorzystane w pewnym obszarze
dziaalnoci zyskujc miano wiedzy.

Dane
Informacja
Wiedza
12,5 3,7 32,4
43,4 0,0 11,1
76,5 5,6 55,4
Stan magazynu
Nr czci stan
105 0
106 12
Zapasy spady w
stosunku do ubie
gego miesica o
10%
Liczby reprezentujce
fakty, obserwacje, miary
Przetworzone dane,
zorganizowane i
zinterpretowane
Zrozumienie lub model
obiektu wywiedziony
z informacji o nim
Dane, informacje, wiedza
Zasoby wiedzy organizacji
Czym rni si zasoby wiedzy
organizacji od wiedzy?

Wiedza jest waciwa dla konkretnego
czowieka. Jest czym indywidualnym,
zwizanym z dowiadczeniem,
przekonaniami, jest funkcj szczeglnego
nastawienia, perspektywy lub intencji.

Zasoby wiedzy organizacji

Zasoby wiedzy organizacji, to suma
wiedzy pojedynczych pracownikw oraz
zespow, wszelkie aktywa intelektualne
w tym bazy danych i informacji, ktre
organizacja wykorzystuje do dziaania.
Pracownik zdolny do przeksztacania
danych w wiedz i wykorzystywania jej z
korzyci dla firmy jest podstawowym
elementem zasobw wiedzy organizacji.

Zarzdzanie wiedz klasyfikacja wiedzy
Wiedza lepka i wyciekajca

Wiedza lepka
przez lepko wiedzy naley rozumie trudno przeniesienia
okrelonych rozwiza w inne rodowisko,
lepko wiedzy to jej warto jako rda przewagi
konkurencyjnej oraz jednoczenie ogromny problem
w przypadku prb wspdzielenia wiedzy wewntrz organizacji.

Wiedza wyciekajca:
powizania ludzi w ich rodowiskach poza organizacyjnych,
kontakty osobiste wpywaj bardzo pozytywnie na wymian
wiedzy.

Zarzdzanie wiedz klasyfikacja wiedzy
Nonaka I., Kakeuchi H.
Wiedza:
Ukryta (cicha),
Jawna

Wiedza ukryta jest indywidualna, specyficzno-kontekstowa,
trudna do sformalizowania i zakomunikowania, wymagajca
specyficznych umiejtnoci uczenia si.

Wiedza jawna (dostpna, skodyfikowana) moe by wyraona
w sowach i liczbach. Moe mie posta dokumentw, instrukcji,
procedur, regulaminw czy wreszcie polece. Wiedz jawn
mona atwo wyrazi za pomoc mowy, dokumentw,
schematw, symboli, podrcznikw itd.. Jest ona atwo
transferowalna poprzez kanay i noniki informacji.


Zarzdzanie wiedz klasyfikacja
wiedzy

Oprcz wiedzy jawnej i cichej wyrniana jest
take wiedza kulturowa. Przejawia si ona w
zaoeniach, przekonaniach normach i
wartociach wykorzystywanych przez ludzi w
czasie przypisywania cennoci oraz
znaczenia nowym informacjom i wiedzy.


Zarzdzanie wiedz klasyfikacja wiedzy
Gambel P.R., Blakwell J.
Wiedza:
Spersonalizowana,
Opisowa,
Osadzona.
Wiedza spersonalizowana (odpowiada wiedzy cichej), ktrej
dysponentami i jedynymi nonikami s pracownicy. Obejmuje
ona wszelkie informacje jakie posiadaj i umiej zastosowa
jednostki.
Wiedza opisowa zwizana jest z dokumentami i bazami
danych.
Wiedz osadzon stanowi procesy zachodzce w organizacji,
produkty przedsibiorstwa, specyficzne zasady i procedury
obowizujce w firmie.
Zarzdzanie wiedz - definicje

PricewaterhauseCoopers:
Zarzdzanie wiedz to sztuka przetwarzania
informacji i aktyww intelektualnych w trwa warto
dla klientw i pracownikw organizacji.

Cranfield School of Management w Wielkiej Brytanii:
Zarzdzanie wiedz to og procesw
umoliwiajcych tworzenie, upowszechnianie i
wykorzystywanie wiedzy do realizacji celw
organizacji.

Zarzdzanie wiedz - definicje
Ernst & Young
System zaprojektowany, aby pomc
przedsibiorstwom w zdobywaniu, analizowaniu
i wykorzystaniu wiedzy w celu podejmowania
szybszych, mdrzejszych i lepszych decyzji dziki
czemu mog one osign przewag konkurencyjn.
Arthur Andersen
Proces identyfikowania, zdobywania
i wykorzystywania wiedzy majcy na celu popraw
pozycji konkurencyjnej organizacji. Cay proces
zarzdzania wiedz jest wspierany przez cztery
czynniki: przywdztwo, kultur organizacyjn,
technologi i system pomiarowy.
Zarzdzanie wiedz - definicje
Definicje zwracaj uwag na konieczno wystpowania nastpujcych dziaa:
Traktowania zasobw wiedzy jako wanego zasobu zarwno dla dziaa
strategicznych, dugofalowych jak i dziaa biecych w ramach caej
organizacji,
Identyfikacji zasobw wiedzy,
Stwarzania rodowiska sprzyjajcego kreowaniu wiedzy, np. poprzez
motywowanie pracownikw i tworzenie wzorcw pobudzajcych do generowania
nowych rozwiza,
Stymulowania do dzielenia si wiedz i pomysami,
Zbierania, kodyfikowania i transferu zasobw wiedzy, cigego ich
aktualizowania i weryfikowania,
Zapewnienia szybkiego i penego dostpu do posiadanych zasobw wiedzy,
Wykorzystania zasobw wiedzy zapisanej (zgromadzonej) i wiedzy pracownikw
do poprawy efektywnoci dziaa.

Istot zarzdzania wiedz jest umiejtne czenie nowoczesnych
rozwiza informatycznych z kreatywnoci, umiejtnoci i chci
uczenia si przez czowieka.


Zarzdzanie wiedz a zarzdzanie kapitaem
intelektualnym
Karle-Erik-Sveiby, Raport Konrada, 1987
Celem byo opracowanie metody pomiaru
caej wartoci przedsibiorstwa cznie z
aktywami niematerialnymi, nie
rejestrowanymi w adnym z
dotychczasowych sprawozda.
Wprowadzono pojcie kapitau
intelektualnego.
Elementy skadowe kapitau
intelektualnego
Na kapita intelektualny skadaj si:
Kapita ludzki - wszelkie zasoby, ktrych nonikami s ludzie, jak:
wiedza, zdolnoci, wartoci, normy, postawy, pogldy, inteligencja
emocjonalna itp.. Kapita ludzki tworzy konfiguracja tych zasobw, ktra
skierowana na pozostae zasoby organizacji aktywizuje dziaania
organizacji dla tworzenia wartoci.
Kapita strukturalny - to w duej mierze kapita organizacyjny, tworzony
przez procesy, sieci powiza (formalne i nieformalne) wewntrznych i
z otoczeniem, wykorzystywane metody, programy ale take bazy
danych i dokumenty.
Kapita kliencki tworzony przez klientw, a jego warto zaley nie
tyle od liczby klientw a od sumy korzyci, jakie klienci s skonni
przekaza na rzecz organizacji, aby wykorzysta jej produkty lub
usugi.
Wasno intelektualna na ktr skadaj si patenty, licencje, prawa
autorski, znaki handlowe, projekty itp.. Zasoby te mog by chronione
prawnie.

Zarzdzanie wiedz a zarzdzanie kapitaem
intelektualnym
Kapita intelektualny wedug Stewarta jest sum wszystkiego
co kady w przedsibiorstwie wie i jest materiaem
intelektualnym - wiedz, informacjami, wasnoci intelektualn
i dowiadczeniem, ktre mog by wykorzystane w firmie do
tworzenia jej bogactwa. Jest sum wiedzy, ktra daje firmie
przewag na rynku.

Wg Edvinssona kapita intelektualny to wiedza, praktyczne
dowiadczenie, technologie i dobre relacje z klientami firmy.

Wg Karla-Erika-Sveibyego gwn rnic pomidzy
kapitaem intelektualnym a zarzdzaniem wiedz jest to, e
kapita intelektualny jest pojciem statycznym, natomiast
zarzdzanie wiedz jest terminem aktywnym i stanowi sztuk
kreowania wartoci z niematerialnych aktyww, jakimi
dysponuje organizacja.
Zarzdzanie wiedz - kodyfikacja i
personalizacja
Zasadnicza cz wiedzy przynalena jest ludziom


Wiedza ukryta
wiedza specjalistyczna i
dowiadczenie pojedynczych
osb oraz grup ludzi
Wiedza kulturowa
zaoenia, przekonania,
wartosci, normy
Wiedza jawna
skodyfikowana w reguach,
rutynach, procedurach
Wiedza
organizacji
Wiedza zawarta
w organizacji gdy
j ludzie opuszcz
Wiedza zawarta
w gowach ludzi
Zarzdzanie wiedz - kodyfikacja i
personalizacja
Z bada przeprowadzonych w ponad 700 firmach amerykaskich wynika, e wiedza
przydatna do zarzdzania firm znajduje si zarwno w formalnych dokumentach, jak i
umysach pracownikw. Wyniki tych bada przedstawia rysunek.













rdo: Numann Management Review,[w:] System informacji strategicznej, praca zbiorowa
pod red. R. Borowieckiego i M. Romanowskiej, Warszawa 2001.

Zarzdzanie wiedz - kodyfikacja i
personalizacja

Dwa podejcia do zarzdzania wiedz (wg.: Hansen, Nohria i
Tierney ):
kodyfikacja,
personalizacja.

Wybr podejcia zaley od specyfiki firmy. Firmy zajmujce si
ustandaryzowanymi produktami wybior kodyfikacj, podczas
gdy organizacje, ktre zmuszone s do dostosowywania swoich
usug czy produktw do potrzeb klienta, lub uywaj intuicji i
wiedzy pracownikw do tworzenia nowych produktw powinny
pooy nacisk na personalizacj. Wikszo firm uywa obu
opcji, ale z naciskiem na jedn ze strategii.
Zarzdzanie wiedz - kodyfikacja

Kodyfikacja to podejcie oparte na kumulowaniu wiedzy
jawnej: tworzenie baz danych, repozytoriw dokumentw.
Pracownicy mog korzysta z pracy wykonanej przez innych
wyszukujc wrd zgromadzonych materiaw potrzebnych
informacji. Przykadem jest tutaj firma konsultingowa
Ernest&Young.

Ralph Poole dyrektor E&Y po usuniciu indywidualnych
informacji o kliencie tworzymy obiekty wiedzy
umieszczajc kluczowe elementy wiedzy tj. harmonogramy
prac, dane porwnawcze z rynku, analizy segmentacji rynku
w elektronicznych repozytoriach, aby kady pracownik mg
z nich korzysta.

Zarzdzanie wiedz - personalizacja
Koncepcja ta zakada, e najistotniejsza wiedza jest
trudna lub niemoliwa do skodyfikowania i mona j
przekaza tylko w kontakcie osobistym.

Podejcie to skupia si przede wszystkim na
uatwieniu komunikacji midzy ludmi, zlikwidowaniu
barier przestrzennych, czasowych itd. Gwn rol
odgrywaj tu narzdzia pozwalajce na odnalezienie
czowieka posiadajcego potrzebn wiedz, proste
skontaktowanie si z nim i wymian wiedzy.
Wiedza jako zasb przedsibiorstwa
cechy charakterystyczne
Z punktu widzenia zarzdzania, wiedza stanowi zasb
specyficzny, ktry nie podlega tym samym reguom, co inne
czynniki wytwrcze:
niewyczerpywalno wiedza w przeciwiestwie do innych
zasobw nie wyczerpuje si, a wrcz odwrotnie wraz ze
wzrostem czstoci uywania rosn zasoby wiedzy,
symultaniczno moliwo jednoczesnego wykorzystania
wiedzy w tym samym czasie w rnych obszarach
przedsibiorstwa,
nieliniowo relatywnie maa ilo wiedzy, waciwie
wykorzystanej przez organizacj, moe wywoa wielkie zmiany
i odwrotnie dua ilo wiedzy le uytej moe nie wywoa
adnych skutkw,

Wiedza jako zasb przedsibiorstwa
cechy charakterystyczne
dominujcy charakter od wykorzystania
wiedzy zaley przyszo firmy, to na wiedzy
opiera si przewaga konkurencyjna wielu
przedsibiorstwa,
niematerialno wiedza jest nieuchwytna,
nie mona jej w prosty sposb uj w ramy i
przedstawi za pomoc tradycyjnych miar
rachunkowych lub innych wykorzystywanych
na co dzie przez przedsibiorstwo.
Koncepcje zarzdzania wiedz

Trzy podstawowe podejcia:
japoskie,
zasobowe,
procesowe.

Wiedza ukryta i jawna- podejcie
japoskie
Wedug podejcia japoskiego
kreacja wiedzy i jej rozszerzanie
odbywa si poprzez interakcje
spoeczne midzy wiedz ukryt
i jawn. Zostay one nazwane
konwersj wiedzy i s uznawane
za najbardziej istotny element
zarzdzania wiedz.
Tworzenia i konwersja wiedzy model SECI

Konwersja wiedzy



Model SECI (nazwa pochodzi od pierwszych liter kadego z etapw).
Tworzenia i konwersji wiedzy model SECI
Czterech etapy tworzenia i konwersji wiedzy:
eksternalizacja to przeprowadzenie wiedzy ukrytej w
jawn. (Wiedza ukryta moe zosta
uzewntrzniona, co jest w zasadzie rwnoznaczne
z uwiadomieniem sobie tego, co wiemy),
kombinacja to przeprowadzenie wiedzy jawnej w
jawn, (wiedza jawna moe zosta sklasyfikowana,
poddana syntezie, usystematyzowana, porwnana i
poczona z wiedz pochodzc z innych
dowiadcze czy dziedzin),
Tworzenia i konwersji wiedzy model SECI

internalizacja to przeprowadzenie wiedzy jawnej w
ukryt. (W procesie uczenia si nastpuje
przyswojenie wiedzy - wiedza jawna staje si ukryt),
socjalizacja to przeprowadzenie wiedzy ukrytej w
ukryt. (Wiedz ukryt mona przechwyci - bez
przeprowadzania jej w jawn - w procesie pracy
grupowej, wsplnego wykonywania zada czy
poprzez praktyczn nauk pod okiem mentora )


Tworzenia i konwersji wiedzy model SECI
Wzajemne oddziaywania wiedzy jawnej
i ukrytej powoduj systematyczny
wzrost poziomu zasobw wiedzy i coraz
wiksz ich jako (unikatowo).
Kady nastpny cykl konwersji odbywa
si na wyszym poziomie, potgujc
zakres interakcji pomidzy obiema
kategoriami wiedzy. Twrcy nazwali to
zjawisko spiral wiedzy.
Koncepcje zarzdzania wiedz
podejcie zasobowe
Modele zasobowe przedstawiaj
teoretycznie, w jaki sposb organizacje
generuj i wykorzystuj wiedz.
Podejcie zasobowe nawizuje do
koncepcji zarzdzania strategicznego
zakadajcej, e gwnym rdem
przewagi konkurencyjnej
przedsibiorstwa s jego kompetencje i
umiejtnoci.
Koncepcje zarzdzania wiedz
podejcie zasobowe
Dla tego podejcia wanym jest
model rde wiedzy oparty na
koncepcji kluczowych kompetencji i
kluczowych umiejtnoci,
opracowany przez Dorothy
Leonard-Barton z Harvardzkiej
Szkoy Biznesu na podstawie
bada dotyczcych rde
innowacji w przedsibiorstwach.
rda wiedzy wg Dorothy Leonard Barton
Importowanie wiedzy
Kluczowe
umiejtnoci
Implementacja i
integracja
Eksperymentowanie
Wsplne rozwizywanie
problemw
Teraniejszo
Otoczenie
Wntrze
organizacji
Przyszo
Koncepcje zarzdzania wiedz
podejcie zasobowe
Wg tego modelu dla efektywnego zarzdzania
wiedz konieczne jest istnienie piciu
elementw:
Kluczowych umiejtnoci, w skad ktrych
wchodz umiejtnoci i wiedza pracownikw,
systemy zarzdzania, systemy techniczne
oraz obowizujce normy i wartoci,
Wsplnego rozwizywania problemw,
dzielenia si wiedz i wsplnego
poszukiwania najlepszych rozwiza,

Koncepcje zarzdzania wiedz
podejcie zasobowe

Implementacji i integracji nowych
narzdzi i rozwiza,
Eksperymentowania, czyli poszukiwania
lepszych, innowacyjnych rozwiza,
Importowania wiedzy, czyli
pozyskiwania wiedzy z otoczenia.
Koncepcje zarzdzania wiedz
podejcie zasobowe
Poszczeglne elementy modelu dotycz
wntrza przedsibiorstwa
(implementacja i integracja nowych
rozwiza), jego otoczenia (import
wiedzy), teraniejszoci (wsplne
rozwizywanie problemw) i przyszoci
(eksperymentowanie). Czynnikiem
czcym wszystkie te elementy w
jeden sprawny system s kluczowe
umiejtnoci.

Koncepcje zarzdzania wiedz
podejcie zasobowe
Zarzdzanie wiedz
Wiedza skodyfikowana:
- bazy danych
- dokumentacja
- publikacje
Wiedza ugruntowna:
-kapita strukturalny,
-produkty,
-usugi
Kapita ludzki
Wiedza spersonalizowana
jawna i cicha
Zdolnoci, wartoci, postawy
Kapita finansowy i rzeczowy
WIEDZA OTOCZENIA
Koncepcje zarzdzania wiedz
podejcie zasobowe
Model podkrela, e generowanie nowej wiedzy jak
rwnie wykorzystanie istniejcej jest uwarunkowane
wprowadzeniem poszczeglnych rodzajw wiedzy
we wzajemne interakcje take z zasobami wiedzy
lecej w otoczeniu organizacji.
Niezbdnym warunkiem tych interakcji jest poprawne
uksztatowanie i wykorzystanie wiedzy
spersonalizowanej i pozostaych elementw kapitau
ludzkiego organizacji, ktry zawsze uczestniczy w
przeksztaceniu wiedzy skodyfikowanej w
ugruntowan i na odwrt.
Koncepcje zarzdzania wiedz
podejcie procesowe
Propagatorami podejcia procesowego w zarzdzaniu wiedz s
Davenport i Prusak. Zaproponowali oni model zarzdzania
wiedz, ktry skada si z trzech podstawowych procesw:
Tworzenie wiedzy poprzez jej import z otoczenia (np. poprzez
przejmowanie firm lub najlepszych pracownikw) oraz poprzez
stwarzanie warunkw wewntrznych sprzyjajcych powstawaniu
wiedzy, takich jak odpowiednia kultura organizacyjna, struktura
organizacyjna i style zarzdzania,
Kodyfikacja wiedzy, czyli uatwianie dostpu do wiedzy tym
osobom, ktre jej potrzebuj oraz przetwarzanie wiedzy w taki
sposb, aby byo atwo ja znale i zrozumie,
Transferu wiedzy poprzez transmisj czyli wysyanie lub
prezentowanie wiedzy odbiorcy i absorpcj czyli przyswajanie
wiedzy w celu jej dalszego wykorzystania.
Koncepcje zarzdzania wiedz
podejcie procesowe
Podobne podejcie do zarzdzania wiedz w
przedsibiorstwie opisuj G. Prost, S.Raub,
K.Romhardt.
Wyrniaj i opisuj sze najwaniejszych
procesw zarzdzania wiedz.
Podejcie procesowe jest uznawane za
najbardziej funkcjonalne. Bazuje na
dowiadczeniach i rozwizaniach
stosowanych w praktyce.
Podejcie procesowe elementy
zarzdzania wiedz
Lokalizowanie
wiedzy
Zachowywanie
wiedzy
Rozwijanie
wiedzy
Dzielenie si
wiedz
Pozyskiwanie
wiedzy
Wykorzystanie
wiedzy
Cele zarzdzania
wiedz
Ocena wiedzy
Cele zarzdzania wiedz

W wikszoci organizacji aspekt wiedzy
jest pomijany przy formuowaniu celw i
to na wszystkich poziomach:
normatywnym, strategicznym i
operacyjnym.
Strategia zarzdzania wiedz powinna
by uzupenieniem tradycyjnego
planowania.
Trzy poziomy zarzdzania wiedz
Struktury Dziaania Zachowanie
Zarzdzanie
normatywne
(zaoenia)
Statut firmy:
- przepisy prawne i ich wpyw na
zarzdzanie wiedz (tajemnica
subowa itp..)
Polityka firmy:
- wizja i misja firmy (w aspekcie
zasobw wiedzy),
- okrelenie najwaniejszych
obszarw wiedzy
Kultura organizacyjna:
- denie do dzielenia si zasobami
wiedzy,
- duch innowacyjnoci,
- bardzo dobra komunikacja
Zarzdzanie
strategiczne
(plany)
Struktura organizacyjna:
- zebrania, podzia obowizkw,
organizacja dziau bada i
rozwoju, grupy wymiany
dowiadcze
Systemy zarzdzania:
- Enterprise Information Syste
Programy:
- wsppraca,
- tworzenie kluczowych
kompetencji,
- dostarczanie informacji
Podejcie do problemw:
- ukierunkowanie na zagadnienia
zwizane z zarzdzaniem wiedz,
- okrelenie zasobw wiedzy w
kontekcie rozwizywania
problemw.
Zarzdzanie
operacyjne
(zadania)
Procesy organizacyjne:
- kontrolowanie przepywu wiedzy.
Procesy wykonawcze:
- infrastruktura zwizana z
wiedz,
- dostarczanie nowej wiedzy.
Zadania:
- projekty zwizane z
zarzdzaniem wiedz,
- tworzenie bankw danych o
ekspertach,
- wprowadzanie szkole
wspomaganych komputerowo
Wykonanie i wsppraca:
- dzielenie si wiedz,
- wykorzystanie wiedzy w dziaaniu
Cele zarzdzania wiedz
Zaoenia pojawiaj si na poziomie
normatywnym i dotycz oglnej polityki
przedsibiorstwa oraz jego kultury
organizacyjnej.
Plany s opracowywane na poziomie
strategicznym i odnosz si do
dugoterminowych programw sucych
realizacji wizji firmy.
Zadania za realizowane na poziomie
operacyjnym pozwalaj na bieco prowadzi
proces wdraania planw strategicznych.
Cele zarzdzania wiedz
Najwaniejszym zaoeniem zarzdzania wiedz
powinno by budowanie kultury organizacyjnej
opartej na wiadomoci znaczenia wiedzy.
Jednym z zada stojcych przed zarzdzajcymi wiedz na poziomie
normatywnym jest zbudowanie atmosfery zaufania, w ktrej - aby
pobudzi ducha przedsibiorczoci - tolerowane powinny by nawet
bdy pracownikw.
Zaoenia mog odnosi si do rnych elementw zarzdzania
wiedz. Przykadowo, jeeli firma dotd niechtnie korzystaa z
zewntrznych pomysw, jednym z przyjtych przez ni zaoe
powinno sta si wiksze otwarcie na wiat zewntrzny i wytworzenie
gotowoci do eksperymentowania i naladowania cudzych rozwiza.
Cele zarzdzania wiedz
Wizja i misja firmy powinny wskazywa
na znaczenie wiedzy oraz na sposoby
korzystania z jej zasobw. Zawierajcy
je dokument powinien by
przewodnikiem dla pracownikw,
wskazywa na preferowany sposb
mylenia i skania do rozwaania
kadej decyzji strategicznej
i operacyjnej w kontekcie wiedzy.
Wizja i misja firmy Phonak Ltd.

Technologia informatyczna, infrastruktura
Standaryzacja wiedzy (np.programy
symulacyjne) Struktury
firm powizanych kapitaowo Koncentracja
wiedzy typu know-haw.
5000-8000 klientw rocznie
Dzia bada i rozwoju powica 40% czasu
pracy na kontakty z klientami
Rodzaj struktur:elastyczne (np. tworzone
tymczasowo grupy robocze) i paskie
Wsppraca na odlegoc za porednictwem
internetu itp.
Dewiza: Od wiedzy specjalistycznej do
wiedzy oglnej
Inwestycje: 10% przychodw
przeznaczonych na badania i rozwj, 40%
czasu pracy kierownictwa - na dziaania
zwizane z rozwojem firmy.
Wydzielenie spek zalenych w celu jak
najlepszego wykorzystania wiedzy typu
know-haw
Aktywny udzia w yciu midzynarodowego
rodowiska naukowego
Wsppraca z innowacyjnymi organizacjami
wykorzystanie
Wiedza
rozwijanie
wewntrzna Wiedza zewntrzna
Kultura organizacyjna:
Otwarto, zaufanie, pomysowo, jako wartoci
biorce gre nad wadz i pozycj w hierarchii,
pena gotowo do dialogu jako metody
rozwizywania problemw wewntrz firmy i poza
ni.
Strategia: Przywdztwo technologiczne przy
wykorzystaniu wasnych zasobw
Plany zarzdzania wiedz
Plany zarzdzania wiedz okrelaj,
ktre umiejtnoci naley rozwija,
ktre chroni, a ktre mona uzna za
zbdne. Mog rwnie dotyczy
ksztatowania struktur organizacyjnych i
systemw zarzdzania
wspomagajcych rozwj umiejtnoci.
Plany zarzdzania wiedz
ujawniaj faktyczny stan kluczowych
zasobw wiedzy,
okrelaj zasoby wiedzy, ktre bd
niezbdne w przyszoci,
umoliwiaj dopasowanie struktur
organizacyjnych i systemw
zarzdzania do strategii
przedsibiorstwa.
Macierz kompetencji

Macierz kompetencji



Profil wiedzy przedsibiorstwa
Cele zarzdzania
wiedz
Pomiar wiedzy
Lokalizowanie wiedzy
Zachowywanie wiedzy
Rozwijanie wiedzy
Dzielenie si wiedz i
rozpowszechnianie jej
Pozyskiwanie wiedzy Wykorzystanie wiedzy
informacja
zwrotna
Obszary kompetencji
rozpoznane, rzadko
odpowiednio wykorzystane
Szkolenia - kontrolowane, podzia
obowizkw niejasny, brak
wskanikw wiedzy
Sprawny system nieformalnej
komunikacji midzy
pracownikami, inteligentna sie
intranetowa
Niedostateczny wkad wiedzy w
nowe produkty, wiedza wycznie w
archwach, wiele bezuytecznych
raportw wewnetrznych
Wsppraca z orodkami
akademickimi, brak zrwnowaonej
rekrutacji, niewielkie wykorzystanie
wiedzy licencjonowanej
Wysoki poziom kreatywnci, wsparcie
ze strony kierownictwa najwyszego
szczebla, koncentracja na wynikach
bada, zbyt mao innowacji
organizacyjnych
Bardzo dobra komunikacja
wewntrz oddziaw, wysepki
wiedzy, nieefektywne zebrania
Brak wnioskw z realizacji
projektw, dua rotacja
pracownikw, brak wytycznych
dotyczcych sporzdzania
dokumentacj
Profil wiedzy przedsibiorstwa
KMAT (Knowledge Management Assessment Tool)
opracowane przez Firm Arthur Andersen we
wsppracy z Amerykaskim Centrum
Produktywnoci i Jakoci. Jest to kwestionariusz z
pytaniami na temat zarzdzania wiedz. Na
podstawie odpowiedzi udzielonej przez menederw
s opracowywane wnioski, ktre mona wykorzysta
w celu nadania firmie odpowiedniego kierunku
rozwoju w sferach: przywdztwa, kultury
organizacyjnej, pomiarw i technologii. KMAT
obejmuje rwnie elementy benchmarkingu.
Kluczowe procesy zarzdzania wiedz -
lokalizowanie wiedzy
Ograniczony dostp do zasobw wiedzy jest
codziennym problemem wielu organizacji.
Brak rozeznania w wewntrznych zasobach
wiedzy i kompetencji zwizanych z wanymi
obszarami dziaania wystpuje przede wszystkim
w duych midzynarodowych firmach.
Jednym z najwaniejszych zada zarzdzania
wiedz jest doprowadzenie do waciwej
przejrzystoci wewntrznych zasobw wiedzy
oraz umoliwienie pojedynczym pracownikom ich
zlokalizowania.
Kluczowe procesy zarzdzania wiedz -
lokalizowanie wiedzy
Rozpoznanie rde wiedzy wewntrznej
polega na okreleniu jej biecego stanu,
a wic na uzyskaniu wiadomoci jakie s
moliwoci organizacji.
Trzeba pozna zasady dotyczce dzielenia
si wiedz, przepywu informacji i
dostpnoci zasobw wiedzy. Istotne jest,
aby jasno zostao okrelone kto za to
odpowiada.
Kluczowe procesy zarzdzania wiedz -
lokalizowanie wiedzy
Ocena wasnych moliwoci firmy
benchmarking
Benchmarking jest zestawem teoretycznych i
praktycznych metod umoliwiajcych firmom
rozpoznanie wasnych sabych stron poprzez
porwnanie z konkurencj.
Benchmarking wewntrzny porwnanie
dwch jednostek organizacyjnych w jednej
firmie.
Kluczowe procesy zarzdzania wiedz -
lokalizowanie wiedzy
Przyczyny braku przejrzystoci zasobw
wiedzy:
Brak osb odpowiedzialnych za zarzdzanie
wiedz
Organizacje nie dysponuj adnymi
centralami kontroli zasobw wiedzy
(restrukturyzacja, fluktuacja zatrudnienia,
odchudzanie organizacji, programy
decentralizacji to czynniki potgujce te
problemy)



Kluczowe procesy zarzdzania wiedz
lokalizowanie wiedzy

Narzdzia lokalizacji wiedzy:
Wykaz ekspertw
Mapy wiedzy
Sieci komunikacji
Spoecznoci w dziaaniu
Kluczowe procesy zarzdzania wiedz
lokalizowanie wiedzy
Wykaz ekspertw sporzdzone w formie ksiek
telefonicznych, posortowane w grupy tematyczne dane o
ekspertach pracujcych dla firmy
Koncern chemiczny Hoffmann-LaRoche zebrane dane o ekspertach
opublikowano w formie listy podzielonej na kategorie najczciej pojawiajcych
si problemw zwizanych z opracowaniem nowych produktw.
Texaco
System informatyczny PeopleNet, ktry umoliwia pracownikom przygotowanie
swych profili osobistych, (charakterystyk) oraz publikowanie ich na stronach
www).
System informatyczny KnowledgeMail czy wspomniany Peoplenet i poczt
elektroniczn. Knowledgemail filtruje poczt subow pracownikw, szukajc
najczciej powtarzajcych si fraz, ktre mogyby wiadczy o wiedzy i
umiejtnociach pracownikw. Nastpnie kady pracownik samodzielnie
dokonuje wyboru fraz, ktre najlepiej jego zdaniem charakteryzuj jego wiedz.



Kluczowe procesy zarzdzania wiedz
lokalizowanie wiedzy
Mapy wiedzy.
S graficznym odwzorowaniem wzajemnych
zalenoci midzy istniejcymi w organizacji
aktywami intelektualnymi, rdami ich pochodzenia
oraz zastosowaniami.
Mapy wiedzy powstay w celu usystematyzowania
istniejcych i stale przyrastajcych zasobw wiedzy a
take powizania zada z odpowiednimi aktywami
intelektualnymi, jakimi dysponuje
organizacja. Wszystkie zawarte w nich informacje
mog by zapisane w formie elektronicznej,
organizowane wg rnych kryteriw i
prezentowane za pomoc programw graficznych.
Kluczowe procesy zarzdzania wiedz
lokalizowanie wiedzy
Podzia map wiedzy ze wzgldu na ich struktur:
topograficzne mapy wiedzy su do lokalizacji osb posiadajcych
okrelone umiejtnoci, a take do prezentacji poziomu ich wiedzy w
konkretnej dziedzinie. Narzdzie to pozwala na szybsze okrelenie, kto i
gdzie posiada najodpowiedniejsze kwalifikacje do realizacji zadania;
mapy zasobw informacji su do okrelenia gdzie (centralna baza
danych, archiwum, umys emerytowanego pracownika itp.) i w jakiej postaci
(notatki, pliki tekstowe, prezentacje, pliki multimedialne itp.) znajduj si
informacje. Uwzgldniaj one stopie nagromadzenia zasobw, a take
okrelenie tego, jak do nich dotrze i w jaki sposb przetwarza;
systemy informacji geograficznej (Geographical Information Systems, GIS)
mog posuy do prezentacji geograficznego rozmieszczenia zasobw
wiedzy. Na przykad mapa obszarw sprzeday przydaje si do planowania
dziaa marketingowych.
mapy rde wiedzy okrelaj, kto w zespole, w caej organizacji lub w jej
otoczeniu dysponuje wartociowymi zasobami wiedzy, ktre mog by
wykorzystane w konkretnych projektach,
macierze wiedzy - aktywa intelektualne mona przedstawi w postaci
dwuwymiarowej macierzy. Przedstawiaj podzia wiedzy na rne kategorie
(np.. wewntrzna, zewntrzna, jawna, ukryta).

Kluczowe procesy zarzdzania wiedz
lokalizowanie wiedzy
Cel dziaa zwizanych z uzyskaniem
przejrzystoci wiedzy:
Umoliwienie wykorzystania dowiadczenia i intuicji
ekspertw wewntrznych, czyli uzyskanie dostpu do
tzw. wiedzy ukrytej czyli nieuwaidomionej. Wiedza
ukryta moe by bowiem wykorzystana do innowacji
tylko wtedy, gdy jej ukryte elementy zostan najpierw
sformalizowane a potem poczone z pozostaymi
skadnikami kapitau intelektualnego
przedsibiorstwa.
Kluczowe procesy zarzdzania wiedz
lokalizowanie wiedzy
Kompetencje organizacji nie mog by traktowane
jako suma kompetencji jednostek. Wiedza organizacji
tkwi w sieci wzajemnych relacji, w niepisanych
reguach postpowania i we wsplnych wartociach.
Jest integraln czci systemw eksperckich i praw
podlegajcych ochronie.
Wewntrz kadej organizacji istnieje organizacja
nieformalna, za pomoc ktrej odbywa si zbiorowe
mylenie.
Nieformalne powizania w organizacji
przedstawiane s za pomoc sieci komunikacji.
Kluczowe procesy zarzdzania wiedz
lokalizowanie wiedzy
Sieci komunikacji graficzne
przedstawienie nieformalnych kanaw
komunikacji w firmie (np. sie kontaktw
doradczych, sie informujca o poziomie
zaufania). Jest to bardzo przydatna metoda
uatwiajca dobr skadu zespow
zadaniowych. Sie powinna wskazywa do
kogo poszczeglni pracownicy zgaszaj si
w celach doradczych. Niepisane zasady
panujce w zespoach s czsto silniejsze od
oficjalnych procedur.

Kluczowe procesy zarzdzania wiedz
lokalizowanie wiedzy
Sieci ekspertw - nieformalne grupy suce
odnajdywania potrzebnej wiedzy. Polegaj one na
dobrowolnym udziale. Wymiana wiedzy jest
ogniwem, ktre czy czonkw i sprawia, e s dla
siebie wzajemnie uyteczni. Kontakty takie nawizuje
si czasem poprzez dziaania zwizane z
wykonywanym zadaniem, czasem s zupenie
niezwizane z prac. Organizacja nie moe stworzy
takiej sieci, ale moe stara si je wykry i wspiera,
aby czerpa w ten sposb korzyci.
Przykady: koa zrzeszajce absolwentw wyszych
uczelni, stowarzyszenia naukowo-techniczne)
Kluczowe procesy zarzdzania wiedz
pozyskiwanie wiedzy

Zewntrzne rda wiedzy:
kontakty z klientami, dostawcami,
kontakty z firmami konkurujcymi
kontakty z firmami partnerskimi.
zakup wiedzy - zatrudnienie
zewntrznych ekspertw lub
przejmowanie caych firm.
Kluczowe procesy zarzdzania wiedz
pozyskiwanie wiedzy
Rynki wiedzy przedmiot obrotu:
wiedza zewntrznych ekspertw,
wiedza innych przedsibiorstw,
wiedza rnych grup uczestnikw
rynku, np. klientw,
produkty zwizane z wiedz.

Kluczowe procesy zarzdzania wiedz
pozyskiwanie wiedzy
Cechy rynkw wiedzy:
Znikoma przejrzysto,
Relacje pomidzy kupujcymi
i sprzedajcymi (oparte s gwnie na
zaufaniu zbudowanym w trakcie wieloletniej
wsppracy),
Najbardziej poszukiwane dobra mog wcale
nie pojawi si na rynku.
Kluczowe procesy zarzdzania wiedz
pozyskiwanie wiedzy, wsppraca z innymi
przedsibiorstwami
przejcia
udziay
mniejszociowe
powizania
strategiczne
okazjonalna wymiana
informacji
fuzje
udziay
wikszociowe
alianse
strategiczne
okazjonalna
wsppraca
Stopie wsppracy
Dostp do zasobw
wiedzy firmy
partnerskiej
poziom inwestycji
kapitaowych
niski
wysoki
czciowy peny
stosunkowo niski stosunkowo wysoki
Kluczowe procesy zarzdzania wiedz
pozyskiwanie wiedzy, wiedza pochodzca od innych
uczestnikw rynku
Bardzo wanym rdem wiedzy jest
opinia klientw:
ocena mocnych i sabych stron
produktu,
wchodzenie w rol klienta,
angaowanie klientw w proces
rozwoju produktu,
projekty pilotaowe.

Kluczowe procesy zarzdzania wiedz rozwijanie
wiedzy
Rozwijanie wiedzy - proces uzupeniajcy
pozyskiwanie wiedzy z zewntrz
Obejmuje ono:
zdobywanie umiejtnoci,
projektowanie nowych produktw,
promowanie innowacji oraz usprawnianie
procesw - wszelkie dziaania kadry
kierowniczej zmierzajce do wytworzenia
nowych moliwoci, ktre dotychczas nie byy
dostpne dla firmy (np. badania rynkowe oraz
przedsiwzicia dziau ds. bada i rozwoju).
Kluczowe procesy zarzdzania wiedz rozwijanie
wiedzy

Zarzdzanie procesem rozwijania
wiedzy powinno polega bardziej
na ksztatowaniu odpowiednich
warunkw rozwijania wiedzy ni na
bezporedniej kontroli procesu.

Kluczowe procesy zarzdzania wiedz
rozwijanie wiedzy
Przeszkody w rozwijaniu wiedzy:
Innowacje oznaczaj konflikt midzy starym
a nowym porzdkiem wi si z
porzuceniem starych wzorcw i
przyzwyczaje,
Innowacje zakcaj rozkad si w
przedsibiorstwie (osabiaj pozycj osb
posiadajcych tradycyjne umiejtnoci
a wzmacniaj pozycj tych, ktrzy posiedli
nowe).
Kluczowe procesy zarzdzania wiedz
rozwijanie wiedzy
Warunki sprzyjajce kreatywnoci
pracownikw:
Swoboda przedstawiania pomysw,
tolerowanie bdw,
Autonomia,
Zgodno interesw,
Niestabilno/twrczy chaos,
Redundancja.
Kluczowe procesy zarzdzania wiedz -dzielenie si
wiedz i rozpowszechnianie jej
Dzielenie si wiedz i jej rozpowszechnianie
to procesy, dziki ktrym pojedyncze,
wyizolowane informacje lub umiejtnoci
przeksztacane zostaj w zasoby wiedzy
suce caej organizacji. Powinnimy
odpowiedzie tutaj na pytania:
Kto powinien wiedzie?. Jak duo?. Na jaki
temat?
W jaki sposb usprawni proces
rozpowszechniania wiedzy.

Kluczowe procesy zarzdzania wiedz -
dzielenie si wiedz i rozpowszechnianie jej

Zanikanie warunkw sprzyjajcych
naturalnemu dzieleniu si wiedz:
Restrukturyzacja firm, szybki rozwj firm,
przejcia firm naruszaj dotychczasowy
ukad kanaw przepywu informacji,
Przeksztacanie si tradycyjnych
organizacji w organizacje wirtualne.


Kluczowe procesy zarzdzania wiedz - dzielenie si
wiedz i rozpowszechnianie jej

Powielanie wiedzy (system szkole),
Dzielenie si dowiadczeniami z
wykonywanych dawniej zada oraz ich
dokumentowanie (intranet, narzdzia do pracy
zespoowej groupware, systemy eksperckie),
Benchmarking i rozpowszechnianie
najlepszych rozwiza.



Zarzdzanie wiedz-zachowywanie wiedzy

Trzy podstawowe procesy:

Wybr wiedzy (osb, zdarze,
procesw), ktra jest warta
zachowania
Nadanie wyselekcjonowanej wiedzy
waciwej formy w ktrej ma by
przechowywana,
Aktualizacja pamici organizacji.

Kluczowe procesy zarzdzania wiedz
wykorzystanie wiedzy

Priorytetowym zadaniem kadego
procesu zarzdzania wiedz
powinno by wykorzystanie wiedzy
grup i jednostek dla osignicia
celw przedsibiorstwa.
Kluczowe procesy zarzdzania wiedz
wykorzystanie wiedzy
Bariery w wykorzystaniu wiedzy:
Bariery natury psychologicznej
i organizacyjnej powstrzymuj
pracownikw przed korzystaniem z nowej
wiedzy. Nie chc niczego zmienia, bo
czuj si wygodnie i bezpiecznie w
dotychczasowym ukadzie
Rutyna (organizacyjna lepota),
Atmosfera i zwyczaje panujce w pracy,
Sposb udostpniania wiedzy.

Mierzenie wartoci zasobw wiedzy
Problemy z mierzeniem zasobw wiedzy:
Grupa I: Niemono wyceny niektrych zasobw wiedzy:
Niezwykle trudno wyjani, skd wynika rnica midzy
wartoci rynkow firmy a jej wartoci ksigow. Wiedza
niezwykle rzadko uwzgldniana jest jako element aktyww
pozostaje zwykle zasobem ukrytym.
Wiedza, ktra ma kluczowe znaczenie dla pozycji
konkurencyjnej firmy, nie jest rozpoznawana, lub jest
rozpoznawana w niedostatecznym stopniu. Trudno jest j wic
opisa, tym samym trudne jest oszacowanie jej wartoci.
Nie istniej systemy monitorowania, ktre umoliwiayby
obserwowanie skali zmian zachodzcych w poszczeglnych
procesach zarzdzania wiedz np. procesach lokalizowania i
rozwijania wiedzy.


Mierzenie wartoci zasobw wiedzy
Problemy z mierzeniem zasobw wiedzy:
Grupa II: Nieodpowiedni przedmiot pomiaru:
Uwaga skupiona jest tylko na wskanikach finansowych, ktre
przedstawiaj sytuacj przedsibiorstwa ale nie przekazuj adnych
informacji o istniejcych w nich zalenociach przyczynowo-
skutkowych.
Wykorzystuje si wycznie wskaniki wewntrzne, co uniemoliwia
badania porwnawcze rozwoju wiedzy w firmie i w firmach
konkurencyjnych.
Ocenia si umiejtnoci i moliwoci jednostek, ale zaniedbuje wiedz
zbiorow.
Mierzy si nakady na rozwj wiedzy, ale nikt nie zajmuje si ocen
wynikw na przykad okrela si wielko nakadw na szkolenia ale
nie bada si korzyci, ktre wynikaj z ich przeprowadzenia.

Mierzenie wartoci zasobw wiedzy
Problemy z mierzeniem zasobw wiedzy:
Grupa III: Nieodpowiednie miary:
Preferuje si miary ilociowe, miary jakociowe
uwaa si za drugorzdne. Nie jest to suszne
podejcie, gdy informacje dotyczce zjawisk o
charakterze jakociowym, takich jak np.. zadowolenie
klienta mog mie wiksze znaczenie dla rozwoju
firmy ni dane i wskaniki opisujce zjawiska
ilociowe.
Pomiary wiedzy s dokonywane w sposb
odpowiadajcy specyfice firmy, co uniemoliwia
porwnanie jej wynikw z wynikami fir konkurujcych.



Mierzenie wartoci zasobw wiedzy
Tradycyjne systemy ksigowe - wiedza
otrzymuje pewien wymiar finansowy dopiero
wtedy, gdy zostanie wyodrbniona jako
skadnik produktw lub usug wystawionych
na sprzeda.
Aktualne tendencje - uwaga jest skupiona
nie na pieninej wartoci wiedzy a na
problemach szacowania zasobw wiedzy
dziki ktremu moliwa jest kontrola nad
procesami prowadzcymi do osignicia
celw zarzdzania wiedz.
Mierzenie wartoci zasobw wiedzy
- strategiczna karta wynikw
Strategiczna karta wynikw zaproponowana przez
Kaplana i Nortona jest systemem zarzdzania
i monitorowania dziaalnoci przedsibiorstwa a
jednoczenie stanowi propozycj rozwizania
problemw z pomiarem aktyww niematerialnych.

Strategiczna karta wynikw analizuje
przedsibiorstwo z czterech rnych perspektyw:
finansowej,
klienta,
procesw wewntrznych,
rozwoju.
Mierzenie wartoci zasobw wiedzy -
strategiczna karta wynikw

Strategiczna karta wynikw

rdo: R.S. Kaplan, D.P. Norton, Strategiczna karta wynikw, Warszawa 2001, s. 28

Mierzenie wartoci zasobw wiedzy -
strategiczna karta wynikw

. Perspektywa Podstawowe mierniki
Finansowa Stopa zwrotu z inwestycji i ekonomiczna
warto dodana
Klienta Satysfakcja klienta, udzia w rynku, udzia w
portfelu
Procesw wewntrznych Jako, czas, koszty, czas wprowadzenia
nowych produktw
Rozwoju Zadowolenie pracownikw, dostpno
systemw informacyjnych

Przykadowe mierniki Strategicznej karty wynikw
Mierzenie wartoci zasobw wiedzy -
strategiczna karta wynikw
Etapy wprowadzania strategicznej karty wynikw
w przedsibiorstwie:
okrelenie strategicznych celw dla gwnych
obszarw danego przedsibiorstwa
i opracowanie miernikw dla kadego z celw,
tworzenie zada i celw dla poszczeglnych
komrek organizacyjnych. Formuowane s one w
taki sposb, aby pozwalay na jasne porwnanie
wynikw dwch (lub wicej) zestawianych
okresw.
Mierzenie wartoci zasobw wiedzy
Nawigator Skandii
Pierwszy raport na temat kapitau intelektualnego
na wiecie.
Nawigator Skandii w 1994 roku by po raz pierwszy
dodany do raportu finansowego firmy.
Raport na temat kapitau intelektualnego obejmuje w
Skandii 168 wskanikw, w tym 150 dotyczy
obszarw: ludzkiego, rozwoju, klientw i procesw.
Pozostae dotycz finansw.
Nawigator ma pomaga w sprawnym operowaniu
tymi wskanikami.

Mierzenie wartoci zasobw wiedzy
Nawigator Skandii
Skandia
Kapita finansowy Kapita intelektualny
Kapita ludzki
Kapita strukturalny
Kapita kliencki Kapita organizacyjny
Kapita innowacyjny Kapita procesowy
Schemat wartoci rynkowej Skandii
Mierzenie wartoci zasobw wiedzy
Nawigator Skandii
Kapita ludzki. Obejmuje know-how, umiejtnoci,
zdolnoci i dowiadczenia czonkw organizacji.
Kapita organizacyjny. Dotyczy metod, technik i
sposobw ulepszajcych efektywno i wydajno
procesw. Obejmuje rwnie kultur organizacyjn
przedsibiorstwa, ktra wytwarza specyficzny dla
danej jednostki zbir wartoci i norm oraz wzorcw
postaw i zachowa. W tej kategorii kapitau mieci si
rwnie innowacyjno organizacji.
Kapita kliencki. Odnosi si on w gwnej mierze do
relacji przedsibiorstwa z klientami.
Nawigator Skandii przykadowe
wskaniki
Klienci:
Liczba kontraktw,
Liczba dni powiconych na
wizyty u klientw,
Indeks zadowolenia klientw,
Liczba straconych klientw
Nawigator Skandii przykadowe
wskaniki
Procesy:
Kontrakty zrealizowane bezbdnie,
Koszty administracyjne/przychody
ogem,
Czas realizacji zamwie,
Kontrakty na jednego zatrudnionego.
Nawigator Skandii przykadowe
wskaniki
Rozwj:
Indeks satysfakcji pracownikw,
Koszty podnoszenia kwalifikacji na
jednego pracownika,
Nakady na badania i rozwj,
Koszty marketingowe na jednego
klienta.
Nawigator Skandii przykadowe
wskaniki
Kapita intelektualny:
Czas powicony na szkolenia
(liczba dni w roku),
Indeks motywacji,
Fluktuacja pracownikw.

Mierzenie wartoci zasobw wiedzy -
wielowymiarowe systemy pomiaru wiedzy
Dostpne narzdzia mierzenia i opisywania zmian w
zasobach wiedzy organizacji wykazuj wiele mankamentw.
Tylko w ograniczonym zakresie nadaj si do monitorowania
zaplanowanego rozwoju zasobw wiedzy i ukazywania
wpywu wiedzy na wyniki przedsibiorstwa.

Gwny problem:
Trudnoci w rozrnieniu rodzaju wskanikw. Wskaniki
dotyczce treci wiedzy (aktualnego stanu zasobw wiedzy)
s mylone ze wskanikami dotyczcymi podejmowanych
dziaa i ich zakresu a take wskanikami, ktre dotycz
transferu rozwiza (efektw podejmowanych dziaa) i w
kocu klasycznymi wskanikami finansowymi.
Wielowymiarowe systemy pomiaru wiedzy
- klasyfikacja wskanikw
Rodzaj wskanikw Zastosowanie Przykady
Zasoby wiedzy organizacji Opisuj stan (tre) zasobw
wiedzy organizacji w czasie
w sposb jakociowy i
ilociowy
Umiejtnoci pracownikw,
kluczowe kompetencje,
jako i ilo zewntrznych
powiza ze rodowiskiem
wiedzy, jako i ilo
wewntrznych centrw
kompetencji oraz patentw
Dziaania Opisuj procesy i nakady
(koszty) na modyfikowanie
zasobw wiedzy organizacji
Liczba warsztatw
zwizanych z
opracowywaniem wnioskw z
realizacji projektw,
przygotowanie profili
ekspertw, wprowadzenie
uczenia si przez dziaanie
(liczba tego typu szkole w
szkoleniach ogem %)
Wyniki porednie i efekty
transferu
Opisuj bezporednie wyniki
dziaa
Publikacje wg sugestii
pracownikw dotyczcych
doskonalenia, czas reakcji na
zgoszenie od klienta,
wskanik wykorzystania
intranetu, wskanik
przejrzystoci wiedzy,
Wyniki dziaalnoci Opisuj wyniki na koniec
okresu (kwartau, roku
finansowego)
Przepywy pienine, udziay
w rynku, wizerunek firmy,
zwrot z inwestycji

Wielowymiarowe systemy pomiaru wiedzy-
klasyfikacja wskanikw
Wskaniki grupy I dotycz stanu zasobw wiedzy
organizacji.
Wskaniki nalece do grupy II opisuj nakady i
procesy traktowane jako wymierne przejawy prb
podejmowanych w celu zmodyfikowania zasobw
wiedzy.
Wskaniki z grupy III su do okrelenie wynikw
porednich i efektw transferu rozwiza.
Wskaniki grupy IV opisuj wyniki dziaalnoci.
Pomiar wiedzy a cele zarzdzania wiedz
Dziaania Pomiary
*
stworzenie warunkw do realizacji
strategicznych planw i zada
operacyjnych zarzdzaniu
*
stworzenie kultury organizacyjnej
wraliwej na wiedz
*
uzyskanie poparcia kadry
menedzerskiej najwyszego
szczebla
*
analiza kultury organizacyjnej
*
obserwowanie zachowania kadry
menedzerskiej (np. analiza porzdku
obrad)
*
analiza wiarygodnoci (rnic
pomidzy status squo a stanem
podanym)
*
ustalenie podstawowych skadnikw
wiedzy organizacji
*
zdefiniowanie zbioru podstawowych
kompetencji
*
wprowadzenie mechanizmw
tworzenia kompetencji
*
wielowymiarowe pomiary wiedzy
(zestawienia bilansowe zasobw
wiedzy, klasyfikacja wskanikw)
*
analiza zbioru kompetencji
*
nadzorowanie realizacji
najwaniejszych projektw
zwizanych z zarzdzaniem wiedz
*
zrwnowaona karta wynikw
*
przeoenie normatywnych i
strategicznych celw zarzdzania
wiedz na jzyk praktyki,
*
dopasowanie dziaa do poziomu na
ktrym s przeprowadzane.
*
nadzr nad procesami szkoleniowymi
ukierunkowanymi na transfer wiedzy,
*
pomiar stopnia wykorzystania
systemw (np.. Intranetu)
*
tworzenie indywidualnych zestaww
umiejtnoci
poziom
normatywny
poziom
strategiczny
poziom
operacyjny
Pomiar wiedzy na poziomie normatywnym
Test wraliwoci kultury organizacyjnej na wiedz:
Czy pracownicy s zachcani do dzielenia si wiedz,
Czy w miejscu pracy panuje atmosfera otwartoci i zaufania,
Czy dobro klienta jest gwnym celem zarzdzania wiedz,
Czy pracownicy maj koncepcj przyszoci firmy i czy czsto
podejmuj dyskusje na ten temat,
Czy firma zapewnia pracownikom wystarczajco duo informacji,
zasobw i bodcw aby mogli zdoby umiejtnoci, ktrych
potrzebuj,
Czy pracownicy stale doskonal umiejtnoci i rozwijaj wiedz,
Czy jako pracy pogarsza si na skutek uprzedze lub
przywizania do rutynowych procedur,
Czy pracownicy wierz, e nikt nie bdzie ich kara za bdy i e
zostan one potraktowane jako szansa na nauczenie si czego
nowego,
Czy pracownicy staraj si doskonali umiejtnoci pracy
zespoowej, aby poprawi jako produktw i usug.
Pomiar wiedzy na poziomie strategicznym
Strategiczne plany zarzdzania wiedz okrelaj
podstawowe zasoby wiedzy organizacji, ktre tworz
optymalny zestaw jej kompetencji. Ocena zasobw
wiedzy dla celw strategicznych musi uwzgldnia
zmiany dotyczce kluczowych kompetencji firmy.
Ze strategicznego punktu widzenia ocena zasobw
wiedzy powinna uwzgldnia zmiany jakie zaszy w
kompetencjach firm konkurencyjnych. Benchmarking
strategiczny pozwala ustali, czy kompetencje
przedsibiorstwa mona uzna za najlepsze w swojej
klasie.
Pomiar wiedzy na poziomie strategicznym
duy
may
Stopie znaczenia
zasobw wiedzy
dla przewagi
konkurencyjnej
may
duy
Stopie wykorzystania
zasobw wiedzy
Kompetencje niewykorzystane
Czy mona je wykorzysta ?
W jakich obszarach?
Kompetencje nieistotne
Czy zastosowa autsourcing?
Jakie bd koszty zatrzymania
kompetencji?
Jakie bd korzyci z autsourcingu?
Kompetencje wyjtkowe
Czy naley je
rozpowszechnia?
W jakich obszarach?
Kompetencje podstawowe
Czy zadbano o ich zachowanie?
Jaki jest koszt zwikszenia ich
wartoci?
Pomiar wiedzy na poziomie operacyjnym

Pomiar na poziomie operacyjnym to pomiar
stopnia realizacji okrelonych celw.

Coaching i mentoring indywidualne
podejcie do kontrolowania postpw
pracownikw.
Wdraanie zarzdzania wiedz struktury
organizacyjne
Organizacje hipertekstowe, Ikujiro Noaka,
Wspistnienie trzech poziomw strukturalnych: poziomu
systemu biznesowego, poziomu zespow projektowych oraz
poziomu zasobw wiedzy.
Przykad BASF - wczono zesp ds. zarzdzania wiedz do
istniejcego dziau badawczego. Zadaniem zespou byo
oszacowanie potencjalnych korzyci z zarzdzania wiedz i
ustalenie jakie dziaania naley podj w pierwszej kolejnoci.
Menederowie ds. Zarzdzania wiedz
Dyrektor ds. Zarzdzania wiedz,
Specjalista ds. Obszarw kompetencji,
Specjalista ds. Koordynacji midzy obszarami kompetencji,
Specjalista ds. Przejrzystoci wiedzy.

Business Intelligence (BI)

Business Intelligence (BI) mona
zdefiniowa jako "szeroki wachlarz aplikacji i
technologii sucych do zbierania,
eksploracji, interpretacji i analizy danych,
ktry prowadzi do usprawnienia i
zracjonalizowania procesu podejmowania
decyzji.

Business Intelligence (BI)
Cztery podstawowe rda koncepcji i narzdzi BI to:
Statystyka i ekonometria, w tym midzy innymi statystyczna
teoria rozpoznawania obrazw, metody taksonometryczne,
wnioskowanie statystyczne oraz metody prognozowania,
Badania operacyjne, w tym midzy innymi programowanie
liniowe, teoria decyzji oraz teoria gier,
Sztuczna inteligencja, w tym midzy innymi metody
przeszukiwania heurystycznego, maszynowe uczenie si,
systemy ekspertowe, algorytmy genetyczne, sztuczne sieci
neuronowe, i systemy wnioskujce na podstawie analogii,
Technologie baz danych, w tym midzy innymi modelowanie
danych, jzyki zapyta, optymalizacja zapyta oraz metody
indeksowania.

Business Intelligence (BI)
Bussines Intelligence znajduje si w centrum stosowanych w organizacji rozwiza
informatycznych, stanowi jakby spoiwo a zarazem rozszerzenie moliwoci wykorzystania ju
istniejcej rozwiza informatycznych w organizacji
Analiza
rynku
Analiza finansowa
ERP
CRM
Analiza sprzeday
Strategiczna karta wynikw
Budetowanie
Technologie
Bussiness Intelligence
Piramida Business Intelligence

Hurtownie danych

W. H. Inmon - twrca koncepcji hurtowni danych (tzw. Data
Warehousing)
Centralne repozytorium wszystkich istotnych danych,
ktre s gromadzone przez poszczeglne systemy
biznesowe przedsibiorstwa".

Dane pochodzce z rnych aplikacji OLTP i innych rde s
selektywnie wydobywane i organizowane w hurtowni danych w
celu wykorzystania ich przez aplikacje analityczne i zapytania
uytkownikw.

Data Mart - wycinek hurtowni danych, skoncentrowany na
okrelonej czci biznesu, np. na konkretnym dziale. Np. dzia
sprzeday P&G kopiuje dane z hurtowni i tworzy Data Mart,
ktry zawiera tylko dane potrzebne do analizy dokonywanej w
tym dziale.

Hurtownie danych

W procesie tworzenia i dziaania hurtowni danych mona
wyrni trzy podprocesy okrelane czsto w skrcie jako ETL
(Extraction, Transformation and Loading).

Extraction - dane s wydobywane z jednego lub wielu rde i
kopiowane do hurtowni; czsto rdem danych s systemy
przetwarzania transakcji.
Transformation - dane s nastpnie transformowane -
konwertowane do jednego formatu, agregowane, ujednolicane.
Jest to najistotniejszy etap procesu przenoszenia danych ze
rde operacyjnych do hurtowni danych.
Loading - adowanie do hurtowni - po wydobyciu
i oczyszczeniu dane umieszczane s w hurtowni.

Hurtownie danych
Powody budowania hurtowni danych:
Przeprowadzanie analiz biznesowych bez ingerencji w
operacyjn prac systemw transakcyjnych (OLTP),
Caociowy wgld w dane firmy, tzn. moliwo integracji
danych z rnych rde, dajca peniejszy obraz zdarze
gospodarczych zachodzcych w przedsibiorstwie,
Dostp do danych historycznych,
Ujednolicenie posiadanych informacji, poprawne wdroenie
hurtowni danych wymusza ujednolicenie poj i sprawia, e
wynikowe wskaniki s tak samo interpretowane w rnych
dziaach firmy i w jednolity sposb obliczane (niweluje to tzw.
problem wielu wersji prawdy firmy).
Systemy pytajco-raportujce Q&R

Systemy pytajco-raportujce "Q&R, s najbardziej
podstawowym narzdziem analizy danych zawartych w
hurtowniach danych.
W latach siedemdziesitych minionego stulecia, miay one
posta tzw. >>twardych<< raportw. Obecnie uytkownicy
systemw BI maj duy wachlarz narzdzi do wizualizacji,
biecego przetwarzania danych, ktre mog formatowa
wybrane dane, tworzy wykresy, dry, dokonywa
wszelakich przekrojw, wzbogaca, eksportowa i
dystrybuowa te dane. Narzdzia typu Queries and report
uzupeniaj systemy odpowiadajc na pytania >>co si
stao?<< stawiane czsto przez zarzd. Np. >>jaki poziom
osigna sprzeda w danym miesicu i jak si ma w
porwnaniu do poprzedniego.<<"
Narzdzia Query and Reports s pierwowzorem narzdzi
OLAP i Data Minig.


OLAP
The OLAP Council definiuje OLAP nastpujco:
On-Line Analitycal Processing (OLAP) jest to
technologia oprogramowania, ktra pozwala
analitykom i managerom sprawnie przeglda
dane dziki szybkiemu, dostpowi do szerokiego
zakresu moliwych postaci informacji, ktre
zostay utworzone z surowych danych w celu
odzwierciedlenia zachowa otoczenia organizacji
w sposb zrozumiay dla uytkownika.


OLAP
Technologia OLAP pozwala uytkownikom
przeprowadza kompleksowe analizy danych
poprzez szybki dostp do wielowymiarowych
widokw przedsibiorstwa. OLAP umoliwia nie
tylko znalezienie odpowiedzi na pytania, "kto?", "co?"
i "kiedy?", ale rwnie "co jeli?" i "dlaczego?".
Aplikacje OLAP pozwalaj na prognozowanie
przyszoci na podstawie danych historycznych.
Kluczowym wskanikiem dobrej aplikacji OLAP jest
dostarczenie potrzebnej informacji w jak najkrtszym
czasie.

OLAP
Oprogramowanie tego typu oferowane
jest na rynku przez rne firmy, m.in.
Hyperion Solutions (Hyperion
EssBase), IBM (DB2 OLAP Server),
Microsoft (Microsoft OLAP Services),
Cognos (PowerPlay Transformation
Server), Oracle (Express OLAP).

Data Mining
Data Mining czyli eksploracja danych suy do wykrywana wzorcw i
powiza pomidzy danymi zawartymi w hurtowni danych.

Data Minig jest to proces odkrywania i analizy, automatycznie lub
pautomatycznie, duych iloci danych w celu odkrywania
znaczcych wzorcw i regu. (M. J. A. Berty i G. Linoff.: Data Mining
Techniques for Marketing, Sales and Customer Suport, USA, 1997)

Wedug Gartner Group jest to: "proces odkrywania istotnych
zalenoci (korelacji), wzorcw i tendencji poprzez analiz duych
iloci danych przechowywanych w repozytoriach za pomoc
technik rozpoznawania wzorcw oraz technik statystycznych i
matematycznych"

Analiza danych majca na celu wykrycie wzorcw
a przez to wzbogacenie wiedzy czowieka.

Data Mining - Eksploracja danych

Data Mining czy w sobie trzy
niezalene dyscypliny: technologi
baz danych, statystyk oraz nurt
bada nad sztuczn inteligencj.
Data Mining - Eksploracja danych
Techniki
bazodanowe
Statystyka
Sztuczna
inteligencja
DATA MINING
DATA MINING
Odkrywanie wiedzy - proces










Bazy danych Hurtownie
danych
Przygotowane
dane
Wzorce
Ewaluacja i
prezentacja
Czyszczenie i

integracja
Wiedza
Wybr i
transformacja

danych
Data Mining
Odkrywanie wiedzy - proces
Odkrywanie wiedzy jako proces skada si z wielokrotnych
sekwencji nastpujcych krokw:
Czyszczenie danych w celu usunicia szumu oraz niepenych
danych
Integracja danych czenie danych z rnych rde
Wybr danych selekcja istotnych danych z baz danych w celu
analizy
Transformacja danych przetwarzanie danych do postaci
waciwych dla eksploracji danych
Data Mining proces w ktrym uywajc metod opartych na
statystyce oraz sztucznej inteligencji wydobywa si wzorce z
danych
Ewaluacja danych identyfikacja interesujcych nas wzorcw
Prezentacja wiedzy zaprezentowanie odkrytej wiedzy
uytkownikowi

Data Mining - Eksploracja danych
Najczciej spotykanym sposobem podziau technik eksploracji
danych jest ich rozrnienie ze wzgldu na cel przeprowadzonej
analizy danych. Na podstawie takiego kryterium wyrniamy
dwa gwne nurty, mianowicie:

odkrywanie wiedzy (ang. knowledge discovery)
wyszukiwanie wzorcw opisujcych dane. Opisy takie, w
postaci modeli deskrypcyjnych, s czsto uywane do
wspomagania procesw decyzyjnych.
prognozowanie (ang. prediction).
uzyskania przyszych wartoci zmiennych poddanych analizie

Data Mining - Eksploracja danych

Odkrywanie wiedzy (ang. knowledge
discovery najczciej wykorzystuje
nastpujce metody:
grupowanie (clustering),
klasyfikowanie (classification),
kojarzenie (association),
drzewa decyzyjne (decision trees).
Data Mining - motywacje
Rozmiary wspczesnych systemw baz danych
Sie sprzeday Wal-Mart gromadzie dziennie dane dotyczce 20 milionw
transakcji,
rednie firmy ubezpieczeniowe obsuguj kilka milionw klientw,
Hurtownia danych koncernu Mobil-Oil pozwala przechowywa ponad 100
terabajtw danych,
Niewielkie supermarkety rejestruj dziennie sprzeda tysicy artykuw.
Wielkie wolumeny danych s trudne w
analizowaniu,
Dane o dotychczasowej dziaalnoci
przedsibiorstwa, poziomie i strukturze
sprzeday oraz cechach klientw mog by
bardzo uyteczne w procesie podejmowania
decyzji.


Klasyfikacja
Klasyfikacja polega na odwzorowywaniu danych w
zbiory predefiniowanych klas. Na podstawie baz danych
budowany jest model, ktry suy do klasyfikowania
nowych obiektw lub te do zrozumienia ju
istniejcych klas. Przykadowe zadania stawiane przed
klasyfikacj to:
ocena stopnia ryzyka przyznania kredytu
hipotecznego,
diagnoza wystpienia danej choroby,
rozpoznawanie trendw na rynkach finansowych,
automatyczne rozpoznawanie obiektw w bazach
danych.
(wg Daniel T Larose)
Grupowanie
Grupowanie, inaczej klastrowanie polega na grupowaniu
rekordw, obserwacji lub przypadkw do odpowiednich
klas opisujcych dane. Klasa jest zbiorem danych, ktre
s podobne do siebie nawzajem i niepodobne do danych
z innych klas. Przykady zada grupowania obejmuj:
segmentacj rynku,
identyfikacj relatywnie jednorodnych grup nabywcw w
celu lepszego zrozumienia reakcji (zachowa) nabywcw,
oceny pozycji produktu (przedsibiorstwa) na rynku na tle
produktw (przedsibiorstw) konkurencyjnych,
okrelenia struktury rynku, identyfikacji relatywnie
jednorodnych rynkw dla testowania produktw,
redukcj wymiarw, gdy zbir danych jest zbyt duy,
podzia zachowa finansowych na korzystne i
niekorzystne.
(wg Daniel T Larose)
Sieci neuronowe w grupowaniu
obiektw

W procesie grupowania obiektw stosowane
by mog tzw. samoorganizujce si
sieci Kohonena. S one szczeglnym
rodzajem sztucznych sieci neuronowych

Grupowanie obiektw - Sieci Kohonena

Sieci Kohonena realizuj uczenie w trybie bez
nauczyciela (bez nadzoru). Sieci uczce si
bez nauczyciela w trakcie uczenia opieraj
si wycznie na obserwacji danych
wejciowych. Sieci te ucz si rozpoznawania
skupie wystpujcych w zbiorze
nieskategoryzowanych (nie podzielonych na
adne klasy) danych uczcych.
Sieci Kohonena

W sieci Kohonena poszczeglne neurony
identyfikuj i rozpoznaj poszczeglne skupienia
danych.
W sieci Kohonena przebiega specyficzny proces
samouczenia nazywany czsto samoorganizacj. W
wyniku tej samoorganizacji zblione do siebie
skupienia danych reprezentowane s (po
zakoczeniu procesu nauki) przez pooone blisko
siebie neurony warstwy wyjciowej, co powoduje, e
neurony te tworz map topologiczn danych
wejciowych.
Sieci Kohonena


Sie Kohonena jest jednym z najbardziej znanych typw
sieci neuronowej uczonej w trybie bez nauczyciela.
Sie o bardzo prostej strukturze posiada tylko dwie
warstwy, a przepyw informacji w sieci jest
jednokierunkowy.
Neurony pierwszej warstwy praktycznie nie dokonuj
przetwarzania danych posiadaj one pojedyncze
wejcia i jedynym ich zadaniem jest rozesanie (poprzez
ich wyjcia) do wszystkich neuronw drugiej warstwy
wszystkich wartoci wprowadzonych na wejcia
(poczenie kady z kadym).
Funkcjonalno sieci Kohonena zapewniaj wycznie
neurony warstwy drugiej (wyjciowej).
Sieci Kohonena schemat neuronu



x
1
x
2
x
n
w
1
w
2
w
n
( ) q y w x q
n
i
i i
= =

=1
2
y

Schemat neuronu wykorzystywanego w warstwie wyjciowej sieci Kohonena
Sieci Kohonena
Zagregowana warto wejciowa obliczana
jest jako kwadrat odlegoci Euklidesa
pomidzy wektorem wartoci wejciowych (x)
a wektorem wspczynnikw wagowych (w).
W neuronach sieci Kohonena stosowana jest
te specyficzna funkcja aktywacji. Jest ni
funkcja wyznaczajca warto pierwiastka
kwadratowego.
Warto uzyskiwana na wyjciu neuronu jest
wic odlegoci Euklidesow pomidzy
wektorami x i w.
Struktura sieci Kohonena
Istotnym elementem architektury sieci Kohonena jest
rozmieszczenie neuronw warstwy wyjciowej. Zwykle s one
umieszczone na paszczynie.

Schematj sieci Kohonena
Struktura sieci Kohonena

Najpierw ustala si struktur warstwy
wyjciowej, okrela si w jaki sposb
rozoone s wchodzce w jej skad
neurony.
W czasie uczenia sieci zmieniaj si
wartoci wag neuronw wyjciowych, nie
zmieniaj si natomiast zalenoci
ssiedzkie.

Struktura sieci Kohonena
Sie heksagonalna Struktura prostoktna
Sieci Kohonena ssiedztwo
Pojcie ssiedztwa w sieci Kohonena

Dotyczy ono wzajemnych relacji rozmieszczonych w
przyjty sposb neuronw, wchodzcych w skad
warstwy wyjciowej sieci.
Przyjte tutaj pojcie ssiedztwa nie odbiega w
swoim znaczeniu od intuicyjnego znaczenia
przypisywanego temu sowu - za ssiadw pewnego
wybranego neuronu uznaje si inne neurony
znajdujce si w jego bliskoci. Zasig ssiedztwa
definiowany jest przez tzw. promie ssiedztwa.
Sieci Kohonena ssiedztwo
Sieci Kohonena uczenie w trybie bez
nauczyciela

Wykorzystywany jest zbir uczcy
obejmujcy wycznie wartoci zmiennych
wejciowych i nie zawiera adnych
wiadomoci dotyczcych wartoci
oczekiwanych na wyjciu.
Uczenie ma charakter iteracyjny zbir
uczcy jest wielokrotnie prezentowany sieci.
Sieci Kohonena uczenie w trybie bez
nauczyciela
Uczenie rozpoczyna si od losowych, zwykle
skupionych wok zera wartoci
wspczynnikw wagowych.
W trakcie uczenia sieci prezentowane s
kolejne wzorce uczce. Kady neuron drugiej
warstwy okrela swj sygna wyjciowy, przy
czym sygna ten jest rwny odlegoci
euklidesowej pomidzy wprowadzonym
wektorem wartoci wejciowej a wektorem
wag rozwaanego neuronu.
Sieci Kohonena uczenie w trybie bez
nauczyciela
Nadrzdny algorytm uczcy
porwnuje wartoci wyznaczone na
wyjciach poszczeglnych neuronw i
wybiera ten neuron, dla ktrego
wyznaczona warto jest najmniejsza.
Wyznaczony w ten sposb neuron
jest okrelany neuronem zwyciskim.
Sieci Kohonena uczenie w trybie bez
nauczyciela
Modyfikacja wag neuronu zwyciskiego
zasadniczy etap procesu uczenia

Modyfikacja wag przeprowadzana jest tak aby
wektor zwyciski jeszcze bardziej przybliy si do
wprowadzonego aktualnie wektora wejciowego.
Jeli przyjmiemy, e wektor wag neuronu
zwyciskiego jest rwny w
zw
za wektor wejciowy
oznaczymy przez x to mona wyznaczy wektor r:

zw
w x r =
Sieci Kohonena uczenie w trybie bez
nauczyciela
Modyfikacja wag przebiega zgodnie ze wzorem:




gdzie:
|-wspczynnik uczenia przyjmujcy wartoci z przedziau (0,1)
Przeprowadzajc obliczenia stosuje si najczciej zmienne
wspczynniki |. W pocztkowych okresach jego warto
ustala si na stosunkowo wysokim poziomie (np. 0,8). W
czasie dalszego treningu warto wspczynnika jest
stopniowo zmniejszana do bardzo maej wartoci (np. 0,001).
r w w
t
zw
1 t
zw
+ =
+
Sieci Kohonena uczenie w trybie bez
nauczyciela
Modyfikacja wag jest przeprowadzana nie tylko dla
neuronu zwyciskiego ale take dla jego ssiadw.
Liczba neuronw modyfikowanych w czasie uczenia
jest okrelona przez obowizujcy w danej chwili
promie ssiedztwa.
W pocztkowej fazie uczenia promie ssiedztwa
jest tak ustalony, aby niezalenie od lokalizacji
neuronu zwyciskiego, jego ssiedztwo obejmowao
wszystkie neurony warstwy wyjciowej sieci (co
powoduje, e modyfikowane s zawsze wszystkie
neurony).
W czasie procesu uczenia promie ssiedztwa
stopniowo si zmniejsza a do wartoci zerowej.
Wwczas modyfikowany jest tylko neuron zwyciski.

Sieci Kohonena uczenie w trybie bez
nauczyciela
Sposb uczenia ssiadw
Dwa podejcia:
Neurony nalece do aktualnie obowizujcego
ssiedztwa uczone s w ten sam sposb co
neuron zwyciski.
Przy uczeniu ssiadw zachowany jest kierunek
zmian wyznaczony dla neuronu zwyciskiego,
natomiast wraz z oddalaniem si ssiada od
neuronu zwyciskiego maleje wielko
wprowadzanych zmian. W takim przypadku wektor
poprawek mnoony jest przez zmniejszajcy si
stopniowo wspczynnik ssiedztwa.
Sieci Kohonena

Niezalenie od zastosowanych szczegw
implementacyjnych algorytmu Kohonena,
prowadzi on do dopasowania si siatki
utworzonej przez warstw wyjciow sieci do
obiektw uczcych.
Sie Kohonena zachowuje informacj o
zalenociach pomidzy zidentyfikowanymi
grupami obiektw. W efekcie ssiadujce ze
sob neurony odpowiadaj podobnym do
siebie grupom danych, za neurony oddalone
od siebie odpowiadaj grupom oddalonym.

Sieci Kohonena

Z uwagi na opisan zdolno sieci
Kohonena do reprezentowania
informacji o strukturze zbioru
obiektw jej warstwa wyjciowa
nazywana jest niekiedy map
topograficzn lub map
topologiczn.

Grupowanie algorytmy genetyczne
Istotnym zagadnienie w przypadku wykorzystania
algorytmw genetycznych dla grupowania jest
problem reprezentacji rozwiza.
Generalnie mona wyrni kilka sposobw
reprezentacji:
Group number,
Matrix,
Permutatiom with the seperator,
Order-based.


Grupowanie metody prezentacji rozwiza

Przykad
{(X
1
,X
3
,X
6
), (X
2
,X
4
,X
5
)}

Kolejne grupy oznaczane s przez 1 i 2
Sze obiektw grupowania oznaczonych jest przez
1 do 6.
Metody reprezentacji - group number
1 2
1 2
2 1
Metody reprezentacji - matrix
1 0
1 0
0 1
0 1 0
1
1
0
Metody reprezentacji-permutation with the
seperator
1 3
6 7
2 4
5
Metody reprezentacji- order-based
1 3
6 2
4 5
Algorytmy genetyczne - funkcja dopasowania
Funkcje okrelajce odlego obiektw wykorzystywane
w statystycznych metodach klasyfikacji mog by
zastosowane w przypadku wykorzystania AG do
grupowania obiektw.
Dokonuje si tutaj zazwyczaj pewnych transformacji.
Np. Bhayan uywa jako funkcji dopasowania sumy
odlegoci Euklidesowej obiektw w grupie od ich rodka
cikoci. Ta warto jest nastpnie transformowana:
f= C
max
-f, gdzie f jest wspomnian powyej miar a
C
max
jest najgorsz wartoci w populacji.
Cucchiara stosuje take jako funkcj dopasowania sum
odlegoci Euklidesowej obiektw w grupie od ich rodka
cikoci ale modyfikuje algorytm tak aby minimalizowa
funkcje dopasowania.
Algorytmy genetyczne operatory
genetyczne- populacje pocztkowe
Group number
Dla kolejnych obiektw losowane s przynalenoci
do poszczeglnych klas 1..k. Taki sposb moe
spowodowa, e do ktrej klasy nie bdzie
zakwalifikowany aden obiekt. Takie chromosomy s
usuwane.
Permutation with separators
Generuj losowo permutacje obiektw
Generuj losowo pooenia separatorw
Utwrz chromosomy



Algorytmy genetyczne operatory
genetyczne- populacje pocztkowe



Matrix
Generowane losowo przynalenoci obiektw
Order-based
Generowane losowo permutacje obiektw




Algorytmy genetyczne selekcja
Wybr osobnikw do rekombinacji bazuje na
funkcjach przystosowania. Jeeli wszystkie
funkcje dopasowania s dodatnie
i maksymalna funkcja dopasowania okrela
optymalny schemat grupowania wwczas
selekcja proporcjonalna jest odpowiednia.
Alternatywnie stosowane s rwnie selekcje
oparte na nadawaniu rang oraz selekcja
elitarna.

Algorytmy genetyczne krzyowanie


Group-number
Stosowane jest w tym przypadku krzyowanie
jednopunktowe lub jednolite. Mog tutaj powstawa
rozwizania niedopuszczalne. Takie rozwizania s
albo odrzucane albo stosowane s mechanizmy
naprawiania tych rozwiza.



Algorytmy genetyczne krzyowanie
1 2 2 1 2 1 1 2 2 1 2 1
Rodzice Rodzice
2 1 2 1 1 2 2 1 2 1 1 2
1 2 2 1 1 2 2 1 2 1 2 1
Potomkowie Potomkowie
2 1 2 1 2 1 1 2 2 1 1 2
miejsce cicia
Algorytmy genetyczne krzyowanie


Matrix
Alipi and Cucchiara wykorzystywali krzyowanie
punktowe
Algorytmy genetyczne krzyowanie
Punkt krzyowania
0 0 0 0 0 1 0 0
0 1 1 0 1 0 0 0
1 0 0 1 0 0 1 1
0 0 0 1 0 0 1 1
0 1 1 0 1 0 0 0
1 0 0 0 0 1 0 0
Algorytmy genetyczne krzyowanie
Rodzic 1 Rodzic 2
1 0 1 0 0 1 0 0 0 1 0 1 0 0
0 1 0 0 1 0 0 1 0 0 0 0 0 1
0 0 0 1 0 0 1 0 1 0 1 0 1 0
Punkt krzyowania
z odlegoci 2
Potomek 1 Potomek 2
1 0 1 0 1 0 0 0 0 1 0 0 1 0
0 1 0 0 0 0 0 1 0 0 0 1 0 1
0 0 0 1 0 1 1 0 1 0 1 0 0 0
Algorytmy genetyczne krzyowanie

Permutation with separators
Tutaj wykorzystywane s dwie
metody krzyowania PMX
(partially mapped crossover) lub
OX (order based crossover).


Algorytmy genetyczne krzyowanie PMX
Rodzice
Pokolenie
1 2 3 4 5 6
4 5 1 3 6 2
1 2 1 3 5 6
4 5 3 4 6 2
1 3 3 4
3 1 4 3
4 2 1 3 5 6
1 5 3 4 6 2
4
3
3
1
7
7
7
7
7
7
Algorytmy genetyczne krzyowanie OX
Rodzice
Pokolenie
1 2 3 4 5 6
4 5 1 3 6 2
1 3
3 4
5 6 2 4
2 4 1 3 5 6
5 1 3 4 6 2
6 2 5 1
7
7
7
7
7
7
Algorytmy genetyczne krzyowanie



Order based
Bhayan i inni przedstawiaj dwa typy
operatorw krzyowania dla tej reprezentacji
Algorytmy genetyczne krzyowanie
Dominujcy rodzic 5 3 8 1 2 7 6 4
Wspomagajcy rodzic 6 5 1 2 4 7 8 3
{5, 1, 2, 7, 4}
od dominujcego
rodzica 5 1 2 7 4
{3, 8, 6}
Potomek 3 8 5 1 2 7 4 6
Algorytmy genetyczne krzyowanie
Rodzic 1 5 3 8 1 2 7 6 4
Wybierz z
Rodzic 2 6 5 1 2 4 7 8 3 {5, 6}
6 Wybierz z
{7, 4, 5}
6 7 Wybierz z
{2, 4, 8}
Potomek 6 7 2 4 8 1 5 3
Algorytmy genetyczne mutacja
Group number
Kady bit jest zmieniany np. z prawdopodobiestwem
1/n gdzie n jest liczb obiektw.

Matrix
Alippi i Cucchiara stosuj mutacje kolumn.
Przeznaczony do mutacji element w kolumnie jest
wybierany losowo. Jeli jego warto jest 0
zmieniana jest na 1. Wszystkie pozostae elementy w
kolumnie zamieniane s na 0. Kiedy element ma
warto 1 nie wykonuje si adnych dziaa.

Algorytmy genetyczne mutacja
Permutation with separators
Jones and Beltramo losowo wybieraj dwa
elementy chromosomu i zamieniaj je.

Order-based
Bhuyan proponuje tu dwa operatory mutacji.
Pierwszy przesuwa losowo wybrany element
do losowo wybranego miejsca. Drugi
przesuwa wybrany obiekt tylko wtedy gdy
poprawia to warto funkcji dopasowania.
Grupowanie algorytmy genetyczne -
przykad
Lin Yu Tseng i Shiueng Bien Yang z National
Chung Hing University w Tajwanie,

A genetic approach to the automatic
clustering problem

Pattern Recognition 34/2001
Grupowanie algorytmy genetyczne -
przykad
Algorytm skada si z dwch gwnych
czci:
z czci wstpnej, majcej za
zadanie zredukowanie iloci danych i
w efekcie przyspieszenie
wykonywania czci drugiej (iteracji),
waciwego algorytmu genetycznego,
w ramach ktrego dokonuj si
kolejne iteracje.
Grupowanie algorytmy genetyczne -
przykad

Cz pierwsza (wstpna) to
jedna z wersji metody najbliszego
ssiedztwa (single linkage).
Wykonywana jest ona w czterech
krokach
Grupowanie algorytmy genetyczne -
przykad
Krok 1: Dla kadego obiektu O
i
mierzona jest odlego tego
obiektu od jego najbliszego ssiada:

||O
j
-O
i
|| to odlego Euklidesowa pomidzy obiektami O
j
i O
i
.


Krok 2: Wyliczana jest minimalna odlego rednia d
av
:

a na jej podstawie parametr d:

warto parametru d jest zalena od przyjtej wielkoci
konfigurowalnego parametru u (zalecana warto u pomidzy
1,0 a 2,0).
i j
i j
i NN
O O ) O ( d
min
=
=

=
=
d
k
k , j k , i i j
) O O ( O O
1
2
) O ( d
n
d
i
n
i
NN av
=
=
1
1
av
d * u d =
Grupowanie algorytmy genetyczne -
przykad
Krok 3: Tworzony jest graf o n wzach (kady obiekt
reprezentowany jest przez wze) i wyliczana jest
macierz przylegania (adjacency matrix) A
n x n
, wg
wzoru:
dla

Krok 4: Wyszukiwane s poczone wzy grafu. Z
obiektw nalecych do poczonych wzw grafu
tworzone s nowe obiekty B

={B
1
, B
2
,B
m
}. rodki
cikoci obiektw B
i
oznaczane s jako V
i
.
Poniewa kady obiekt B
i
moe si skada z
jednego lub wicej obiektw O
i
, m n, czyli ilo
otrzymanych obiektw B
i
jest nisza ni w
wyjciowym zbiorze obiektw O
i
.

<
=
wypadku przeciwnym w
d O O jezeli
j i A
j i
, 0
, 1
) , ( n i j s s s 1
Grupowanie algorytmy genetyczne -
przykad

Cz druga (waciwy algorytm
genetyczny) operuje ju tylko na
zbiorze danych (obiektw) B
i

(wygenerowanych w czci
pierwszej).
Grupowanie algorytmy genetyczne -
przykad
Krok 1: Inicjalizacja. Generowana jest populacja N cigw binarnych. Dugo
kadego cigu wynosi m (ilo obiektw B
i
uzyskanych po wstpnej obrbce).
Cigi s generowane tak, aby ilo jedynek w poszczeglnych cigach miaa
rozkad rwnomierny w zakresie [1,m]. Kady cig odpowiada jednemu
sposobowi pogrupowania obiektw B
i.
Grupowanie to otrzymuje si metod
zblion do metody k-rednich. Kady element cigu odpowiada jednemu
obiektowi B
i
. Wszystkie jedynki w cigu (obiekty B
i,
dla ktrych odpowiadajce
im elementy cigu zawieraj 1) staj si zarodkami skupie. Nastpnie
wszystkie pozostae B
i
(zera), przyporzdkowywane s do poszczeglnych
skupie C
j
wybierane jest skupienie, ktrego rodek cikoci S
j
jest
najbliszy rodkowi cikoci obiektu B
i
(V
i
)
jeeli:
dla 1 k s i k j
Jeeli B
i
zostaje przyporzdkowane do skupienia Cj, rodek cikoci Sj jest
uaktualniany wg wzoru:



|Bi| jest tutaj liczebnoci obiektu Bi, czyli iloci obiektw Oi
,
z ktrych si B
i
skada.

j i
C B e
k i j i
S V S V s
i j
i i j j
'
j
B C
B * V C * S
S
+
+
=
i j
'
j
B C C + =
Grupowanie algorytmy genetyczne -
przykad
Krok 2: Selekcja. Aby dokona selekcji naley wyliczy
wartoci funkcji przystosowania dla wszystkich N czonkw
populacji. W tym celu, dla wszystkich skupie C
i
obliczane s
dwa wskaniki D
intra
i D
inter
:



e
=
i k
C B
k i k i ra int
B * S V ) C ( D

e
=
=
i k
C B
k j k
i j
i er int
B * ) S V min ( ) C ( D
Grupowanie algorytmy genetyczne -
przykad
Jeeli pojedynczy cig oznaczymy jako R
j
, to funkcja
przystosowania Fitness(R
j
) ma posta:


Parametr w to waga. Maa warto w skutkuje
zwikszeniem znaczenia parametru D
intra
i w efekcie
uzyskiwaniem wikszej iloci maych, kompaktowych
(zwartych) skupie. Odwrotnie dua warto w
eksponuje znaczenie parametru D
inter
i w efekcie
uzyskiwaniem mniejszej iloci duych skupie o luno
powizanych obiektach.

= ) C ( D w * ) C ( D ) R ( Fitness
i ra int i er int j
Grupowanie algorytmy genetyczne -
przykad
Jeli cig R zawiera same zera, jego przystosowanie (warto
funkcji przystosowania) zdefiniowane jest jako 0. Jeli R zawiera
tylko jedn jedynk D
inter
(C
i
) zdefiniowane jest jako 0.
Parametr D
intra
reprezentuje zrnicowanie obiektw wewntrz
rozpatrywanego skupienia (suma odlegoci euklidesowej
wszystkich obiektw nalecych do danego skupienia od rodka
cikoci tego skupienia), a D
inter
zrnicowanie obiektw
pomidzy skupieniami (suma odlegoci euklidesowej
wszystkich obiektw nalecych do rozpatrywanego skupienia
od rodka cikoci najbliszego z pozostaych skupie).
Majc wyliczon warto funkcji przystosowania dla wszystkich
N czonkw populacji (reprezentowanych przez N cigw
binarnych) dokonuje si selekcji za pomoc metody ruletki

Grupowanie algorytmy genetyczne -
przykad
Krok 3: Krzyowanie. Jeli para cigw R i Q zostaa
wylosowana (wyselekcjonowana) do reprodukcji,
generowane s dwie losowe liczby p i q z zakresu
[1,m]. Zakadajc, e p < q, bity od pozycji p do
pozycji q z cigu R bd wymienione z bitami z tych
samych pozycji w cigu Q. Dla kadej wylosowanej
pary cigw krzyowanie dokonywane jest z
prawdopodobiestwem P
c
( w przeciwnym wypadku
cigi te wprowadzane s wprost do nowej populacji).
Krok 4: Mutacja. W fazie mutacji bity wszystkich
cigw nalecych do nowej populacji s zamieniane
(z 0 na 1 i na odwrt) z prawdopodobiestwem P
m
.
Grupowanie rozmyte
Rodzaje rozmytych metod
grupowania:
rozmyta metoda k-rednich (fuzzy
c-means method - FCM)
algorytm Gustafsona-Kessela,
algorytm Gatha-Geva.

Zbiory rozmyte

Zbiory rozmyte s uoglnieniem zbiorw
klasycznych. W przypadku zbiorw rozmytych
element x moe nalee do rozmytego podzbioru
z pewnym stopniem przynalenoci.
Warto stopnia przynalenoci elementu do zbioru
zawarta jest midzy 0 element na pewno nie naley
a 1 element na pewno naley do zbioru. Funkcja
przynalenoci odgrywa tutaj rol funkcji
charakterystycznej klasycznego zbioru.
Zbiory rozmyte
Formalnie rozmyty podzbir
A
~

przestrzeni X jest to zbir par,
( ) ( ) { } X e = x : x x
A
~ , A
~
gdzie
[0,1] : X
A
~
jest
dowoln funkcj okrelon na X
nazywan funkcj przynalenoci
rozmytego podzbioru
A
~

Zbiory rozmyte
Zbir duych liczb mona traktowa jako zbir ostry;
wwczas, jeeli przyjmiemy, e funkcja ustala przynaleno
obiektw do zbioru moemy napisa:






jeeli stwierdzimy, e 20 to dua liczba to warto funkcji
przynalenoci do zbioru duych liczb
A
(20)=1
podobnie, jeeli uznamy, e 1 to nie jest dua liczba wwczas
funkcji przynalenoci do zbioru duych liczb
A
(1)=0

e
e
=
e
A x dla
A x dla
) x (
A
X x
0
1
Zbiory rozmyte
Zbir duych liczb mona traktowa jako zbir rozmyty;
wwczas, jeeli przyjmiemy, e funkcja ustala przynaleno
obiektw do zbioru moemy napisa:


Do opisu przynalenoci mona pod pewnymi warunkami uy
dowolnej funkcji, np.:


X)} x | (x) {(x, A DUZA_LICZB
A DUZA_LICZB
e =

>
+

s
=
1 x dla
x x
1) (x
1 x dla 0
(x)
2
2
A DUZA_LICZB
Zbiory rozmyte
Wwczas moemy stwierdzi, e stopie
przynalenoci liczby 20 do zbioru dua liczba
jest rwny:





8595 , 0
20 20
) 1 20 ( ) 1 (
) (
2
2
2
2
A DUZA_LICZB
=
+

=
+

=
x x
x
x
Zbiory rozmyte
Funkcj przynalenoci mona przedstawi
graficznie:
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 10 20 30 40 50
Zbiory rozmyte
Wszystkie operacje na zwykych zbiorach mog by
rozszerzone na zbiory rozmyte
Np. zawieranie zbiorw mona okreli nastpujco:
(x) (x) B
~
A
~
B
~
A
~
X x
s _
e
Liczby rozmyte

W opisie rzeczywistoci uywamy
czsto okrelenia w rodzaju okoo
2
Do ich reprezentacji uywa si
rnego rodzaju liczb rozmytych

Liczby rozmyte
Przykad okoo 2



0,33
| 4 2 | 1
1
(4)
0,50
| 3 2 | 1
1
(3)
| x 2 | 1
1
(x)
2 okolo
2 okolo
2 okolo
=
+
=
=
+
=
+
=
Liczby rozmyte

Liczba rozmyta A
~
jest trapezow liczb rozmyt
jeli jej funkcja przynalenoci przyjmuje posta:

|
.
|

\
|
e

e
e

> <
=
] [ x dla
x
] [ x dla 1
] [ x dla
- x
x dla x dla 0
3 4
3 4
3 2
2
2
4
a , a
a a
a
a , a ,
a , a
a a
a
a i a
x
4
1
1
1
1
A

Liczby rozmyte
Przykad liczby trapezowej:
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,5 1 1,5 2 2,5 3
Zbiory rozmyte - definicje
Dubois i Prade przedstawiaj kilka interpretacji funkcji przynalenoci zbioru rozmytego. Warto
stopnia przynalenoci moe by interpretowana jako:
- Stopie podobiestwa. W tym przypadku przez ( ) x
A
~
rozumie si miar bliskoci elementu x do
prototypu (wzorca) zbioru rozmytego A
~

Taka interpretacja jest istotna na przykad w metodach
rozmytego grupowania obiektw. Warto funkcji przynalenoci wyraa stopie podobiestwa do
prototypu grupy.
- Stopie preferencji. W tym przypadku zbir rozmyty A
~
przedstawia zbir bardziej lub mniej
preferowanych obiektw. Funkcja przynalenoci
A
(x) reprezentuje tutaj stopie preferencji
dotyczcy obiektu x.
- Stopie niepewnoci. W tym przypadku funkcja przynalenoci
A
(x) przedstawia stopie
moliwoci, e zmiennej x przypisana zostanie warto x
o
, gdy jedyn wiedz jak posiadamy jest
stwierdzenie x jest A
~

. Powysza interpretacja zbiorw rozmytych zostaa przedstawiona przez
Zadeha. Zadeh definiuje tam pojcie rozkadu moliwoci.
Grupowanie rozmyte
J. C. Dunn (1973): "A Fuzzy Relative of the
ISODATA Process and Its Use in Detecting
Compact Well-Separated Clusters", Journal
of Cybernetics 3: 32-57
J. C. Bezdek (1981): "Pattern Recognition
with Fuzzy Objective Function Algoritms",
Plenum Press, New York
Grupowanie rozmyte
FCM (Fuzzy c-means) to iteracyjna metoda,
ktrej idea jest bardzo zbliona do klasycznej
metody k-rednich.
Celem metody jest znalezienie takich
rodkw cikoci klas, ktre minimalizuj
funkcj:



2
1 1
ij
c
i
n
j
m
ij m
d J

= =
=

- stopie przynalenoci j-tego obiektu do i-tej klasy rozmytej
ij
d
- odlego euklidesowa pomidzy rodkiem cikoci i-tej klasy a j-tym
obiektem,
m - parametr rozmycia (fuzzificiation parametr), przy czym m>1

ij

Fuzzy c-means method - algorytm


Krok 1. Losowe zainicjowanie macierzy przynalenoci przy czym


Krok 2 Obliczenie rodkw cikoci klas zgodnie ze wzorem:






Krok 3 Obliczenie nowej macierzy przynalenoci

Jeeli gdzie
to odlego euklidesowa a to przyjty prg zbienoci, wwczas
naley przyj i przej do kroku 2. Postpowanie koczy si w sytuacji
gdy lub zostanie osiagnita zadana liczba iteracji k.

1 =

=
c
i
ij

1
ij
U =
1,2,...n j =

=
=
=
n
j
m
ij
n
j
j
m
ij
i
x
c
1
1

|
|
.
|

\
|
=
c
k
m
kj
ij
ij
d
d

1
1
2
1
nowe
U
U U
nowe
>
U U
nowe


nowe
U U =
U U
nowe
s
Fuzzy c-means method- algorytm
Przed rozpoczciem oblicze naley okreli
stosowan miar odlegoci, liczb klas oraz warto
parametru rozmycia m.
Parametr m okrela stopie rozmycia wynikw
klasyfikacji. Warto parametru powinna by m>1,
przy czym wartoci bliskie jednoci skutkowa bd
otrzymaniem wynikw bliskich do tych, ktre
zostayby uzyskane przy zastosowaniu metod
klasycznych. Wzrost wartoci parametru m powoduje,
e stopnie przynalenoci obiektw do
poszczeglnych klas bd przyjmoway wartoci
zblione do odwrotnoci liczby klas.
Naiwny klasyfikator Bayes'a
W myl teorii Bayes'a, najbardziej
prawdopodobn klas, do ktrej naley
przypisa nowy obiekt, opisany wartociami
n-atrybutw warunkowych A
j1
= v
j1
, A
j2
= v
j2

A
jn
= v
jn
(lub w skrcie <v
j1
, v
j2
v
jn
>, jest
klasa d
i
, ktra maksymalizuje
prawdopodobiestwo warunkowe
P(d
i
| v
j1
, v
j2
v
jn
). Klasa ta oznaczona jest
jako d
MAP
(maximum a posterori).
Naiwny klasyfikator Bayes'a
( )
( ) ( )
( )
( ) ( )
i i jn j j
V d
jn j j
i i jn j j
V d
jn j j i
V d
MAP
d P d v v v P
v v v P
d P d v v v P
v v v d P d
D i
D i
D i
| , max arg
,
| ,
max arg
, | max arg
2 1
2 1
2 1
2 1

e
e
e
=
=
=
V
D
oznacza dziedzin atrybutu decyzyjnego (czyli zbir
klas decyzyjnych). W ostatniej linii usunito mianownik
prawdopodobiestwo P(v
j1
, v
j2
v
jn
) ma warto sta,
niezalen od klasy decyzyjnej d
i
, wic nie ma ono
wpywu na wybr klasy d
MAP
.
Naiwny klasyfikator Bayes'a
Prawdopodobiestwo P(d
i
) mona oszacowa w
prosty sposb jako stosunek liczby przykadw
uczcych nalecych do klasy d
i
do liczby wszystkich
przykadw uczcych.
Oszacowanie prawdopodobiestwa
P(v
j1
, v
j2
v
jn
/ d
i
) w analogiczny sposb (tzn. jako
stosunek liczby przykadw uczcych opisanych
wartociami atrybutw warunkowych <v
j1
, v
j2
v
jn
> i
nalecych do klasy d
i
do liczby wszystkich
przykadw uczcych z klasy d
i
) jest dopuszczalne
jedynie dla bardzo duych zbiorw przykadw
uczcych.
Naiwny klasyfikator Bayes'a
Aby umoliwi atwe oszacowanie prawdopodobiestwa
P(v
j1
, v
j2
v
jn
| d
i
), w naiwnym klasyfikatorze Bayes'a
wprowadzono zaoenie o warunkowej niezalenoci wartoci
atrybutw przy ustalonej klasie decyzyjnej. Po przyjciu takiego
zaoenia prawdopodobiestwo to mona zapisa jako:
( ) ( )
[
=
=
n
k
i jk i jn j j
d v P d v v v P
1
2 1
| | ,
Prawdopodobiestwo P(v
jk
/d
i
) mona oszacowa jako
stosunek liczby przykadw uczcych z klasy d
i
, dla
ktrych warto atrybutu A
jk
rwna jest v
jk
, do liczby
wszystkich przykadw uczcych z klasy d
i
.
Algorytm k- najbliszych ssiadw
(k nearest neighbours )
Zaoenia:
Dany jest zbir uczcy zawierajcy obserwacje, z ktrych kada ma
przypisany wektor zmiennych objaniajcych oraz warto zmiennej
objanianej Y.
Dana jest obserwacja C z przypisanym wektorem zmiennych
objaniajcych dla ktrej chcemy prognozowa warto zmiennej
objanianej Y.
Algorytm :
porwnanie wartoci zmiennych objaniajcych dla obserwacji C z
wartociami tych zmiennych dla kadej obserwacji w zbiorze uczcym.
wybr k (ustalona z gry liczba) najbliszych do C obserwacji ze zbioru
uczcego.
Okrelenie prognozy:
Urednienie wartoci zmiennej objanianej dla wybranych obserwacji
w przypadku problemw regresyjnych,
Przypisaniu najczciej wystpujcej etykiety wrd wybranych
obserwacji w przypadku problemw klasyfikacyjnych.

Algorytm k - najbliszych ssiadw
(k nearest neighbours )

Definicja "najbliszych obserwacji" sprowadza si do
minimalizacji pewnej metryki, mierzcej odlego pomidzy
wektorami zmiennych objaniajcych dwch obserwacji.
Zwykle stosowana jest tu metryka Euklidesa lub metryka
Mahalanobisa.
Algorytm k najbliszych ssiadw jest uyteczny szczeglnie
wtedy, gdy zaleno midzy zmiennymi objaniajcymi a
objanianymi jest zoona lub nietypowa (np.
niemonotoniczna), czyli trudna do modelowania w klasyczny
sposb.
W przypadku, gdy zaleno ta jest atwa do interpretacji (np.
liniowa), a zbir nie zawiera obserwacji odstajcych, metody
klasyczne (np. regresja liniowa) dadz zwykle dokadniejsze
wyniki.

Algorytm k- najbliszych ssiadw (k
nearest neighbours )
+
+
-
-
- +
jeden najbliszy ssiad - wynik +
dwch najbliszych ssiadw - wynik nieokrelony
piciu najbliszych ssiadw - wynik -
+
-
+
-
-
Drzewo decyzyjne

Drzewa decyzyjne w uczeniu
maszynowym su do wyodrbniania
wiedzy z zestawu przykadw.
Zakadamy, e posiadamy zestaw
przykadw: obiektw opisanych przy
pomocy atrybutw, ktrym
przyporzdkowujemy jak decyzj.
Drzewo decyzyjne- przykad
Drzewo odzwierciedla, w jaki sposb na
podstawie atrybutw byy podejmowane
decyzje klasyfikujce. Zalet tej
reprezentacji jest jej czytelno dla
czowieka. W prosty sposb mona
przeksztaci j do reprezentacji
reguowej.

Drzewo decyzyjne- przykad
Wiek
< 31
Wysokie
Typ samochodu
>= 31
Sportowy
Wysokie
Niskie
Rodzinny
Minivan
Combi
Wiek
Typ
samochodu
Ryzyko
20 Combi Wysokie
18 Sportowy Wysokie
40 Sportowy Wysokie
50 Rodzinny Niskie
35 Minivan Niskie
30 Combi Wysokie
32 Rodzinny Niskie
40 Combi Niskie
Drzewo decyzyjne - budowa

Metody analizy oparte na drzewach
Drzewa klasyfikacyjne
Reprezentuj proces podziau
obiektw na klasy (reprezentowane
przez etykiety),
Decyzja o przypisaniu obiektw do
klasy podejmowana jest w oparciu
o wartoci zmiennych
objaniajcych
Drzewa regresyjne

Przypisuj obiektom wartoci
numerycznej zmiennej objanianej,
Warto zmiennej objanianej
uzaleniona jest od wartoci
zmiennych objaniajcych.

Drzewo decyzyjne
Drzewem nazywamy dowolny spjny graf
acykliczny

Krawdzie takiego grafu nazywane s gaziami.
Wierzchoki, z ktrych wychodzi co najmniej
jedna krawd nazywamy wzami, Wierzchoki
nie bdce wzami nazywamy liciami.
Drzewo decyzyjne
Drzewo klasyfikacyjne jest drzewem o nastpujcych wasnociach:
W kadym wle drzewa umieszczony jest jeden z atrybutw,
Kada krawd wychodzca z danego wza jest etykietowana
wartoci atrybutu ojca,
Liciem w takim drzewie jest warto ze zbioru kategorii, jak
przyporzdkujemy rekordom majcym takie wartoci, jakie znajduj si
na ciece od korzenia do licia,
Na kadym poziomie w drzewie mog si znajdowa zarwno wzy z
atrybutami, jak i licie.

Ponadto dobrze zbudowane drzewo decyzyjne (tzn. takie, ktre szybko
potrafi zwrci kategori) ma odpowiednio rozmieszczone atrybuty w
wzach:
W korzeniu znajduje si atrybut, ktry zawiera ,,najwicej informacji''
(tzn. jego wartoci maj wikszy wpyw na wynik ni pozostae),
Dalej drzewo budowane jest rekurencyjnie zgodnie z zasad
umieszczania w korzeniu atrybutw z ,,najwiksz informacj''.

Drzewo decyzyjne
Dla kadego licia istnieje dokadnie jedna
cieka czca go z korzeniem.
Zbir wszystkich takich cieek moe by
przeksztacony w zbir regu (zwykle
koniunkcji pewnych warunkw
elementarnych) klasyfikujcych przykady w
sposb identyczny jak robi to drzewo.
Moliwa jest wic konwersja drzewa
decyzyjnego do zbioru regu.
Drzewo klasyfikacyjne zasada
dziaania

Spord zmiennych
opisujcych obiekty
wybierz t, ktra
pozwala podzieli
obiekty na dwie grupy w
taki sposb aby
jednorodno
powstaych grup bya
maksymalna.

Drzewo klasyfikacyjne zasada
dziaania


Wybierz jedn z
powstaych grup i
dokonaj jej podziau w
analogiczny sposb.

Drzewo klasyfikacyjne zasada
dziaania


Proces powtarzaj a do
momentu uzyskania
podziau na jednorodne
grupy.

Drzewo klasyfikacyjne zasada
dziaania
Drzewo klasyfikacyjne zasada
dziaania
jeeli x
1
< 3 to:
obiekt jest czerwony
w przeciwnym przypadku
jeeli x
2
< 4 to:
jeeli x
2
< 2 to obiekt jest niebieski
w przeciwnym przypadku obiekt jest czerwony
w przeciwnym przypadku:
obiekt jest niebieski
Drzewo decyzyjne
Algorytm zachanny, ktry konstruuje
rekurencyjnie drzewo decyzyjne metod
top-down.
Warianty algorytmu:
algorytm ID3, C4.5,
algorytm CART
algorytm CHAID

Podstawowa rnica kryterium podziau

Drzewo decyzyjne
Kryteria podziau:
Indeks Gini( algorytm CART)
(wybierany jest atrybut, ktry minimalizuje indeks Gini)

Zysk informacyjny (algorytm ID3, C4.5)
(wybierany jest ten atrybut, ktry maksymalizuje redukcj entropii)

Indeks korelacji _
2
(algorytm CHAID)
(mierzona jest korelacja pomidzy kadym atrybutem a kad
klas (wartoci atrybutu decyzyjnego). Wybieramy atrybut o
maksymalnej korelacji (pierwotnie tylko dla zmiennych nominalnych)

Drzewo decyzyjne
Algorytm wykonywany jest w dwch fazach:

Faza I:
Konstrukcja drzewa decyzyjnego w oparciu o
zbir treningowy
Faza II:
Przycinanie drzewa w celu poprawy dokadnoci,
interpretowalnoci i uniezalenienia si od efektu
przetrenowania

CHAID (Chi-squared Automatic Interaction Detector)
przebieg analizy
Dla kadych dwch kategorii kadego predykatora liczony jest
test Chi-kwadrat (zmienne nominalne) lub test F (zmienne
cige) jako sprawdzian, czy rnicuj one zmienn zalen,
Jeli tak nie jest, kategorie s ze sob czone dzieje si tak
a do momentu wyczerpania moliwych kategorii dla danego
predyktora,
W przypadku zmiennych cigych tworzony jest pocztkowy
podzia na kategorie o zblionych licznociach,
Dla kadego predyktora z uprzednio zdefiniowanymi
kategoriami oblicza si warto testu Chi-kwadrat lub F, dla tych
wartoci statystyk obliczane jest p-value,
Wybierany jest predyktor z najmniejsz wartoci p-value,
Zbiorowo dzielona jest wg kategorii wybranej zmiennej
ustalonych w pierwszym kroku,
W kadej z wyrnionych podgrup caa procedura jest
powtarzana, powstaj w ten sposb kolejne podgrupy.

Drzewo decyzyjne
Drzewo 1 dla Ryzyko
Liczba wzw dzielonych: 3, liczba wzw kocowych: 4
ID=1 N=8
Wysokie
ID=3 N=5
Wysokie
ID=5 N=2
Wysokie
ID=2 N=3
Niskie
ID=4 N=3
Wysokie
ID=6 N=1
Wysokie
ID=7 N=1
Niskie
Typ samochodu
= Rodzinny, ... = Inne
Wiek
<= 35,000000 > 35,000000
Typ samochodu
= Sportowy... = Inne
Wysokie
Niskie
Algorytm ID3 - Quinlana
) p log p ( I
i
n
i
i

=
=
1
2
Entropia:
p
i
prawdopodobiestwo wystpienia stanu i
1
1
=

=
n
i
i
p
Entropi mona interpretowa jako niepewno
wystpienia danego zdarzenia elementarnego.
Entropia - przykad
Entropia eksperymentu polegajcego na losowaniu
w oparciu o rzut monet

1 ) 1 (
2
1
) 1 (
2
1
2
1
log
2
1
2
1
log
2
1
) log (
2 2
1
2
= =
=
=

=
I
I
p p I
i
n
i
i
Entropia - przykad








Entropia jest maksymalna, gdy
prawdopodobiestwa zaj zdarze s takie
same.


P=(0.5, 0.5) I(P)=1
P=(0.67, 0.33) I(P)=0.92
P=(1, 0) I(P)=0
Algorytm ID3 informacja atrybutu

Podzielmy zbir rekordw T na rozczne klasy
C
1
, C
2
, ..., C
k
wedug wartoci ich atrybutu kategorii.
Informacj potrzebn, by stwierdzi do ktrej klasy
naley element ze zbioru oznaczmy przez: I(T)


( )
|
|
.
|

\
|
|
|
.
|

\
|
+ +
|
|
.
|

\
|
+
|
|
.
|

\
|
=
T
C
log
T
C
T
C
log
T
C
T
C
log
T
C
T I
n n

2 2 1 1
Algorytm ID3 informacja atrybutu
Podzielmy zbir T na podstawie wartoci
atrybutu X na podzbiory T
1
, T
2
, .., T
m
.
Informacja potrzebna, by stwierdzi do
jakiej klasy naley element z T jest redni
waon informacji potrzebnych, by
stwierdzi do jakiej klasy naley element z
T
i
:

) T ( I
T
T
) T , X ( E
i
m
i
i
=

=1
Algorytm ID3 informacja atrybutu

Rnic pomidzy informacj potrzebn, by
stwierdzi do jakiej klasy naley element T, a
informacj potrzebn, po tym jak poznalimy
warto atrybutu X definiujemy jako:

) T , X ( E ) T ( I ) T , X ( Gain =
Algorytm ID3 - Quinlana
) T , X ( Gain max
X
Kryterium wyboru atrybutu:
Algorytm ID3 - przykad


ATRYBUTY DECYZJA
Lp. TEMPERATURA BL GOWY SAMOPOCZUCIE GRYPA
1 Wysoka Tak Ze Tak
2 Bardzo wysoka Tak Dobre Tak
3 Normalna Nie Ze Nie
4 Wysoka Tak Dobre Tak
5 Wysoka Nie Dobre Nie
6 Normalna Tak Ze Nie
7 Normalna Nie Dobre Nie


Mona utworzy dwa zbiory decyzji, pierwszy {1, 2, 4}, gdzie cyfry oznaczaj numer
obiektw, ktre maja warto Tak dla decyzji Grypa, drugi {3, 5, 6, 7}, czyli obiekty,
ktrym odpowiada warto decyzji Nie.

Entropia decyzji Grypa jest rwna:

( ) 985 0,
7
4
log
7
4
7
3
log
7
3
Grypa I
2 2
= = .
Algorytm ID3 - przykad

Pierwszym kandydatem, aby by atrybutem oznaczajcym korze drzewa decyzyjnego jest
Temperatura. Odpowiedni podzia zbioru obiektw jest pokazany na rys. 1.


TEMPERATURA

Normalna Wysoka Bardzo wysoka


3, 6, 7 1, 4, 5 2

Nie, Nie, Nie Tak, Tak, Nie Tak

Rys. 1. Drzewo decyzyjne


Entropia decyzji Grypa przy danym atrybucie Temperatura wynosi:

( ) 394 0 0
7
1
3
2
3
2
3
1
3
1
7
3
0
7
3
2
, * log log * a Temperatur / Grypa E =
(

+ =

( ) . , 0,394 0,985 Grypa , a Temperatur Gain 591 0 = =

Algorytm ID3 - przykad

Nastpnym kandydatem, aby by atrybutem oznaczajcym korze drzewa decyzyjnego jest
Bl_gowy. W tym przypadku:



BL GOWY

Tak Nie


1, 2, 4, 6 1, 5, 7

Tak, Tak, Tak, Nie Nie, Nie, Nie

Rys. 2. Drzewo decyzyjne


( )
( ) . , 0,464 0,985 Grypa , glowy _ Bl Gain
0,464 0 *
7
3
4
3
log
4
3
4
1
log
4
1
7
4
glowy _ Bl / Grypa E
2 2
521 0 = =
=
(

+ =

Algorytm ID3 - przykad

Dla atrybutu Samopoczucie, podzia przypadkw jest pokazany na rys 3 .


SAMOPOCZUCIE

Dobre Ze


2, 4, 5, 7 1, 3, 6

Tak, Tak, Nie, Nie Tak, Nie, Nie

Rys. 3. Drzewo decyzyjne


( ) 965 0
3
2
3
2
3
1
3
1
7
3
2
1
2
1
2
1
2
1
7
4
2 2 2 2 2
, log log log log log ie Samopoczuc / Grypa E =
(

+ =
( ) . , 0,965 0,985 Grypa , ie Samopoczuc Gain 02 0 = =
W zwizku z tym Temperatur wybieramy
jako korze drzewa decyzyjnego.
Nastpnym krokiem (rys. 1.) jest znalezienie
atrybutu rozrniajcego przykady ze zbioru
{1, 4, 5} (wszystkie przykady z tego zbioru
charakteryzuj si t sam wartoci
Wysoka atrybutu Temperatura) a
przykady 1 i 4 nale do innej klasy ni
przykad 5.
Algorytm ID3 - przykad
Algorytm ID3 - przykad

Temperatura zostaa wybrana jako korze drzewa, pozostay wic dwa atrybuty:
Bl_gowy i Samopoczucie.




BL GOWY

Tak Nie


1, 4 5

Tak, Tak Nie

Rys, 4. Drzewo decyzyjne drugi poziom



( ) 918 0,
3
1
log
3
1
3
2
log
3
2
aW Temperatur I
2 2
= =
( ) 0 =
(

= 1 log *
3
1
1 log
2
1
3
2
glowy _ Bl / aW Temperatur E
2 2

( ) 918 0, 0 0,918 glowy _ Bl , aW Temperatur Gain = =
Algorytm ID3 - przykad



SAMOPOCZUCIE

Tak Nie


4, 5 1

Tak, Nie Tak

Rys. 5. Drzewo decyzyjne drugi poziom.

( ) 918 0,
3
1
log
3
1
3
2
log
3
2
aW Temperatur I
2 2
= =
( ) 0,666 =
(

+ = 1 log *
3
1
2
1
log
2
1
2
1
log
2
1
3
2
e Sampoczuci / aW Temperatur E
2 2 2

( ) 251 0, 0,666 0,918 e Sampoczuci , aW Temperatur Gain = =


Atrybut Bl_gowy powinien by wybrany.
Algorytm ID3 - przykad
Algorytm ID3 - przykad

Kocowe drzewo decyzyjne jest pokazane na rys. 6.




TEMPERATURA

Normalna Bardzo wysoka
Wysoka

3, 6, 7 2

Nie, Nie, Nie Tak

BL GOWY

Tak Nie


1, 4 5

Tak, Tak Nie

Rys. 6. Kocowe drzewo decyzyjne.
Algorytm ID3 - przykad
Algorytm ID3 - przykad

Na podstawie tak powstaego drzewa mona
sformuowa nastpujce reguy:
(Temperatura, Normalna) (Grypa, Nie)
(Temperatura, Wysoka) i (Bl_gowy, Tak) (Grypa, Tak)
(Temperatura, Wysoka) i (Bl_gowy, Nie) (Grypa, Nie)
(Temperatura, Bardzo_wysoka) (Grypa, Tak)
Algorytm ID3 przy cigych wartociach cech
Zamy, e cechy obiektw przyjmuj wartoci z pewnych
cigych przedziaw, wwczas

=
=
=
K
D
O
gdzie
} k ,..., k ,..., k { K
} d ,..., d ,..., d { D
} o ,..., o ,..., o { O
l i
m i
n i
1
1
1
zbir obiektw (przykadw)
zbir atrybutw identyczny dla wszystkich przykadw
zbir klas, do ktrych kwalifikujemy przykady
Algorytm ID3 przy cigych
wartociach cech

e
=
= . . = . . =
i
j i
j j j i
l i
m i m i j i j i i i
c
d
gdzie
w w w
i k c
w d w d w d
,
,
, , , , 1 , 1 ,
) max ; min (
) (
) ( ... ) ( ... ) (
warto atrybutu j w przykadzie i
numer klasy do ktrej naley i-ty przykad
Algorytm ID3 przy cigych
wartociach cech
Poniewa dla takiego zapisu nie mona wprost wykorzysta
metody ID3 naley wprowadzi dodatkowo dla kolejnych
atrybutw wartoci w* dzielce dziedzin na dwa rozczne
podzbiory
Naley tak przeksztaca warunki i przykady by moliwy by
nastpujcy zapis:

) (
) ( ... ) ( ... ) (
*
,
*
,
*
1 1 ,
l i
m m i j j i i
k c
w d w d w d
=
< . . < . . <
Przykad
Naley okreli zaleno wielkoci
sprzeday od wieku klienta, poziomu
wyksztacenia oraz odlegoci od sklepu
wiek wyksztacenie odlego
lata poziom m z/m-c klasa
18 2 200 100 1
20 3 500 50 1
35 3 100 400 3
21 4 600 200 2
40 5 400 550 3
warto zakupw
Wybr punktu podziau

Badamy jak ilo informacji na temat
problemu przenosi wiek klienta. W tym celu
wybieramy taki punktu podziau w* ze zbioru
{20, 21, 35, 40}, ktry wprowadza najwicej
informacji. Uzyskujemy nastpujce tabele:

Wybr punktu podziau wg wieku
wiek <20 1 0 0 0 0
>=20 0 1 1 1 1
klasa 1 1 1 0 0 0
2 0 0 1 0 0
3 0 0 0 1 1
wiek <21 1 1 0 0 0
>=21 0 0 1 1 1
klasa 1 1 1 0 0 0
2 0 0 1 0 0
3 0 0 0 1 1
wiek <35 1 1 1 0 0
>=35 0 0 0 1 1
klasa 1 1 1 0 0 0
2 0 0 1 0 0
3 0 0 0 1 1
wiek <40 1 1 1 1 0
>=40 0 0 0 0 1
klasa 1 1 1 0 0 0
2 0 0 1 0 0
3 0 0 0 1 1
Wybr punktu podziau wg wieku
w* I-E
j
20 0,5219
21 1,063
35 1,063
40 0,5219
Wybr punktu podziau wg
wyksztacenia
w* I-E
j
3 0,5219
4 0,7294
5 0,5219
Wybr punktu podziau wg odlegoci
w* I-E
j
200 0,5219
400 0,3961
500 0,7294
600 0,8553
Koniec pierwszego etapu
Jeeli za czynnik decydujcy w pierwszym etapie o podziale
przypadkw przyjmiemy wiek <35 wwczas uzyskamy
nastpujce podzbiory
wiek wyksztacenie odlego
lata poziom m z/m-c klasa
18 2 200 100 1
20 3 500 50 1
21 4 600 200 2
wiek wyksztacenie odlego
lata poziom m z/m-c klasa
35 3 100 400 3
40 5 400 550 3
warto zakupw
warto zakupw
Kontynuacja
Przedstawione procedury
powtarzamy dla kadego z
podzbiorw a do penego
rozjanienia problemu
Indeks Giniego
S- zbir przykadw nalecych do n klas
p
j
wzgldna czsto wystpowania klasy j w S

=
=
n
i
j
p ) S ( Gini
1
2
1
Indeks Giniego
Przykad
Dwie klasy: Pos i Neg,
Zbir przykadw S zawierajcy p elementw nalecych do
klasy Pos i n elementw nalecych do klasy Neg
n p
n
p
n p
p
p
Neg Pos
+
=
+
=
2 2
Neg Pos
p p ) S ( Gini =1
Indeks Giniego
Indeks podziau zbioru S na partycje S
1
i S
2
jest definiowany
nastpujco:

p
1
- liczba elementw w S
1
nalecych do klasy Pos,
n
1
- liczba elementw w S
1
nalecych do klasy Neg,
p
2
- liczba elementw w S
2
nalecych do klasy Pos,
n
2
- liczba elementw w S
2
nalecych do klasy Neg.
( ) ) S ( Gini
n p
n p
) S ( Gini
n p
n p
S Gini
p 2
2 2
1
1 1
+
+
+
+
+
=
Indeks Giniego

Najlepszym punktem podziau
zbioru S jest punkt podziau,
ktry charakteryzuje si
najmniejsz wartoci wskanika
Gini(S)

Indeks Giniego
Dany jest zbir treningowy, skadajcy si z atrybutw
opisujcych klienta towarzystwa ubezpieczeniowego: wiek
ubezpieczonego, typ samochodu oraz atrybut decyzyjny ryzyko.
Atrybut decyzyjny oznacza czy ubezpieczony jest potencjalnym
zagroeniem na drodze czy te nie.
ID Wiek Typ_sam Ryzyko
0 23 family high
1 17 sport high
2 43 sport high
3 68 family low
4 32 truck low
5 20 family high
Indeks Giniego
Lista wartoci atrybutu
Wiek
Lista wartoci atrybutu
Typ_sam
Wiek ID Ryzyko Typ_sam ID Ryzyko
23 0 high family 0 high
17 1 high sport 1 high
43 2 high sport 2 high
68 3 low family 3 low
32 4 low truck 4 low
20 5 high family 5 high
Indeks Giniego
"warto atrybutu numerycznego"< lub <= X
Atrybut Wiek jest atrybutem numerycznym, std punkt podziau dla
tego atrybutu ma posta:
Moliwe punkty podziau atrybutu Wiek
Wiek <=17 Wiek <=32
Wiek <=20 Wiek <=43
Wiek <=23 Wiek <=68
Indeks Giniego
High Low
Wiek <=17 1 0
Wiek >17 3 2
Wiek <=17
( ) ( ) 0 0 1 1 17 = = <=
2 2
) Wiek ( Gini
0,40 = |
.
|

\
|
+ |
.
|

\
|
= 0,48
6
5
0
6
1
17 ) Wiek ( Gini
p
0,48
5
2
5
3
1 17 =
|
.
|

\
|

|
.
|

\
|
= >
2 2
) Wiek ( Gini
Indeks Giniego
Wiek <=20

High Low
Wiek <=20 2 0
Wiek >20 2 2
( ) ( ) 0 0 1 1 20 = = <=
2 2
) Wiek ( Gini
0,50
2
1
2
1
1 20 = |
.
|

\
|
|
.
|

\
|
= >
2 2
) Wiek ( Gini
0,33 =
|
.
|

\
|
+
|
.
|

\
|
= 0,5
6
4
0
6
2
20 ) Wiek ( Gini
p
Indeks Giniego
Wiek <=23
High Low
Wiek <=23 3 0
Wiek >23 1 2
( ) ( ) 0 0 1 1 23 = = <=
2 2
) Wiek ( Gini
0,44
3
2
3
1
1 23 =
|
.
|

\
|

|
.
|

\
|
= >
2 2
) Wiek ( Gini
0,22 =
|
.
|

\
|
+
|
.
|

\
|
= 0,44
6
3
0
6
3
23 ) Wiek ( Gini
p
Indeks Giniego
Wiek <=32

High Low
Wiek <=32 3 1
Wiek >32 1 1
0,375
4
1
4
3
1 3 =
|
.
|

\
|

|
.
|

\
|
= <=
2 2
2 ) Wiek ( Gini
0,50
2
1
2
1
1 3 =
|
.
|

\
|

|
.
|

\
|
= >
2 2
2 ) Wiek ( Gini
0,42 5 375 2 = |
.
|

\
|
+ |
.
|

\
|
= , , ) Wiek ( Gini
p
0
6
2
0
6
4
3
Indeks Giniego
Wiek <=43

High Low
Wiek <=43 4 1
Wiek >43 0 1
0,32
5
4
5
1
1 =
|
.
|

\
|

|
.
|

\
|
= <=
2 2
43) Wiek ( Gini
( ) ( ) 0 0 1 1 43 = = >
2 2
) Wiek ( Gini
( ) 0,27 32 43 = |
.
|

\
|
+ |
.
|

\
|
= 0
6
1
0
6
5
, ) Wiek ( Gini
p
Indeks Giniego
Ocena punktw podziau dla atrybutu kategorycznego
high low
2 0
2 1
0 1
Typ_same{sport, family} 4 1
Typ_same{sport, truck} 2 1
Typ_same{family, truck}
2 2
Typ_same{sport}
Typ_same{family}
Typ_same{truck}
Gini (Typ_same{sport})=1-1
2
-0
2
=0
Gini (Typ_same{family})=1-(2/3)
2
-(1/3)
2
=0,44
Gini (Typ_same{truck})=1-0
2
-1
2
=0
Gini (Typ_same{sport, family})=1-(4/5)
2
-(1/5)
2
=0,32
Gini (Typ_same{sport, truck})=1-(2/3)
2
-(1/3)
2
=0,44
Gini (Typ_same{family, truck})=1-(1/2)
2
-(1/2)
2
=0,50
Gini
p
(Typ_same{sport})=(2/6)*0+(4/6)*0,50=0,33
Gini
p
(Typ_same{family})=(3/6)*0,44+(3/6)*0,44=0,44
Gini
p
(Typ_same{truck})=(1/6)*0+(5/6)*0,32=0,27
Gini
p
(Typ_same{sport, family})=(5/6)*0,32+(1/6)*0=0,27
Gini
p
(Typ_same{sport, truck})=(3/3)*0,44+(3/6)*0,44=0,44
Gini
p
(Typ_same{family, truck})=(4/6)*0,50+(2/6)*0=0,33
Indeks Giniego
Najmniejsz warto indeksu podziau ma punkt podziau Wiek<=23
Tworzymy wierzchoek drzewa decyzyjnego dla punktu podziau
Wiek=(23+32)/2=27,5
Indeks Gini
0,40
0,22
0,42
0,27
0,33
0,44
0,27
Wiek 17
Wiek 23
Typ_same{sport}/{family, truck}
Typ_same{family}/{sport, truck}
Typ_same{truck}/{sport, family}
Punkt podziau
Wiek 32
Wiek 43
Indeks Giniego
Wiek
Wiek <= 27,5
Wiek >27,5
Ryzyko=High
Ryzyko= ?
Indeks Giniego
List wartoci atrybutw dzielimy w punkcie podziau
Lista wartoci atrybutw dla Wiek <=27,5
Wiek ID Ryzyko Typ_sam ID Ryzyko
17 1 High family 0 High
20 5 High sport 1 High
23 0 High family 5 High
Lista wartoci atrybutw dla Wiek > 27,5
Wiek ID Ryzyko Typ_sam ID Ryzyko
32 4 low sport 2 high
43 2 high family 3 low
68 3 low truck 4 low
Indeks Giniego
Gini (Typ_same{sport})=1-1
2
-0
2
=0
Gini (Typ_same{family})=1-0
2
-1
2
=0
Gini (Typ_same{truck})=1-0
2
-1
2
=0
Gini (Typ_same{sport, family})=1-(1/2)
2
-(1/2)
2
=0,5
Gini (Typ_same{sport, truck})=1-(1/2)2-(1/2)2=0,5
Gini (Typ_same{family, truck})=1-0
2
-1
2
=0
Gini
p
(Typ_same{sport})=(1/3)*0+(2/3)*0=0
Gini
p
(Typ_same{family})=(1/3)*0+(2/3)*(1/2)=0,33
Gini
p
(Typ_same{truck})=(1/3)*0+(2/3)*(1/2)=0,33
Gini
p
(Typ_same{sport, family})=(2/3)*(1/2)+(1/3)*0=0,33
Gini
p
(Typ_same{sport, truck})=(1/3)*(2/2)+(1/3)*0=0,33
Gini
p
(Typ_same{family, truck})=(2/3)*0+(1/3)*0=0
high low
1 0
0 1
0 1
Typ_same{sport, family} 1 1
Typ_same{sport, truck} 1 1
Typ_same{family, truck}
0 2
Typ_same{sport}
Typ_same{family}
Typ_same{truck}
Indeks Giniego
Wiek
Wiek <= 27,5
Wiek >27,5
Ryzyko=high
Typ_san
Typ_same{sport}
Typ_same{family, truck}
Ryzyko=high Ryzyko=low
Indeks Giniego
Drzewo 1 dla Ryzyko
Liczba wzw dzielonych: 2, liczba wzw kocowych: 3
ID=1 N=6
high
ID=3 N=3
low
ID=2 N=3
high
ID=4 N=1
high
ID=5 N=2
low
Wiek
<= 27,500000 > 27,500000
Typ_sam
= sport ... = Inne
high
low
Losowy las

Bootstrap opracowana przez Bradleya
Efrona metoda szacowania rozkadu bdw
estymacji, za pomoc wielokrotnego
losowania ze zwracaniem z prby. Jest
przydatna szczeglnie, gdy nie jest znana
posta rozkadu zmiennej w populacji.
Losowy las
Losowy las (Random Forests)- Algorytm Random
Forest opracowany by przez Breimana.
Losowy las nadaje si do rozwizywania zarwno
zada klasyfikacyjnych jak i regresyjnych.
W metodzie tej do przewidywania wartoci zmiennej
zalenej stosuje si zbir wielu, stosunkowo
prostych, drzew decyzyjnych. Kade z tych drzew
przewiduje warto zmiennej zalenej na podstawie
zmiennych niezalenych (predyktorw), a
przewidywanie caego modelu wyznaczane jest przez
urednianie albo gosowanie.
Losowy las
Dla kadego i=1n
tree
(liczba drzew) wykonaj:
Utwrz prb bootstrapow (losowanie bez zwracania),
Utwrz drzewo (regresyjne, klasyfikacyjne) uwzgldniajc
nastpujc modyfikacj: w kadym wle nie rozpatruj
wszystkich zmiennych lecz tylko uwzgldnij losowo wybrane
m
try
zmiennych.

Wykonaj obliczenia dla rozpatrywanego obiektu
i dokonaj agregacji wynikw wskazywanych
przez poszczeglne drzewa (najczciej
wskazywana klasa problem klasyfikacji,
warto rednia problem regresyjny)
Ocena dokadnoci w klasyfikacji


W zagadnieniach klasyfikacyjnych (przy
skategoryzowanej zmiennej zalenej)
uywane s trzy oceny dokadnoci
klasyfikacji: resubstytucji, prby testowej i
v-krotnej walidacji.
Ocena dokadnoci w klasyfikacji
Ocena wedug resubstytucji. Jest to proporcja przypadkw bdnie
sklasyfikowanych przez model klasyfikujcy zbudowany na bazie
wszystkich przypadkw. Wzr jest nastpujcy:

Miara ta obliczana jest dla tego samego zbioru danych, na bazie
ktrego zbudowano model d .
( ) ( ) ( )

=
= =
N
i
i i
j x d X
N
d R
1
1
( ) ( )
i i
j x d X =
gdzie X jest funkcj wskanikow;
X = 1, jeli wyraenie jest prawdziwe
X = 0, jeli wyraenie jest faszywe
oraz d (x) jest klasyfikujcym modelem
( ) ( )
i i
j x d X =
Ocena dokadnoci w klasyfikacji
Ocena na bazie prby testowej. Wszystkie przypadki danych
dzielone s na dwie grupy Z
1
i Z
2
. Ocen dokadnoci klasyfikacji
jest proporcja przypadkw w grupie Z
2
, bdnie sklasyfikowanych
przez model zbudowany na bazie grupy Z
1
. Oblicza si j
nastpujco
gdzie N
2
jest liczb przypadkw w grupie Z
2
, ktra nie bya
wykorzystywana przy budowie modelu.
( ) ( ) ( )
( )

e
= =
2 2
Z j , x
i i
ts
i i
j x d X
N
d R
1
Ocena dokadnoci w klasyfikacji
V-krotna walidacja krzyowa. Wszystkie przypadki danych
dzielone s na V grup Z
1
, Z
2
, ..., Z
V
o takiej samej, na ile to
moliwe licznoci. Ocen dokadnoci klasyfikacji jest rednia
proporcja przypadkw w grupie Z
v
bdnie sklasyfikowanych przez
model zbudowany na bazie przypadkw grup Z - Z
v
. Obowizuje
tu nastpujcy wzr:

( ) ( ) ( )
( )

= e
|
|
.
|

\
|
= =
V
v Z j , x
i i
v
v
v ts
v n i
j x d X
N V
d R
1
1 1
gdzie

obliczone jest dla prby Z

-

Z
v

.

( )
i
v
x d
Ocena dokadnoci przy regresji

W zagadnieniach regresyjnych (przy
cigej zmiennej zalenej) uywane s
podonie trzy oceny dokadnoci:
resubstytucji, prby testowej i v-krotnej
walidacji.
Ocena dokadnoci przy regresji
Ocena wedug resubstytucji. Oblicza si tu oczekiwany
bd kwadratowy, bazujc na predykcji zalenej
zmiennej cigej. Wzr jest nastpujcy:

gdzie prba uczca Z skada si z punktw (x
i
,y
i
), i = 1,2,...,N.
Miara ta obliczana jest dla tego samego zbioru danych, na
bazie ktrego zbudowano model d.
( ) ( ) ( )
2
1

=
=
N
i
i i
x d y
N
d R
1
Ocena dokadnoci przy regresji
Ocena na bazie prby testowej. Wszystkie przypadki
danych dzielone s na dwie grupy Z
1
i Z
2
. Ocen
dokadnoci obliczana jest jak we wzorze poniej:
gdzie N
2
jest liczb przypadkw w grupie Z
2
, ktra
nie bya wykorzystywana przy budowie modelu.
( ) ( ) ( )
( )

e
=
2
2
2
Z y , x
i i
ts
i i
x d y
N
d R
1
Ocena dokadnoci przy regresji

V-krotna walidacja krzyowa. Wszystkie przypadki danych dzielone
s na V grup Z
1
, Z
2
, ..., Z
V
o takiej samej, na ile to moliwe licznoci.
Grupa prbek Z - Z
v
uyta zostaje do zbudowania modelu d. Ocen
dokadnoci prognozy jest rednie odchylenie wartoci
rzeczywistych od wartoci okrelonych przez model zbudowany na
bazie przypadkw grup Z - Z
v
obliczone dla przypadkw Z
v
.
Obowizuje tu nastpujcy wzr:




gdzie

obliczone jest dla prby

Z

-

Z
v
.

( )
i
v
x d
( ) ( ) ( )
( )

= e
|
|
.
|

\
|
=
V
v Z y , x
i
v
i
v
v ts
v i i
x d y
N V
d R
1
1 1 2
Ocena dokadnoci przy regresji

Mean absolute error (MAE)

Mean absolute percentage error
(MAPE)

Symmetric mean absolute percentage
error (SMAPE or sMAPE)




Drzewa decyzyjne kryterium stopu
wywoania rekurencyjne algorytmu tworzcego drzewo naley kiedy
zakoczy,
kryterium stopu. okrela czy dany wze drzewa powinien by
traktowany jako kocowy (li drzewa ) zawierajcy w swoim opisie
etykiet klasy-decyzji.
wze musi zwrci warto etykiety w dwch przypadkach:
1. Kiedy w trakcie wywoa rekurencyjnych w zestawie przykadw
znajduj si ju tylko przykady opisujce tylko jedn klas-decyzji. W
takim przypadku kryterium stopu powinno zwrci wanie t klas.
2. Kiedy zestaw atrybutw argumentw osignie zero wtedy kryterium
stopu powinno zgosi jedn z moliwoci:
o Bd, gdy na podstawie przykadw nie mona jednoznacznie ustali
odpowiedni klas-odpowied. Moe to by spowodowane
niepoprawnym zbiorem przykadw (zawierajcym przekamania), lub
zestaw atrybutw nie opisuje przykadw w dostatecznym stopniu.
o Zwrci etykiet klasy-decyzji, ktra najliczniej wystpuje w zestawie
przykadw, jednak takie rozwizanie nie zapewni spjnoci drzewa z
uczcym cigiem przykadw

Drzewa decyzyjne - przycinanie
w trakcie generowania drzewa decyzyjnego istnieje ryzyko
nadmiernego dopasowania do przykadw trenujcych (zjawisko
zwane przeuczeniem (ang. overfitting),
drzewo decyzyjne moe okaza si zbyt zoone i
odzwierciedla przypadkowe zalenoci wystpujce w zbiorze
przykadw, zwaszcza, jeli jest on zaszumiony (zawiera
pewn ilo bdnych danych),
powstay algorytmy upraszczania drzew w taki sposb, aby
zachowa jak najwiksz spjno z zbiorem przykadw i
zminimalizowa bd rzeczywisty (powstajcy podczas
testowania obiektami nie nalecymi do zbioru przykadw),
algorytmy te nosz nazw algorytmw przycinania.
Przycinanie jest to czynno polegajca na zastpowaniu
wybranych poddrzew limi, ktrym przypisuje si etykiet
kategorii najczciej wystpujcej wrd zwizanych z nim
przypadkw.
Drzewa decyzyjne - przycinanie

Metody przycinania drzew decyzyjnych:
Przycinanie w trakcie wzrostu jest to przycinanie podczas
konstrukcji drzewa taki mechanizm jest jednak mao
precyzyjny gdy podczas konstrukcji nie znamy jeszcze
struktury caego drzewa i prowadzi to zazwyczaj do stosunkowo
duych bdw predykcji,
Przycinanie od rodka jest to zastpowanie wza jednym z
jego wzw potomnych taki algorytm jest bardzo zoony i
wymaga reorganizacji struktury poddrzewa, jednak zazwyczaj
daje on najlepsze rezultaty,
Przycinanie proste - polega na zastpieniu wybranego wza
wzem zawierajcym etykiet klasy-decyzji (liciem). Taki
mechanizm jest stosunkowo prosty w implementacji i
najczciej stosowany.
Przycinanie drzewa - algorytm
Funkcja przytnij drzewo(T, P)
Argumenty wejciowe
T drzewo do przycinania,
P zbir przycinania
Zwraca: drzewo T po przyciciu
Dla wszystkich wzw n drzewa T wykonaj
Zastp n liciem l z etykiet wikszociowej kategorii
w zbiorze P
T,n
jeli nie powikszy to szacowanego na
podstawie P bdu rzeczywistego drzewa T ;
Koniec dla
Zwr T
Przycinanie drzewa - algorytm
Bardziej zaawansowana wersja przycinania, to taka
w ktrej przycicie wza nie oznacza zastpienia go
liciem, lecz jednym z jego wzw potomnych. Nie
jest wwczas usuwane cae poddrzewo a jedynie
jego korze (przycinanie od rodka).
Konieczna w tym przypadku reorganizacja struktury
drzewa moe by skomplikowana zmiana testu w
wle na inny moe spowodowa, e dla pozostaych
wzw potomnych ich testy przestan by
optymalne, a dla lici mog ulec zmianie
wikszociowe kategorie,
Z tego wzgldu tego typu sposb przycinania nie jest
stosowany zbyt czsto.



Drzewa decyzyjne - przycinanie

Podstawowe znaczenie ma sposb szacowania bdu drzewa
na podstawie ktrego podejmowana jest decyzja o przycinaniu
drzewa,
Mona wyrni dwa podejcia:
Szacowanie na podstawie bdu prbki na oddzielnym
zbiorze przycinania, zoonym z przykadw spoza zbioru
trenujcego,
Szacowanie na podstawie bdu prbki na zbiorze
trenujcym.

Drzewa decyzyjne - przycinanie
Przycinanie z oddzielnym zbiorem przycinania:
Musi by dostpna odpowiednio dua liczba
przykadw, ktre dzieli si na zbir trenujcy i zbir
przycinania,
Poddrzewo jest przycinane, jeli po zastpieniu go
liciem nie zwikszy si bd prbki obliczony na
zbiorze przycinania,
Algorytm przycinania stosujcy takie kryterium jest
nazywany przycinaniem redukujcym bd,
Prosty algorytm dajcy dobre efekty,
Drzewa decyzyjne - przycinanie
Jeli ze wzgldu na ograniczon liczb danych nie
moemy powici czci z nich wycznie do celw
przycinania, to decyzja o przycinaniu moe by
podejmowana na podstawie rnych heurystycznych
oszacowa bazujcych na zbiorze trenujcym.
Jedna z tych heurystyk moe polega na wyznaczeniu na
podstawie zbioru trenujcego pesymistycznego
oszacowania bdu przycinanego wza i porwnania go z
bdem licia, ktry miaby go zastpi.
Pesymistyczne oszacowanie bdu moe by wyraone
np. przez grny koniec przedziau ufnoci dla bdu
przycinanego wza.
Decyzja o przyciciu zapada pod warunkiem, e bd
prbki licia nie przekroczy tego pesymistycznego
oszacowania.
Drzewa decyzyjne

W praktyce zstpujca konstrukcja
drzew decyzyjnych naley zazwyczaj do
najbardziej efektywnych obliczeniowo
metod uczenia si poj, a w kadym
razie dajcych bardzo dobry stosunek
kosztu uzyskania hipotez do ich jakoci.
Drzewa decyzyjne wady i zalety
Zalety
Drzewa decyzyjne mog reprezentowa dowolnie
zoone pojcia pojedyncze lub wielokrotne, jeli
tylko ich definicja da si wyrazi w zalenoci od
atrybutw,
Efektywno pamiciowa reprezentacji
drzewiastej,
Czas decyzyjny ograniczony liniowo przez liczb
atrybutw (maksymalna gboko drzewa),
Czytelna forma reprezentacji,
atwo przejcia od reprezentacji drzewiaastej
do reprezentacji reguowej.




Drzewa decyzyjne wady i zalety
Wady
testuje si warto jednego atrybutu na raz, co powoduje
niepotrzebny rozrost drzewa dla danych gdzie poszczeglne
atrybuty zale od siebie),
kosztowna reprezentacja alternatyw midzy atrybutami
znaczny rozrost drzewa (w przeciwiestwie do reprezentacji
koniunkcji, ktra jest zapisywana w postaci cieki czyli drogi
od korzenia do licia),
drzewa decyzyjne nie stwarzaj atwej moliwoci do ich
inkrementacyjnego aktualizowania, algorytmy udoskonalajce
gotowe ju drzewa poprzez zestaw nowych przykadw s
bardzo zoone i zazwyczaj wynikiem jest drzewo gorszej
jakoci ni drzewo budowane od pocztku z kompletnym
zestawem przykadw.

You might also like