Professional Documents
Culture Documents
WYDZIA FIZYKI
PRACA MAGISTERSKA
ANALIZA KORELACJI PRZEBIEGW CZASOWYCH
IMISJI PYU ZAWIESZONEGO PM
10
I PM
2,5
ORAZ TLENKW AZOTU
CORRELATION ANALYSIS OF TIME SERIES OF PARTICULATE MATTER
(PM
10
AND PM
2,5
) AND NITROGEN OXIDE IMISSION
Jacek Bzdak
nr. albumu: 196909
Promotor:
prof. Bronisaw Sowi nski
doc. Mieczysaw Sowi nski
WARSZAWA 2011
ii
Podzi ekowania:
Chciabym podzi ekowa c moim opiekunom: doc. Sowi n-
skiemu i prof. Sowi nskiemu, ktrzy wprowadzili mnie
w tematyk e bada n - przez wiele godzin rozmawiaem z
nimi na tematy poruszane w mojej pracy.
Za cenne uwagi dotycz ace modelowania za pomoc a sieci
neuronowych oraz za podzielenie si e dziaaj acym ko-
dem Matlaba chciabym podzi ekowa c dr. Siwkowi z Wy-
dziau Elektrycznego PW.
Wreszcie chciabym podzi ekowa c prof. Kosi nskiemu i
prof. Osowskiemu, na ktrych wykady dotycz ace Sieci
Neuronowych ucz eszczaem. Bez ich wykadw (i bez
lektury ich podr ecznikw) praca ta byaby na du zo ni z-
szym poziomie.
Bardzo dzi ekuj e dr. Przemysawowi Dudzie, na ktrego
zyczliwo s c zawsze mogem liczy c.
iii
Streszczenie
Zanieczyszczenia powietrza s a jednym z najbardziej istotnych proble-
mw ekologicznych i zdrowotnych wspczesnej cywilizacji. Istniej a ba-
dania jednoznacznie wi a z ace poziomy poszczeglnych zanieczyszcze n i np.
smiertelno s c na danym terenie. Modelowanie tego zjawiska mo ze wspo-
maga c dziaania maj ace na celu obni zanie poziomw zanieczyszcze n oraz
wspomaga c sam proces pomiaru ich poziomw. Praca niniejsza dotyczy
problematyki zwi azanej z ochron a jako sci powietrza oraz modelowania po-
ziomw wyst epuj acych zanieczyszcze n. W pracy skoncentrowano si e na
pyle zawieszonym ze wzgl edu na powszechno s c tego zanieczyszczenia.
Przedmiotem pracy jest analiza modeli, w ktrych b ed a wykorzysty-
wane dane imisyjne, w szczeglno sci tzw. historyczne szeregi czasowe po-
ziomy zanieczyszcze n. Modele, dziaaj ace w oparciu o zbiory danych tego
rodzaju, nazywaj a si e modelami eksploruj acymi dane. Opracowano mo-
del pozwalaj acy na ekstrapolacj e przestrzenn a poziomw zanieczyszcze n.
Model ten mo ze mie c zastosowanie mi edzy innymi do uzupeniania luk w
danych pomiarowych, ktre mog a powstawa c podczas konserwacji urz a-
dze n lub ich awarii. Praca zawiera rwnie z krtkie wprowadzenie do me-
tod pomiarowych pyu zawieszonego. Ze wzgl edu na specyk e pomiarw
tego zanieczyszczenia (du ze niepewno sci pomiarowe, r znorodno s c metod
pomiarowych), jak i ze wzgl edu na obowi azuj ac a legislacj e i standardy, mo-
delowanie mo ze odgrywa c istotn a rol e w procesie pomiaru poziomu pyu
zawieszonego. Modele eksploruj ace dane pochodz ace ze zr znicowanych
zrde, z ktrych pobiera si e informacje, powinny pracowa c w okre slonym
dla nich srodowisku. Opracowano zatemzao zenia koncepcyjne dla takiego
srodowiska oraz wyszczeglniono, jakie cechy i funkcjonalno sci powinno
ono posiada c.
Uruchomiono rwnie z cz e sciow a wersj e takiego srodowiska, ktr a wy-
korzystano w modelach opisanych w pracy. W Dodatkach opisano pod-
stawy dziaania sztucznych sieci neuronowych i wykorzystywanych w ni-
niejszej pracy sieci SSN oraz podano krtki zarys analizy falkowej, ktra
jest jednym z wa znych narz edzi wspomagaj acych sieci neuronowe.
iv
Abstract
Air pollution is one of most important environmental and health issues.
Many studies link level of particular pollutants and mortality rates on
given area. Modeling can support air remediation programs, as well as aid
in the pollutant measurement process. This work concerns air pollution
management. In this work we focus on particulate matter because this
pollutant is one of most common.
The subject of this work is investigation and development of models
that work on imission data (time series of archival pollutant levels). Mod-
els that work using this data are called data mining models (DMM). Model
that extrapolates pollutant levels was developed in this work, such model
can be used to ll gaps in timeseries of measurements collected by par-
ticular station (these gaps may occur due to equipment conservation and
malfunction). This work contains also short introduction to measurement
methods of PM levels. Particulate Matter measurement proses can aug-
mented using modeling techniques, due to the fact of high measurement
uncertainty, and because of current legislation and standards. DMM mod-
els should be embedded in a system that will provide access to data col-
lected from many external sources. In this work requirements for this
system were developed. Working prototype for this system was also devel-
oped.
Theoretical basis for articial neural networks were also described in
this work, as well as introduction to wavelet transform technique that
can be used to enhance neural network performance.
Spis tre sci
Spis tre sci v
1 Wprowadzenie 1
1.1 Motywacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Py zawieszony . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Zanieczyszczenia powietrza jako zagro zenie dla zdrowia . . 2
1.4 Regulacje unijne . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Zastosowania metod opartych o eksploracj e danych w kon-
tek scie uwarunkowa n prawnych oraz ochrony zdrowia miesz-
ka ncw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Przedmiot bada n 12
2.1 Istniej ace systemy modelowania o podobnym charakterze w
Polsce i Europie . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Porwnanie modeli CTM i DMM . . . . . . . . . . . . . . . . 15
2.3 Denicja modelu . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 Metody pomiarw poziomw PM 20
3.1 Regulacje prawne . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Metoda grawimetryczna . . . . . . . . . . . . . . . . . . . . . 21
3.3 Osabienie promieniowania . . . . . . . . . . . . . . . . . . 22
3.4 Mierniki TEOM . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.5 Rola modelowania w pomiarach poziomw PM . . . . . . . . 24
4 Opracowanie systemu modelowania zanieczyszcze n 27
4.1 Zao zenia koncepcyjne . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Baza danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.3 Ocena stosowanego schematu bazy danych . . . . . . . . . . 37
4.4 Biblioteka dost epu do bazy danych . . . . . . . . . . . . . . . 39
4.5 Framework importu danych . . . . . . . . . . . . . . . . . . . 40
4.6 Framework modelowania zanieczyszcze n . . . . . . . . . . . 42
v
SPIS TRE
SCI vi
4.7 Analiza opracowanego systemu . . . . . . . . . . . . . . . . . 46
4.8 Stosowane w systemie algorytmy . . . . . . . . . . . . . . . . 49
5 Wykorzystanie sieci neuronowych 53
5.1 Wst epna ekstrapolacja przestrzenna . . . . . . . . . . . . . . 53
6 Podsumowanie 62
6.1 Zawarto s c pracy . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.2 Wnioski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
A Sownik poj e c 64
B Sztuczne sieci neuronowe 68
B.1 Wst ep . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
B.2 Podstawy teoretyczne . . . . . . . . . . . . . . . . . . . . . . . 71
B.3 Poj ecie cechy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
B.4 Kroki potrzebne do zbudowania modeli opartego na SSN . . 78
B.5 Sieci SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
C Dyskretna transformata falkowa 87
C.1 Transformata Fouriera . . . . . . . . . . . . . . . . . . . . . . 88
C.2 Porwnanie transformaty Fouriera i falkowej . . . . . . . . . 89
C.3 Budowanie rodziny falek . . . . . . . . . . . . . . . . . . . . . 89
C.4 Ci aga transformata falkowa . . . . . . . . . . . . . . . . . . . 90
C.5 Analiza wielorozdzielcza . . . . . . . . . . . . . . . . . . . . . 90
C.6 Funkcja skaluj aca . . . . . . . . . . . . . . . . . . . . . . . . 91
C.7 Transformata falkowa a analiza wielorozdzielcza . . . . . . 93
C.8 Szybka dyskretna transformata falkowa . . . . . . . . . . . 94
C.9 Praktyczne aspekty transformaty falkowej . . . . . . . . . . 95
D Teksty cytatw w tumaczeniu wasnym w j ezyku oryginau 97
D.1 Cytaty z rozdziau pierwszego . . . . . . . . . . . . . . . . . . 97
D.2 Cytaty z rozdziau drugiego . . . . . . . . . . . . . . . . . . . 98
D.3 Cytaty z dodatkw . . . . . . . . . . . . . . . . . . . . . . . . . 98
E Sownik terminw informatycznych 99
F Zawarto s c pyty i uruchomienie projektu 102
F.1 Zawarto s c pyty . . . . . . . . . . . . . . . . . . . . . . . . . . 102
F.2 Uruchomienie projektu . . . . . . . . . . . . . . . . . . . . . . 102
Bibliograa 104
SPIS TRE
SCI vii
Lista ilustracji 113
Lista tabel 114
Indeks 118
Rozdzia 1
Wprowadzenie
1.1 Motywacja
Szeroko poj ete zanieczyszczenia powietrza s a jednym z wa zniejszych, nie-
rozwi azanych problemw zarwno w zakresie ochrony srodowiska jak i
ochrony zdrowia. Fakt negatywnego wpywu st e ze n zanieczyszcze n powie-
trza na zdrowie ludno sci zosta wykazany wwielu niezale znych badaniach.
Du zo atwiej jest owym zanieczyszczeniom zapobiega c, ni z likwidowa c ich
skutki.
Brak pewnych, miarodajnych metod prognozowania i modelowania za-
nieczyszcze n powietrza jest powa zn a przeszkod a zarwno wdora znych dzia-
aniach zapobiegaj acym przekroczeniom dopuszczalnych poziomw zanie-
czyszcze n, jak i przy dugofalowym zarz adzaniu ich poziomami. By zapo-
biega c dora znie zanieczyszczeniom wadze samorz adowe ka zdego poziomu
musz a mie c dost ep do wiarygodnego systemu ostrzegaj acego o przyszych
przekroczeniach, natomiast do dugofalowego zarz adzania ich poziomami
potrzebuj a one narz edzi pozwalaj acych oceni c wpyw r znych inwestycji
na poziomy zanieczyszcze n. Dodatkowo budowa, rozwj i utrzymanie sieci
pomiarowych zanieczyszcze n powietrza jest bardzo kosztowne mo zliwe
jest budowanie modeli, ktre umo zliwi a obni zenie tych kosztw, b ad z te z
podwy zszenie ilo sci i jako sci zbieranych danych bez widocznego ich pod-
wy zszania.
Problemten dotyczy wszczeglno sci wadz lokalnych, dla ktrych szcze-
glnie trudno opracowa c modele emisyjne.
Celem pracy jest opracowanie i zbadanie narz edzi do wspomagania sa-
morz adw lokalnych w realizacji programw naprawczych, tj. zmniejsza-
nia poziomu pyu zawieszonego tak, by poziom ten by zgodny z poziomami
dopuszczalnymi zapisanymi w dyrektywie UE 2008/50/WE.
1
ROZDZIA 1. WPROWADZENIE 2
1.2 Py zawieszony
Py zawieszony ( PM
poni-
zej 10m
PM
2,5
jest to frakcja pyu zawieszonego o srednicy aerodynamicznej poni-
zej 2, 5m
Rozr znia si e si e rwnie z inne frakcje. Jednak ze wzgl edu na mo zliwo-
sci pomiarowe (im ni zsze jest grne ograniczenie na wielko s c cz astki, tym
trudniejszy jej pomiar), jak i obowi azuj ac a legislacj e, w ktrej wydzielono
wa snie te dwie frakcje, pozostaniemy przy tym podziale.
Podzia ten nie jest zupenie aprioryczny pomiar tych frakcji wy-
maga r znej aparatury pomiarowej, a ich wpyw zdrowotny rwnie z jest
istotnie inny. Jednak w miar e rozwoju wiedzy na temat wpywu stanu
zanieszczyszcze n na stan zdrowia czowieka oraz innowacji pomiarowych,
mo zliwe s a daleko id ace zmiany regulacji. Zmianom mo ze ulega c nie tylko
podzia na frakcje, ale i przykadowo na jednostki, w ktrych dokonuje si e
pomiaru
.
1.3 Zanieczyszczenia powietrza jako zagro zenie dla
zdrowia
Wpyw pyw zawieszonych na zdrowie ludno sci
Wielokrotnie powtarzane badania przeprowadzane zarwno w Europie jak
i w USA,[1, 4, 5]
Trwaj a badania ktre wykazuj a istotny wpyw zdrowotny liczby drobnych cz astek ktre
przedostaj acych si e do drg oddechowych.
W USA przeprowadzono zdecydowanie wi ecej bada n na ten temat. Podane prace s a pra-
cami przegl adowymi zawieraj acymi wnioski z wielu innych prac badawczych w tej dziedzinie.
ROZDZIA 1. WPROWADZENIE 3
Metodologie badawcze w tym zakresie
Wi ekszo s c przeprowadzanych bada n polegaa na analizie serii czasowych
st e ze n PM i konkretnej metryki zdrowia ludno sci na danym terenie. Me-
tryk a t a mo ze by c, na przykad, smiertelno s c czy ilo s c wizyt w szpitalu.
Prowadzi si e te z badania polegaj ace na ekspozycji badanych ludzi i zwie-
rz at na wysokie st e zenia PM, a nast epnie sprawdzania ich stanu zdrowot-
nego pod k atem przewidywanych objaww.
Badania epidemiologiczne prowadzono porwnuj ac r zne metryki zdro-
wotne na jakim s terenie przed, w trakcie i po epizodach, w ktrych poziom
pyw zawieszonych by istotnie r zny od sredniej na tym terenie
. Wnio-
ski z szeregu bada n prowadzonych w USA t a metod a znajduj a si e w tabeli
1.1.
Kolejnymrodzajembada n epidemiologicznych prowadzonych wtej dzie-
dzinie s a badania porwnuj ace zdrowie ludno sci na terenach o r znych
srednich st e zeniach pyw zawieszonych (i innych zanieczyszcze n). Bada-
nia te s a trudniejsze do przeprowadzania z racji konieczno sci wprowadze-
nia poprawek na inne czynniki maj ace wpyw na zdrowie ludno sci.
Badania mechanizmw oddziaywania pyw zawieszonych przeprowa-
dzano zarwno metodami in vitro jak i in vivo. Prowadzi si e zarwno
mikroskopowe badania efektw oddziaywania cz astek pyw na tkanki
i bada si e makroskopowe objawy pacjentw wystawionych na konkretne
st e zenia pyw zawieszonych.
Wnioski z bada n
Cytowane prace jasno stwierdzaj a istnienie przyczynowej zale zno sci mi e-
dzy st e zeniami PM oraz ilo sci a zgonw i wizyt w szpitalach na danym te-
renie.
Liczba bada n na temat wpywu poziomu pyu zawieszonego
na zdrowie ludno sci wzrosa istotnie w ci agu ostatnich kilku
lat. Badania te dotycz a rwnie z poziomw zanieczyszcze n po-
wszechnie spotykanych w miastach Europy. Wzrosa zarwno
ilo s c bada n epidemiologicznych, jak i toksykologicznych. Te ostat-
nie powoduj a nowe spojrzenie na temat mo zliwych mechani-
zmw niebezpiecznych dla zdrowia procesw zachodz acych pod
wpywem zanieczyszcze n powietrza czym uzupenia zestaw do-
wodw epidemiologicznych. Zgromadzone dowody s a wystar-
czaj ace by mocno zarekomendowa c dalsze regulacje maj ace na
.[6]
S a jednak takie badania, ktre wskazuj a zale zno s c mi edzy szkodliwymi symptomami
zdrowotnymi, a st e zeniem PM
2,5
w zakresie st e ze n od 8 do 30
g
m
3
(ktry to zakres mie sci si e
poni zej wi ekszo sci norm).
ROZDZIA 1. WPROWADZENIE 5
Rysunek 1.1: Zale zno s c wzrostu smiertelno sci przy wzro scie st e zenia PM
10
o 10
g
m
3
od sredniego st e zenia PM
10
.[7] Wykres ten obrazuje fakt istnienia
w przybli zeniu liniowej zale zno sci mi edzy st e zeniem pyw zawieszonych
a ich skutkami zdrowotnymi.
.
Cele tej dyrektywy s a nast epuj ace:
1. zdeniowanie i okre slenie celw dotycz acych jako sci powietrza, wy-
znaczonych w taki sposb, aby unika c, zapobiega c lub ogranicza c
szkodliwe oddziaywanie na zdrowie ludzi i srodowisko jako cao s c;
2. ocen e jako sci powietrza w pa nstwach czonkowskich na podstawie
wsplnych metod i kryteriw;
Powy zej tych progw nale zy wprowadzi c stay monitoring poziomw zanieczyszcze n.
ROZDZIA 1. WPROWADZENIE 9
uzupenianie pomiarw modelowaniem Mo zna, przy spenieniu okre-
slonych warunkw, zast api c 50% wymaganych stacji pomiarowych
wynikami modelowania (Artyku 7 par. 3).
zrda naturalne Je sli zostanie udowodnione, ze przekroczenie okre slo-
nego poziomu zanieczyszcze n wynika z udziau zanieczyszcze n po-
wstaj acych w sposb naturalny przekroczenie takie nie jest uzna-
wane za przekroczenie (Artyku 20, par. 2) .
konieczno s c informowania o przekroczeniach Nakada si e obowi azek
informowania mieszka ncw poszczeglnych obszarw o przekrocze-
niu dopuszczalnych poziomw zanieczyszcze n (Artyku 19 i Za acznik
16) .
normy zanieczyszcze n Wymaga si e osi agni ecia odpowiednich norm ja-
ko sci powietrza.
pomiary wska znikowe Wprowadza si e poj ecie pomiarwwska znikowych.
S a to pomiary, dla ktrych wymagania dotycz ace jako sci danych s a
mniej restrykcyjne w porwnaniu z pomiarami staymi
. By w aczy c
do u zycia owe pomiary nale zy wykaza c (posikuj ac si e modelami), ze
warto sci zanieczyszcze n s a odpowiednio niskie.
wprowadzenie kar Dyrektywa ta nakada na pa nstwa czonkowskie obo-
wi azek wprowadzenia kar dla samorz adw, na terenie ktrych po-
ziomy zanieczyszcze n przekraczaj a odpowiednie poziomy dopuszczalne
(Artyku 7). Aktualnie przepisy te nie s a zaimplementowane w Pol-
sce.
1.5 Zastosowania metod opartych o eksploracj e
danych w kontek scie uwarunkowa n prawnych
oraz ochrony zdrowia mieszka ncw
Metody oparte o eksploracj e danych mo zna stosowa c w nakre slonych kon-
tekstach na nast epuj ace sposoby:
modelowanie By podejmowa c racjonalne decyzje w zarz adzaniu zanie-
czyszczeniami powietrza, lokalne wadze samorz adowe powinny mc
Normy dotycz ace pomiarw wska znikowych rwnie z zale z a od konkretnego rodzaju za-
nieczyszczenia. Dla przykadu dla pyu zawieszonego (PM
10
i PM
2,5
) i pomiary wska znikowe
musz a spenia c nast epuj ace normy: niepewno s c mniejsza od 50%, minimalne pokrycie czasu
14% (albo losowy dzie n w ka zdym tygodniu albo 8 caych tygodni pomiarw rozo zonych rw-
nomiernie w ci agu roku), minimalny uzysk danych 90%.
ROZDZIA 1. WPROWADZENIE 10
oceni c wpyw swoich decyzji na te zanieczyszczenia (zatem na zdro-
wie mieszka ncw). Przykadem takiego narz edzia jest modeli EME-
P/RAINS (dokadniej omwiony w sekcji 2.1), ktry umo zliwia ocen e
wpywu osi agni ecia wymaganych poziomw emisji na zdrowie miesz-
ka ncw Wsplnoty Europejskiej. Model ten umo zliwia wysanie wa-
dzom centralnym poszczeglnych krajw komunikatu: Je sli caa
wsplnota osi agnie oczekiwane poziomy emisji pyu zawieszonego to
wTwoim kraju b edzie rocznie kilka tysi ecy hospitalizacji mniej. Jest
to komunikat przekonuj acy, zrozumiay i konkretny. Bez takiego na-
rz edzia mo zna powiedzie c co najwy zej: Je sli caa wsplnota osi agnie
oczekiwane poziomy emisji to wszyscy b ed a zdrowsi, co ju z nikogo
nie przekona. Byoby po z adanym opracowa c podobne narz edzia dzia-
aj ace na szczeblu lokalnym, by decyzje o wydaniu zgody na loka-
lizacj e (b ad z rozbudow e) fabryk, ranerii, elektrowni, wadze odpo-
wiedniego szczebla podejmoway swiadomie. Przykadem tego typu
modelu, ktry okre sla gwne zrda PM
2,5
, mo ze by c model opisany
w [22].
ostrzeganie Nie tylko dugotrwae srednie st e zenie pyu zawieszonego
jest gro zne dla zdrowia obywateli. Jak pokazuj a badania opisane w
sekcji 1.3 rwnie z krtkotrwae wystawienie na bardzo wysokie st e-
zenia niesie dla osb szczeglnie wra zliwych ryzyko utraty zycia i
zdrowia. Lokalne wadze samorz adowe mog a podj a c pewnie krtko-
terminowe dziaania zapobiegawcze
Mo zliwo s c podj ecia tego typu krtkoterminowych dziaa n zale zy od przyczyn powstania
zanieczyszczenia (a zatem specyki danego terenu). Bez specjalnego dowodu podam nast e-
puj ace przykady takich dziaa n:
Zamkni ecie centrum miasta dla ruchu samochodowego
Oczyszczenie ulic z bota po sniegowego
Wy aczenie konkretnych uci a zliwych zakadw produkcyjnych
Jak wida c dziaania te s a kosztowne i by je podj a c wadze samorz adowe musz a mie c po-
wa zne powody.
ROZDZIA 1. WPROWADZENIE 11
uzupenia c luki w danych powstae albo na skutek awarii oprzyrz a-
dowania, albo wynikaj ace z metody pomiarw (dla pomiarw wska z-
nikowych). Propozycja takiej metody zawarta jest w niniejszej pracy
5.1, inna w [20]. Prowadzone s a prby szacowania poziomw jed-
nych zanieczyszcze n za pomoc a innych zanieczyszcze n [21]. Wreszcie
buduje si e modele wspomagaj ace dokadno s c pomiarw poziomu PM
(patrz 3.5).
zrda naturalne zanieczyszcze n agodniej traktuje si e w dyrektywie
2008/50/WEzanieczyszczenia ze zrde naturalnych (oraz zanieczysz-
czenia kilku innych typwnp. spowodowane nasypywaniemdrg sol a
i piaskiem). Musz a jednak istnie c narz edzia dowodz ace, ze przyczyn a
przekroczenia byy wa snie takie zrda[22].
Rozdzia 2
Przedmiot bada n
On two occasions I have been asked, Pray, Mr.
Babbage, if you put into the machine wrong
gures, will the right answers come out? I am not
able rightly to apprehend the kind of confusion of
ideas that could provoke such a question.
Charles Babbage
a
a
Charles Babbage projektant Silnika Analitycznego
maszyny ktra moga by c pierwszym dziaaj acym urz a-
dzeniem rwnowa znym Uniwersalnej Maszynie Turinga.
Praca skupia si e na rozwini eciu i ulepszeniu metod prognozowania st e-
ze n zanieczyszcze n powietrza. Metody modelowania mo zna podzieli c na
dwie gwne kategorie:
chemical transport model(CTM) S a to metody oparte na analitycznych
Analityczne jest tutaj u zyte w znaczeniu: posiadaj ace matematyczne modele oczywi-
scie przywidywania otrzymuje si e za pomoc a numerycznych oblicze n.
12
ROZDZIA 2. PRZEDMIOT BADA
N 13
2.1 Istniej ace systemy modelowania o podobnym
charakterze w Polsce i Europie
Wdro zenia w Polsce
Aktualnie w Polsce WIO
Sl askie).
Model EMEP jako model pyw zawieszonych
Geneza modelu EMEP
W roku 1979 podpisano traktat o transgranicznym przenoszeniu zanie-
czyszcze n powietrza na dalekie odlego sci (LRTAP
. W jednym z
protokow do tego traktatu ustalono nansowanie programu monitoringu
i oceny dugo zasi egowego transportu zanieczyszcze n powietrza w Europie
(EMEP
Sama konwencja nie wprowadza zadnych norm wyra za ona po prostu wol e podpisu-
j acych j a stron do badania i ograniczania emisji zanieczyszcze n powietrza[26], jednak pod-
pisano w ramach tej konwencji osiem protokow, ktre normuj a, mi edzy innymi, kwesti e
emisji wielu zanieczyszcze n powietrza[27].
(...).
Istniej a wi ec znane zrda pyw zawieszonych niezawarte
w modelu EMEP (...) s a to:
Wtrne organiczne aerozole powstae w atmosferze, ktre
powstay z kondensacji lotnych zwi azkworganicznych (wy-
produkowanych zarwno przez czowieka, jak i pochodze-
nia naturalnego
Emisji pyw zawieszonych z spalania biomasy i po zarw
lasw
Pierwotnych organicznych takich jak pyki czy zarodniki
grzybw[11]
Charakterystyka dziaania modelu EMEP
Wyniki modelu EMEP maj a dobre korelacje czasowe i przestrzenne z da-
nymi pomiarowym (warto sci liczbowe zawarte w tabeli 2.1). Model ten
rwnie z systematycznie niedoszacowuje poziom zanieczyszcze n (warto sci
liczbowe w tabeli 2.2).
Pouczaj ace s a wymienione przyczyny niedoszacowa n. Jedn a ze zdia-
gnozowanych przyczyn niedoszacowa n modelu jest nieuwzgl ednienie wszyst-
kich zrde zanieczyszcze n. Drug a, istotniejsz a, przyczyn a s a immanentne
wa sciwo sci metody pomiaru poziomw PM.
Poziomy PM mierzone s a wieloma metodami, jednak metod a referen-
cyjn a jest metoda grawimetryczna, ktra polega na pomiarze wzrostu masy
ltra, przez ktry przepuszczono zadan a obj eto s c mierzonego powietrza.
Na owym ltrze osadzaj a si e nie tylko pyy zawieszone, ale rwnie z woda
(czy to woda pochodz aca z atmosfery, czy woda b ed aca cz e sci a skadow a
danej drobiny pyu atmosferycznego). Woda ta mo ze stanowi c od 10 do
Istnieje model aerozolowy EMEP, ktry zawiera zrda takie jak poderwana przez wiatr
gleba w uprawach, czy py znad Sahary [przyp. aut.][11].
ROZDZIA 2. PRZEDMIOT BADA
N 15
30% przyrostu masy ltra
O metodach pomiaru poziomu PM jak rwnie z o tym jakie mog a one powodowa c pro-
blemy patrz rozdzia3)
Tablica 2.1: Korelacje mi edzy danymi pomiarowymi a wynikami mo-
delu[12]
Rodzaj korelacji Zakres wspczynnikw korelacji
Czasowa (0, 56; 0, 78)
Przestrzenna (0, 70; 0, 78)
Tablica 2.2: Systematyczne niedoszacowanie poziomw zanieczyszcze n w
modelu EMEP[6]
Rodzaj pomiaru Niedoszacowanie
c
PM
10
w Niemczech 66%
PM
10
w pozostaych krajach 100%
PM
2,5
50%
PM
2,5
uwzgl edniaj ac porwany przez wiatr py 28%
PM
2,5
uwzgl edniaj ac jeszcze
d
wilgotno s c mierzonej prbki 12%
a
Korelacja szeregu czasowego pomiarw dziennych
b
Korelacja dugoterminowych srednich w poszczeglnych punktach prze-
strzennych
c
Zdeniowana jako iloraz r znicy mi edzy poziomami mierzonym i modelowa-
nym do poziomu mierzonego. 100% oznacza ze model daje dwukrotnie mniej-
sze wyniki.
d
Czyli uwzgl edniaj ac py porwany przez wiatr i wilgotno s c mierzonej prbki
ROZDZIA 2. PRZEDMIOT BADA
N 16
Rysunek 2.1: Korelacje szeregw czasowych pomiarw i wynikw modelu
EMEP (na osi odci etych poszczeglne stacje bior ace udzia w programie
EMEP)[11]
(a) Dla PM
10
a
(b) Dla PM
2,5
b
a
Niebieska krzywa reprezentuje korelacje dla suchej masy PM, zielona
reprezentuje such a mas e PM z uwzgl ednieniem pyu porwanego przez
wiatr, czerwona uwzgl ednia dodatkowo wilgotno s c prbki.
b
Niebieska krzywa reprezentuje korelacje dla suchej masy PM, czer-
wona uwzgl ednia dodatkowo wilgotno s c prbki.
W obu rysunkach na osi odci etych znajduj a si e r zne stacje pomiarowe.
Na osi odci etych oznaczono r zne stacie dziaaj ace w ramach programu
EMEP.
Rysunek 2.2: Porwnanie wynikw modelu EMEP z poziomami
zanieczyszcze n[11]
(a) PM
10
(b) PM
2,5
Przerywan a lini a niebiesk a oznaczono wyniki modelowania, czerwon a li-
ni a ci ag a natomiast wyniki pomiarw.
ROZDZIA 2. PRZEDMIOT BADA
N 17
lej. Uzyskanie wymienionych danych jest trudne
, czasochonne i co
wa zniejsze, kosztowne.
mo zliwo sci predykcyjne Modele CTM maj a du zo wi eksze mo zliwo sci
przewidywania. Umo zliwiaj a przewidzenie np. wpywu nowej in-
westycji na poziomy zanieczyszcze n na okre slonym terenie, potra a
wyznacza c przestrzenne rozkady zanieczyszcze n, potra a, wreszcie,
powiedzie c jakie s a zrda zanieczyszcze n powietrza w danym punk-
cie. Metody oparte o eksploracje danych nie maj a natomiast takich
mo zliwo sci. Ich mo zliwo sci opieraj a si e na analizie przeszych danych
nie s a w stanie zatem da c odpowiedzi na pytanie o wpyw jakiej s
przyszej inwestycji na poziomy zanieczyszcze n. Mimo to, mo zna wy-
korzystywa c tego typu modele do przewidywania poziomw zanie-
czyszcze n, jednak b edzie to przewidywanie oparte na analizie danych
przeszych, wi ec niezdolne do uwzgl ednienia nowych uwarunkowa n
(natomiast, przy zao zeniu braku bardzo szybkich zmian charakte-
rystyki emisji, modele te b ed a ci agle dokadniejsze od modeli CTM).
Nie ma rwnie z prostej metody u zycia modeli eksploruj acych dane
do odtworzenia przestrzennego rozkadu zanieczyszcze n na danym
terenie.
systematyczny b ad Wyniki modeli opartych na eksploracji danych s a
rzadziej obarczone systematycznym b edem. Wynika to po prostu z
faktu, ze pracuj a one na danych pomiarowych wi ec, w sposb natu-
ralny odtwarzaj a je. Nale zy jednak zauwa zy c, ze ma to rwnie z ze
strony: modele takie odtwarzaj a rwnie z b edy detektora
. Je sli na
jakiej s stacji pomiarowej, w ktrej dokonuje si e pomiarw r ecznych
pracuje leniwy pracownik, ktry nieprawidowo przygotowuje prbki
pomiarowe przed wa zeniem w wyniku czego pomiary z tej stacji s a
systematycznie zawy zone o np 30%, to model oparty o eksploracj e
danych wiernie odtworzy rwnie z ten artefakt. Je sli dla modeli
tych odtwarzanie danych pomiarowych przychodzi zupenie natural-
nie dla modeli analitycznych uzyskanie wiernego odtwarzania da-
nych jest bardzo trudne, wynika zarwno to z du zej trudno sci w uzy-
skaniu godnych zaufania danych emisyjnych, jak i trudno sci pomia-
rowych pomiaru imisji PM. Problemy z pozyskaniem wiarygodnych i
Szczeglnie w maych miejscowo sciach problemem jest tzw. niska emisja czyli emisja
z gospodarstw domowych. W typowym maym mie scie emitentem zanieczyszcze n jest ka zde
domostwo a jego charakterystyka emisji zale zy od bardzo wielu czynnikw (wygody atwiej
jest uruchomi c piec gazowy ni z nagrza c w kominku, cen paliw, temperatury przy silnych
mrozach cz esto korzysta si e z wielu zrde ciepa na raz).
.
dokadno s c Modele oparte o eksploracj e danych s a rwnie z dokadniej-
sze od modeli analitycznych. Model EMEP daje wyniki systematycz-
nie zani zone (w najlepszym wypadku) o 40% (powody nieoszacowa-
nia opisane w 2.1) . Dokadno s c tego rz edu osi agaj a nawet najprost-
sze modele eksploruj ace dane. Przykadowo, dokadno s c tego rz edu
ma model zdeniowany jako: Dla danego punktu pomiarowego za
wynik modelowania przyjmij zawsze sredni poziom zanieczyszcze n z
caej historii tego punktu.
2.3 Denicja modelu
Sowo model ma wiele znacze n i w tym miejscu okre slamy dokade znacze-
nie w jakim u zywane jest ono w dalszej cz e sci pracy. Model b edzie tutaj
u zywany w rozumieniu:
Schematyczny opis systemu, teorii, lub fenomenu, ktry bie-
rze pod uwag e jego znane lub przewidziane wa sciwo sci i mo ze
by c u zyty do dalszego badania jego charakterystyki (...)
[35]
Dla nas cech a charakterystyczn a modelu jest to ze mo zna na jego podsta-
wie bada c pewne cechy obiektu modelowanego.
Model oparty na technikach eksploracji danych
Model oparty na technikach eksploracji danych to narz edzie, ktre maj ac
pewien korpus danych historycznych jest w stanie odtwarza c dane nale-
W du zej mierze wynika to ze sprzeczno sci interesw, z jednej strony r znym instytucjom
zale zy na posiadaniu miarodajnych danych o emisji, z drugiej emitenci s a karani za prze-
kraczanie norm emisji (co mo ze powodowa c zani zanie raportowanych wynikw pomiarw).
Jako ciekawostk e obrazuj ac a ten fakt podam, ze w grudniu 2010 roku sekretariat traktatu
LRTAP wyda not e o amaniu przez Hiszpani e jednego z protokow traktatu, w ktrej to no-
cie napi etnowano mi edzy innymi posugiwanie si e przestarzaymi danymi dotycz acymi emisji
niektrych zanieczyszcze n[25].
O ile da si e stworzy c katalog emitentw przemysowych, o tyle dla PM przemys nie jest
gwnym emitentem, a co najmniej rwnie istotnymi zrdami emisji jest emisja komunika-
cyjna (czyli produkty spalania paliw, zu zycie opon, hamulcw i asfaltu, oraz pyy wyrzucane
w gr e z powierzchni drogi) oraz tak zwan a niska emisja (czyli emisja z piecw domowych).
Badania przeprowadzone w Finlandii sugeruj a, ze emisja PM z tych kategorii zrde ma, co
do rz edu wielko sci, podobny poziom[30]. O tyle o ile charakterystyka emisji w Polsce i krajach
skandynawskich jest istotnie inna o tyle fakt, ze nie da si e zignorowa c zrde komunikacyj-
nych i niskiej emisji wydaje si e obowi azywa c zawsze. Polskie zrda wydaj a si e potwierdza c
znaczny udzia zrde nieprzemysowych w zanieczyszczaniu powietrza [19]. Model RAINS
stwierdza emisja PM
2,5
ze zrde w kategoriach niska emisja, transportu przemys jest po-
dobny ka zda z tych kategorii wnosia wkad rz edu 24 35%.
.
3.2 Metoda grawimetryczna
Wbie z acej legislacji tylko urz adzenia grawimetryczne s a urz adzeniami od-
niesienia.
Metoda ta jest najprostsza konceptualnie i polega ona na przepuszcze-
niu danej obj eto sci powietrza przez ltr. Powietrze wcze sniej przechodzi
przez system sortownikw, tak by tylko cz astki o odpowiedniej srednicy
traay do ltra, na ktrym si e osadzaj a. Po przepuszczeniu odpowiedniej
ilo sci powietrza przez ltr (chodzi o to, by przyrost masy ltra by istotny
)
ltr jest kondycjonowany, czyli trzymany w warunkach okre slonej tempe-
ratury i wilgotno sci
Dokadny opis ukadw odniesienia oraz metody wykazywania ekwiwalentno sci w [37].
do-
konuj a pomiary przyrostu masy ltra badaj ac spadek jasno sci promienio-
wania . Jasno s c promieniowania po przej sciu przez materi e dana jest
wzorem:
I = I
0
exp (gm) (3.1)
gdzie to staa zale zna od materiau, g to staa zale zna od geometrii
ukadu, natomiast m to przyrost masy prbki.
r znica pomi e-
dzy staymi materiaowymi jest mniejsza ni z 10%[41]. Stae geometryczne
eliminuje si e ze wzorw za pomoc a wprowadzenia prbek kalibracyjnych,
ktre maj a taki ksztat jak folia, przez ktr a przepuszcza si e PM. Dodat-
kowo prbki kalibracyjne cz esto maj a skad podobny do PM (co cz e sciowo
rozwi azuje rwnie z problem nieokre slono sci staej materiaowej.
Rwnanie z jakiego wyznaczamy mas e to[42]:
m = Aln
_
I
0
I
_
(3.2)
gdzie: I
0
to jasno s c wi azki elektronw przechodz acej przez fragment
przed przepuszczeniem przez niego prbki powietrza, I jasno s c wi azki po
tym. A to sta a wyznaczana z kalibracji.
Urz adzenia tego typu s a w stanie dokonywa c pomiary srednich godzi-
nowych st e ze n PM.
Typowy pomiar srednich godzinnych PM wygl ada nast epuj aco: przez 6
minut trwa pomiar osabienia promieniowania przez ltr, na ktrym nie
osadzono pyu, przez 46 minut trwa osadzanie pyu na ta smie, potem przez
6 minut trwa pomiar osabienia promieniowania przez ltr z osadzonym
pyem. Pozostae dwie minuty rezerwowane s a na przemieszczanie ta smy.
3.4 Mierniki TEOM
Jest to mo zliwe w urz adzeniach dziaaj acych wielostopniowo (oddzielny pomiar cz e sci
lotnej) lub poprzez absorpcj e lotnej cz e sci PM na np. w eglu aktywowanym (po uprzednim
pozbyciu si e gazowej cz e sci NO
x
i O
3
. Tego typu rozwi azania s a dla nas mniej ciekawe
poniewa z w dalszej cz e sci rozdziau b edziemy si e koncentrowa c na metodach wspierania
pomiarw za pomoc a modelowania.
Przykadem systemu ktry dziaa w oparciu o TEOM ale jest rwnowa zny za pomiarami
grawimetrycznymi jest system FDMS.
ROZDZIA 3. METODY POMIARW POZIOMW PM 24
3.5 Rola modelowania w pomiarach poziomw PM
Modelowanie poziomu PM
2,5
za pomoc a PM
10
W Polsce nie ma zbyt wielu punktw pomiaru PM
2,5
, poniewa z jednak po-
ziom tego zanieczyszczenia jest skorelowany z poziomem PM
10
oraz z pa-
rametrami pogodowymi, mo zliwe jest jego szacowanie za pomoc a tych da-
nych oraz modelu opartego o eksploracj e danych. W[21] opracowano model
DMM oparty o regresj e wielokrotn a, ktry estymowa poziom PM
2,5
za po-
moc a poziomu PM
10
, oraz parametrw meteorologicznych i charakterystyk
czasowych. Podany model dziaa na srednich godzinowych.
Poziom PM
2,5
wyznaczano ze wzoru:
PM
2,5
= b
0
+
N
i=1
b
i
X
i
(3.3)
gdzie X
i
to odpowiednie zmienne pogodowe, a wspczynniki b
i
wyzna-
czono metod a najmniejszych kwadratw.
Po sprawdzeniu wielu zestaww parametrw autorzy wybrali model
pracuj acy na nast epuj acym zbiorze zmiennych X
i
:
Poziom PM
10
cosinus dnia w roku
cosinus godziny w dobie
temperatura powietrza
wilgotno s c wzgl edna powietrza
Model ten z dobr a dokadno sci a by w stanie (po wytrenowaniu na danych
z Zabrza) prawidowo odtwarza c dane z D abrowy Grniczej.
Model ekstrapoluj acy do uzupeniania luk w pomiarach
Mo zliwe jest zbudowanie modelu dokonuj acego ekstrapolacji poziomu PM
10
,
na podstawie poziomu PM
10
na pobliskich stacjach, oraz parametrw po-
godowych w punkcie ekstrapolowanym. Model ten dokadnie jest opisany
w sekcji 5.1.
Model ten mo ze mie c nast epuj ace zastosowania:
godz
24
dzien
365
.
ROZDZIA 3. METODY POMIARW POZIOMW PM 25
Uzupenianie luk wynikaj acych z awarii b ad z konserwacji urz adze n
pomiarowych. W pomiarach wyst epuj a krtkotrwae luki, model ten
mo ze z powodzeniem uzupenia c takie luki korzystaj ac z pomiarw
na pobliskich stacjach.
Zapewnianie pomiarw on line ze stacji grawimetrycznych. Jedn a z
wad miernikw grawimetrycznych jest czas po jakim otrzymuje si e
wyniki pomiarw. Ukad interpoluj acy mgby bardzo atwo udost ep-
nia c pierwsz a estymacj e pomiarw on line tj. udost epnia c esty-
macj e bie z acego poziomu PM
10
za pomoc a wynikw z pobliskiej stacji
automatycznej.
Zapewnianie ekwiwalentno sci dla miernikw TEOM
Gwn a metod a prowadzenia pomiarw PM
10
on line w Wielkiej Brytanii
s a mierniki TEOM. Wielka Brytania jest jednak zobowi azana do prowa-
dzenia pomiarw za pomoc a urz adze n rwnowa znych w rozumieniu normy
EN 12341:1999, a mierniki TEOM nie speniaj a tego warunku. Wymiana
miernikw, b ad z ich modernizacja, jednak poci aga za sob a du ze koszty.
Poniewa z ilo s c lotnych zwi azkw w PM zmienia si e w zale zno sci od se-
zonu, nie da si e wprowadzi c zadnego staego czynnika koryguj acego po-
miary miernikw TEOM tak, by byy one zgodne z pomiarami referencyj-
nymi, tj. nie istnieje takie A
popr
ktre gwarantuje;
PM
ref
= A
popr
PM
TEOM
(3.4)
gdzie: PM
REF
to poziom PM
10
ktry jest zgodny z pomiarami referen-
cyjnymi, PM
TEOM
to poziom mierzony miernikiem TEOM, a A
popr
to staa
w czasie i pomi edzy r znymi miernikami TEOM warto s c.
Jednym z rodzajw miernikw, ktry jest zgodny z pomiarami referen-
cyjnymi jest s a mierniki FDMS
Termin zwi azany z pomiarami pyw zawieszonych-, wyja snienie w dodatku w dodatku
A.
ROZDZIA 3. METODY POMIARW POZIOMW PM 26
gdzie PM
FDMS PURGE
to ilo s c lotnych substancji w PM mierzona za po-
moc a miernika FDMS.
Rozdzia 4
Opracowanie systemu
modelowania zanieczyszcze n
A gdyby, za zmy, by taki opis, ktry by
doskonale wiernie opisywa rzecz opisywan a?
To nie byby opis.
Aha, no tak. To byaby wtedy rzecz opisywana.
To byaby rzecz nie opisywana. To byby fakt.
Edward Stachura Fabula Rasa
Oprogramowanie powstae w ramach niniejszej pracy mo ze stanowi c
zr eby automatycznego systemu modelowania zanieczyszcze n. W nast ep-
nych cz e sciach zostanie opisana architektura takiego systemu, z zaznacze-
niem, jakie jej cz e sci s a ju z uruchomione oraz jakie prace mo zna nad nimi
wykona c.
4.1 Zao zenia koncepcyjne
Kroki niezb edne do wykonania modelowania
By wykona c zadanie modelowania nale zy wykona c nast epuj ace kroki:
1. Pobra c niezb edne dane z zewn etrznych systemw. Zazwyczaj
niezb edne dane zawarte s a w wielu r znych systemach nale z acych do
r znych organizacji
bazy danych.
U zywam terminu zrdo danych poniewa z dane pobieramy nie tylko ze stacji pomiaro-
wych, ale zrdem danych s a dla nas wyniki modelowania z ICM.
.
6. Baza danych powinna mie c mo zliwo s c pracy w trybie rozproszonym,
tj. powinna istnie c mo zliwo s c przenoszenia danych mi edzy oddziel-
nymi serwerami bazodanowymi.
7. Oprogramowanie zarz adzaj ace baz a danych powinno umo zliwia c do-
st ep do bazy danych z jak najwi ekszej liczby j ezykwprogramowania.
Skadniki systemu
System ten powinien skada c si e z nast epuj acych skadnikw:
1. Kod bazy danych. Udost epniaj acy takie operacje jak u srednianie i
normalizacja danych.
2. Biblioteki dost epu do bazy danych stworzone w odpowiednich
j ezykach. Powinny one umo zliwia c nie tylko dost ep do bazy danych
za pomoc a SQL
Ten wymg nie jest bezwzgl edny, jednak wedug Autora, jako s c naukowa i wiarygodno s c
prac zyska, je sli b edzie mo zna powiedzie c, ile danych byo r ecznie zmienianych i w jakim
zakresie dokonano zmian.
p
u
B
a
z
a
d
a
n
y
c
h
t
c
p
/
i
p
M
o
d
e
l
o
w
a
n
i
e
I
m
p
o
r
t
d
a
n
y
c
h
B
i
b
l
i
o
t
e
k
a
i
m
p
o
r
t
u
W
t
y
c
z
k
a
i
m
p
o
r
t
u
I
W
t
y
c
z
k
a
i
m
p
o
r
t
u
I
I
i
m
p
o
r
t
i
m
p
o
r
t
d
a
n
e
p
o
m
i
a
r
o
w
e
/
m
o
d
e
l
o
w
e
d
a
n
e
o
s
t
a
n
i
e
i
m
p
o
r
t
u
Z
e
w
n
t
r
z
n
y
s
y
s
t
e
m
Z
e
w
n
t
r
z
n
y
s
y
s
t
e
m
D
a
n
e
D
a
n
e
B
a
z
a
d
a
n
y
c
h
M
o
d
e
l
I
M
o
d
e
l
I
I
d
a
n
e
p
o
m
i
a
r
o
w
e
/
m
o
d
e
l
o
w
e
d
a
n
e
p
o
m
i
a
r
o
w
e
/
m
o
d
e
l
o
w
e
w
y
n
i
k
i
m
o
d
e
o
w
a
n
i
a
w
y
n
i
k
i
m
o
d
e
o
w
a
n
i
a
A
p
l
i
k
a
c
j
a
W
W
W
S
e
r
w
e
r
W
W
W
O
p
e
r
a
t
o
r
U
y
t
k
o
w
n
i
k
S
e
r
w
e
r
e
m
a
i
l
d
a
n
e
p
o
m
i
a
r
o
w
e
/
m
o
d
e
l
o
w
e
Z
m
i
a
n
y
w
p
r
o
w
a
d
z
a
n
e
p
r
z
e
z
o
p
e
r
a
t
o
r
a
A
l
e
r
t
y
e
-
m
a
i
l
W
y
n
i
k
i
m
o
d
e
l
o
w
a
i
a
W
y
n
i
k
i
m
o
d
e
l
o
w
a
i
a
P
o
p
r
a
w
i
a
n
i
e
d
a
n
y
c
h
O
p
e
r
a
t
o
r
U
r
u
c
h
a
m
i
a
n
i
e
i
m
p
o
r
t
u
A
u
t
o
m
a
t
y
c
z
n
e
u
r
u
c
h
a
m
i
a
n
i
e
i
m
p
o
r
t
u
U
r
u
c
h
a
m
i
a
n
i
e
i
m
p
o
r
t
u
S
c
h
e
m
a
t
b
a
z
y
d
a
n
y
c
h
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 31
Rysunek 4.2: Przepyw danych w systemie
Import danych
SQL
import danych
Gotowe dane
Dane surowe
przetwarzanie
Modelowanie
Model 2 Model 1
SQL
Dane dla modelu
SQL
Wyniki modelu
SQL
Dane dla modelu
Wyniki modelowania
SQL
Wyniki modelu
Dane poprawione
Operator
GUI
Werykacja danych
przetwarzanie
Baza danych
Modelowanie
Dostarczanie danych
Strona WWW
Emaile o poziomach
alarmowych
Sprawdzanie jakoci
modelowania
SQL
Wyniki
SQL
Dane pomiarowe
GUI
Werykacja modeli
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 32
Rysunek 4.3: Zale zno sci programistyczne w systemie
Schemat bazy danych
Baza danych
Biblioteka dostpu
do bazy danych
tcp/ip
Framework importu
includes
Importer I Importer II
includes includes
Framework modelowania
includes
Model I Model II
includes includes
Oprogramowanie aplikacji WWW
includes
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 33
Rysunek 4.4: J ezyki w jakich wykonano poszczeglne komponenty sys-
temu. Na szaro cz e sci nie zaimplementowane.
B
a
z
a
d
a
n
y
c
h
J
a
v
a
J
P
A
D
o
s
t
p
d
o
b
a
z
y
d
a
n
y
c
h
M
a
t
l
a
b
A
p
i
d
o
s
t
p
u
d
o
b
i
b
l
i
o
t
e
k
J
A
V
A
A
P
I
j
a
v
a
d
l
a
M
A
T
L
A
B
A
M
o
d
e
l
e
P
y
t
h
o
n
S
Q
L
A
l
c
h
e
m
y
O
p
r
o
g
r
a
m
o
w
a
n
i
e
s
t
r
o
n
y
W
W
W
S
e
r
w
e
r
W
W
W
d
o
s
t
p
d
o
b
a
z
y
d
a
n
y
c
h
d
o
s
t
p
d
o
b
a
z
y
d
a
n
y
c
h
I
n
t
e
g
r
a
c
j
a
r
o
d
o
w
i
s
k
a
M
A
T
L
A
B
z
j
z
y
k
i
e
m
J
A
V
A
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 34
4.2 Baza danych
Bie z acy rozdzia jest opisem uruchomionego w ramach pracy systemu ba-
zodanowego. W ostatniej cz e sci podane zostan a prace, ktre wedug au-
tora, powinny zosta c jeszcze wykonane.
Podj ete decyzje projektowe
Najwa zniejsz a decyzj a jest prba jak najwi ekszej normalizacji
, schematu
bazy danych i rezygnowanie z normalizacji tylko z przyczyn wydajno scio-
wych. Utrzymanie spjno sci danych jest w tego typu systemach zawsze
bardzo trudne do osi agni ecia dane te, bowiem zmieniaj a si e w czasie
(na przykad podczas werykacji danych pomiarowych przez operatora),
wi ec po z adanym jest minimalizacja pracy zwi azanej z utrzymaniem ich
spjno sci.
Z przyczyn wydajno sciowych zdecydowano si e na przechowywanie w
bazie danych rwnie z:
U srednionych wynikw pomiarw
Znormalizowanych wynikw pomiarw
Podstawowe metadane
Podstawowe metadane
Zrda danych
Inne dane sownikowe
Dane te opisane za pomoc a trzech tabel: POINT_TYPE, DATA_SOURCE
oraz DICTIONARY.
Schemat tych tabel na rys. 4.5.
).
Dla pozostaych tabel, w ktrych dane b ed a dodawane zdecydowanie
cz e sciej, do tworzenia klucza gwnego u zywa si e funkcji skrtu
. Dla ta-
beli DATA_SOURCE warto s c klucza gwnego rwna jest skrtowi MD5
Jest to wada tego rozwi azania. Jednak nie jest to wada bardzo gro zna. Wydaje si e, ze
rodzaje parametrw pogodowe b ed a wprowadzane do systemu do s c rzadko.
Rodzaj funkcji skrtu. Jest to jedna z najpowszechniej u zywanych funkcji skrtu ogl-
nego zastosowania
Dla pomiarw jest to czas zebrania pomiaru, natomiast dla modelu chwila, dla ktrej
wykonano modelowanie.
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 36
Przechowywanie danych u srednionych
Dane u srednione przechowywane s a w oddzielnej tabeli dla ka zdego ro-
dzaju u srednienia. Oddzielnie tworzony jest widok
Stworzenie takiego systemu nie byo celem pracy, udao si e to niejako przy okazji.
Rysunek 4.8: Schemat tabeli POINT_TYPE_META_DATA
TABLE: POINT_TYPE
ID: MEDIUMINT
NAME: VARCHAR
TABLE: POINT_TYPE_METADATA
POINT_TYPE: MEDIUMINT
META_DATA_TYPE: VARCHAR
NORMALIZATION_FACTOR_A: DECIMAL
NORMALIZATION_FACTOR_B: DECIMAL
LOW_BOUND: DECIMAL
HIGH_BOUND: DECIMAL
POINT_TYPE
0..n 0..1
Rodzaj punktu
Pole deniuje czy normalizacja jest dla danych urednionych
i jak urednionych.
Moliwe wartoci:
* DAILY --- dane urednione dziennie
* HOURLY --- dane urednione godzinowo
* NORMAL --- dane nie urednione
META_DATA_TYPE
Rysunek 4.9: Schemat tabel przechowuj acych dane znormalizowane
TABLE: DAILY_AGGREGATE_MATERIALIZED_NORMALIZED
DATE: DATE
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
VIEW: HOURLY_AGGREGATE_NORMALIZED
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
VIEW: DAILY_AGGREGATE_NORMALIZED
DATE: DATE
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
TABLE: DATA_POINT
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
TABLE: HOURLY_AGGREGATE_MATERIALIZED_NORMALIZED
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
Wylicza dane
Wylicza dane
Cache
Cache
Dane urednione na godzine (projekt)
Dane urednione na dzie
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 38
Zalety przyj etego podej scia
Dodanie nowego zrda danych nie powoduje zmiany sche-
matu. Gwn a zalet a metod modelowania zanieczyszcze n opartych
na eksploracji danych jest relatywna atwo s c wprowadzania w no-
wych miejscach. Konieczno s c modykacji bazy danych dla ka zdego
zrda pomiarw cz e sciowo osabiaaby zalety tego systemu.
Jest do s c wydajny. Przy korzystaniu z kopi podr ecznych u srednio-
nych danych czasy wykonania zapyta n s a rz edu sekund (czasy zale z a
od zo zono sci zapytania zapytanie dokonuj ace treningu sieci na da-
nych kilkuletnich z dwch stacji pomiarowych trwa nieca a minut e).
Zapytania normalizuj ace/u sredniaj ace dane s a proste i dzia-
aj a szybko.
Wady przyj etego podej scia
Niezb edne indeksy zajmuj a du zo miejsca. Przykadowo w bazie
danych Autora dane w tabeli DATA_POINT zajmuj a ok 500mb, nato-
miast indeksy do niej ok 1GB. Nie jest to wielka wada. Baza danych,
podana w przykadzie, ma ju z rozmiar podobny do rozmiaru bazy da-
nych, ktra b edzie u zywana produkcyjnie. Bior ac pod uwag e dzisiej-
sze ceny dyskw twardych, rozmiar bazy danych nie b edzie proble-
mem.
Zapytania pobieraj ace dane dla modeli s a skomplikowane.
Typowe zapytania dla modelu da si e opisa c w nast epuj acy sposb:
Pobierz dane u srednione dziennie, zawieraj ace poziomy zanieczysz-
cze n z poprzednich trzech dni oraz dane pogodowe z danego dnia dla
caego roku 2010. W bie z acym schemacie bazy danych tumacze-
nie tego zapytania na j ezyk SQL wymaga stworzenia wielu komend
JOIN, ktre powoduj a, ze zapytanie to robi si e dugie i atwo w nim
popeni c b ad. By rozwi aza c ten problem w bibliotece dost epu do bazy
danych udost epniono metod e automatyzacji tego procesu (patrz 4.4).
Potrzebne prace
Automatyczne tworzenie/od swie zanie danych u srednionych
Do
wdro zenia systemu do ci agej pracy nale zy stworzy c mechanizm au-
tomatycznego wykonywania u srednionych podr ecznych kopi danych.
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 39
W tej chwili takie u srednienia wykonuje si e poprzez r eczne urucho-
mienie zapytania. Metoda wdro zenia tego rozwi azania zale zy od u zy-
wanego DBMS (niektre DBMS maj a tak a funkcjonalno s c wbudo-
wan a), inne wymagaj a stworzenia odpowiedniego podprogramu dzia-
aj acego w bazie danych.
Przygotowanie bazy danych do przetrzymywania srednich go-
dzinowych.
Umo zliwienie r ecznego poprawiania danych wraz z przecho-
wywaniem historii zmian poszczeglnych punktw.
4.4 Biblioteka dost epu do bazy danych
Biblioteka dost epu do bazy danych oparta jest o mechanizm JPA 1.0
.
Parametryzowane zapytania SQL
Bezpo srednim powodem wdro zenia funkcjonalno sci parametryzowanych
zapyta n SQL by fakt, ze Matlab nie udost epnia takiej funkcjonalno sci
(mo zna tylko wykonywa c kwerendy
Jest to klasa Matlaba, ktra wydziela operacje i wasno sci wsplne dla
ka zdego modelu, oraz implementuje cz e s c tych operacji.
Deniowane wasno sci to:
nazwa nazwa predyktora
non_model_params metaparametry modelu: s a to parametry, ktrych
nie pobieramy bezpo srednio z danych. Dla perceptronu b edzie to ilo s c
warstw, dla sieci SVM parametry C, i .
Te operacje to:
trening Funkcja trenuj aca, ktra pobiera zestaw danych treningowych.
predykcja Funkcja dokonuj aca modelowania
optymalizacja metaparametrw Wi ekszo s c modeli umo zliwia optyma-
lizacj e metaparametrw w oparciu o testowy zbir danych.
Dodatkowo predyktor implementuje operacj e treningu i walidacji, ktra
jest dokadniej opisana w rozdziale 4.8.
Predyktor oparty o SVM
Jest to klasa Matlaba realizuj aca predyktor oparty o SVM. Jej du za zalet a
jest mo zliwo s c wydajnej (a zatem cz estej) optymalizacji metaparametrw,
opisana w rozdziale 4.8.
Jest to mo zliwe, poniewa z obie te technologie acz a si e z baz a danych za pomoc a JDBC
niskopoziomow a bibliotek a dost epu do bazy danych w j ezyku Java.
Rysunek 4.11: Klasy managerw
HajmonConnector
query_manager
point_type_manager
data_source_manager
database
HajmonEntryPoint
query_manager
point_type_manager
data_source_manager
database
MATLAB JAVA
Rwnie pozostae
managery maj swoje
matlabowe odowiedniki
QueryManager
Zawiera
QueryManager
QueryManager
PointTypeManager
Udostpnia
Udostpnia
Udostpnia
Udostpnia
Rysunek 4.12: Manager bazy danych
Database
url_jdbc
nazwa_uytkownika
haso
sterownik_jdbc
Konguracja JPA
Pobiera dane
JRE
konguracja dostpu
do SSL (jeli jest
potrzebna)
API dostpu
do bazy danych
matlaba
Konguraja
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 46
4.7 Analiza opracowanego systemu
Opracowany system nie jest, zadn a miar a, gotowy do produkcyjnego wdro-
zenia powsta on w ramach pracy magisterskiej i brakuje w nim wielu
niezb ednych funkcjonalno sci. Jednak jest on funkcjonuj acym systemem, a
wdro zenie tych funkcjonalno sci nie b edzie utrudnione, poniewa z pozostaa
cz e s c systemu by a pisana z my sl a o ich przyszym w wdro zeniu.
Najwi eszymbrakiemjest niezaprzeczalnie (opisany ju z wrozdziale 4.3),
brak automatycznego u sredniania danych przy ich imporcie. Gwnym
powodem nie zaimplementowania takiej funkcjonalno sci jest fakt, ze naj-
prawdopodobniej wykracza ona poza to, co da si e osi agn a c posuguj ac si e
kodem SQL, zatem taka funkcjonalno s c b edzie z konieczno sci przywi azana
do konkretnego DBMS, a co za tym idzie, niejako, przywi a ze projekt do da-
nego DBMS. Dodatkowo tego typu funkcjonalno sci s a wbudowane w naj-
bardziej zaawansowane DBMS .
Du z a wag e przyo zono do tego by proponowany system by elastyczny
zarwno pod wzgl edem atwo sci wprowadzania nowych zrde danych, czy
parametrw,jak i pod wzgl edem czysto informatycznym. Poniewa z rela-
cje pomi edzy poszczeglnymi komponentami s a jasno zdeniowane to wy-
miana cz e sci elementw nie powinna zaburza c cao sci systemu.
Najwi eksz a wad a proponowanego systemu jest fakt, ze zawiera on kod
w trzech j ezykach (a po dodaniu mo zliwo sci wy swietlania wynikw mode-
lowania na stronie WWWdojdzie czwarty j ezyk)
Tymi j ezykami s a: SQL, JAVA, j ezyk MATLABA i (dla aplikacji WWW) Python.
Rysunek 4.13: Schemat klas udost epniaj acych parametryzowane zapyta-
nia SQL.
HajmonConnector
getQueryFromSQL(String sql)
getQuery(String name)
Java: Query
Ustawianie parametrw:
Object = getParameter(String name)
setParameter(String name, Object value)
Pobieranie tekstu zapytania
String getSQL
Matlab: Query
Wasnoci:
query: klasa implementujca zapytanie w Javie
Ustawianie parametrw:
Object = getParameter(String name)
setParameter(String name, Object value)
Wykonanie zapytania
execute
execute_cell_array
Tworzy
Zawiera
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 47
Model
stwrz
zapytanie
HajmonConnector
stwrz
Kwerenda:matlaba Kwerenda:Java
return
stwrz
Query lifecycle
ustawianie parametrw
Ustaw
parametr
Pobierz gotowy
kod SQL
Sprawd warto i
konwertuj parametr
Wykonaj zapytanie
Wykonaj
zapytanue
Pobierz gotowy
kod SQL
kod SQL
Sprawd warto
czy wszystkie parametry
podane
Database
Toolbox
Ustaw preferencje
bazy danych
Wykonaj zapytanie
Zwrc wyniki Zwrc wyniki
return
Rysunek 4.14: Schemat wykonywania zapytania
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 48
autora, bya nie do unikni ecia j ezyk MATLABA jest mocno nakierowany
na obliczenia numeryczne i ma on du zo ogranicze n przy innych zastosowa-
niach. MATLAB ponadto ma ograniczon a integracj e z baz a danych. By
omin a c wady MATLABA wprowadzono bibliotek e JAVA. Ponadto jako pro-
gramista ktry pracowa zarwno przy aplikacjach webowych opartych o
j ezyk JAVA
i
= a v
i
+b (4.1)
Nale zy zatem wyznaczy c parametry a i b. By wyznaczy c te parametry
posugujemy si e wzorami:
a =
1
v
max
v
min
(4.2)
b =
v
min
v
max
v
min
(4.3)
gdzie parametry v
max
i v
min
to grny i dolny przedzia, ktry normali-
zujemy do przedziau (0, 1).
Najprostsz a metod a normalizacji jest wzi ecie odpowiednio warto sci mi-
nimalnej i maksymalnej, ma to jednak jedn a zasadnicz a wad e: praktycz-
nie w tej bazie danych znajdowa c si e b ed a warto sci b edne, w tym warto sci
bardzo wysokie i bardzo niskie, ktrych uwzgl ednienie mo ze powodowa c,
ze normalizacja b edzie przebiega c de facto do odcinka w e zszego ni z (0, 1),
co mo ze wprowadza c SSN w b ad.
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 50
Zdecydowano si e przyj a c nast epuj ac a metod e wyznaczania v
max
i v
min
:
Dzieli si e dane na zbir danych mniejszych od sredniej i wi ekszych
od sredniej ( v).
Oddzielnie wyznacza si e ich odchylenia standardowe
min
i
max
Odpowiednie warto sci wyznacza si e ze wzorw:
v
min
= v 5
min
(4.4)
v
max
= v + 5
max
(4.5)
W ten sposb zarwno wpyw pojedynczych pomiarw na warto sci v jest
may, oraz zapewnia si e, ze wi ekszo s c danych b edzie w przedziale (0, 1).
Algorytm treningu i walidacji sieci
Najistotniejszym warunkiem uzyskania miarodajnych wynikw dokadno-
sci danej SSN jest wyznaczanie dokadno sci przy u zyciu danych wej scio-
wych, ktre nie bray udziau w procesie uczenia.
Pierwszym krokiem algorytmu jest wi ec podzielenie zbioru uzyskanych
danych na dwa podzbiory: zbir danych do uczenia i zbir su z acy do te-
stowania. Dane testuj ace nale zy wybra c w sposb losowy. Przyj eto, ze
stosunek danych testuj acych do danych ucz acych wynosi 0.2. Dane ucz ace
su z a do uczenia sieci, ktra jest wykorzystana do przewidzenia danych w
serii testuj acej. Schemat blokowy algorytmu podano na rys. 4.15, opis w
pseudokodzie do aczono jako alg. 4.1.
Po takiej procedurze otrzymuje si e dwa ci agi danych: ci ag danych prze-
widzianych przez sie c oraz danych zarejestrowanych przez stacj e pomia-
row a pomiarow a.
Rysunek 4.15: Schemat blokowy pojedynczej iteracji trenowania i walida-
cji predyktor
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE
N 51
Wybr danych do testowania ma wpyw na otrzyman a dokadno s c mo-
delowania. W naszym przypadku wynika to z tego ze st e zenia zanieczysz-
cze n zmieniaj a si e wsposb skokowy. Zmian tych sie c dziaaj aca na danych
imisyjnych nie ma szans przewidzie c. Je sli do danych testuj acych dostanie
si e wi ecej takich punktw danych, to wyznaczona dokadno s c sieci spad-
nie. By zminimalizowa c takie efekty ca a procedur e testowania i walidacji
nale zy powtrzy c kilkukrotnie. Przyj eto ze, przy otrzymywaniu wynikw,
ktre tra a do niniejszej pracy
, czyli wytreno-
.
By zbada c mo zliwo sci tego modelu, musimy zbada c takie charaktery-
styki jak:
By uzupenia c pomiary wska znikowe nale zy jeszcze uzyska c dost ep do danych pogodo-
wych zbieranych w sposb ci agy w ekstrapolowanym punkcie. Problem ten wymaga dalszych
bada n najprawdopodobniej mo zliwe jest zast apienie danych pomiarowych numeryczn a
analiz a pogody.
53
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 54
Czy wdro zenie tego modelu wprowadza dodatkowe dane do zbioru
danych wska znikowych tj. czy uzupenienie danych wska zniko-
wych wynikami modelowania polepsza jako s c estymacji takich para-
metrw srednie roczne, czy ilo s c przekrocze n w roku.
Jaka jest maksymalna odlego s c mi edzy stacjami wspieraj acymi eks-
trapolacj e i stacj a ekstrapolowan a.
Jaka jest minimalna ilo s c danych o poziomie zanieczyszczenia powie-
trza na stacji ekstrapolowanej, ktr a model potrzebuje do poprawnej
pracy.
Czy mo zna przeprowadza c ekstrapolacj e mi edzy stacjami r znych ty-
pw (na przykad ekstrapolowa c poziomy na stacji ta regionalnego
na podstawie stacji ta miejskiego).
By zbada c te informacje stworzono modele ekstrapoluj ace opisane na ta-
beli 5.1.
Schemat sieci ekstrapoluj acych
Sieci ekstrapoluj ace otrzymuj a nast epuj ace dane wej sciowe:
Poziom PM
10
na stacjach wspieraj acych ekstrapolacj e.
Temperatur e na wszystkich stacjach na bie z acy dzie n oraz wilgotno s c
na dzie n bie z acy oraz poprzedni.
Opady na stacji ekstrapolowanej na dzie n bie z acy oraz poprzedni
.
Schemat modelu na rys 5.1.
Badane wasno sci modeli ekstrapoluj acych
By odpowiedzie c na pytania okre slone w powy zszym paragrae spraw-
dzimy modele wedug nast epuj acego schematu:
1. Do testw ekstrapolacji wybierzemy stacje, ktre zbieraj a dane w try-
bie ci agym.
2. Z penego zbioru danych stacji ekstrapolowanej b edziemy losowa c pe-
wien odsetek danych, ktre b ed a u zywane do treningu modelu. Pozo-
stae dane u zyte b ed a do werykacji.
Wybrano takie, a nie inne parametry pogodowe tylko w celu ujednolicenia zbioru para-
metrw, na ktrych operuj a r zne modele
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 55
3. Ca a procedur e testowania powtarza c b edziemy 80 razy dla r znych,
wylosowanych zestaww danych treningowych (by otrzymane wyniki
reprezentoway sredni MAPEmodeli wytrenowanych dla danego wsp-
czynnika wypenienia).
Zanimwska zemy jakie rodzaje danych sprawdzimy wprowadzimy denicje
poszczeglnych serii danych.
peny zbir danych f
i
cay zbir danych z ekstrapolowanej stacji
dane wska znikowe w
i
dane u zyte do treningu modeli. U zywam tej na-
zwy mimo, ze jest to merytorycznie w atpliwe dlatego, i z model ten
b edzie mg su zy c do uzupeniania luk w danych wska znikowych.
dane sprawdzaj ace s
i
seria danych z dni, dla ktrych mamy pomiar w
penych danych, a ktre nie zostay wybrane jako dane wska znikowe.
dane modelowane m
i
seria danych, w ktrej zawieraj a si e modelowane
wyniki z dni znajduj acych si e wpenymzbiorze danych a nie znajduj a
si e w danych wska znikowych.
dane ekstrapolowane e
i
seria danych skadaj aca si e z danych wska zni-
kowych, w ktrych luki uzupeniono wynikami modelowana.
wspczynnik wypenienia F
f
ilo s c danych wybranych jako dane wska z-
nikowe w stosunku do penego zbioru danych F
f
=
w
i
f
i
.
Model
ekstrapolujcy
Poziomy PM_10
na stacjach
wspomagajcych
interpolacj dla dnia N
Temperatura dla
dnia N, wilgotno
dla dni N, N-1, dla
wszystkich stacji
Opady dla dni N,
N-1 dla stacji
ekstrapolowanej
Poziom
PM_10 na
dzie N dla
stacji
ekstrapolowanej
Rysunek 5.1: Schemat modelu ekstrapoluj acego
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 56
Testowane wasno sci sieci:
MAPE mi edzy danymi sprawdzaj acymi a modelowanymi
korelacja mi edzy danymi sprawdzaj acymi a modelowanymi
wzgl edna r znica w srednim poziomie zanieczyszcze n mi edzy danymi
ekstrapolowanymi a danymi wska znikowymi. Je sli oznaczymy przez
x
i
sredni a zbioru danych to b edzie to:
wsk
=
w
i
f
i
,
extra
=
e
i
f
i
. Je-
sli parametr ten dla ekstrapolowanego zbioru danych b edzie lepszy
ni z dla zbioru wska znikowego oznacza to, ze model ekstrapoluj acy
wprowadza dodatkowe dane do zbioru danych wska znikowego i dane
te polepszaj a dokadno s c wyznaczenia sredniego poziomu.
wzgl edna r znica mi edzy ilo sci a przekrocze n mi edzy danymi ekstra-
polowanymi danymi wska znikowymi. Je sli przez p(x
i
) ilo s c przekro-
cze n w serii danych x
i
to
wsk
=
1
F
f
p(w
i
)
p(f
i
)
,
extra
=
p(e
i
)
p(f
i
)
. Ilo s c prze-
krocze n w zbiorze wska znikowym wyznaczamy zakadaj ac, ze dane
wska znikowe s a reprezentatywne dla caego zbioru danych i otrzy-
mamy rozs adn a estymacj e. Je sli w zbiorze zawieraj acym 20% danych
jest 5 przekrocze n, to w penym zbiorze mo zemy oczekiwa c 25.
Wszystkie te parametry zbieramy w funkcji wspczynnika wypenienia.
Zbadane modele opisano w tablicy 5.1, mapk e sytuacyjn a przedstawia-
j ac a poo zenie stacji zamieszczono na rys. 5.2.
Analiza wynikw
Wyniki analizowanych modeli zamieszczono w tabeli 5.1 oraz na rys. 5.3
5.6.
Wida c spadek dokadno sci ekstrapolacji wraz ze wzrostem odlego sci
stacji ekstrapolowanej od stacji wspieraj acych nie jest to jednak prosta
zale zno s c. Mog a nad ni a dominowa c inne czynniki. Dokadno s c modelu
Radom II, ktry pracuje na danych z Pocka i Ursynowa jest lepsza od mo-
delu Radom, ktry opiera si e na warszawskich stacjach.
Srednia odlego s c
od stacji wspieraj acych jest ni zsza dla modelu Radom, jednak zdaje si e, i z
wa zniejszym czynnikiem jest to, ze stacja w Pocku mo ze by c nieczua na
pewne zdarzenia wpywaj ace na emisj e charakterystyczne dla Warszawy
takie jak korki czy roboty budowlane.
Dla wszystkich stacji (nawet dla Belska) w aczenie danych ekstrapolo-
wanych wzbir danych wska znikowych podnioso dokadno s c wyznaczania
takich parametrw jak sredni poziom pyu zawieszonego, czy srednia ilo s c
przekrocze n. Interpretujemy to jako potwierdzenie zao zenia o tym, ze
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 57
E
k
s
t
r
a
p
o
l
o
w
a
n
a
T
y
p
e
k
s
t
r
a
p
o
l
o
w
a
n
e
j
S
t
a
c
j
e
O
d
l
e
g
o
s
c
M
A
P
E
w
y
z
n
a
c
z
a
n
i
a
s
t
a
c
j
a
s
t
a
c
j
i
w
s
p
i
e
r
a
j
a
c
e
m
i
e
d
z
y
s
t
a
c
j
a
m
i
s
r
e
d
n
i
c
h
d
z
i
e
n
n
y
c
h
2
0
%
w
y
p
e
n
i
e
n
i
a
8
0
%
w
y
p
e
n
i
e
n
i
a
1
K
o
m
u
n
i
k
a
c
y
j
n
a
k
o
m
u
n
i
k
a
c
y
j
n
a
U
r
s
y
n
w
,
P
o
c
k
7
;
1
0
0
2
0
%
1
8
%
2
K
o
m
u
n
i
k
a
c
y
j
n
a
I
I
k
o
m
u
n
i
k
a
c
y
j
n
a
U
r
s
y
n
w
,
T
a
r
g
w
e
k
7
;
7
1
3
%
1
2
%
3
R
a
d
o
m
t
a
m
i
e
j
s
k
i
e
g
o
U
r
s
y
n
w
,
T
a
r
g
w
e
k
8
0
;
1
0
1
1
8
%
1
7
%
4
R
a
d
o
m
I
I
t
a
m
i
e
j
s
k
i
e
g
o
U
r
s
y
n
w
,
P
o
c
k
8
0
;
1
6
3
2
7
%
2
3
%
5
U
r
s
y
n
w
t
a
m
i
e
j
s
k
i
e
g
o
T
a
r
g
w
e
k
,
K
o
m
u
n
i
k
a
c
y
j
n
a
1
5
;
7
1
2
%
1
1
%
6
U
r
s
y
n
w
I
I
t
a
m
i
e
j
s
k
i
e
g
o
T
a
r
g
w
e
k
,
P
o
c
k
7
;
1
0
0
1
3
%
1
3
%
7
B
e
l
s
k
t
a
r
e
g
i
o
n
a
l
n
e
g
o
T
a
r
g
w
e
k
,
P
o
c
k
5
4
;
1
1
0
4
5
%
8
B
e
l
s
k
I
I
t
a
r
e
g
i
o
n
a
l
n
e
g
o
T
a
r
g
w
e
k
,
U
r
s
y
n
w
5
4
;
4
2
4
2
%
4
4
%
9
P
o
c
k
t
a
m
i
e
j
s
k
i
e
g
o
(
a
)
P
o
d
s
t
a
w
o
w
e
d
a
n
e
o
m
o
d
e
l
a
c
h
e
k
s
t
r
a
p
o
l
u
j
a
c
y
c
h
E
k
s
t
r
a
p
o
l
o
w
a
n
a
T
y
p
e
k
s
t
r
a
p
o
l
o
w
a
n
e
j
S
r
e
d
n
i
b
a
d
w
y
z
n
a
c
z
e
n
i
a
S
r
e
d
n
i
b
a
d
w
y
z
n
a
c
z
e
n
i
a
s
t
a
c
j
a
s
t
a
c
j
i
s
r
e
d
n
i
e
g
o
p
o
z
i
o
m
u
P
M
1
0
i
l
o
s
c
i
p
r
z
e
k
r
o
c
z
e
n
e
k
s
t
r
a
p
o
l
a
c
j
a
w
s
k
a
z
n
i
k
o
w
e
e
k
s
t
r
a
p
o
l
a
c
j
a
w
s
k
a
z
n
i
k
o
w
e
1
K
o
m
u
n
i
k
a
c
y
j
n
a
k
o
m
u
n
i
k
a
c
y
j
n
a
2
%
3
.
1
%
6
%
8
%
2
K
o
m
u
n
i
k
a
c
y
j
n
a
I
I
k
o
m
u
n
i
k
a
c
y
j
n
a
1
.
5
%
3
%
5
%
8
%
3
R
a
d
o
m
t
a
m
i
e
j
s
k
i
e
g
o
4
.
3
%
4
.
3
%
1
1
%
1
5
%
4
R
a
d
o
m
I
I
t
a
m
i
e
j
s
k
i
e
g
o
2
.
1
%
3
.
9
%
9
%
1
2
%
5
U
r
s
y
n
w
t
a
m
i
e
j
s
k
i
e
g
o
1
.
2
%
3
.
6
%
8
%
1
4
%
6
U
r
s
y
n
w
I
I
t
a
m
i
e
j
s
k
i
e
g
o
1
.
9
%
4
.
3
%
5
%
1
3
%
7
B
e
l
s
k
t
a
r
e
g
i
o
n
a
l
n
e
g
o
2
.
5
%
3
.
1
%
1
2
%
1
7
%
8
B
e
l
s
k
I
I
t
a
r
e
g
i
o
n
a
l
n
e
g
o
1
.
9
%
1
.
9
%
1
1
%
1
5
%
(
b
)
P
o
r
w
n
a
n
i
e
d
o
k
a
d
n
o
s
c
i
w
y
z
n
a
c
z
a
n
i
a
p
a
r
a
m
e
t
r
w
s
e
r
i
i
d
a
n
y
c
h
z
u
z
y
c
i
e
m
e
k
s
t
r
a
p
o
l
a
c
j
i
i
z
u
z
y
c
i
e
m
s
a
m
y
c
h
t
y
l
k
o
d
a
n
y
c
h
w
s
k
a
z
-
n
i
k
o
w
y
c
h
,
d
l
a
w
s
p
c
z
y
n
n
i
k
a
w
y
p
e
n
i
e
n
i
a
2
0
%
.
T
a
b
l
i
c
a
5
.
1
:
S
t
w
o
r
z
o
n
e
m
o
d
e
l
e
d
o
k
o
n
u
j
a
c
e
e
k
s
t
r
a
p
o
l
a
c
j
i
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 58
Warszawa Targwek
Warszawa Komunikacyjna /
Warszawa Ursynw
yrardw
Belsko
Radom
Pock
Wydzia Fizyki
Rysunek 5.2: Poo zenie stacji bior acych udzia w ekstrapolacji
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 59
model ekstrapoluj acy wprowadza do zbioru danych wska znikowych nowe
informacje.
Wywnioskowanie ilo sci przekrocze n z danych ekstrapolowanych jest
trudne, mo zliwe, ze trudno s c ta wynikaa z tego, ze model ten modelo-
wa srednie dzienne, z ktrych w nast epnej kolejno sci wyznaczano fakt
przekroczenia. Model, ktry modeluje fakt przekroczenia bezpo srednio po-
winien dziaa c zdecydowanie lepiej.
Stacja w Belsku nie dostarczaa danych meteorologicznych co bardzo
utrudniao ekstrapolacj e.
Mo zemy te z pokusi c si e o stwierdzenie, ze dla dugich zbiorw danych
prg ilo sci danych treningowych, dla ktrego model zaczyna dziaa c dobrze
to okoo 120 dni, natomiast poni zej 50 dni model ten nie daje sensownych
wynikw.
Model ten jest jeszcze na bardzo wczesnymetapie bada n, jednak wydaje
si e, i z mo ze on by c z powodzeniem u zywany do uzupeniania luk w pomia-
rach dla pomiarw staych. U zywanie go do uzupeniania luk w pomiarach
wska znikowych wymaga dodatkowych bada n, w szczeglno sci nale zaoby
stworzy c procedur e wprowadzania takiego modelu do nowej stacji pomia-
rowej, na ktrej rozpocz eto dopiero pomiary wska znikowe tj. nale zaoby
zbada c w jaki sposb nale zy prowadzi c pomiary by maksymalnie szybko
zgromadzi c dostateczny materia ucz acy.
Rysunek 5.3:
Sredni b ad wyznaczania srednich dziennych dla wybranych
modeli ekstrapoluj acych (dane pomiarowe z lat 2009 2010).
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 60
Rysunek 5.4: Porwnanie dokadno sci wyznaczenia sredniej z caego
okresu przy u zyciu modeli ekstrapoluj acych i przy u zyciu samych tylko
danych wska znikowych dla dwch wybranych modeli (dane pomiarowe z
lat 2009 2010).
Rysunek 5.5: Porwnanie b edu w wyznaczeniu ilo sci przekrocze n z u zy-
ciem modeli ekstrapoluj acych i samych tylko danych wska znikowych. Mo-
dele pracoway na danych z lat 2009 2010.
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 61
(a) Kwiecie n 2010 (b) Maj 2010
(c) Czerwiec 2010 (d) Lipiec 2010
Rysunek 5.6: Porwnanie zmierzonych i modelowanych poziomw
PM
10
dla modelu Ursynw dwa dla czterech kolejnych miesi ecy (miesi ace
te zostay wybrane ze wzgl edu na podobny do caego zbioru danych MAPE)
Rozdzia 6
Podsumowanie
Py zawieszony jest jednym z najgro zniejszych zanieczyszcze n powietrza,
nie z powodu jego toksyczno sci, lecz z powodu jego powszechno sci (poziomy
PM s a przekraczane w wielu bardzo miejscowo sciach).
Modele s a jednym z niezb ednych narz edzi do efektywnego zarz adza-
nia poziomami zanieczyszcze n powietrza. Modele mog a wspiera c zarwno
dugo, jak i krtkoterminowe dziaania zapobiegaj ace przekroczeniom od-
powiednich poziomw zanieczyszcze n oraz wspiera c proces pomiarw tych
poziomw. Ze wzgl edu na rozproszon a natur e emisji pyu zawieszonego
(wi ekszo s c cz e s c emisji tego zanieczyszczenia pochodzi z transportu oraz
ogrzewania domw) zanieczyszczenie to sprawia du ze problemy modelom
emisyjnym. Praca ta koncentrowaa si e na modelach modeluj acych po-
ziomy PM opartych na metody eksploracji danych.
6.1 Zawarto s c pracy
W pracy zbadano jeden nowy typ modelu emisyjnego model dokonu-
j acy ekstrapolacji przestrzennej poziomwzanieczyszcze n. Model ten mo ze
mie c praktyczne zastosowanie do uzupeniania luk w pomiarach pyu za-
wieszonego.
Wpracy opracowano podstawy koncepcyjne systemu dedykowanego jako
srodowisko, w ktrym uruchamiane b ed a modele eksploruj ace dane. Sys-
tem przeznaczony jest do pracy on line. W prazy zaimplementowano du z a
cz e s c proponowanego systemu.
Praca zawiera rwnie z obszern a cz e s c teoretyczn a, w ktrej opisane s a
Sztuczne Sieci Neuronowe (element dokonuj acy modelowania) oraz dys-
kretna transformata falkowa su z aca do wst epnego przetwarzania da-
nych dla SSN.
62
ROZDZIA 6. PODSUMOWANIE 63
6.2 Wnioski
Modele oparte na eksploracj e danych s a bardzo cennym narz edziem, ktre
jest w stanie kompleksowo wspiera c pomiar i zarz adzanie poziomami pyu
zawieszonego (oraz innych zanieczyszcze n).
Zaproponowany system wymaga jeszcze wiele prac programistycznych
jednak wykorzystanie go w niniejszej pracy do stworzenia wielu modeli
DMM, wykazao jego przydatno s c. Posiadanie takiego systemu powoduje:
Znaczne zmniejszenie ilo sci pracy wykonywanej przez czowieka w
przygotowywaniu serii danych ucz acych model.
Znaczne zmniejszenie ryzyka b edwwprowadzanych przez czowieka
w tym procesie.
Umo zliwienie pracy w cakowicie automatycznym trybie.
Znaczne przy spieszenie procesu wdra zania nowych modeli opartych
o eksploracj e danych.
Dodatek A
Sownik poj e c
BAM (z ang. beta attenuation monitor) mierniki mierz ace poziom PM
dokonuj ace pomiaru masy osadzonej na ltrze za pomoc a pomiaru,
jak w ltr osabia promieniowanie . Patrz te z 3.3.
cecha Patrz sekcja B.3.
CTM (z ang. Chemical Transport Model) S a to metody oparte na ana-
litycznych modelach propagacji zanieczyszcze n oraz ich chemicznych
przemian. Danymi wej sciowymi do modeli tego typu s a szacunki emi-
sji badanych zanieczyszcze n, topograa terenu, przewidywania para-
metrw pogodowych na kolejne dni. Kluczowa dla dokadno sci tych
modeli jest baza danych emisyjnych, ktrej uzyskanie jest trudne i
do s c kosztowne.
FDMS (z ang. Filter Dynamic Measurement System) system pomiaru wy-
korzystuj acy miernik TEOM, ktry jednak jest rwnowa zny pomia-
rom referencyjnym.
funkcja celu Funkcja celu
Termin ten zaczerpn aem z pi smiennictwa angielskiego z tej dziedziny, nie znalazem
odpowiednika polskiego.
64
DODATEK A. SOWNIK POJ E
C 65
LRTAP (z ang. Long Range Transbounary Air Pollution) mi edzynaro-
dowy traktat kontroluj acy pewne kwestie zwi azane z ochron a srodo-
wiska w Europie. Dokadniejszy opis patrz 2.1.
MAE (z ang. mean absolute error) funkcja celu dla sieci neuronowych.
Wzr patrz strona 75.
MAPE (z ang. mean absolute percentage error) funkcja celu dla sieci neu-
ronowych. Wzr patrz strona 75.
metaparametr modelu Metaparametr modelu jest to parametr, ktry
nie jest ustalany w procesie treningu a przed nim. Nie zale zy
on zatem od konkretnych danych treningowych i jest wsplny dla
caej klasy modeli, maj acych t a sam a struktur e i pracuj acych na po-
dobnych zestawach danych. W SSN metaparametry okre sla c b ed a
struktur e sieci i np. rodzaj funkcji aktywacji.
MLP (z ang. Multilayer perceptron) Perceptron wielowarstwowy. Rodzaj
SSN.
model Model oparty na technikach eksploracji danych to narz edzie, ktre
maj ac pewien korpus danych historycznych jest w stanie odtwarza c
dane nale z ace do tej samej klasy, do ktrej nale z a dane z korpusu
historycznego, ktrych to jednak w owym korpusie nie ma.
parametr modelu Jest to parametr
parametr kompozytowy (pogodowy) parametr pogody, ktry mo zna wy-
liczy c z innych parametrw pogodowych. Przykadowo mo ze by c to
punkt rosy, czy temperatura odczuwalna.
PCA (z ang. principial component analysis) metoda obni zania ilo sci wy-
miarw instancji danych z minimaln a utrat a informacji.
PM (z ang. particulate matter) py zawieszony to okre slenie drobin ciaa
staego, ktre s a zawieszone w powietrzu (ze wzgl edu na rozmiar pro-
ces ich grawitacyjnego osiadania jest albo bardzo powolny, albo wr ecz
nie jest gwnym kanaem ich usuwania ze srodowiska).
poziom st e zenie danego zanieczyszczenia w powietrzu
punkt rosy (dokadniej temperatura punktu rosy) taka temperatura, dla
ktrej przy danym skadzie mieszaniny gazw i ustalonym ci snieniu
mo ze rozpocz a c skraplanie si e jednego z jej skadnikw. U nas przez
ten termin b edziemy rozumie c punkt rosy pary wodnej w powietrzu
DODATEK A. SOWNIK POJ E
C 66
czyli temperatur e przy jakiej para wodna zawarta w powietrzu
mogaby si e skropli c. Przybli zony wzr pozwalaj acy wyznaczy c tem-
peratur e punktu rosy to[?]:
T
d
=
8
_
H
100
[112 + (0, 9 T)] + (0, 1 T) 112 (A.1)
gdzie T
d
to temperatura punktu rosy (
C).
predyktor Model su z acy do krtkoterminowej prognozy jakiego s feno-
menu.
SSN Sztuczna sie c neuronowa
srednica aerodynamiczna cz astki
Srednica kuli o g esto sci 1
g
cm
3
o ta-
kiej samej, jak cz astka badana, pr edko sci opadania w nieruchomym
powietrzu, w wyniku dziaania si grawitacji, w identycznych warun-
kach temperatury, ci snienia i wilgotno sci wzgl ednej[23].
srednica dyfuzyjna cz astki
Srednica kuli o g esto sci 1
g
cm
3
o takim sa-
mym, jak cz astka badana, wspczynniku dyfuzji w identycznych wa-
runkach temperatury, ci snienia i wilgotno sci wzgl ednej[23]
temperatura odczuwalna Temperatura odczuwalna odwzorowuje odczu-
cie temperatury w danych warunkach otoczenia, jednak nie jest to
cakowicie antropomorczny parametr bowiem badania nad nim
wzi ey si e z badania pr edko sci zamarzania wody w danych warun-
kach na arktyce (pr edko s c ta zale zaa od temperatury otoczenia i
pr edko sci wiatru). Istnieje kilka wzorw pozwalaj acych przybli zy c
t a wielko s c, jednak zaden z nich nie daje dobrych wynikw na caym
spektrum temperatur.
TEOM (z ang. tapered element oscillating microbalance) metoda pomiaru
poziomu PM
trening Operacja, w ktrej model oparty o eksploracj e danych uczy si e
historii pomiarw. Dla SSNb edzie to operacja ustalenia wag w
i
predyktor
WIO
C 67
Poj ecia u zywane w rozumieniu dyrektywy 2008/50/WE[14]
warto s c dopuszczalna Oznacza poziom substancji w powietrzu usta-
lany (...) w celu zapobiegania lub ograniczenia szkodliwego wpywu
na zdrowie ludzkie lub srodowisko, (...) ktry powinien by c osi agni ety
w okre slonym terminie i po tym terminie nie powinien by c przekra-
czany
poziom krytyczny Oznacza poziom substancji w powietrzu (...) po prze-
kroczeniu, ktrego mog a wyst api c bezpo srednie niepo z adane skutki
w odniesieniu do niektrych receptorw, takich jak drzewa, inne ro-
sliny lub ekosystemy naturalne, jednak nie w odniesieniu do czo-
wieka
.
Poniewa z z punktu widzenia niniejszej pracy sieci neuronowe s a tylko
narz edziem, a nie przedmiotem bada n, ich opis b edzie mo zliwie skrcony
i b edzie koncentrowa c si e na praktycznych aspektach ich funkcjonowania.
W tym wprowadzeniu Autor korzysta gwnie z [46, 45, 51].
Cechy sieci neuronowych
Zdolno s c do generalizacji danych. Wszystkie systemy ucz ace musz a
by c w stanie generalizowa c dane ucz ace, tj. umie c reagowa c na dane
podobne do danych ucz acych, ale z nimi nie to zsame.
. Jako cieka-
wostk e mo zna poda c, ze ta wa snie cecha ukadu nerwowego bya
jedn a z pierwszych przyczyn zainteresowania sztucznymi sieciami
neuronowymi
Bardzo dobrze obrazuje t a cech e cytat: Czas jaki neuron potrzebuje na zmian e stanu [a
zatem na przetworzenie informacji przyp. mj] jest rz edu 10
3
s do s c wolno w porw-
naniu z systemami komputerowymi, dla ktrych czasy te s a rz edu 10
10
s. Jednak czowiek
jest w stanie dokona c bardzo skomplikowanych decyzji, bardzo szybko. Dla przykadu prze-
ci etna osoba potrzebuje ok 10
1
s by rozpozna c wasn a matk e. Zauwa zmy, ze maksymalna
dugo s c a ncucha neuronw, ktry mo ze w tym czasie zareagowa c to co najwy zej kilkaset. Ta
obserwacja spowodowaa, ze zdolno sci do przetwarzania informacji przez biologiczne systemy
nerwowe musz a mie c swoje zrdo w wysokim zrwnolegleniu procesw wykonywanych na
reprezentacjach rozproszonych na wielu neuronach. Jedn a z motywacji SNN jest uchwycenie
takiej zrwnoleglonej metody oblicze n (...).[45] (tumaczenie moje)
DODATEK B. SZTUCZNE SIECI NEURONOWE 70
pracy maj ac wytrenowan a sie c neuronow a poprawnie przewidu-
j ac a przysze st e zenia zanieczyszcze n, nie koniecznie musimy by c w
stanie powiedzie c dlaczego sie c przewidziaa taki, a nie inny poziom
zanieczyszcze n. Da si e posuguj ac si e wieloma sieciami neuronowymi
wywnioskowa c takie informacje, jednak nie s a to metody ani proste,
ani stuprocentowo pewne.
Dane wej sciowe da si e przedstawi c jako wektor liczb rzeczywistych.
Dane wyj sciowe da si e przedstawi c jako wektor liczb rzeczywistych.
Poszczeglne atrybuty danych wej sciowych mog a by c ze sob a silnie
skorelowane.
Ocena SSN do zastosowania w modelowaniu zanieczyszcze n
powietrza
Cz e s c podanych wpoprzedniej cz e sci cech sieci neuronowych nie jest istotna
dla zastosowania SSN do modelowania zanieczyszcze n powietrza, inne na-
tomiast przes adziy o ich wyborze do tego zadania.
Bardzo istotna jest odporno s c SSN na du ze szumy w danych wej scio-
wych. Dyrektywa 2008/50/WE zakada, ze niepewno s c pomiaru poziomu
PM dla pomiarw staych musi by c mniejsza ni z 25%[17], inaczej mwi ac:
mierniki tego zanieczyszczenia mog a si e myli c wa snie o tyle. Ju z sam
fakt dopuszczenia takiej niepewno sci powoduje, ze dane wej sciowe s a bar-
dzo zaszumione (jak na standardy uczenia maszynowego). Zdolno s c do
generalizacji jest sine qua non zastosowania w tej dziedzinie jakiejkolwiek
metody.
Wymagania SSN co do postaci danych s a atwe w tej dziedzinie do spe-
nienia dane nie wymagaj a zadnej obrbki do tej postaci.
Zupenie nie istotne s a dla nas metryki wydajno sciowe SSN sieci
dziaaj a wyznaczaj ac srednie st e zenia dzienne b ad z godzinowe, a godzina
na wyznaczenie srednich dla kilku stacji to bardzo du zo czasu.
Zasadnicz a wad a SSN w tym zastosowaniu jest fakt, ze bardzo trudno
jest czowiekowi zrozumie c, to w jaki sposb sie c odwzorowuje dane
maj ac dziaaj acy predyktor chcieliby smy mc na jego podstawie wywnio-
skowa c proste zale zno sci (albo potwierdzi c te znajdowane w literaturze).
Chcieliby smy mc powiedzie c: Pr edko s c wiatru ma bardzo istotny wpyw
na poziomy zanieczyszcze n powietrza, jednak sieci neuronowe nie pozwa-
laj a na atwe uzyskanie takich informacji (jeden ze sposobw wyci agni ecia
takich wnioskw w ??).
DODATEK B. SZTUCZNE SIECI NEURONOWE 71
Wreszcie sieci s a najlepiej przebadan a metod a eksploracji danych do
podobnych zastosowa n.
B.2 Podstawy teoretyczne
Budowa neuronu w SSN
Sie c neuronowa jest w oglno sci pewnym ukadem po aczonych ze sob a
neuronw.
Neuron jest to struktura posiadaj aca wiele wej s c oraz jedno wyj scie.
Wyj scie to opisywane jest funkcj a:
w
out
= F
_
N
i=0
w
i
x
i
, p
_
(B.1)
gdzie:
F to tzw. funkcja aktywacji,
p to wektor parametrw tej funkcji,
x
i
to warto s c sygnau wej sciowego na i-tym wej sciu,
w
i
to waga i-tego wej scia.
By wyznaczy c warto s c wyj sciow a neuronu musimy wysumowa c wszystkie
jego wej scia (po pomno zeniu ich przez wspczynniki wag), a nast epnie
wykona c na tej liczbie jednoargumentow a funkcj e aktywacji.
Mo zliwe s a r zne funkcje aktywacji:
Funkcja signum Jest ona opisana wzorem
sgn(x) =
_
_
1 x < 0
1
2
x = 0
1 x > 0
(B.2)
Ta funkcja aktywacji bya u zywana w jednej z pierwszych prac nauko-
wych na temat sieci neuronowych[84].
Funkcja skokowa Heavisidea Jest ona opisana wzorem
H(x) =
_
_
_
1 x 0
0 x < 0
(B.3)
Funkcji tej u zywa si e w najprostszych modelach perceptronu
DODATEK B. SZTUCZNE SIECI NEURONOWE 72
Funkcja sigmoidalna Jest to w zasadzie uoglnienie funkcji signum:
f(x) =
1
1 +e
x
(B.4)
Jest to jedna z najcz e sciej u zywanych funkcji aktywacji. Ma ona jeden
parametr .
Nieunormowana funkcja Gaussa Jest to funkcja u zywana w sieciach
RBF oraz niektrych SVM:
f(x) = exp
_
(x a)
2
b
_
(B.5)
Sie c neuronowa
Rozwa zmy perceptron wielowarstwowy b ed acy jedn a z prostszych sieci
neuronowych. Ma on nast epuj ac a struktur e:
Perceptron skada si e z kilku warstw (przynajmniej z jednej) .
Neurony na s asiednich warstwach po aczone s a na zasadzie ka zdy z
ka zdym.
Neurony le z ace na tej samej warstwie oraz na warstwach nie s asia-
duj acych ze sob a nie s a po aczone.
Po aczenia w sieci perceptronu s a jednokierunkowe w kierunku
warstwy wyj sciowej, tj. stan neuronu na warstwie n nie ma wpywu
na stan neuronu na warstwach m > n.
W ostatniej warstwie, zwanej warstw a wyj sciow a, jest tyle neuronw,
ile sie c ma parametrw wyj sciowych.
Rysunek B.1: Symboliczny schemat neuronu
x
1
x
2
x
n
w
1
w
n
w
out
DODATEK B. SZTUCZNE SIECI NEURONOWE 73
Rysunek B.2: Przykady funkcji sigmoidalnej dla r znych warto sci para-
metrw
10 8 6 4 2 0 2 4 6 8 10
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
x
Funkcja sigmoidalna dla parametru = 0.5
Funkcja sigmoidalna dla parametru = 2
Funkcja sigmoidalna dla parametru = 10
Rysunek B.3: Przykady funkcji Gaussa dla r znych warto sci parametru a
10 8 6 4 2 0 2 4 6 8 10
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Zdenormalizowana funkcja gaussa dla parametru a = 0.5 i b = 0
Zdenormalizowana funkcja gaussa dla parametru a = 3 i b = 0
Zdenormalizowana funkcja gaussa dla parametru a = 15 i b = 0
DODATEK B. SZTUCZNE SIECI NEURONOWE 74
Pozostae warstwy nazywamy warstwami ukrytymi.
By wyznaczy c odpowied z sieci na okre slone wej scie nale zy:
Ustawi c warto sci na wej sciu pierwszej warstwy neuronw
Po kolei wyznacza c warto sci w poszczeglnych warstwach.
By stworzy c funkcjonuj ac a sie c neuronow a nale zy najpierw wybra c odpo-
wiedni a struktur e sieci. W przypadku perceptronu trzeba wybra c ilo s c
warstw ukrytych oraz wybra c ilo s c neuronu w ka zdej warstwie. Nast ep-
nie nale zy przeprowadzi c trening czyli operacj e, ktra ustali wagi po acze n
mi edzy neuronami oraz warto sci ewentualnych parametrw funkcji akty-
wacji.
Budowanie struktury sieci
Jest to najtrudniejsza i najbardziej czasochonna operacja. Jest najtrud-
niejsza, poniewa z jest niewiele twierdze n, ktre pozwalaj a rozstrzygn a c
kiedy jaka struktura sieci jest najlepsza i w zasadzie w wi ekszo s c me-
tod sprowadza si e do sprawdzenia wszystkich mo zliwych struktur sieci.
Jednak w wi ekszo sci przypadkw s a albo twierdzenia matematyczne, albo
dobrze dziaaj ace heurystyczne zasady, ktre pozwalaj a na ustalenie roz-
s adnych granic problemowi poszukiwania najlepszej struktury.
Dla perceptronu nale zy najpierw ustali c ilo s c warstw a nast epnie
ilo s c neuronw w ka zdej warstwie. Przy czym dane s a nast epuj ace twier-
dzenia matematyczne:
Twierdzenie 1 ((Hornik 1989)) Je sli : R R jest funkcj a aktywacji
funkcji, ktra nie jest funkcj a sta a, oraz : R
N
R
M
to funkcja ci aga
to istnieje sie c MLP posiadaj aca jedn a warstw e ukryt a, ktra aproksymuje
dowolnie dobrze. [56]
Do s c istotne w tym twierdzeniu jest to, ze rodzaj przyj etej funkcji akty-
wacji nie gra roli. Oczywi scie w mo ze on uatwia c, b ad z utrudnia c uczenie
sieci, jednak w praktyce starczy dla wszystkich neuronw wybra c funkcj e
sigmoidaln a z rozs adnym parametrem .
Twierdzenie 2 ((Hornik 1991) Je sli : R R jest funkcj a aktywacji
funkcji, ktra nie jest funkcj a sta a, oraz : R
N
R
M
to istnieje sie c
MLP, ktra aproksymuje dowolnie dobrze. [52, 53]
):
i=0
|p
i
z
i
| (B.7)
i=0
|p
i
z
i
|
z
i
(B.8)
Jak atwo zauwa zy c, by MAPE by dobrze okre slony musi zachodzi c
z
i
= 0, w niniejszej pracy dane wprowadzane do sieci b ed a normalizowane
do zakresu (0, 1], jednak sposb normalizacji danych wej sciowych
powo-
duje, ze w z
i
mog a si e tra c zerowe elementy (jednak b edzie ich niewiele).
Metod e liczenia MAPE nale zy wi ec zmodykowa c:
err =
1
N
i=0
_
_
_
|p
i
z
i
|
z
i
z
i
= 0
0 z
i
= 0
(B.9)
przy czym N
(z
i
p
i
)
2
N
(B.10)
W niniejszej pracy gwnie u zywan a funkcj a celu b edzie B.9.
Uczenie sieci
Uczenie sieci jest procesem takiego doboru wag po acze n pomi edzy neuro-
nami (oraz ewentualnych parametrw funkcji aktywacji) by funkcja celu
bya na zbiorze danych minimalna. Przy czym to, w jaki sposb sie c b edzie
odwzorowywa c dane, zale zy od minimalizowanej funkcji celu to jakie
sie c b edzie dawaa wyniki istotnie zale zy od podanej funkcji celu. Przykad
dotycz acy pola tematu pracy: je sli funkcj a celu b edzie MAPE, to sie c b e-
dzie popeniaa mniejsze absolutne b edy przy predykcji niskich st e ze n, a
je sli b edzie to MAE to absolutne b edy b ed a podobne dla caego spektrum
st e ze n.
W oglnym przypadku do uczenia sieci mo zna u zy c dowolnego algo-
rytmu z dziedziny teorii optymalizacji, ktry w przypadkach praktycznych
radzi sobie z silnie nieliniowymi funkcjami, ktre posiadaj a wiele mini-
mw lokalnych. W tej, wst epnej, cz e sci poprzestaniemy na takim opisie
problemu. Podam pewne praktyczne uwagi, ktre s a bardzo wa zne bez
wzgl edu na to jaki algorytm si e stosuje.
b edzie miaa
du zy wymiar, jednak dane te b ed a ze sob a w jaki s sposb skorelowane.
Niskie zachmurzenie, b edzie powodowao wzrost nasonecznienia a zatem
temperatury; deszcz powoduje spadek temperatury; wysokie ci snienie b e-
dzie budowao ukady wy zowe ktre wpyn a na pozostae parametry (do-
kadny opis tych zjawisk jest w tej cz e sci pracy nieistotny). Mwi ac ogl-
niej mamy problem ktry da si e opisa c tak: dane maj a wiele wymiarw
oraz poszczeglne wymiary s a ze sob a skorelowane
Przykad jest troch e naci agany stacje pomiaru zanieczyszcze n powietrza cz esto daj a
tylko podstawowe parametry pogodowe wi ec nie mamy tutaj kl eski urodzaju.
DODATEK B. SZTUCZNE SIECI NEURONOWE 78
dokonuj a takich operacji jak kompresja stratna, odszumowanie i wyzna-
czenie istotnych cech sygnau
.
Wynik pracy takiego ukadu dokonuj acego wst epnego przetwarzania
dalej stanowi dane wej sciowe do SSN i jest nazywany instancj a cech
. Opis
dziaania takiego ukadu na rys. B.4. Fakt, ze tego typu ukady s a z r z-
nych przyczyn implementowane jako SSN nie jest istotny dla dalszej ana-
lizy.
Przykadami metod wst epnego przetwarzania danych s a takie metody
jak PCA, BSS, transformata falkowa. PCA i BSS s a metodami, ktre po-
zwalaj a zmniejszy c wymiar instancji z minimaln a utrat a informacji, wy-
korzystuj a one korelacje pomi edzy poszczeglnymi elementami instancji.
Transformata falkowa b edzie szerzej opisana w C.
B.4 Kroki potrzebne do zbudowania modeli opartego
na SSN
By zbudowa c dziaaj acy model oparty o SSN
Zauwa zmy ze wszystkie te operacje s a do siebie bardzo podobne. Dla przykadu, do do-
konaniu kompresji stratnej obrazu pozbywamy si e z niego gwnie szumw. Po kompresji
zbioru instancji o wymiarze N do takiego o wymiarze M N poszczeglne elementy skom-
presowanego zbioru b ed a bardziej istotne.
Nie znalazem w polskim pi smiennictwie odpowiadaj acego terminu. Sowo cecha jest
tumaczeniem terminu feature zaczerpni etego z pi smiennictwa angloj ezycznego.
Poni zsze uwagi mo zna rwnie z zastosowa c do dowolnego modelu opartego na eksploracj e
danych.
Rysunek B.4: Sie c z ukadem wst epnie przetwarzaj acym dane. Ilustracja
poj ecia cecha.
Wstpne
przetwarzanie
(PCA, BSS,
transformata falkowa)
SSN
Instancja wejciowa
danych o wymiarze
np. 100 000
Instancja cech o
o znacznie mniejszym
wymiarze (np. 50)
DODATEK B. SZTUCZNE SIECI NEURONOWE 79
Ustalenie typu modelu Ustalenie jakiej sieci neuronowej u zy c itp.
Ustalenie danych wej sciowych i wyj sciowych do modelu Pierwszy krok
to ustalenie z jakich danych model korzysta i jakie parametry model
b edzie modelowa c.
Ustalenie przestrzeni cech ktre b ed a traa c do SSN Model mo ze do-
konywa c pewnych przeksztace n na danych wej sciowych. Na przy-
kad dokonywa c PCA, albo dyskretnej transformaty falkowej.
Ustalenie metaparametrw modelu Przed rozpocz eciemtreningu sieci
neuronowej nale zy ustali c wszystkie metaparametry
modelu. Dla
sieci SVM b ed a to parametry C, i , dla transformaty falkowej b e-
dzie to decyzja na ile falek dokona c rozkadu etc.
Wytrenowanie modelu Dokonanie treningu SSN.
B.5 Sieci SVM
B ed e koncentrowa si e na aspektach dotycz acych praktycznego wykorzy-
stania tych sieci. Szczeglny nacisk kad ac na wskazanie jak a rol e peni a
metaparametry w procesie budowania i treningu sieci.
Wprowadzenie do sieci SVM za [49].
Sieci SVM w zadaniu klasykacji problemu separowalnego
liniowo
Klasykacja problemu separowalnego liniowo jest najprostszym proble-
mem z jakim radz a sobie sieci SVM. Danych jest p par ucz acych w postaci
(x
i
, d
i
), gdzie x
i
to wsprz edne punktu natomiast d
i
to warto s c ze zbioru
{1, 1}.
W problemie tym mamy dwie klasy (przynale zno s c punktu x
i
do da-
nej klasy jest determinowana przez warto s c d
i
) punktw w przestrzeni N
wymiarowej, przy czym istnieje paszczyzna ktra te klasy rozdziela tj.
paszczyzna o rwnaniu:
g(x) = 0,
gdzie:
g(x) = w
T
x +b. (B.11)
podtrzymuj acym a
paszczyzn a separacji wyra za si e wzorem:
r =
g(s
sv
)
x
, (B.17)
DODATEK B. SZTUCZNE SIECI NEURONOWE 81
Wyznaczenie szeroko sci marginesu separacji
Wprowad zmy oznaczenia g
+
(x) to paszczyzna okre slaj aca grn a granic e
marginesu separacji, g
.
Podane oznaczenia rwnie z na rys B.5.
Stwierdzamy nast epuj ace fakty [65]:
w jest prostopade do g(x), g
(x), g
+
(x) (B.18)
x
+
= x
+w (B.19)
Mamy wi ec:
g(x
+
) = 1
w
T
x
+
+b = 1 (B.20)
wstawiamy do B.20 warunek B.19 i otrzymujemy:
a
s
z
c
z
y
z
n
a
s
e
p
a
r
a
c
j
i
g
+
g-
x+
x-
m
a
r
g
i
n
e
s
s
e
p
a
r
a
c
j
i
s
z
e
r
o
k
o
m
a
r
g
i
n
e
s
u
s
e
p
a
r
a
c
j
i
punkt klasy A
punkt klasy B
wektor wsparcia
specjalny punkt
Rysunek B.5: Margines separacji
DODATEK B. SZTUCZNE SIECI NEURONOWE 82
w
T
x
+b
. .
=g(x
)=1
w
T
w = 1, (B.21)
mamy zatem:
=
2
w
T
w
. (B.22)
Szeroko s c marginesu separacji wyra za si e zatem wzorem:
M =
x
+
x
= |w| = |w| =
2 |w|
w
T
w
=
2
w
T
w
=
2
|w|
(B.23)
Uczenie liniowego klasykatora SVM
Klasykator SVM d a zy do maksymalizacji marginesu separacji, wi ec by go
wytrenowa c nale zy rozwi aza c problem:
max{M} min
_
w
T
w
_
przy dodatkowym warunku B.14, ktry mo zna zapisa c te z w postaci:
d
i
g(x
i
) 1. (B.24)
Jest to problem programowania kwadratowego i jest on rozwi azywany
metod a mno znikw Lagrangea, polegaj acej na minimalizacji funkcji La-
grangea:
J(w, b, ) =
1
2
w
T
w
p
i=0
i
_
d
i
_
w
T
x
i
+b
_
1
_
(B.25)
Problem ten mo zna rozwi aza c, rozwi azuj ac tzw. problem dualny
, ktry
okre sla si e nast epuj aco:
max
_
_
_
p
i=0
i
1
2
p
i=0
p
j=0
j
d
i
d
j
x
T
i
x
j
_
_
_
(B.26)
przy warunkach:
i
0 (B.27)
p
i=1
i
d
i
= 0 (B.28)
i=0
i
d
i
x
i
(B.29)
b = 1 w
T
x
sv
(B.30)
Liniowe klasykatory SVM dla problemw
nieseparowalnych liniowowo
Nawet dla problemw w ktre co do zasady powinny by c separowalne li-
niowo, szum wyst epuj acy w danych mo ze spowodowa c to ze pewne punkty
tra a na z a stron e paszczyzny separacji. Algorytmy opisane w poprzed-
nim paragrae nie radz a sobie z takim przypadkiem (warunek B.13 nie
uwzgl ednia mo zliwo sci wyst epowania punktw w marginesie separacji).
Wproblemie tymstara si e znale z c paszczyzn e ktra minimalizuje szans e
b ednej klasykacji, w tym celu przeksztaca si e rwnanie B.15 do postaci:
d
i
g(x
i
) 1
i
, (B.31)
Parametr
i
pozwala efektywnie zmienia c rozmiar marginesu toleran-
cji dla ka zdego punktu i jest z zao zenia wi ekszy od zera.
i
z zakresu
(0; 1) oznacza ze dany punkt jest wewn atrz marginesu tolerancji, jednak
po prawidowej stronie paszczyzny separacji (tj. b edzie prawidowo skla-
sykowany. Je sli
i
> 0 punkt zostanie b ednie sklasykowany.
Problem znalezienia wag sieci sprowadza si e wi ec do rozwi azania zmo-
dykowanego problemu B.26:
min {(w, )}
1
2
w
T
w+C
p
i=1
i
, (B.32)
przy ograniczeniach:
d
i
g(x
i
) 1
i
, (B.33)
i
0 (B.34)
Problem ten rozwi azujemy analogicznie jak B.26.
Parametr C jest pierwszym ustalanym przez u zytkownika metapara-
metrem. Kontroluje on rwnowag e pomi edzy dwoma czonami minima-
lizowanego wyra zenia B.32, im wi ekszy parametr C, tym model rzadziej
b edzie pozwala c punkty pojawiaj ace si e wewn atrz marginesu separacji.
DODATEK B. SZTUCZNE SIECI NEURONOWE 84
Jego poprawna warto s c zale zy od tego jak bardzo podane klasy si e prze-
krywaj a tj. jak cz esto w naturalny sposb punkty ktre s a w klasie
d
i
= 1 traaj a do obszaru drugiej klasy. Zbyt maa warto s c parametru C
b edzie powodowaa ze model b edzie szed na skrty i b edzie pozwala na
zbyt wiele b ednych klasykacji, zbyt du za jego warto s c mo ze prowadzi c
do przeuczenia sieci.
Klasykatory SVM dla problemw nieliniowych
Problem nieseparowalny liniowo zdeniowany przestrzeni oryginalnej o N
wymiarach mo ze by c separowalny liniowo w innej przestrzeni o K wymia-
rach (nazwanej przestrzeni a cech
(x) = w
T
(x) +b, (B.35)
gdzie jest funkcj a wektorow a : R
N
R
K
, ktra deniuje odwzo-
rowanie do przestrzeni cech. Problem ten rozwi azuje si e analogicznie jak
problemy poprzednie. Problem pierwotny mo zna zapisa c jako (jest on taki
sam jak w B.32):
min {(w, )}
1
2
w
T
w+C
p
i=1
i
, (B.36)
przy warunkach (tutaj zmiana w pierwszym warunku):
d
i
g
(x
i
) 1
i
, (B.37)
i
0 (B.38)
Problem dualny
i=1
i
1
2
p
i=1
p
j=1
j
d
i
d
j
K(x
i
T
, x
j
)
_
_
_
(B.39)
przy warunkach:
Patrz te z B.3.
i=1
i
d
i
= 0 (B.41)
Gdzie K (x
i
, x
j
) =
T
(x
i
) (x
j
), jest skalarn a funkcj a, zwan a funkcj a
j adra
(x) w j ezyku
wspczynnikw Lagrangea
1
oraz funkcji j adra:
g
(x) =
N
sv
i=0
i
d
i
K(x, x
i
) +b (B.42)
Wprowadzenie funkcji j adra powoduje ze nie trzeba bezpo srednio obli-
cza c warto sci funkcji wektorowej , co przy spiesza obliczenia.
Najcz e sciej u zywane funkcje j adra[44]
Liniowe:
K (x
i
, x
j
) = x
T
i
x
j
+ (B.43)
Wielomianowe:
K (x
i
, x
j
) =
_
x
T
i
x
j
+
0
_
1
(B.44)
Radialne:
K (x
i
, x
j
) = exp
_
x
i
x
j
2
_
(B.45)
Sigmoidalne:
K (x
i
, x
j
) = tgh
_
1
x
T
i
x
j
+
0
_
(B.46)
Parametry
n
s a traktowane jako metaparametry sieci.
Sieci SVM dla nieliniowego problemu regresji
Do tej pory pokazano wykorzystanie sieci SVMjako klasykatora, tj. ukadu
ktry jest w stanie przypisywa c sygnay wej sciowe do pewnych klas. Przy-
kadowo ukady tego typu s a w stanie stwierdzi c czy w danym dniu nast api
przekroczenie poziomw dopuszczalnych czy nie, jednak nie s a wstanie po-
da c poziomu zanieczyszczenia. Mwi ac sci slej r znica mi edzy problemem
klasykacji a regresji jest taka ze w parach ucz acych (x, d
i
), warto s c d
i
dla
(d, g
(x)) =
_
0 dla |d g
(x)|
|d g
(x)| dla |d g
(x)|
(B.47)
Przy czym g
(x) = w
T
(x) +b, (B.48)
Parametr jest metaparametrem sieci.
Dalsze wyprowadzenie nie przebiega w sposb istotnie r zny od wypro-
wadze n z poprzednich paragrafw, wi ec dla ustalenia uwagi ominiemy je.
Dodatek C
Dyskretna transformata
falkowa
Analiza falkowa zostaa wielokrotnie niezale znie odkryta przez specjali-
stw wielu dziedzin (matematykw, zykw, elektronikw, geologw)[59],
znalaza te z zastosowanie we wczesnych prbach modelowania ukadu per-
cepcji czowieka przy problemach takich jak: rozpoznawanie kraw edzi[61],
g ebi i ruchu. Jest ona zwi azana ze stosowaniem SSN, tylko w tym sensie,
ze jest powszechnie u zywan a technik a wst epnego przetwarzania zo zonych
sygnaw.
Wspcze snie jest stosowana do:
kompresji obrazw
analizy sygnaw w przestrzeni cz estotliwo sci i czasu
redukcji ilo sci sygnaw wej sciowych Mi edzy innymi przy przetwa-
rzaniu obrazw. Wysoko rozdzielcze obrazy przed podaniem sieci mu-
sz a by c przetworzone tak, by sie c ta miaa rozs adn a ilo s c neuronw
wej sciowych.
tworzenie cech Przy zo zonych problemach SSN cz esto nie s a w stanie
odpowiednio generalizowa c
Powy zszy rozdzia stanowi gwnie wprowadzenie terminw i poj e c, ktre
s a niezb edne do zrozumienia dyskretnej analizy falkowej, ni z samo for-
malne wprowadzenie tej analizy. Zrozumienie tych poj e c jest kluczowe do
stosowania tego narz edzia.
Punktem wyj scia do omawiania transformaty falkowej b edzie jej pre-
kursor Transformata Fouriera
f(x)e
2ix
dx (C.2)
gdzie F to transformata Fouriera przypisuj aca ka zdej funkcji f(x) funk-
cj e Ff().
Pozwala ona rozdzieli c funkcj e na skadniki o r znych cz estotliwo sciach.
Inaczej mwi ac, pozwala ona wyrazi c dowoln a funkcj e jako kombinacj e li-
niow a funkcji nale z acych do pewnej konkretnej bazy
Je sli baza ta b edzie ci aga mwimy o transformacie Fouriera, je sli baza ta b edzie
skada c ze sko nczonej ilo sci elementw mwimy o szeregi Fouriera.
No snik (termin topologiczny): domkni ecie zbioru argumentw funkcji, w ktrych ma ona
warto sci mniejsze od zera.
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 89
C.2 Porwnanie transformaty Fouriera i falkowej
ilo s c mo zliwych baz Wtransformacie Fouriera jest to zawsze jedna baza
zawieraj ace funkcje trygonometryczne. Dla transformaty falkowej
istnieje wiele r znych baz funkcji.
no snik funkcji bazowych Dla transformaty Fouriera jest to zawsze (; +).
Dla transformaty Fouriera natomiast no snik jest zawsze ograniczony
i r zny, dla r znych funkcji bazowych.
C.3 Budowanie rodziny falek
Falk a macierzyst a (x) nazywamy funkcj e, ktra spenia nast epuj ace warunki[57]:
(x) = 0 (C.3)
Rysunek C.1: Przykad ci agej transformaty falkowej
t
f(t)
(a) Funkcja transformowana
t
F()
< (C.5)
gdzie F() to transformata Fouriera falki macierzystej.
Z funkcji tej budujemy rodzin e falek:{
u,s
: j, k R}, ktra ma nast e-
puj ace wa sciwo sci:
u,s
= 2
s
2
_
t u
s
_
(C.6)
Wspczynniki u i s s a w ci agej transformacie falkowej rzeczywiste.
Dodatkowo wymagamy by:
j,k
;
u,s
= (j u)(k s) (C.7)
C.4 Ci aga transformata falkowa
Denicja ci agej transformaty falkowej:
W : C C (C.8)
Wf(u, s) = f,
u,s
=
f(t)
_
t u
s
_
dt (C.9)
Transformata odwrotna:
f(t) =
Wf(u, s)
_
t u
s
_
duds (C.10)
C.5 Analiza wielorozdzielcza
Analiza wielorozdzielcza pozwala rzutowa c sygna na ci ag przestrzeni funk-
cyjnych (V
j
), ktre mog a aproksymowa c okre slon a funkcj e. Przestrzenie te
intuicyjnie odpowiadaj a coraz wi ekszym stopniom szczegowo sci analizy.
Przybli zenie funkcji f w rozdzielczo sci 2
j
jest reprezentowane jako siatka
przybli ze n srednich funkcji f w obszarach o rozmiarze proporcjonalnym do
2
j
. Przestrze n V
j
zawiera wszystkie mo zliwe przybli zenia w rozdzielczo sci
2
j
, dodatkowo deniuje si e projekcj e f
j
V
j
, ktra jest funkcj a tak a, ze
f f
j
jest najmniejsze. Funkcja ta jest interpretowana jako przybli zenie
f na poziomie dokadno sci V
j
.
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 91
Przestrzenie V
j
speniaj a nast epuj ace aksjomaty[58]:
V
j
L
2
(R) (C.11)
V
j
jest podprzestrzeni a funkcji o sko nczonej energii, tj. dla ka zdej funk-
cji f nale z acej do V
j
speniony jest warunek
+
|f(t)|
2
dt < .
j Z, f(t) V
j
f
_
t
2
_
V
j+1
(C.12)
Intuicyjnie wraz ze wzrostem indeksu j maleje dokadno s c aproksyma-
cji funkcji (ro snie cz estotliwo s c prbkowania). Przy dwukrotnym podnie-
sieniu cz estotliwo sci funkcji przenosimy j a do wy zszej przestrzeni V
j
.
j Z, V
j+1
V
j
(C.13)
Przestrze n funkcji o ni zszej rozdzielczo sci zawiera si e w przestrzeni
funkcji o wy zszej rozdzielczo sci.
(j, k) Z
2
, f(t) V
j
f(t 2
j
k) V
j
(C.14)
Funkcje s a niewra zliwe na translacje o 2
j
.
lim
j+
V
j
=
+
j=infty
V
j
= {0} (C.15)
W bardzo niskiej skali nie mo zemy nic powiedzie c o aproksymowanej
funkcji.
lim
j
V
j
= domkniecie
_
_
+
_
j=
V
j
_
_
= L
2
(R) (C.16)
Dla dowolnie du zej skali aproksymacje zbiegaj a do aproksymowanej
funkcji f.
C.6 Funkcja skaluj aca
Najlepsza aproksymacja funkcji f w rozdzielczo sci 2
j
jest deniowana
jako ortogonalna projekcja P
v
j
f w V
j
. Wyra za si e ona za pomoc a funk-
cji skaluj acej , ktrej przeskalowania i przesuni ecia
j,n
tworz a ortonor-
maln a baz e V
j
. Metod e otrzymywania mo zna znale z c w [58].
j,n
(t) = 2
j
2
_
t n
2
j
_
(C.17)
gdzie n Z.
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 92
Najlepsz a aproksymacj a f w rozdzielczo sci 2
j
jest:
P
v
j
f =
+
n=
a
j
[n]
j,n
(C.18)
gdzie a
j
[n] = f,
j,n
=
f(t)
j,n
dt
Dodatkowo funkcje skaluj ace mo zna powi aza c z ltrami pasmowoprze-
pustowymi.
Poniewa z V
j
V
j1
oraz poniewa z
0,n
tworz a ortonormaln a baz e V
0
mo zemy napisa c:
1
_
t
2
_
=
nZ
h[n](t n) (C.19)
gdzie:
h[n] = f,
0,n
(C.20)
Wspczynniki h[n] b ed a interpretowane jako ltr pasmowoprzepustowy.
Rysunek C.2: Podzia przestrzeni czasu i cz estotliwo sci na poszczeglne
funkcje bazowe w dyskretnych transformatach
exp(i)
exp(2i)
exp(3i)
exp(4i)
exp(5i)
x
(a) Zwyka transformata Furie-
rowska
x
exp(i)
exp(2i)
exp(3i)
exp(4i)
exp(5i)
(b) Okienkowa transformata Fu-
rierowska
x
W(4,1)
W(3,1)
W(2,1)
W(3,2)
W(2,2) W(2,3) W(2,4)
W
(
1
,
1
)
W
(
1
,
2
)
W
(
1
,
3
)
W
(
1
,
4
)
W
(
1
,
5
)
W
(
1
,
6
)
W
(
1
,
7
)
W
(
1
,
8
)
(c) Dyskretna transformat fal-
kowa
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 93
C.7 Transformata falkowa a analiza wielorozdzielcza
Formalizm analizy falkowej jest blisko powi azany z analiz a wielorozdziel-
cz a. Zdeniujmy przestrze n W
j
, ktra stanowi r znic e pomi edzy przestrze-
niami V
j
i V
j1
. Intuicyjnie przestrze n W
j
b edzie zawiera c szczegy aprok-
symacji funkcji, ktre s a obecne w przestrzeni V
j1
, natomiast nie ma ich
w przestrzeni V
i
.
V
ji
= V
j
W
j
(C.21)
Zatem ortogonalna projekcja aproksymowanej funkcji f w V
j1
mo ze zo-
sta c napisana jako:
P
V
j1
f = P
V
j
f +P
W
j
f (C.22)
Dodatkowo mo zna udowodni c, ze da si e skonstruowa c baz e W
j
za po-
moc a przeskalowanej i przesuni etej falki . Baz a t a jest:
_
j,n
(t) = 2
j
2
_
t 2
j
n
2
j
__
(j,n)Z
(C.23)
Dla funkcji falkowych da si e rownie z zbudowa c powi azany z nimi ltr
pasmowoprzepustowy (oznaczany g[n]), ktry jest sci sle powi azany z l-
trem budowanym dla funkcji skaluj acej.
W analizie falkowej przedstawiamy aproksymacj e funkcji na poziomie
j 1 jako:
P
V
j1
f = P
V
j
f +P
W
j
f, (C.24)
co mo zna rwnie z zapisa c jako:
P
V
j1
=
j,k
j,k
+
j,k
j,k
, (C.25)
gdzie element:
k
k
j,k
(powi azany z funkcj a skaluj ac a) interpretu-
jemy jako aproksymacja funkcji na poziomie j, natomiast element
k
k
j,k
powi azany z funkcj a falkow a interpretujemy jako wzrost dokadno sci aprok-
symacji na poziomie j + 1.
Analogicznie mo zna post api c dla poziomu j, j + 1 itp, buduj ac w ten
sposb piramid e wielorozdzielczych aproksymacji sygnau. Algorytm szyb-
kiej transformaty falkowej pozwala badzo efektywnie wyznaczy c wsp-
czynniki
j,n
i
j,k
(zo zono s c obliczeniowa O(n), gdzie n to ilo s c prbek w
rozkadanym sygnale).
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 94
C.8 Szybka dyskretna transformata falkowa
Funkcja skaluj aca
Poj ecie funkcji skaluj acej mo zna te z wprowadzi c z poziomu samej transfor-
maty falkowej.
Celem naszych dziaa n jest wprowadzenie metody rozkadu funkcji na
sko nczon a liczb e falek. Ze wzgl edu na wyra zenie 2
j
x we wzorze ka zda
falka ma dwa razy mniejsz a cz estotliwo s c gwnej harmonicznej oraz zaj-
muje dwa razy mniejszy obszar pasma cz estotliwo sci. By pokry c w ten spo-
sb cae pasmo cz estotliwo sci nale zaoby u zy c niesko nczonej ilo sci falek,
co w praktycznych zastosowaniach oznaczaoby konieczno s c zastosowania
zbyt du zej ilo sci falek do osi agni ecia rozs adnej dokadno sci aproksymacji
sygnau. Stosuje si e wi ec funkcj e skaluj ac a, ktra przy danej ilo sci falek,
zapenia luk e w widmie cz estotliwo sciowym[61].
Dodatkowo uznajemy ze:
j,k
;
l,m
=
j,l
k,m
(C.26)
gdzie to funkcja skaluj aca.
Algorytm szybkiej transformaty falkowej
Ze wzgl edu na warunek C.5 falki s a blisko powi azane z poj eciem ltrw
pasmowo przepustowych. Filtry pasmowo przepustowe s a to narz edzia,
ktre dany sygna przeksztacaj a na sygna, z ktrego usuni eto zadane
cz e sci jego widma cz estotliwo sciowego. Intuicyjnie mo zna powiedzie c, ze
warunek C.5, ktry mwi ze widmo cz estotliwo sciowe falki ma ograniczony
no snik powoduje, ze operacja falki dziaaj a jak ltry pasmowoprzepustowe.
Rysunek C.3: Przykady falek falka Haara
0.2 0 0.2 0.4 0.6 0.8 1 1.2
1.5
1
0.5
0
0.5
1
1.5
(a) Falka Haara
0.2 0 0.2 0.4 0.6 0.8 1 1.2
0.4
0.2
0
0.2
0.4
0.6
0.8
1
1.2
1.4
(b) Funkcja skaluj aca Haara
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 95
Filtr h[n]
] =
kZ
g[k]f[2n
k] (C.27)
f
low
[n
] =
kZ
h[k]f[2n
k] (C.28)
gdzie n
przebiega od 1 do
n
2
.
Skadniki f
high
[n
] stosujemy
podany algorytm ponownie.
C.9 Praktyczne aspekty transformaty falkowej
Pierwszym krokiem jest wybranie falki
).
Dokadniej: h[n] oznacza n-ty czynnik w ci agu deniuj acym ten ltr.
W [62] zawarto list e falek i ich wasno sci i ktra mo ze stanowi c dobry pocz atek w tym
wyborze.
Na rysunku C.3c podano przykad transformaty falkowej dla stopnia dekompozycji rw-
nego 4.
Rysunek C.4: Przykady funkcji falkowych falka DB16
0 5 10 15 20 25 30 35
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
1
(a) Falka DB16
0 5 10 15 20 25 30 35
0.5
0
0.5
1
(b) Funkcja skaluj aca dla falki DB16
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 96
Wybr stopnia dekompozycji
W naszym przypadku wybr stopnia dekompozycji jest ograniczony ilo sci a
dost epnych punktw pomiarowych. Dla dziesi ecioletniej historii pomiarw
przy 90% uzysku danych mamy ok 3100 punktw pomiarowych. P ka zdym
kolejnym kroku falka ma dwa razy mniejszy no snik atwo zauwa zy c ze
przy tej ilo sci punktw przy 13 falkach no snik najmniejszej funkcji b edzie
mniejszy ni z pojedynczy punkt. Wiemy rwnie z ze falki nie startuj a z ca-
ego zakresu
Mwi ac formalniej: no sniki najwi ekszej falki jest mniejszy od caego zakresu danych.
Dodatek D
Teksty cytatw w tumaczeniu
wasnym w j ezyku oryginau
D.1 Cytaty z rozdziau pierwszego
Cytat ze strony 4
The body of evidence on health effects of PM at levels cur-
rently common in Europe has strengthened considerably over
the past few years. Both epidemiological and toxicological evi-
dence has contributed to this strengthening; the latter provides
newinsights into possible mechanisms for the hazardous effects
of air pollutants on human health and complements the large
body of epidemiological evidence. The evi- dence is sufcient
to strongly recommend further policy action to reduce levels of
PM. It is reasonable to assume that a reduction in air pollution
will lead to considerable health benets. [6]
Cytat ze strony 6
According to RAINS model estimates, cur- rent exposure to
PM from anthropogenic sources leads to the loss of 8.6 months
of life expectancy in Europe. The impacts vary from around 3
months in Finland to more than 13 months in Belgium.
The total number of premature deaths attributed to expo-
sure amounts to around 348 000 annually in the EU (25 coun-
tries).
Apart from effects on mortality, some 100 000 hospital ad-
missions per year can be attributed to exposure. Several other
97
DODATEK D. TEKSTY CYTATW W TUMACZENIU WASNYM W
J EZYKU ORYGINAU 98
impacts on morbidity are also expected to occur but the existing
database is weak, affecting the precision and reliability of the
estimates.
Current legislation related to the emission of pollutants is
expected to reduce impacts by around one third. A further re-
duction, down to around 50% of those estimated for current pol-
lution levels, could be achieved by implementing all currently
feasible emission reduction measures (the maximum feasible
reduction (MFR) scenario).[10]
D.2 Cytaty z rozdziau drugiego
Cytat ze strony 18[35]
A schematic description of a system, theory, or phenomenon
that accounts for its known or inferred properties and may be
used for further study of its characteristics: a model of genera-
tive grammar; a model of an atom; an economic model.
D.3 Cytaty z dodatkw
Oryginalny tekst cytatu ze strony 69
The fastest neuron switching times are known to be on the
order of 10
3
seconds quite slowcompared to computer switch-
ing speeds of 10
10
. Yet humans are able to make surpris-
ingly complex decisions, surprisingly quickly. For example, it
requires approximately 10
1
seconds to visually recognize your
mother. Notice that sequence of neuron rings that can take
place during this 10
1
second interval cannot be possibly longer
that few hundred steps, given the switching speed of single neu-
rons. This observation has led many to speculate that the infor-
mation processing abilities of biological neural systems must
follow from highly parallel processed operating on representa-
tions that are distributed on many neurons. One motivation for
ANN systems is to capture this kind of highly parallel compu-
tation based on distributed representations.[45]
Dodatek E
Sownik terminw
informatycznych
Wszystkie okre slenia cytowane s a za Wikipedi a. Autor pozwoli sobie na
u zycie tego zrda tutaj poniewa z:
Informacje te nie dotycz a gwnej tre sci pracy, a jedynie wyja sniaj a
informatyczne poj ecia u zywane w tym rozdziale.
Autor uznaje, ze jest w stanie sam zwerykowa c poprawno s c tych
artykuw w encyklopedii.
API (z ang Application Interface) sci sle okre slony zestaw regu, za po-
moc a ktrego programy si e komunikuj a.
framework (z ang. rusztowanie) framework jest szkieletem do budowy
aplikacji. Deniuje on struktur e aplikacji oraz oglny mechanizm jej
dziaania, a tak ze dostarcza zestaw komponentw i bibliotek ogl-
nego przeznaczenia do wykonywania poszczeglnych zada n.
ORM (z ang. Object Relational Mapping odwzorowywanie obiektw na
relacje) to sposb odwzorowywania danych mi edzy systemem napi-
sanym w j ezyku programowania orientowanym obiektowo, oraz rela-
cyjn a baz a danych
JAVA Wspczesny, wieloplatformowy, j ezyk programowania.
JRE (z ang Java Runtime Enviorment) srodowisko uruchomieniowe pro-
gramw napisanych w j ezyku Java, skadaj ace si e z maszyny wirtu-
alnej oraz obszernej biblioteki klas
99
DODATEK E. SOWNIK TERMINW INFORMATYCZNYCH 100
JDBC (z ang Java Database connectivity) niskopoziomowe API pozwa-
laj ace na aczenie si e z bazami danych z programw napisanych w
j ezyku Java. API to jest standardow a cz e sci a JRE.
JPA (z ang. Java Persistence API) wysokopoziomowe API pozwalaj ace
na aczenie si e z bazami danych. Zapewnia ono ORM. API to jest
standardow a cz e sci a JRE[82].
XML (z ang Extensible Markup Language) rozszerzalny format danych,
ktry ma dobre metody integracji z wi ekszo sci a wspczesnych j ezy-
kw
JAXB (z ang Java architecture for XML binding) wysokopoziomowe API
pozwalaj ace na przetwarzanie danych w formacie XML z poziomu
programu Java
DBMS (z ang. database management system system zarz adzaj acy ba-
zami danych) to program umo zliwiaj acy innym programom dost ep do
danych i ich modykacj e.[73]
SQL (z ang. structured query language strukturalny j ezyk zapyta n)
j ezyk pozwalaj acy tworzy c zapytania, ktre pobieraj a dane z bazy da-
nych, modykuj a dane wniej zawarte oraz zmieniaj a jej struktur e[74]
schemat bazy danych opis systemu bazodanowego w formalnym j ezyku
wspieranym przez konkretny DBMS, ktry okre sla sposb organiza-
cji danych, wi ezy spjno sci itp.[71]
kwerenda (inaczej zapytanie) precyzyjne okre slenie zestawu danych jaki
ma zosta c pobrany
klucz gwny poj ecie z zakresu baz danych. Oznacza minimaln a infor-
macj e na temat wiersza danej tabeli ktra jednoznacznie w wiers
normalizacja bazy danych Celem normalizacji bazy danych jest mini-
malizowanie redundancji (nadmiarowo sci) informacji czyli likwido-
wanie sytuacji, w ktrych albo ta sama informacja przechowywana
jest w wielu miejscach, jak rwnie z minimalizowanie ilo sci informa-
cji, ktre od siebie wspzale z a.
logika aplikacji (synonimicznie: logika biznesowa
) zestaw zachowa n,
ktre powoduj a, ze aplikacja realizuje swoje zadania (w przypadku
aplikacji biznesowej jest to realizacja odpowiednich zada n w rmie;
W scisym, matematycznym, sensie zawsze da si e tak wybra c dane wej sciowe, by warto-
sci skrtw tych danych miay nierwnomierny rozkad. Jednak wymaga si e, by dla prawdzi-
wych danych, na jakich dana funkcja skrtu ma pracowa c rozkad ten by rwnomierny.
Dodatek F
Zawarto s c pyty i
uruchomienie projektu
F.1 Zawarto s c pyty
Pyta zawiera nast epuj ace katalogi:
hajmon Gwny projekt Java, zawieraj acy gwne elementy systemu do-
st epne z poziomu j ezyka Matlab.
hajmon-importer Projekt zawieraj acy kod importuj acy dane z poszcze-
glnych zrde.
hajmon-mysql Schemat bazy danych.
hajmon-matlab Projekt matlaba.
praca-mgr Elektroniczna wersja pracy magisterskiej.
F.2 Uruchomienie projektu
Kompilacja kodu Java
Wszystkie projekty budowane s a za pomoc a systemu budowania Maven.
Wszystkie wspczesne IDE Java zawieraj a wtyczki obsuguj ace ten sys-
tem.
By zbudowa c ten konkretny projekt nale zy b ed ac w jego katalogu gw-
nym wpisa c polecenie mvn install. By zbudowa c projekt hajmon nale zy
wykona c nast epuj ace polecenia:
cd hajmon
mvn install
102
DODATEK F. ZAWARTO
.
[2] Tam ze str. 715
[3] Tam ze str. 714 715
[4] C A Pope, 3rd, D V Bates oraz M E Raizenne, He-
alth effects of particulate air pollution: time for
reassessment?; W: Enviormental Health Perspecti-
ves [online]; Nr. 103(5) Maj 1995 str 473-480 [do-
st ep 22 kwietnia 2011]; Dost epny w internecie:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1523269/
.
[15] Tam ze artyku 1 dyrektywy; strona 152/3
[16] Tam ze artyku 2 dyrektywy; strona 152/3 152/6
[17] Tam ze za acznik I; strona 152/14
[18] Tam ze; punkt 11 na stronie 152/2
[19] Aneta Duda: Zastosowanie modelu numerycznego do ana-
lizy rozprzestrzeniania si e zanieczyszcze n w Lublinie; Po-
st epy Nauki i Techniki nr 2; str. 62 70; 2001
[20] . A. Sahin, C. Bayat, and O. N. Uan: Application of cel-
lular neural network (CNN) to the prediction of missing air
pollutant data; Atmospheric Research, vol. 101, no. 1-2, pp.
314-326, Mar. 2011.
[21] L. O srdka, M. Wojtylak, E. Krajny, and K. Klejnowski:
Proposal method of estimation PM2.5 concenrtaion on base
measurements PM10 for application in short-range air qu-
ality forecast in gornoslaska agglomeration, in Ochrona po-
wietrza w teorii i praktyce Vol. 2, vol. II, J. Konieczy nski,
Ed. Instytut Podstaw In zynierii
Srodowiska PAN w Zabrzu,
2008, pp. 115-122.
.
[25] Sekretariat traktatu LRTAP; Non-compliance by
Spain with the Protocol on Volatile Organic Com-
pounds or their Transboudary Fluxes to the Co-
nvention on Long-range Transboundary Air Pollu-
tion [dost ep 8 sierpnia 2011]; dost epny w Internecie
http://live.unece.org/leadmin/DAM/env/lrtap/ExecutiveBody
/CLRTAP%20Spain%20Violation%20of%20VOC%20Protocol.
edited.ae.pdf.
[26] Tekst traktatu o transgranicznym przenoszeniu za-
nieczyszcze n powietrza na dalekie odlego sci [on-
line]; Ekonomiczna Komisja ONZ dla Europy [do-
st ep z dnia 23 kwietnia 2011]; Dost epny w Internecie
http://www.unece.org/env/lrtap/full%20text/1979.CLRTAP.e.pdf
; 11 grudnia 2008
[40] David Buttereld, Paul Quincey: Measurement science is-
sues relating to PM10 and PM2.5 airborne particle [do-
st e 20 sierpnia 2011], Raport NPL; Dost epny w Internecie:
http://publications.npl.co.uk/npl_web/pdf/as15.pdf
[41] Peter H. McMurry: A review of atmospheric aerosol me-
asurements; Atmospheric Environment; Volume 34; Issues
12-14; 2000; Pages 1959-1999; ISSN 1352-2310;
[42] David Gobeli, Herbert Schloesser, Thomas Pottber: Met
One Instruments BAM-1020 Beta Attenuation Mass Moni-
tor US-EPA PM2.5 Federal Equivalent Method Field Test
Results; Met One Instruments Incorporated
[43] David C. Green, Gary W. Fuller, Timothy Baker: Deve-
lopment and validation of the volatile correction model for
PM10 - An empirical method for adjusting TEOM measu-
rements for their loss of volatile particulate matter; Atmo-
spheric Environment; Volume 43; Issue 13; April 2009; Pa-
ges 2132-2141; ISSN 1352-2310
[44] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin: A
Practical Guide to Support Vector Classication [online];
http://www.csie.ntu.edu.tw/cjlin/papers/guide/guide.pdf;
Dost ep z dnia 8 maja 2011;
S
denicja, 66