You are on page 1of 127

POLITECHNIKA WARSZAWSKA

WYDZIA FIZYKI
PRACA MAGISTERSKA
ANALIZA KORELACJI PRZEBIEGW CZASOWYCH
IMISJI PYU ZAWIESZONEGO PM
10
I PM
2,5
ORAZ TLENKW AZOTU
CORRELATION ANALYSIS OF TIME SERIES OF PARTICULATE MATTER
(PM
10
AND PM
2,5
) AND NITROGEN OXIDE IMISSION
Jacek Bzdak
nr. albumu: 196909
Promotor:
prof. Bronisaw Sowi nski
doc. Mieczysaw Sowi nski
WARSZAWA 2011
ii
Podzi ekowania:
Chciabym podzi ekowa c moim opiekunom: doc. Sowi n-
skiemu i prof. Sowi nskiemu, ktrzy wprowadzili mnie
w tematyk e bada n - przez wiele godzin rozmawiaem z
nimi na tematy poruszane w mojej pracy.
Za cenne uwagi dotycz ace modelowania za pomoc a sieci
neuronowych oraz za podzielenie si e dziaaj acym ko-
dem Matlaba chciabym podzi ekowa c dr. Siwkowi z Wy-
dziau Elektrycznego PW.
Wreszcie chciabym podzi ekowa c prof. Kosi nskiemu i
prof. Osowskiemu, na ktrych wykady dotycz ace Sieci
Neuronowych ucz eszczaem. Bez ich wykadw (i bez
lektury ich podr ecznikw) praca ta byaby na du zo ni z-
szym poziomie.
Bardzo dzi ekuj e dr. Przemysawowi Dudzie, na ktrego
zyczliwo s c zawsze mogem liczy c.
iii
Streszczenie
Zanieczyszczenia powietrza s a jednym z najbardziej istotnych proble-
mw ekologicznych i zdrowotnych wspczesnej cywilizacji. Istniej a ba-
dania jednoznacznie wi a z ace poziomy poszczeglnych zanieczyszcze n i np.
smiertelno s c na danym terenie. Modelowanie tego zjawiska mo ze wspo-
maga c dziaania maj ace na celu obni zanie poziomw zanieczyszcze n oraz
wspomaga c sam proces pomiaru ich poziomw. Praca niniejsza dotyczy
problematyki zwi azanej z ochron a jako sci powietrza oraz modelowania po-
ziomw wyst epuj acych zanieczyszcze n. W pracy skoncentrowano si e na
pyle zawieszonym ze wzgl edu na powszechno s c tego zanieczyszczenia.
Przedmiotem pracy jest analiza modeli, w ktrych b ed a wykorzysty-
wane dane imisyjne, w szczeglno sci tzw. historyczne szeregi czasowe po-
ziomy zanieczyszcze n. Modele, dziaaj ace w oparciu o zbiory danych tego
rodzaju, nazywaj a si e modelami eksploruj acymi dane. Opracowano mo-
del pozwalaj acy na ekstrapolacj e przestrzenn a poziomw zanieczyszcze n.
Model ten mo ze mie c zastosowanie mi edzy innymi do uzupeniania luk w
danych pomiarowych, ktre mog a powstawa c podczas konserwacji urz a-
dze n lub ich awarii. Praca zawiera rwnie z krtkie wprowadzenie do me-
tod pomiarowych pyu zawieszonego. Ze wzgl edu na specyk e pomiarw
tego zanieczyszczenia (du ze niepewno sci pomiarowe, r znorodno s c metod
pomiarowych), jak i ze wzgl edu na obowi azuj ac a legislacj e i standardy, mo-
delowanie mo ze odgrywa c istotn a rol e w procesie pomiaru poziomu pyu
zawieszonego. Modele eksploruj ace dane pochodz ace ze zr znicowanych
zrde, z ktrych pobiera si e informacje, powinny pracowa c w okre slonym
dla nich srodowisku. Opracowano zatemzao zenia koncepcyjne dla takiego
srodowiska oraz wyszczeglniono, jakie cechy i funkcjonalno sci powinno
ono posiada c.
Uruchomiono rwnie z cz e sciow a wersj e takiego srodowiska, ktr a wy-
korzystano w modelach opisanych w pracy. W Dodatkach opisano pod-
stawy dziaania sztucznych sieci neuronowych i wykorzystywanych w ni-
niejszej pracy sieci SSN oraz podano krtki zarys analizy falkowej, ktra
jest jednym z wa znych narz edzi wspomagaj acych sieci neuronowe.
iv
Abstract
Air pollution is one of most important environmental and health issues.
Many studies link level of particular pollutants and mortality rates on
given area. Modeling can support air remediation programs, as well as aid
in the pollutant measurement process. This work concerns air pollution
management. In this work we focus on particulate matter because this
pollutant is one of most common.
The subject of this work is investigation and development of models
that work on imission data (time series of archival pollutant levels). Mod-
els that work using this data are called data mining models (DMM). Model
that extrapolates pollutant levels was developed in this work, such model
can be used to ll gaps in timeseries of measurements collected by par-
ticular station (these gaps may occur due to equipment conservation and
malfunction). This work contains also short introduction to measurement
methods of PM levels. Particulate Matter measurement proses can aug-
mented using modeling techniques, due to the fact of high measurement
uncertainty, and because of current legislation and standards. DMM mod-
els should be embedded in a system that will provide access to data col-
lected from many external sources. In this work requirements for this
system were developed. Working prototype for this system was also devel-
oped.
Theoretical basis for articial neural networks were also described in
this work, as well as introduction to wavelet transform technique that
can be used to enhance neural network performance.
Spis tre sci
Spis tre sci v
1 Wprowadzenie 1
1.1 Motywacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Py zawieszony . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Zanieczyszczenia powietrza jako zagro zenie dla zdrowia . . 2
1.4 Regulacje unijne . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Zastosowania metod opartych o eksploracj e danych w kon-
tek scie uwarunkowa n prawnych oraz ochrony zdrowia miesz-
ka ncw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Przedmiot bada n 12
2.1 Istniej ace systemy modelowania o podobnym charakterze w
Polsce i Europie . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Porwnanie modeli CTM i DMM . . . . . . . . . . . . . . . . 15
2.3 Denicja modelu . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 Metody pomiarw poziomw PM 20
3.1 Regulacje prawne . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Metoda grawimetryczna . . . . . . . . . . . . . . . . . . . . . 21
3.3 Osabienie promieniowania . . . . . . . . . . . . . . . . . . 22
3.4 Mierniki TEOM . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.5 Rola modelowania w pomiarach poziomw PM . . . . . . . . 24
4 Opracowanie systemu modelowania zanieczyszcze n 27
4.1 Zao zenia koncepcyjne . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Baza danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.3 Ocena stosowanego schematu bazy danych . . . . . . . . . . 37
4.4 Biblioteka dost epu do bazy danych . . . . . . . . . . . . . . . 39
4.5 Framework importu danych . . . . . . . . . . . . . . . . . . . 40
4.6 Framework modelowania zanieczyszcze n . . . . . . . . . . . 42
v
SPIS TRE

SCI vi
4.7 Analiza opracowanego systemu . . . . . . . . . . . . . . . . . 46
4.8 Stosowane w systemie algorytmy . . . . . . . . . . . . . . . . 49
5 Wykorzystanie sieci neuronowych 53
5.1 Wst epna ekstrapolacja przestrzenna . . . . . . . . . . . . . . 53
6 Podsumowanie 62
6.1 Zawarto s c pracy . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.2 Wnioski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
A Sownik poj e c 64
B Sztuczne sieci neuronowe 68
B.1 Wst ep . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
B.2 Podstawy teoretyczne . . . . . . . . . . . . . . . . . . . . . . . 71
B.3 Poj ecie cechy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
B.4 Kroki potrzebne do zbudowania modeli opartego na SSN . . 78
B.5 Sieci SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
C Dyskretna transformata falkowa 87
C.1 Transformata Fouriera . . . . . . . . . . . . . . . . . . . . . . 88
C.2 Porwnanie transformaty Fouriera i falkowej . . . . . . . . . 89
C.3 Budowanie rodziny falek . . . . . . . . . . . . . . . . . . . . . 89
C.4 Ci aga transformata falkowa . . . . . . . . . . . . . . . . . . . 90
C.5 Analiza wielorozdzielcza . . . . . . . . . . . . . . . . . . . . . 90
C.6 Funkcja skaluj aca . . . . . . . . . . . . . . . . . . . . . . . . 91
C.7 Transformata falkowa a analiza wielorozdzielcza . . . . . . 93
C.8 Szybka dyskretna transformata falkowa . . . . . . . . . . . 94
C.9 Praktyczne aspekty transformaty falkowej . . . . . . . . . . 95
D Teksty cytatw w tumaczeniu wasnym w j ezyku oryginau 97
D.1 Cytaty z rozdziau pierwszego . . . . . . . . . . . . . . . . . . 97
D.2 Cytaty z rozdziau drugiego . . . . . . . . . . . . . . . . . . . 98
D.3 Cytaty z dodatkw . . . . . . . . . . . . . . . . . . . . . . . . . 98
E Sownik terminw informatycznych 99
F Zawarto s c pyty i uruchomienie projektu 102
F.1 Zawarto s c pyty . . . . . . . . . . . . . . . . . . . . . . . . . . 102
F.2 Uruchomienie projektu . . . . . . . . . . . . . . . . . . . . . . 102
Bibliograa 104
SPIS TRE

SCI vii
Lista ilustracji 113
Lista tabel 114
Indeks 118
Rozdzia 1
Wprowadzenie
1.1 Motywacja
Szeroko poj ete zanieczyszczenia powietrza s a jednym z wa zniejszych, nie-
rozwi azanych problemw zarwno w zakresie ochrony srodowiska jak i
ochrony zdrowia. Fakt negatywnego wpywu st e ze n zanieczyszcze n powie-
trza na zdrowie ludno sci zosta wykazany wwielu niezale znych badaniach.
Du zo atwiej jest owym zanieczyszczeniom zapobiega c, ni z likwidowa c ich
skutki.
Brak pewnych, miarodajnych metod prognozowania i modelowania za-
nieczyszcze n powietrza jest powa zn a przeszkod a zarwno wdora znych dzia-
aniach zapobiegaj acym przekroczeniom dopuszczalnych poziomw zanie-
czyszcze n, jak i przy dugofalowym zarz adzaniu ich poziomami. By zapo-
biega c dora znie zanieczyszczeniom wadze samorz adowe ka zdego poziomu
musz a mie c dost ep do wiarygodnego systemu ostrzegaj acego o przyszych
przekroczeniach, natomiast do dugofalowego zarz adzania ich poziomami
potrzebuj a one narz edzi pozwalaj acych oceni c wpyw r znych inwestycji
na poziomy zanieczyszcze n. Dodatkowo budowa, rozwj i utrzymanie sieci
pomiarowych zanieczyszcze n powietrza jest bardzo kosztowne mo zliwe
jest budowanie modeli, ktre umo zliwi a obni zenie tych kosztw, b ad z te z
podwy zszenie ilo sci i jako sci zbieranych danych bez widocznego ich pod-
wy zszania.
Problemten dotyczy wszczeglno sci wadz lokalnych, dla ktrych szcze-
glnie trudno opracowa c modele emisyjne.
Celem pracy jest opracowanie i zbadanie narz edzi do wspomagania sa-
morz adw lokalnych w realizacji programw naprawczych, tj. zmniejsza-
nia poziomu pyu zawieszonego tak, by poziom ten by zgodny z poziomami
dopuszczalnymi zapisanymi w dyrektywie UE 2008/50/WE.
1
ROZDZIA 1. WPROWADZENIE 2
1.2 Py zawieszony
Py zawieszony ( PM

), to okre slenie drobin ciaa staego, ktre s a zawie-


szone w powietrzu (ze wzgl edu na rozmiar proces ich grawitacyjnego osia-
dania jest: albo bardzo powolny, albo nie jest gwnym kanaem ich usu-
wania ze srodowiska).
Aktualnie rozr znia si e dwie frakcje PM:
PM
10
jest to frakcja pyu zawieszonego o srednicy aerodynamicznej

poni-
zej 10m
PM
2,5
jest to frakcja pyu zawieszonego o srednicy aerodynamicznej poni-
zej 2, 5m
Rozr znia si e si e rwnie z inne frakcje. Jednak ze wzgl edu na mo zliwo-
sci pomiarowe (im ni zsze jest grne ograniczenie na wielko s c cz astki, tym
trudniejszy jej pomiar), jak i obowi azuj ac a legislacj e, w ktrej wydzielono
wa snie te dwie frakcje, pozostaniemy przy tym podziale.
Podzia ten nie jest zupenie aprioryczny pomiar tych frakcji wy-
maga r znej aparatury pomiarowej, a ich wpyw zdrowotny rwnie z jest
istotnie inny. Jednak w miar e rozwoju wiedzy na temat wpywu stanu
zanieszczyszcze n na stan zdrowia czowieka oraz innowacji pomiarowych,
mo zliwe s a daleko id ace zmiany regulacji. Zmianom mo ze ulega c nie tylko
podzia na frakcje, ale i przykadowo na jednostki, w ktrych dokonuje si e
pomiaru

.
1.3 Zanieczyszczenia powietrza jako zagro zenie dla
zdrowia
Wpyw pyw zawieszonych na zdrowie ludno sci
Wielokrotnie powtarzane badania przeprowadzane zarwno w Europie jak
i w USA,[1, 4, 5]

bezspornie udowodniy wpyw wysokich st e ze n na zdro-


wie mieszka ncw. Obserwuje si e zarwno wpyw pojedynczych epizodw
wysokich st e ze n pyw, jak i skumulowany wpyw sredniego poziomu za-
nieczyszcze n, na ktry wystawiona jest ludno s c w dugim okresie.
Powy zszy rozdzia stanowi krtkie wprowadzenie do tego tematu, ktry
wymaga g ebszych analiz.

PM (z ang. particulate matter)



Srednica aerodynamiczna patrz. A

Trwaj a badania ktre wykazuj a istotny wpyw zdrowotny liczby drobnych cz astek ktre
przedostaj acych si e do drg oddechowych.

W USA przeprowadzono zdecydowanie wi ecej bada n na ten temat. Podane prace s a pra-
cami przegl adowymi zawieraj acymi wnioski z wielu innych prac badawczych w tej dziedzinie.
ROZDZIA 1. WPROWADZENIE 3
Metodologie badawcze w tym zakresie
Wi ekszo s c przeprowadzanych bada n polegaa na analizie serii czasowych
st e ze n PM i konkretnej metryki zdrowia ludno sci na danym terenie. Me-
tryk a t a mo ze by c, na przykad, smiertelno s c czy ilo s c wizyt w szpitalu.
Prowadzi si e te z badania polegaj ace na ekspozycji badanych ludzi i zwie-
rz at na wysokie st e zenia PM, a nast epnie sprawdzania ich stanu zdrowot-
nego pod k atem przewidywanych objaww.
Badania epidemiologiczne prowadzono porwnuj ac r zne metryki zdro-
wotne na jakim s terenie przed, w trakcie i po epizodach, w ktrych poziom
pyw zawieszonych by istotnie r zny od sredniej na tym terenie

. Wnio-
ski z szeregu bada n prowadzonych w USA t a metod a znajduj a si e w tabeli
1.1.
Kolejnymrodzajembada n epidemiologicznych prowadzonych wtej dzie-
dzinie s a badania porwnuj ace zdrowie ludno sci na terenach o r znych
srednich st e zeniach pyw zawieszonych (i innych zanieczyszcze n). Bada-
nia te s a trudniejsze do przeprowadzania z racji konieczno sci wprowadze-
nia poprawek na inne czynniki maj ace wpyw na zdrowie ludno sci.
Badania mechanizmw oddziaywania pyw zawieszonych przeprowa-
dzano zarwno metodami in vitro jak i in vivo. Prowadzi si e zarwno
mikroskopowe badania efektw oddziaywania cz astek pyw na tkanki
i bada si e makroskopowe objawy pacjentw wystawionych na konkretne
st e zenia pyw zawieszonych.
Wnioski z bada n
Cytowane prace jasno stwierdzaj a istnienie przyczynowej zale zno sci mi e-
dzy st e zeniami PM oraz ilo sci a zgonw i wizyt w szpitalach na danym te-
renie.
Liczba bada n na temat wpywu poziomu pyu zawieszonego
na zdrowie ludno sci wzrosa istotnie w ci agu ostatnich kilku
lat. Badania te dotycz a rwnie z poziomw zanieczyszcze n po-
wszechnie spotykanych w miastach Europy. Wzrosa zarwno
ilo s c bada n epidemiologicznych, jak i toksykologicznych. Te ostat-
nie powoduj a nowe spojrzenie na temat mo zliwych mechani-
zmw niebezpiecznych dla zdrowia procesw zachodz acych pod
wpywem zanieczyszcze n powietrza czym uzupenia zestaw do-
wodw epidemiologicznych. Zgromadzone dowody s a wystar-
czaj ace by mocno zarekomendowa c dalsze regulacje maj ace na

Zarwno okresw bardzo wysokich st e ze n, jak i okresw st e ze n niskich (na przykad


podczas strajkw w o srodkach przemysowych).
ROZDZIA 1. WPROWADZENIE 4
celu obni zanie poziomw st e ze n pyu zawieszonego. Jest rozs ad-
nym zao zeniem, ze zmniejszanie poziomw zanieczyszczenia po-
wietrza b edzie prowadzi c do poprawienia poziomu zdrowia lud-
no sci

.[6]

Stwierdzono liniow a, na badanym spektrum st e ze n, zale zno s c mi edzy nie-


bezpiecznymi efektami zdrowotnymi (w tym smiertelno sci a), a st e zeniem
pyw zawieszonych[1, 5]. Zale zno s c t a dobrze obrazuje wykres 1.1.
Nie udao si e wykry c dolnej granicy, poni zej ktrej pyy zawieszone
nie oddziauj a na zdrowie, cz e sciowo wynika to z tego, ze niewiele bada n
koncentruje si e na obszarze niskich st e ze n

, cz e sciowo fakt ten tuma-


czy si e tym, ze w ka zdej du zej populacji znajduj a si e szczeglnie wra z-
liwe grupy spoeczne. Do szczeglnie wra zliwych grup spoecznych zalicza
si e[8]: osoby starsze; noworodki i mae dzieci, osoby o niskim statusie so-
cjoekonomicznym, osoby z rozwini etymi chorobami szczeglnie nara zonych
ukadw (oddechowy, krwiono sny).
Poniewa z szkodliwa ka zda ilo s c pyu zawieszonego jest niekorzystna
dla zdrowia (w szczeglno sci dotyczy to PM
2,5
[18]), wyznaczone poziomy
dopuszczalne winny by c traktowane umownie jako maj ace techniczny i
ekonomiczny charakter.
Z bada n epidemiologicznych jasno wynika, ze krtkoterminowe oddzia-
ywanie pyu zawieszonego koncentruje si e na ukadzie oddechowymi krwio-
no snym. W tabeli 1.1 zamieszczono porwnanie ilo sci zgonw spowodo-
wanych problemami z ukadem oddechowym i krwiono snym w wielu mia-
stach USA podczas okresw bardzo wysokich st e ze n zanieczyszcze n.
Dane dotycz ace dugoterminowego wpywu srednich st e ze n pyw za-
wieszanych na smiertelno s c s a bardziej sk ape, a ze wzgl edu na trudno-
sci w ich analizie oraz konieczno s c wprowadzania poprawek na wiele do-
datkowych czynnikw, ich poprawno s c bywa dyskutowana. Wi ekszo s c ba-
da n wskazuje, ze wraz ze wzrostem srednich st e ze n pyu zawieszonego ro-
snie liczba osb, ktre przedwcze snie umieraj a na choroby ukadu krwio-
no snego (w tym zaway). Wi ekszo s c bada n nie wi a ze wzrostu st e ze n za-
nieczyszcze n ze zgonami spowodowanymi chorobami ukadu oddechowego
cho c wydaje si e prawdopodobne, ze dugotrwae wystawienie na pyy zwie-
szone mo ze powodowa c astm e u dzieci. S a rwnie z badania acz ace wyso-
kie srednie st e zenia pyw zwieszonych z rakiem puc[9].

Podkre slenie moje.

Tumaczenie wasne, cytat w j ezyku oryginau na stronie 97.

S a jednak takie badania, ktre wskazuj a zale zno s c mi edzy szkodliwymi symptomami
zdrowotnymi, a st e zeniem PM
2,5
w zakresie st e ze n od 8 do 30
g
m
3
(ktry to zakres mie sci si e
poni zej wi ekszo sci norm).
ROZDZIA 1. WPROWADZENIE 5
Rysunek 1.1: Zale zno s c wzrostu smiertelno sci przy wzro scie st e zenia PM
10
o 10
g
m
3
od sredniego st e zenia PM
10
.[7] Wykres ten obrazuje fakt istnienia
w przybli zeniu liniowej zale zno sci mi edzy st e zeniem pyw zawieszonych
a ich skutkami zdrowotnymi.

Zte kwadraty oznaczaj a sredni poziom PM


10
_

m
3

, niebieskie kropki na-


tomiast wzgl edny wzrost ryzyka zdrowotnego dla wzrostu poziomu za-
nieczyszczenia o 10
g
m
3
(w arbitralnych jednostkach).
Tablica 1.1: Wzrost zgonw podzielony na szerokie kategorie medyczne
spowodowany wzrostem st e zenia PM
2,5
o 50
g
m
3
(na podstawie szeregu ba-
da n przeprowadzonych na przykadach okresw podwy zszonych st e ze n za-
nieczyszcze n w XX wieku w USA).[1]

Smiertelno s c Wzrost Procent dodatkowych


poza okresem smiertelno sci smierci
Przyczyna podwy zszonych z danej spowodowanych
smierci zanieczyszcze n przyczyny[%] ekspozycj a na PM
2,5
b
Cao s c
a
100 7 100
Ukad oddechowy 8 25 28
Ukad kr a zenia 45 11 69
Inne 47 0.4 3
a
Z wykluczeniem niemedycznych przyczyn (takich jak wypadek, morderstwo,
samobjstwome)
b
Podczas epizodw smogowych
ROZDZIA 1. WPROWADZENIE 6
Badania wpywu podwy zszonych st e ze n pyw zawieszonych na stan
zdrowotny pojedynczych osb wykazay: symptomy ze strony dolnych drg
oddechowych (kaszel, nasilenie objaww astmy) oraz mierzalne badaniami
klinicznymi osabienie czynno sci puc

. Nie udao si e wykry c wpywu st e-


zenia pywzawieszonych na grne drogi oddechowe. Zaobserwowano utrzy-
mywanie si e objaww do 7 dni.[3]
Badania in vitro s a w toku i nie ma jeszcze bezspornych wynikw[1].
Zyski z ograniczenia emisji pyu zawieszonego
Europejski oddzia WHO szacuje ze:
Zgodnie z przewidywaniami modelu RAINS, ekspozycja po-
pulacji na py zawieszony ze zrde antropogenicznych powo-
duje obni zenie sredniej dugo sci zycia o srednio 8,6 miesi ecy (...)
Cakowita liczba przedwczesnych smierci spowodowanych eks-
pozycj a na py zawieszony to okoo 348 000 rocznie w caej Unii
Europejskiej.
Dodatkowo ok 100 000 wizyt w szpitalach powodowane jest
ekspozycj a. (...)
Implementacja obowi azuj acej legislacji zwi azanej z emisj a
zanieczyszcze n mo ze obni zy c powy zsze liczby o okoo jedn a trzeci a[10]

1.4 Regulacje unijne


Polska jako czonek Wsplnoty Europejskiej podlega dyrektywom Parla-
mentu Europejskiego i Rady Europy. Podstawow a dyrektyw a normuj ac a
kwesti e jako sci powietrza wpa nstwach czonkowskich jest dyrektywa 2008-
/50/WE w sprawie jako sci powietrza i czystego powietrza dla Europy[14]

.
Cele tej dyrektywy s a nast epuj ace:
1. zdeniowanie i okre slenie celw dotycz acych jako sci powietrza, wy-
znaczonych w taki sposb, aby unika c, zapobiega c lub ogranicza c
szkodliwe oddziaywanie na zdrowie ludzi i srodowisko jako cao s c;
2. ocen e jako sci powietrza w pa nstwach czonkowskich na podstawie
wsplnych metod i kryteriw;

Zmiany te byy niewielkie lecz statystycznie istotne.

Tumaczenie moje. Wersja oryginalna na stronie 97.

W tej cz e sci pracy b edziemy si e odnosi c do prawodawstwa europejskiego z kilku po-


wodw. Gwnym powodem jest fakt i z wiele uwarunkowa n zwi azanych z t a dziedzin a ma
charakter ponadnarodowy (jest to zwi azane z transgranicznym transportem zanieczyszcze n
powietrza).
ROZDZIA 1. WPROWADZENIE 7
Rysunek 1.2: Skrcenie sredniej dugo sci zycia spowodowane ekspozycj a
populacji na produkowany przez czowieka py zawieszony.
(a) Dane na 2010 rok (b) Symulowane dane dla 2020 roku w pod-
stawowym scenariuszu CAFE
*
(c) Skala powy zszych rysun-
kw (w miesi acach)
*
Scenariusz CAFE (z ang. Clean Air for Europe) to scenariusz zakadaj acy
osi agni ecie bie z acych mo zliwych do osi agni ecia redukcji poziomw emisji
oddzielnie wyznaczanych dla poszczeglnych krajw Wsplnoty Europej-
skiej.
ROZDZIA 1. WPROWADZENIE 8
3. uzyskiwanie informacji na temat jako sci powietrza, pomocnych w
walce z zanieczyszczeniami powietrza i uci a zliwo sciami oraz w mo-
nitorowaniu dugoterminowych trendw i poprawy stanu powietrza
wynikaj acych z realizacji srodkw krajowych i wsplnotowych;
4. zapewnienie, ze informacja na temat jako sci powietrza bya udost ep-
niana spoecze nstwu;
5. utrzymanie jako sci powietrza, tam gdzie jest ona dobra, oraz jej po-
praw e w pozostaych przypadkach;
6. promowanie scisej wsppracy pomi edzy pa nstwami czonkowskimi
w zakresie ograniczania zanieczyszczenia powietrza;[15]
Najwa zniejsze regulacje
Powy zsza dyrektywa kompleksowo reguluj e kwesti e dugo i krtkotermi-
nowego zarz adzania jako sci a powietrza, jednak dla mojej pracy istotne
b ed a w niej szczeglne regulacje:
ocena jako sci powietrza Dyrektywa ta wprowadza poj ecie oceny jako-
sci powietrza. Poj ecie to oznacza ka zd a metod e stosowan a do po-
miaru, obliczania, przewidywania lub oszacowania poziomw zanie-
czyszcze n. Jest to bardzo istotne w kontek scie niniejszej pracy, po-
niewa z taka jego denicja umo zliwia, wkonkretnych sytuacjach, uzu-
penianie (b ad z zast epowanie) punktw pomiarowych wynikami mo-
delowania.
liczba stacji pomiarowych Dyrektywa jasno okre sla wymagane ilo sci
punktw pomiarowych, jednocze snie w pewnych warunkach (o tym
dalej) pozwala na zast apienie cz e sci z nich modelami.
progi oszacowania Je sli w konkretnej stree poziom zanieczyszczenia
jest ni zszy od okre slonych poziomw, mo zna stosowa c ta nsze sposoby
oceny poziomu danego zanieczyszczenia ni z pomiar. Dokadniej: je-
sli poziom zanieczyszczenia jest ni zszy, ni z dolny prg oszacowania

pomiary mo zna cakowicie zast api c wynikami modelowania/sza-


cowania. Je sli poziom zanieczyszczenia jest ni zszy, ni z grny prg
oszacowania, mo zna u zywa c pomiarw wska znikowych po aczonych
z wynikami modelowania

(Artyku 6, par 1 3).

Poziomy te deniowane s a oddzielnie dla ka zdego zanieczyszczenia oraz zmieniaj a si e w


czasie, przytaczanie ich tutaj jest zatem niepotrzebne.

Powy zej tych progw nale zy wprowadzi c stay monitoring poziomw zanieczyszcze n.
ROZDZIA 1. WPROWADZENIE 9
uzupenianie pomiarw modelowaniem Mo zna, przy spenieniu okre-
slonych warunkw, zast api c 50% wymaganych stacji pomiarowych
wynikami modelowania (Artyku 7 par. 3).
zrda naturalne Je sli zostanie udowodnione, ze przekroczenie okre slo-
nego poziomu zanieczyszcze n wynika z udziau zanieczyszcze n po-
wstaj acych w sposb naturalny przekroczenie takie nie jest uzna-
wane za przekroczenie (Artyku 20, par. 2) .
konieczno s c informowania o przekroczeniach Nakada si e obowi azek
informowania mieszka ncw poszczeglnych obszarw o przekrocze-
niu dopuszczalnych poziomw zanieczyszcze n (Artyku 19 i Za acznik
16) .
normy zanieczyszcze n Wymaga si e osi agni ecia odpowiednich norm ja-
ko sci powietrza.
pomiary wska znikowe Wprowadza si e poj ecie pomiarwwska znikowych.
S a to pomiary, dla ktrych wymagania dotycz ace jako sci danych s a
mniej restrykcyjne w porwnaniu z pomiarami staymi

. By w aczy c
do u zycia owe pomiary nale zy wykaza c (posikuj ac si e modelami), ze
warto sci zanieczyszcze n s a odpowiednio niskie.
wprowadzenie kar Dyrektywa ta nakada na pa nstwa czonkowskie obo-
wi azek wprowadzenia kar dla samorz adw, na terenie ktrych po-
ziomy zanieczyszcze n przekraczaj a odpowiednie poziomy dopuszczalne
(Artyku 7). Aktualnie przepisy te nie s a zaimplementowane w Pol-
sce.
1.5 Zastosowania metod opartych o eksploracj e
danych w kontek scie uwarunkowa n prawnych
oraz ochrony zdrowia mieszka ncw
Metody oparte o eksploracj e danych mo zna stosowa c w nakre slonych kon-
tekstach na nast epuj ace sposoby:
modelowanie By podejmowa c racjonalne decyzje w zarz adzaniu zanie-
czyszczeniami powietrza, lokalne wadze samorz adowe powinny mc

Normy dotycz ace pomiarw wska znikowych rwnie z zale z a od konkretnego rodzaju za-
nieczyszczenia. Dla przykadu dla pyu zawieszonego (PM
10
i PM
2,5
) i pomiary wska znikowe
musz a spenia c nast epuj ace normy: niepewno s c mniejsza od 50%, minimalne pokrycie czasu
14% (albo losowy dzie n w ka zdym tygodniu albo 8 caych tygodni pomiarw rozo zonych rw-
nomiernie w ci agu roku), minimalny uzysk danych 90%.
ROZDZIA 1. WPROWADZENIE 10
oceni c wpyw swoich decyzji na te zanieczyszczenia (zatem na zdro-
wie mieszka ncw). Przykadem takiego narz edzia jest modeli EME-
P/RAINS (dokadniej omwiony w sekcji 2.1), ktry umo zliwia ocen e
wpywu osi agni ecia wymaganych poziomw emisji na zdrowie miesz-
ka ncw Wsplnoty Europejskiej. Model ten umo zliwia wysanie wa-
dzom centralnym poszczeglnych krajw komunikatu: Je sli caa
wsplnota osi agnie oczekiwane poziomy emisji pyu zawieszonego to
wTwoim kraju b edzie rocznie kilka tysi ecy hospitalizacji mniej. Jest
to komunikat przekonuj acy, zrozumiay i konkretny. Bez takiego na-
rz edzia mo zna powiedzie c co najwy zej: Je sli caa wsplnota osi agnie
oczekiwane poziomy emisji to wszyscy b ed a zdrowsi, co ju z nikogo
nie przekona. Byoby po z adanym opracowa c podobne narz edzia dzia-
aj ace na szczeblu lokalnym, by decyzje o wydaniu zgody na loka-
lizacj e (b ad z rozbudow e) fabryk, ranerii, elektrowni, wadze odpo-
wiedniego szczebla podejmoway swiadomie. Przykadem tego typu
modelu, ktry okre sla gwne zrda PM
2,5
, mo ze by c model opisany
w [22].
ostrzeganie Nie tylko dugotrwae srednie st e zenie pyu zawieszonego
jest gro zne dla zdrowia obywateli. Jak pokazuj a badania opisane w
sekcji 1.3 rwnie z krtkotrwae wystawienie na bardzo wysokie st e-
zenia niesie dla osb szczeglnie wra zliwych ryzyko utraty zycia i
zdrowia. Lokalne wadze samorz adowe mog a podj a c pewnie krtko-
terminowe dziaania zapobiegawcze

ktre pozwol a unikn a c takich


wysokich st e ze n jednak dziaania takie mog a by c same w sobie
uci a zliwe dla mieszka ncw lub kosztowne. Wadze lokalne posiada-
j ace dost ep do odpowiedniego modelu przed takimi sytuacjami mo-
gyby podejmowa c te dziaania w sposb swiadomy. Dodatkowym
bod zcem mo ze by c skuteczna implementacja kar dla samorz adw na
terenach, na ktrych wyst epuj a przekroczenia odpowiednich norm[29,
31]
wspomaganie pomiarw wynikami modelowania Wyniki pomiarw
mo zna wspomaga c za pomoc a modelowania na wiele sposobw. Mo zna

Mo zliwo s c podj ecia tego typu krtkoterminowych dziaa n zale zy od przyczyn powstania
zanieczyszczenia (a zatem specyki danego terenu). Bez specjalnego dowodu podam nast e-
puj ace przykady takich dziaa n:
Zamkni ecie centrum miasta dla ruchu samochodowego
Oczyszczenie ulic z bota po sniegowego
Wy aczenie konkretnych uci a zliwych zakadw produkcyjnych
Jak wida c dziaania te s a kosztowne i by je podj a c wadze samorz adowe musz a mie c po-
wa zne powody.
ROZDZIA 1. WPROWADZENIE 11
uzupenia c luki w danych powstae albo na skutek awarii oprzyrz a-
dowania, albo wynikaj ace z metody pomiarw (dla pomiarw wska z-
nikowych). Propozycja takiej metody zawarta jest w niniejszej pracy
5.1, inna w [20]. Prowadzone s a prby szacowania poziomw jed-
nych zanieczyszcze n za pomoc a innych zanieczyszcze n [21]. Wreszcie
buduje si e modele wspomagaj ace dokadno s c pomiarw poziomu PM
(patrz 3.5).
zrda naturalne zanieczyszcze n agodniej traktuje si e w dyrektywie
2008/50/WEzanieczyszczenia ze zrde naturalnych (oraz zanieczysz-
czenia kilku innych typwnp. spowodowane nasypywaniemdrg sol a
i piaskiem). Musz a jednak istnie c narz edzia dowodz ace, ze przyczyn a
przekroczenia byy wa snie takie zrda[22].
Rozdzia 2
Przedmiot bada n
On two occasions I have been asked, Pray, Mr.
Babbage, if you put into the machine wrong
gures, will the right answers come out? I am not
able rightly to apprehend the kind of confusion of
ideas that could provoke such a question.
Charles Babbage
a
a
Charles Babbage projektant Silnika Analitycznego
maszyny ktra moga by c pierwszym dziaaj acym urz a-
dzeniem rwnowa znym Uniwersalnej Maszynie Turinga.
Praca skupia si e na rozwini eciu i ulepszeniu metod prognozowania st e-
ze n zanieczyszcze n powietrza. Metody modelowania mo zna podzieli c na
dwie gwne kategorie:
chemical transport model(CTM) S a to metody oparte na analitycznych

modelach propagacji zanieczyszcze n oraz ich chemicznych przemian.


Danymi wej sciowymi do modeli tego typu s a szacunki emisji bada-
nych zanieczyszcze n, topograa terenu, przewidywania parametrw
pogodowych na kolejne dni. Kluczowa dla dokadno sci tych modeli
jest baza danych emisyjnych, ktrej uzyskanie jest trudne i do s c kosz-
towne.
metody oparte o eksploracj e danych S a to metody oparte oparte na
zao zeniu, ze pomimo i z przebieg szeregu czasowego st e ze n zanie-
czyszcze n jest do s c chaotyczny. Da si e opracowa c krtkoterminowe
predykcje w oparciu o historyczne dane pomiarowe (oraz inne para-
metry takie jak, historyczne parametry pogodowe, prognozy pogody,
etc.).

Analityczne jest tutaj u zyte w znaczeniu: posiadaj ace matematyczne modele oczywi-
scie przywidywania otrzymuje si e za pomoc a numerycznych oblicze n.
12
ROZDZIA 2. PRZEDMIOT BADA

N 13
2.1 Istniej ace systemy modelowania o podobnym
charakterze w Polsce i Europie
Wdro zenia w Polsce
Aktualnie w Polsce WIO

S-ie w niektrych wojewdztwach wdra zaj a za-


rwno systemy oparte na modelach emisyjnych (Mazowieckie i inne), jak i
eksploracji danych (

Sl askie).
Model EMEP jako model pyw zawieszonych
Geneza modelu EMEP
W roku 1979 podpisano traktat o transgranicznym przenoszeniu zanie-
czyszcze n powietrza na dalekie odlego sci (LRTAP

), ktra normuje trans-


graniczne przepywy niektrych zanieczyszcze n powietrza oraz nakada
ograniczenia na wzrosty emisji niektrych zanieczyszcze n

. W jednym z
protokow do tego traktatu ustalono nansowanie programu monitoringu
i oceny dugo zasi egowego transportu zanieczyszcze n powietrza w Europie
(EMEP

), ktry ma dostarcza c, mi edzy innymi, narz edzi do oceny trans-


granicznego przepywu zanieczyszcze n.
Gwnym narz edziem do oceny tego przepywu jest model EMEP.
Metoda dziaania modelu EMEP
Model EMEP zosta stworzony do obliczenia dugotermino-
wych zale zno sci mi edzy zrdami zanieczyszcze n w skali Euro-
pejskiej. Opisuje emisj e, transport, transformacje chemiczne
oraz usuwanie poprzez suche i mokre osiadanie dla 75 rodza-
jw cz astek (...) i 140 reakcji chemicznych. Model EMEP by
oryginalnie stworzony do pracy w skali regionu na siatce nu-
merycznej o wymiarach 50 na 50 kilometrw obejmuj acej ca a
Europ e. (...)
Model EMEP zawiera naturalne jak i antropogeniczne zr-
da pyw zawieszonych.

Zrda antropogeniczne zawieraj a za-
rwno pierwotne zrda pyw zawieszonych takie jak fabryki,

LRTAP (z ang. Long Range Transbounary Air Pollution)

Sama konwencja nie wprowadza zadnych norm wyra za ona po prostu wol e podpisu-
j acych j a stron do badania i ograniczania emisji zanieczyszcze n powietrza[26], jednak pod-
pisano w ramach tej konwencji osiem protokow, ktre normuj a, mi edzy innymi, kwesti e
emisji wielu zanieczyszcze n powietrza[27].

Programme for monitoring and evaluation of Long-Range transmission of air pollutants


in Europe
ROZDZIA 2. PRZEDMIOT BADA

N 14
osadnictwo ludzkie i rolnictwo sklasykowane jako zrda gru-
bego i drobnego pyu

, jak i emitentw gazowych prekursorw


wtrnych nieorganicznych aerozoli, dokadniej dwutlenku siarki,
tlenkwazotu oraz amoniaku. Informacje o zrdach antropoge-
nicznych pochodz a z ocjalnie zgaszanych, w ramach traktatu
LRTAP w programie EMEP, danych. (...) Jedynym naturalnym
zrdem pyw zawieszonych, ktre w tej chwili zawiera model
EMEP jest sl morska

(...).
Istniej a wi ec znane zrda pyw zawieszonych niezawarte
w modelu EMEP (...) s a to:
Wtrne organiczne aerozole powstae w atmosferze, ktre
powstay z kondensacji lotnych zwi azkworganicznych (wy-
produkowanych zarwno przez czowieka, jak i pochodze-
nia naturalnego
Emisji pyw zawieszonych z spalania biomasy i po zarw
lasw
Pierwotnych organicznych takich jak pyki czy zarodniki
grzybw[11]
Charakterystyka dziaania modelu EMEP
Wyniki modelu EMEP maj a dobre korelacje czasowe i przestrzenne z da-
nymi pomiarowym (warto sci liczbowe zawarte w tabeli 2.1). Model ten
rwnie z systematycznie niedoszacowuje poziom zanieczyszcze n (warto sci
liczbowe w tabeli 2.2).
Pouczaj ace s a wymienione przyczyny niedoszacowa n. Jedn a ze zdia-
gnozowanych przyczyn niedoszacowa n modelu jest nieuwzgl ednienie wszyst-
kich zrde zanieczyszcze n. Drug a, istotniejsz a, przyczyn a s a immanentne
wa sciwo sci metody pomiaru poziomw PM.
Poziomy PM mierzone s a wieloma metodami, jednak metod a referen-
cyjn a jest metoda grawimetryczna, ktra polega na pomiarze wzrostu masy
ltra, przez ktry przepuszczono zadan a obj eto s c mierzonego powietrza.
Na owym ltrze osadzaj a si e nie tylko pyy zawieszone, ale rwnie z woda
(czy to woda pochodz aca z atmosfery, czy woda b ed aca cz e sci a skadow a
danej drobiny pyu atmosferycznego). Woda ta mo ze stanowi c od 10 do

Jako grube okre sla si e tutaj zarwno PM


10
jak i grubsze frakcje pyw, jako drobne
PM
2,5
. [przyp. aut.]

Istnieje model aerozolowy EMEP, ktry zawiera zrda takie jak poderwana przez wiatr
gleba w uprawach, czy py znad Sahary [przyp. aut.][11].
ROZDZIA 2. PRZEDMIOT BADA

N 15
30% przyrostu masy ltra

. Model EMEP natomiast modeluje such a mas e


PM (uwzgl ednienie wilgotno sci daje istotn a popraw e dokadno sci patrz
tabela 2.2).
2.2 Porwnanie modeli CTM i DMM
atwo s c implementacji Zdecydowanie atwiej jest zaimplementowa c mo-
del
oparty o eksploracj e danych, gwnie z tego powodu, ze potrzebuje
on du zo mniejszej ilo sci danych do poprawnego dziaania. Z samej
swojej natury modele te oparte s a o archiwaln a baz e danych pomia-
rowych (a bazy takie na mocy mi edzynarodowych porozumie n s a zbie-
rane i musz a by c udost epniane) i do pracy potrzebuj a niewiele wi e-
cej. Modele CTM, natomiast, wymagaj a zgromadzenia bazy danych o
producentach zanieczyszcze n na danym terenie (a bazy takie cz esto
trzeba tworzy c od zera lub poprawia c), bazy uksztatowania terenu,
cz esto wymagaj a wasnego trjwymiarowego modelu pogody i tak da-

O metodach pomiaru poziomu PM jak rwnie z o tym jakie mog a one powodowa c pro-
blemy patrz rozdzia3)
Tablica 2.1: Korelacje mi edzy danymi pomiarowymi a wynikami mo-
delu[12]
Rodzaj korelacji Zakres wspczynnikw korelacji
Czasowa (0, 56; 0, 78)
Przestrzenna (0, 70; 0, 78)
Tablica 2.2: Systematyczne niedoszacowanie poziomw zanieczyszcze n w
modelu EMEP[6]
Rodzaj pomiaru Niedoszacowanie
c
PM
10
w Niemczech 66%
PM
10
w pozostaych krajach 100%
PM
2,5
50%
PM
2,5
uwzgl edniaj ac porwany przez wiatr py 28%
PM
2,5
uwzgl edniaj ac jeszcze
d
wilgotno s c mierzonej prbki 12%
a
Korelacja szeregu czasowego pomiarw dziennych
b
Korelacja dugoterminowych srednich w poszczeglnych punktach prze-
strzennych
c
Zdeniowana jako iloraz r znicy mi edzy poziomami mierzonym i modelowa-
nym do poziomu mierzonego. 100% oznacza ze model daje dwukrotnie mniej-
sze wyniki.
d
Czyli uwzgl edniaj ac py porwany przez wiatr i wilgotno s c mierzonej prbki
ROZDZIA 2. PRZEDMIOT BADA

N 16
Rysunek 2.1: Korelacje szeregw czasowych pomiarw i wynikw modelu
EMEP (na osi odci etych poszczeglne stacje bior ace udzia w programie
EMEP)[11]
(a) Dla PM
10
a
(b) Dla PM
2,5
b
a
Niebieska krzywa reprezentuje korelacje dla suchej masy PM, zielona
reprezentuje such a mas e PM z uwzgl ednieniem pyu porwanego przez
wiatr, czerwona uwzgl ednia dodatkowo wilgotno s c prbki.
b
Niebieska krzywa reprezentuje korelacje dla suchej masy PM, czer-
wona uwzgl ednia dodatkowo wilgotno s c prbki.
W obu rysunkach na osi odci etych znajduj a si e r zne stacje pomiarowe.
Na osi odci etych oznaczono r zne stacie dziaaj ace w ramach programu
EMEP.
Rysunek 2.2: Porwnanie wynikw modelu EMEP z poziomami
zanieczyszcze n[11]
(a) PM
10
(b) PM
2,5
Przerywan a lini a niebiesk a oznaczono wyniki modelowania, czerwon a li-
ni a ci ag a natomiast wyniki pomiarw.
ROZDZIA 2. PRZEDMIOT BADA

N 17
lej. Uzyskanie wymienionych danych jest trudne

, czasochonne i co
wa zniejsze, kosztowne.
mo zliwo sci predykcyjne Modele CTM maj a du zo wi eksze mo zliwo sci
przewidywania. Umo zliwiaj a przewidzenie np. wpywu nowej in-
westycji na poziomy zanieczyszcze n na okre slonym terenie, potra a
wyznacza c przestrzenne rozkady zanieczyszcze n, potra a, wreszcie,
powiedzie c jakie s a zrda zanieczyszcze n powietrza w danym punk-
cie. Metody oparte o eksploracje danych nie maj a natomiast takich
mo zliwo sci. Ich mo zliwo sci opieraj a si e na analizie przeszych danych
nie s a w stanie zatem da c odpowiedzi na pytanie o wpyw jakiej s
przyszej inwestycji na poziomy zanieczyszcze n. Mimo to, mo zna wy-
korzystywa c tego typu modele do przewidywania poziomw zanie-
czyszcze n, jednak b edzie to przewidywanie oparte na analizie danych
przeszych, wi ec niezdolne do uwzgl ednienia nowych uwarunkowa n
(natomiast, przy zao zeniu braku bardzo szybkich zmian charakte-
rystyki emisji, modele te b ed a ci agle dokadniejsze od modeli CTM).
Nie ma rwnie z prostej metody u zycia modeli eksploruj acych dane
do odtworzenia przestrzennego rozkadu zanieczyszcze n na danym
terenie.
systematyczny b ad Wyniki modeli opartych na eksploracji danych s a
rzadziej obarczone systematycznym b edem. Wynika to po prostu z
faktu, ze pracuj a one na danych pomiarowych wi ec, w sposb natu-
ralny odtwarzaj a je. Nale zy jednak zauwa zy c, ze ma to rwnie z ze
strony: modele takie odtwarzaj a rwnie z b edy detektora

. Je sli na
jakiej s stacji pomiarowej, w ktrej dokonuje si e pomiarw r ecznych
pracuje leniwy pracownik, ktry nieprawidowo przygotowuje prbki
pomiarowe przed wa zeniem w wyniku czego pomiary z tej stacji s a
systematycznie zawy zone o np 30%, to model oparty o eksploracj e
danych wiernie odtworzy rwnie z ten artefakt. Je sli dla modeli
tych odtwarzanie danych pomiarowych przychodzi zupenie natural-
nie dla modeli analitycznych uzyskanie wiernego odtwarzania da-
nych jest bardzo trudne, wynika zarwno to z du zej trudno sci w uzy-
skaniu godnych zaufania danych emisyjnych, jak i trudno sci pomia-
rowych pomiaru imisji PM. Problemy z pozyskaniem wiarygodnych i

Szczeglnie w maych miejscowo sciach problemem jest tzw. niska emisja czyli emisja
z gospodarstw domowych. W typowym maym mie scie emitentem zanieczyszcze n jest ka zde
domostwo a jego charakterystyka emisji zale zy od bardzo wielu czynnikw (wygody atwiej
jest uruchomi c piec gazowy ni z nagrza c w kominku, cen paliw, temperatury przy silnych
mrozach cz esto korzysta si e z wielu zrde ciepa na raz).

O ile b edy te powoduj a powstawanie przewidywalnych wynikw.


ROZDZIA 2. PRZEDMIOT BADA

N 18
dokadnych danych emisyjnych cz e sciowo mog a wynika c ze zej woli
emitentw zanieczyszcze n

, cz e sciowo z immanentnych trudno sci w


uzyskaniu takich baz danych

.
dokadno s c Modele oparte o eksploracj e danych s a rwnie z dokadniej-
sze od modeli analitycznych. Model EMEP daje wyniki systematycz-
nie zani zone (w najlepszym wypadku) o 40% (powody nieoszacowa-
nia opisane w 2.1) . Dokadno s c tego rz edu osi agaj a nawet najprost-
sze modele eksploruj ace dane. Przykadowo, dokadno s c tego rz edu
ma model zdeniowany jako: Dla danego punktu pomiarowego za
wynik modelowania przyjmij zawsze sredni poziom zanieczyszcze n z
caej historii tego punktu.
2.3 Denicja modelu
Sowo model ma wiele znacze n i w tym miejscu okre slamy dokade znacze-
nie w jakim u zywane jest ono w dalszej cz e sci pracy. Model b edzie tutaj
u zywany w rozumieniu:
Schematyczny opis systemu, teorii, lub fenomenu, ktry bie-
rze pod uwag e jego znane lub przewidziane wa sciwo sci i mo ze
by c u zyty do dalszego badania jego charakterystyki (...)

[35]
Dla nas cech a charakterystyczn a modelu jest to ze mo zna na jego podsta-
wie bada c pewne cechy obiektu modelowanego.
Model oparty na technikach eksploracji danych
Model oparty na technikach eksploracji danych to narz edzie, ktre maj ac
pewien korpus danych historycznych jest w stanie odtwarza c dane nale-

W du zej mierze wynika to ze sprzeczno sci interesw, z jednej strony r znym instytucjom
zale zy na posiadaniu miarodajnych danych o emisji, z drugiej emitenci s a karani za prze-
kraczanie norm emisji (co mo ze powodowa c zani zanie raportowanych wynikw pomiarw).
Jako ciekawostk e obrazuj ac a ten fakt podam, ze w grudniu 2010 roku sekretariat traktatu
LRTAP wyda not e o amaniu przez Hiszpani e jednego z protokow traktatu, w ktrej to no-
cie napi etnowano mi edzy innymi posugiwanie si e przestarzaymi danymi dotycz acymi emisji
niektrych zanieczyszcze n[25].

O ile da si e stworzy c katalog emitentw przemysowych, o tyle dla PM przemys nie jest
gwnym emitentem, a co najmniej rwnie istotnymi zrdami emisji jest emisja komunika-
cyjna (czyli produkty spalania paliw, zu zycie opon, hamulcw i asfaltu, oraz pyy wyrzucane
w gr e z powierzchni drogi) oraz tak zwan a niska emisja (czyli emisja z piecw domowych).
Badania przeprowadzone w Finlandii sugeruj a, ze emisja PM z tych kategorii zrde ma, co
do rz edu wielko sci, podobny poziom[30]. O tyle o ile charakterystyka emisji w Polsce i krajach
skandynawskich jest istotnie inna o tyle fakt, ze nie da si e zignorowa c zrde komunikacyj-
nych i niskiej emisji wydaje si e obowi azywa c zawsze. Polskie zrda wydaj a si e potwierdza c
znaczny udzia zrde nieprzemysowych w zanieczyszczaniu powietrza [19]. Model RAINS
stwierdza emisja PM
2,5
ze zrde w kategoriach niska emisja, transportu przemys jest po-
dobny ka zda z tych kategorii wnosia wkad rz edu 24 35%.

Tumaczenie wasne. Tekst oryginalny na stronie 98


ROZDZIA 2. PRZEDMIOT BADA

N 19
z ace do tej samej klasy, do ktrej nale z a dane z korpusu historycznego,
ktrych to jednak w owym korpusie nie ma.
Nale zy rwnie z zauwa zy c, ze nie stawiamy znaku rwno sci pomi edzy
sieci a neuronow a a modelem opartym o eksploracj e danych. Model mo ze
u zywa c sieci neuronowej, jednak nie jest z ni a to zsamy. Model mo ze na
przykad dokonywa c pewnych przeksztace n na danych wej sciowych, przed
podaniem ich sieci neuronowej.
Rozdzia 3
Metody pomiarw poziomw
PM
Dotychczas przyjmowano, ze wszelkie nasze
poznanie musi si e dostosowywa c do przedmiotw.
Lecz wszelkie prby, by przy ich pomocy orzec co s,
co by rozszerzyo poznanie nasze, obracay si e przy
tym zao zeniu w niwecz. Prbujmy z wi ec raz, czy
si e nam lepiej nie powiedzie przy rozwi azywaniu
zada n metazyki, je zeli przyjmiemy, ze to
przedmioty musz a si e dostosowywa c do naszego
poznania.
Immanuel Kant Krytytyka czystego rozumu
Parametrem, ktry jest u zywany do opisu poziomu PM jest cakowita
masa pyu na jednostk e obj eto sci powietrza.
Ze wzgl edu na zo zon a natur e samego mierzonego fenomenu wszyst-
kie metody pomiaru masy PM s a zarwno do s c zo zone, jak i obarczone
sporym b edem do swiadczalnym. Zarwno w prawodawstwach UE[36, 37]
jak i USA ustalono, ze referencyjn a metod a pomiaru jest metoda grawime-
tryczna i wszystkie inne metody nale zy kalibrowa c za jej pomoc a.
3.1 Regulacje prawne
Urz adzenia, ktre mierz a poziom PM dziel a si e na dwie kategorie:
odniesienia Urz adzenia uznawane s a za urz adzenia odniesienia odpo-
wiednie organy regulacyjne.
20
ROZDZIA 3. METODY POMIARW POZIOMW PM 21
rwnowa zne Dla urz adze n rwnowa znych wykazano w specjalnej proce-
durze testw, ze daj a one wyniki spjne z urz adzeniami odniesienia

.
3.2 Metoda grawimetryczna
Wbie z acej legislacji tylko urz adzenia grawimetryczne s a urz adzeniami od-
niesienia.
Metoda ta jest najprostsza konceptualnie i polega ona na przepuszcze-
niu danej obj eto sci powietrza przez ltr. Powietrze wcze sniej przechodzi
przez system sortownikw, tak by tylko cz astki o odpowiedniej srednicy
traay do ltra, na ktrym si e osadzaj a. Po przepuszczeniu odpowiedniej
ilo sci powietrza przez ltr (chodzi o to, by przyrost masy ltra by istotny

)
ltr jest kondycjonowany, czyli trzymany w warunkach okre slonej tempe-
ratury i wilgotno sci

przez okre slony czas (czas ten jest rz edu dni). Po


okresie kondycjonowania ltr jest wa zony.
Metoda ta ma dwie zasadnicze wady:
niska rozdzielczo s c czasowa Czas wykonywania pomiaru jest rz edu
dnia tj. powietrze jest przepuszczane przez ltr przynajmniej
dzie n (zdarzaj a si e rwnie z pomiary, w ktrych rozdzielczo s c czasowa
jest ni zsza). Nie da si e zatem za pomoc a urz adze n grawimetrycznych
uzyska c lepszej rozdzielczo sci czasowej.
dugi czas do odczytu pomiaru pomi edzy wykonaniem pomiaru (osa-
dzaniem pyu na ltrze), a jego odczytem (wa zenie ltra) jest rz edu
dni, wi ec z urz adze n grawimetrycznych nie da si e uzyskiwa c danych
o stanie atmosfery w trybie on line.
Prawidowe wyniki pomiaru mog a by c zaburzone przez efekty takie jak[38,
39, 40]:
wilgo c osadzaj aca si e na prbce Masa pyu jest relatywnie maa w po-
rwnaniu z mas a ltra czy mas a wody ktra mo ze si e na nim osadzi c.
Intensywno s c zmiany masy wraz z wilgotno sci a zale zy od u zywanego
rodzaju ltru.
histereza wilgotno sci masa prbki nie jest funkcj a wilgotno sci, zale zy
jeszcze od tego czy dan a wilgotno s c osi agni eto poprzez osuszanie prbki
z wysokiej wilgotno sci, czy pozwalaj ac osadza c si e wilgoci na suchej
prbce.

Dokadny opis ukadw odniesienia oraz metody wykazywania ekwiwalentno sci w [37].

Typowa masa ltra to 100mg, typowa masa PM osadzonego na ltrze to 0 2mg.[39]

W Unii Europejskiej jest to 20 1

C przy wilgotno sci wzgl ednej 50 5%.


ROZDZIA 3. METODY POMIARW POZIOMW PM 22
rozpuszczanie i parowanie soli Cz e s c skadnikwPMstanowi a rozpusz-
czalne sole, ktre mog a rozpuszcza c si e w wilgoci na prbce i cz e-
sciowo z niej parowa c.
transport Filtru cz esto wykonane s a z materiaw nie odpornych mecha-
nicznie, ich transport mo ze powodowa c zmian e masy.
Problemy z ltrami
Kwestie te dotycz a wszystkich metod pomiarowych, w ktrych py jest
zbierany na ltrze przed dokonaniem pomiaru masy[38, 39, 40]:
reakcje chemiczne pomi edzy skadnikami PM oraz PM a ltrem. Inten-
sywno s c tego rodzaju procesw zale zy od rodzaju ltru.
zapychanie si e ltrw Przy du zych poziomach PM ltry potra a si e za-
tyka c. Zale zy to od rodzajw ltrw.
parowanie cz e sciowo lotnych substancji Zwi azki takie jak naftalen
czy azotan amonu s a cz e sciowo lotne i mog a parowa c z ltra w czasie
procesu jego kondycjonowania. Podczas gdy azotan amonu zaczyna
parowa c dopiero w temperaturach ok 50

C, to naftalen paruje z ltra


do s c szybko bez wzgl edu na temperatur e. Temperatura parowania
poszczeglnych zwi azkw wchodz acych w skad
zmniejszanie masy ltra pod wpywem przepywu powietrza. Niektre
ltry s a zbudowane z ciasno zbitych wkien, ktre pod wpywem
przepywu powietrza mog a si e odrywa c od ltra.
3.3 Osabienie promieniowania
W miernikach dziaaj acych na zasadzie osabienia promieniowania

do-
konuj a pomiary przyrostu masy ltra badaj ac spadek jasno sci promienio-
wania . Jasno s c promieniowania po przej sciu przez materi e dana jest
wzorem:
I = I
0
exp (gm) (3.1)
gdzie to staa zale zna od materiau, g to staa zale zna od geometrii
ukadu, natomiast m to przyrost masy prbki.

(BAM, z ang. beta attenuation monitor)


ROZDZIA 3. METODY POMIARW POZIOMW PM 23
Osabienie promieniowania zale zy od materiau, przez ktry ono prze-
chodzi jednak dla typowych zwi azkw, ktre tworz a PM

r znica pomi e-
dzy staymi materiaowymi jest mniejsza ni z 10%[41]. Stae geometryczne
eliminuje si e ze wzorw za pomoc a wprowadzenia prbek kalibracyjnych,
ktre maj a taki ksztat jak folia, przez ktr a przepuszcza si e PM. Dodat-
kowo prbki kalibracyjne cz esto maj a skad podobny do PM (co cz e sciowo
rozwi azuje rwnie z problem nieokre slono sci staej materiaowej.
Rwnanie z jakiego wyznaczamy mas e to[42]:
m = Aln
_
I
0
I
_
(3.2)
gdzie: I
0
to jasno s c wi azki elektronw przechodz acej przez fragment
przed przepuszczeniem przez niego prbki powietrza, I jasno s c wi azki po
tym. A to sta a wyznaczana z kalibracji.
Urz adzenia tego typu s a w stanie dokonywa c pomiary srednich godzi-
nowych st e ze n PM.
Typowy pomiar srednich godzinnych PM wygl ada nast epuj aco: przez 6
minut trwa pomiar osabienia promieniowania przez ltr, na ktrym nie
osadzono pyu, przez 46 minut trwa osadzanie pyu na ta smie, potem przez
6 minut trwa pomiar osabienia promieniowania przez ltr z osadzonym
pyem. Pozostae dwie minuty rezerwowane s a na przemieszczanie ta smy.
3.4 Mierniki TEOM

W miernikach TEOM ltry umieszczane s a w oscyluj acej rurce, ktra jest


pobudzana do drga n. Rezonansowa cz estotliwo s c drga n zale zy od masy ca-
ego ukadu (ltr, osadzony PM) oraz od temperatury. By ustabilizowa c
temperatur e powietrze wlatuj ace do miernika TEOM podgrzewa si e do
50

C. Podgrzewanie strumienia powietrza powoduj e utrat e lotnych zwi az-


kw z prbki co powoduje, ze mierniki te mierz a tylko sta a cz e s c PM,
przez to mierniki TEOM nie s a uznawane rwnowa zne, o ile nie zastosuje
si e jakiej s dodatkowej metody oceny ilo sci traconej lotnej masy PM

Mierniki BAM mog a mierzy c zarwno PM


10
, jak i PM
2,5
, sama cz e s c pomiarowa pozo-
staje niezmieniona nale zy tylko przed ni a umie sci c odpowiedni inny ukad sortownikw.

(z ang. tapered element oscillating microbalance)

Jest to mo zliwe w urz adzeniach dziaaj acych wielostopniowo (oddzielny pomiar cz e sci
lotnej) lub poprzez absorpcj e lotnej cz e sci PM na np. w eglu aktywowanym (po uprzednim
pozbyciu si e gazowej cz e sci NO
x
i O
3
. Tego typu rozwi azania s a dla nas mniej ciekawe
poniewa z w dalszej cz e sci rozdziau b edziemy si e koncentrowa c na metodach wspierania
pomiarw za pomoc a modelowania.
Przykadem systemu ktry dziaa w oparciu o TEOM ale jest rwnowa zny za pomiarami
grawimetrycznymi jest system FDMS.
ROZDZIA 3. METODY POMIARW POZIOMW PM 24
3.5 Rola modelowania w pomiarach poziomw PM
Modelowanie poziomu PM
2,5
za pomoc a PM
10
W Polsce nie ma zbyt wielu punktw pomiaru PM
2,5
, poniewa z jednak po-
ziom tego zanieczyszczenia jest skorelowany z poziomem PM
10
oraz z pa-
rametrami pogodowymi, mo zliwe jest jego szacowanie za pomoc a tych da-
nych oraz modelu opartego o eksploracj e danych. W[21] opracowano model
DMM oparty o regresj e wielokrotn a, ktry estymowa poziom PM
2,5
za po-
moc a poziomu PM
10
, oraz parametrw meteorologicznych i charakterystyk
czasowych. Podany model dziaa na srednich godzinowych.
Poziom PM
2,5
wyznaczano ze wzoru:
PM
2,5
= b
0
+
N

i=1
b
i
X
i
(3.3)
gdzie X
i
to odpowiednie zmienne pogodowe, a wspczynniki b
i
wyzna-
czono metod a najmniejszych kwadratw.
Po sprawdzeniu wielu zestaww parametrw autorzy wybrali model
pracuj acy na nast epuj acym zbiorze zmiennych X
i
:
Poziom PM
10
cosinus dnia w roku
cosinus godziny w dobie

temperatura powietrza
wilgotno s c wzgl edna powietrza
Model ten z dobr a dokadno sci a by w stanie (po wytrenowaniu na danych
z Zabrza) prawidowo odtwarza c dane z D abrowy Grniczej.
Model ekstrapoluj acy do uzupeniania luk w pomiarach
Mo zliwe jest zbudowanie modelu dokonuj acego ekstrapolacji poziomu PM
10
,
na podstawie poziomu PM
10
na pobliskich stacjach, oraz parametrw po-
godowych w punkcie ekstrapolowanym. Model ten dokadnie jest opisany
w sekcji 5.1.
Model ten mo ze mie c nast epuj ace zastosowania:

Posuguje si e tutaj okre sleniami zaczerpni etymi z artykuu. Najprawdopodobniej cho-


dzio jednak o wzory w postaci: dla godziny cos

godz
24

; dla dnia w roku cos

dzien
365

.
ROZDZIA 3. METODY POMIARW POZIOMW PM 25
Uzupenianie luk wynikaj acych z awarii b ad z konserwacji urz adze n
pomiarowych. W pomiarach wyst epuj a krtkotrwae luki, model ten
mo ze z powodzeniem uzupenia c takie luki korzystaj ac z pomiarw
na pobliskich stacjach.
Zapewnianie pomiarw on line ze stacji grawimetrycznych. Jedn a z
wad miernikw grawimetrycznych jest czas po jakim otrzymuje si e
wyniki pomiarw. Ukad interpoluj acy mgby bardzo atwo udost ep-
nia c pierwsz a estymacj e pomiarw on line tj. udost epnia c esty-
macj e bie z acego poziomu PM
10
za pomoc a wynikw z pobliskiej stacji
automatycznej.
Zapewnianie ekwiwalentno sci dla miernikw TEOM
Gwn a metod a prowadzenia pomiarw PM
10
on line w Wielkiej Brytanii
s a mierniki TEOM. Wielka Brytania jest jednak zobowi azana do prowa-
dzenia pomiarw za pomoc a urz adze n rwnowa znych w rozumieniu normy
EN 12341:1999, a mierniki TEOM nie speniaj a tego warunku. Wymiana
miernikw, b ad z ich modernizacja, jednak poci aga za sob a du ze koszty.
Poniewa z ilo s c lotnych zwi azkw w PM zmienia si e w zale zno sci od se-
zonu, nie da si e wprowadzi c zadnego staego czynnika koryguj acego po-
miary miernikw TEOM tak, by byy one zgodne z pomiarami referencyj-
nymi, tj. nie istnieje takie A
popr
ktre gwarantuje;
PM
ref
= A
popr
PM
TEOM
(3.4)
gdzie: PM
REF
to poziom PM
10
ktry jest zgodny z pomiarami referen-
cyjnymi, PM
TEOM
to poziom mierzony miernikiem TEOM, a A
popr
to staa
w czasie i pomi edzy r znymi miernikami TEOM warto s c.
Jednym z rodzajw miernikw, ktry jest zgodny z pomiarami referen-
cyjnymi jest s a mierniki FDMS

, ktre dodatkowo s a w stanie szacowa c


ilo s c substancji lotnych w PM. Opracowano wi ec model ktry umo zliwia
kalibracj e jednym miernikiem FDMS wielu miernikw TEOM. Odlego s c
mi edzy stacj a FDMS, a stacjami TEOM mo ze wynosi c do 200km. Za po-
moc a jednego miernika FDMS mo zna byo kalibrowa c wiele miernikw
TEOM (w artykule podano, ze byo to ponad 20 stacji).
Model ten jest bardzo prosty[43]:
PM
ref
= PM
TEOM
1.87PM
FDMS PURGE
(3.5)

Termin zwi azany z pomiarami pyw zawieszonych-, wyja snienie w dodatku w dodatku
A.
ROZDZIA 3. METODY POMIARW POZIOMW PM 26
gdzie PM
FDMS PURGE
to ilo s c lotnych substancji w PM mierzona za po-
moc a miernika FDMS.
Rozdzia 4
Opracowanie systemu
modelowania zanieczyszcze n
A gdyby, za zmy, by taki opis, ktry by
doskonale wiernie opisywa rzecz opisywan a?
To nie byby opis.
Aha, no tak. To byaby wtedy rzecz opisywana.
To byaby rzecz nie opisywana. To byby fakt.
Edward Stachura Fabula Rasa
Oprogramowanie powstae w ramach niniejszej pracy mo ze stanowi c
zr eby automatycznego systemu modelowania zanieczyszcze n. W nast ep-
nych cz e sciach zostanie opisana architektura takiego systemu, z zaznacze-
niem, jakie jej cz e sci s a ju z uruchomione oraz jakie prace mo zna nad nimi
wykona c.
4.1 Zao zenia koncepcyjne
Kroki niezb edne do wykonania modelowania
By wykona c zadanie modelowania nale zy wykona c nast epuj ace kroki:
1. Pobra c niezb edne dane z zewn etrznych systemw. Zazwyczaj
niezb edne dane zawarte s a w wielu r znych systemach nale z acych do
r znych organizacji

Samo ich zebranie jest problemem nastr eczaj a-


cym pewnych trudno sci.
2. Przygotowa c dane dla modelu. Po pobraniu danych nale zy spro-
wadzi c je do formy, ktra jest czytelna dla programu modeluj acego.

Takich jak: WIO

S, ICM czy Wydzia Fizyki Politechniki Warszawskiej.


27
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 28
Dane te, mog a by c na przykad zbierane z r zn a cz estotliwo sci a i na-
le zy dokona c odpowiednich u srednie n.
3. Uruchomi c model.
4. Zapisa c wyniki dziaania modelu.
5. Dostarczy c wyniki odbiorcom, na przykad poprzez umieszczenie
na stronie WWW.
Zauwa zono, ze te problemy s a od siebie oddzielne, tj. mo zna je rozwi a-
zywa c niezale znie od siebie. Program modeluj acy nie powinien zale ze c od
tego, w jaki sposb dane s a dostarczane przez zewn etrzne organizacje. Tak
samo program pobieraj acy te dane nie powinien zale ze c od tego, jakie w
danej chwili uruchamiane s a modele. Schemat systemu modelowania za-
warty jest na rys. 4.1.
Baza danych jako jedyne zrdo danych w systemie
By oddzieli c problem pobierania danych od problemu dokonywania mode-
lowania nale zy zao zy c, ze w systemie jest jeden punkt gromadzenia i prze-
twarzania danych gromadzonych w czasie rzeczywistym, ktry je sprowa-
dza do jednolitej formy, a nast epnie udost epnia innym cz e sciom systemu.
Naturalnym rozwi azaniem jest wi ec wprowadzenie bazy danych, ktra b e-
dzie peni c te funkcje.
Wymagania co do bazy danych
Baza danych powinna uwzgl ednia c nast epuj ace charakterystyki zrde da-
nych z ktrymi musi by c integrowana:
1. Ka zde zrdo

danych dostarcza r zny zestaw parametrw.


2. Dane zbierane s a z r zn a cz estotliwo sci a.
3.

Zrda danych mog a w trakcie swojej pracy zmienia c zestaw parame-
trw, ktry dostarczaj a.
4. Wtrakcie pracy systemu do systemu mog a by c dodawane nowe zrda
danych. Wprowadzenie nowych zrde danych nie powinno poci aga c
za sob a zmiany schematu

bazy danych.

U zywam terminu zrdo danych poniewa z dane pobieramy nie tylko ze stacji pomiaro-
wych, ale zrdem danych s a dla nas wyniki modelowania z ICM.

Termin informatyczny wyja snienie w dodatku E.


ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 29
5. Nale zy umo zliwi c r eczn a werykacj e danych

, przy jednoczesnym za-


chowaniu danych zebranych pierwotnie

.
6. Baza danych powinna mie c mo zliwo s c pracy w trybie rozproszonym,
tj. powinna istnie c mo zliwo s c przenoszenia danych mi edzy oddziel-
nymi serwerami bazodanowymi.
7. Oprogramowanie zarz adzaj ace baz a danych powinno umo zliwia c do-
st ep do bazy danych z jak najwi ekszej liczby j ezykwprogramowania.
Skadniki systemu
System ten powinien skada c si e z nast epuj acych skadnikw:
1. Kod bazy danych. Udost epniaj acy takie operacje jak u srednianie i
normalizacja danych.
2. Biblioteki dost epu do bazy danych stworzone w odpowiednich
j ezykach. Powinny one umo zliwia c nie tylko dost ep do bazy danych
za pomoc a SQL

, ale te z zawiera c wspln a logik e

, dost epu do bazy


danych.
3. Framework

, importu danych oddziela wsplne operacje, ktre


musz a wykonywa c wszystkie importery danych pracuj ace w trybie
ci agym

oraz na udost epnia wsplne komendy uruchamiania im-


portu.
4. Importery oddzielne podprogramy realizuj ace import z jakiego s zr-
da.
5. Modele rwnie z udost epniaj ace mechanizm jednolitego ich urucha-
miania.
6. Oprogramowanie WWW udost epniaj ace wyniki odpowiednich mo-
deli.

Pomiar zanieczyszcze n powietrza sprawia trudno sci eksperymentalne, wi ec zdarzaj a si e


w nim b edy.

Ten wymg nie jest bezwzgl edny, jednak wedug Autora, jako s c naukowa i wiarygodno s c
prac zyska, je sli b edzie mo zna powiedzie c, ile danych byo r ecznie zmienianych i w jakim
zakresie dokonano zmian.

Termin informatyczny wyja snienie w dodatku E.

Termin informatyczny wyja snienie w dodatku E.

Termin informatyczny wyja snienie w dodatku E.

Takie jak zapis do bazy danych stanu importu.


ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 30
Rysunek 4.1: Schemat systemu modelowania zanieczyszcze n
B
i
b
l
i
o
t
e
k
a
d
o
s
t

p
u
B
a
z
a

d
a
n
y
c
h

t
c
p
/
i
p

M
o
d
e
l
o
w
a
n
i
e
I
m
p
o
r
t

d
a
n
y
c
h

B
i
b
l
i
o
t
e
k
a

i
m
p
o
r
t
u
W
t
y
c
z
k
a

i
m
p
o
r
t
u

I
W
t
y
c
z
k
a

i
m
p
o
r
t
u

I
I

i
m
p
o
r
t

i
m
p
o
r
t

d
a
n
e

p
o
m
i
a
r
o
w
e
/
m
o
d
e
l
o
w
e
d
a
n
e

o

s
t
a
n
i
e
i
m
p
o
r
t
u
Z
e
w
n

t
r
z
n
y

s
y
s
t
e
m
Z
e
w
n

t
r
z
n
y

s
y
s
t
e
m
D
a
n
e
D
a
n
e
B
a
z
a

d
a
n
y
c
h
M
o
d
e
l

I
M
o
d
e
l

I
I
d
a
n
e

p
o
m
i
a
r
o
w
e
/
m
o
d
e
l
o
w
e
d
a
n
e

p
o
m
i
a
r
o
w
e
/
m
o
d
e
l
o
w
e
w
y
n
i
k
i

m
o
d
e
o
w
a
n
i
a
w
y
n
i
k
i

m
o
d
e
o
w
a
n
i
a
A
p
l
i
k
a
c
j
a

W
W
W
S
e
r
w
e
r

W
W
W
O
p
e
r
a
t
o
r
U

y
t
k
o
w
n
i
k
S
e
r
w
e
r

e
m
a
i
l
d
a
n
e

p
o
m
i
a
r
o
w
e
/
m
o
d
e
l
o
w
e
Z
m
i
a
n
y

w
p
r
o
w
a
d
z
a
n
e
p
r
z
e
z

o
p
e
r
a
t
o
r
a
A
l
e
r
t
y

e
-
m
a
i
l
W
y
n
i
k
i

m
o
d
e
l
o
w
a
i
a
W
y
n
i
k
i

m
o
d
e
l
o
w
a
i
a
P
o
p
r
a
w
i
a
n
i
e

d
a
n
y
c
h
O
p
e
r
a
t
o
r
U
r
u
c
h
a
m
i
a
n
i
e

i
m
p
o
r
t
u
A
u
t
o
m
a
t
y
c
z
n
e

u
r
u
c
h
a
m
i
a
n
i
e

i
m
p
o
r
t
u
U
r
u
c
h
a
m
i
a
n
i
e

i
m
p
o
r
t
u
S
c
h
e
m
a
t

b
a
z
y

d
a
n
y
c
h
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 31
Rysunek 4.2: Przepyw danych w systemie
Import danych
SQL
import danych
Gotowe dane
Dane surowe
przetwarzanie
Modelowanie
Model 2 Model 1
SQL
Dane dla modelu
SQL
Wyniki modelu
SQL
Dane dla modelu
Wyniki modelowania
SQL
Wyniki modelu
Dane poprawione
Operator
GUI
Werykacja danych
przetwarzanie
Baza danych
Modelowanie
Dostarczanie danych
Strona WWW
Emaile o poziomach
alarmowych
Sprawdzanie jakoci
modelowania
SQL
Wyniki
SQL
Dane pomiarowe
GUI
Werykacja modeli
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 32
Rysunek 4.3: Zale zno sci programistyczne w systemie
Schemat bazy danych
Baza danych
Biblioteka dostpu
do bazy danych
tcp/ip
Framework importu
includes
Importer I Importer II
includes includes
Framework modelowania
includes
Model I Model II
includes includes
Oprogramowanie aplikacji WWW
includes
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 33
Rysunek 4.4: J ezyki w jakich wykonano poszczeglne komponenty sys-
temu. Na szaro cz e sci nie zaimplementowane.
B
a
z
a

d
a
n
y
c
h
J
a
v
a

J
P
A
D
o
s
t

p

d
o

b
a
z
y

d
a
n
y
c
h
M
a
t
l
a
b
A
p
i

d
o
s
t

p
u

d
o

b
i
b
l
i
o
t
e
k

J
A
V
A
A
P
I

j
a
v
a

d
l
a

M
A
T
L
A
B
A
M
o
d
e
l
e
P
y
t
h
o
n
S
Q
L

A
l
c
h
e
m
y
O
p
r
o
g
r
a
m
o
w
a
n
i
e

s
t
r
o
n
y

W
W
W
S
e
r
w
e
r

W
W
W
d
o
s
t

p

d
o

b
a
z
y

d
a
n
y
c
h
d
o
s
t

p

d
o

b
a
z
y

d
a
n
y
c
h
I
n
t
e
g
r
a
c
j
a

r
o
d
o
w
i
s
k
a

M
A
T
L
A
B

z

j

z
y
k
i
e
m

J
A
V
A
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 34
4.2 Baza danych
Bie z acy rozdzia jest opisem uruchomionego w ramach pracy systemu ba-
zodanowego. W ostatniej cz e sci podane zostan a prace, ktre wedug au-
tora, powinny zosta c jeszcze wykonane.
Podj ete decyzje projektowe
Najwa zniejsz a decyzj a jest prba jak najwi ekszej normalizacji

, schematu
bazy danych i rezygnowanie z normalizacji tylko z przyczyn wydajno scio-
wych. Utrzymanie spjno sci danych jest w tego typu systemach zawsze
bardzo trudne do osi agni ecia dane te, bowiem zmieniaj a si e w czasie
(na przykad podczas werykacji danych pomiarowych przez operatora),
wi ec po z adanym jest minimalizacja pracy zwi azanej z utrzymaniem ich
spjno sci.
Z przyczyn wydajno sciowych zdecydowano si e na przechowywanie w
bazie danych rwnie z:
U srednionych wynikw pomiarw
Znormalizowanych wynikw pomiarw
Podstawowe metadane
Podstawowe metadane

opisuj ace punkty pomiarowe to:


Rodzaje parametrw pogodowych


Zrda danych
Inne dane sownikowe
Dane te opisane za pomoc a trzech tabel: POINT_TYPE, DATA_SOURCE
oraz DICTIONARY.
Schemat tych tabel na rys. 4.5.

Termin informatyczny wyja snienie w dodatku E.

Termin informatyczny wyja snienie w dodatku E.


Rysunek 4.5: Tabele opisuj ace dane sownikowe
TABLE: DICTIONARY
ID: MEDIUMINT
TYPE: VARCHAR(20)
NAME: VARCHAR(200)
TABLE: DATA_SOURCE
ID: MEDIUMINT
NAME: VARCHAR
TABLE: DATA_SOURCE
ID: MEDIUMINT
NAME: VARCHAR
TABLE: POINT_TYPE
ID: MEDIUMINT
NAME: VARCHAR
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 35
Zapewnienie przeno sno sci zebranych punktw mi edzy bazami
danych
By umo zliwi c przenoszenie punktw danych pomiarowych, pomi edzy r z-
nymi bazami danych nale zy: zapewni c by wiersze w tabelach opisuj acych
metadane miay takie same klucze gwne

w ka zdej bazie danych, je sli


tylko opisuj a t a sam a metadan a. Mwi ac pro sciej: je sli w bazie danych
A wiersz w tabeli POINT_TYPE, ktry reprezentuje parametr PM
10
, ma
klucz gwny rwny 4, to w ka zdej innej bazie danych wiersz reprezentu-
j acy PM
10,
rwnie z musi mie c klucz gwny o warto sci 4.
Dla tabeli POINT_TYPE warto sci klucza gwnego jest zapisana w sa-
mym kodzie biblioteki dost epu do bazy danych (zatem, by doda c nowy ro-
dzaj punktu danych trzeba wprowadza c zmian e w kod biblioteki

).
Dla pozostaych tabel, w ktrych dane b ed a dodawane zdecydowanie
cz e sciej, do tworzenia klucza gwnego u zywa si e funkcji skrtu

. Dla ta-
beli DATA_SOURCE warto s c klucza gwnego rwna jest skrtowi MD5

z nazwy danego zrda danych, na ktrej wykonano operacj e modulo tak


by skrcona warto s c mie scia si e w odpowiedniej kolumnie. Podobnie dla
tabeli DICTIONARY, dla ktrej warto s c klucza gwnego jest rwna skr-
towi MD5 ci agu znakw w formacie <<TYPE>>:<<NAME>>, gdzie TYPE i
NAME to warto sci odpowiednich kolumn w danym wierszu.
Przechowywanie zebranych danych
Zebrane dane przechowywane s a w tabeli DATA_POINT (schemat tabeli
na rysunku 4.6). Kluczami gwnymi w tej tabeli s a kolumny:
DATE przechowuje ona czas, dla jakiego obowi azuje dana warto s c

POINT_TYPE klucz wiersza w tabeli POINT_TYPE, ktry odpowiada ty-


powi punktu, dla ktrego zebrano dany pomiar
DATA_SOURCE klucz wiersza w w tabeli DATA_SOURCE, ktry odpowiada
zrdu danych, z ktrego pochodzi dany pomiar
W kolumnie VALUE przechowuje si e warto s c danego pomiaru.

Termin informatyczny wyja snienie w dodatku E.

Jest to wada tego rozwi azania. Jednak nie jest to wada bardzo gro zna. Wydaje si e, ze
rodzaje parametrw pogodowe b ed a wprowadzane do systemu do s c rzadko.

Funkcja skrtu wyja snienie terminu w E

Rodzaj funkcji skrtu. Jest to jedna z najpowszechniej u zywanych funkcji skrtu ogl-
nego zastosowania

Dla pomiarw jest to czas zebrania pomiaru, natomiast dla modelu chwila, dla ktrej
wykonano modelowanie.
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 36
Przechowywanie danych u srednionych
Dane u srednione przechowywane s a w oddzielnej tabeli dla ka zdego ro-
dzaju u srednienia. Oddzielnie tworzony jest widok

danych oraz tabela


zawieraj aca podr eczn a

kopi e danych z widoku (schemat na rys. 4.7). Ta-


bele z kopiami podr ecznymi danych s a tworzone ze wzgl edw wydajno scio-
wych.
Metadane normalizacyjne
Metadane su z ace do normalizacji danych znajduj a si e w tabeli POINT_-
TYPE_METADATA (schemat tabeli na rys. 4.8). Tabela ta ma nast epuj ace
kolumny:
POINT_TYPE typ punktu opisywany przez dany wiersz.
META_DATA_TYPE czy normalizacja zachodzi dla danych surowych czy u sred-
nionych.
NORMALIZATION_FACTOR_A Wspczynnik a prostej normalizuj acej dane
o rwnaniu v
norm
= a v
orig
+b.

Termin informatyczny wyja snienie w dodatku E.

albo inaczej cache


Rysunek 4.6: Schemat tabeli DATA_POINT
TABLE: POINT_TYPE
ID: MEDIUMINT
NAME: VARCHAR
TABLE: DATA_SOURCE
ID: MEDIUMINT
NAME: VARCHAR
TABLE: DATA_POINT
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
1
DATA_SOURCE
0..n
Punkt danych
1
POINT_TYPE
0..n
Rodzaj parametru
Rysunek 4.7: Tabele i widoki przechowuj ace dane u srednione
TABLE: DAILY_AGGREGATE_MATERIALIZED
DATE: DATE
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
VIEW: HOURLY_AGGREGATE
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
VIEW: DAILY_AGGREGATE
DATE: DATE
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
TABLE: DATA_POINT
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
TABLE: HOURLY_AGGREGATE_MATERIALIZED
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
Wylicza dane
Wylicza dane
Cache
Cache
Dane urednione na godzine (projekt)
Dane urednione na dzie
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 37
NORMALIZATION_FACTOR_B Wspczynnik b prostej normalizacyjnej.
LOW_BOUND Najmniejsza warto s c w zbiorze danych.
HIGH_BOUND Najwi eksza warto s c w zbiorze danych.
Algorytm ustalania wspczynnikw normalizacji opisany jest w roz-
dziale 4.8.
Znormalizowane dane
Znormalizowane dane przechowywane s a w sposb analogiczny do danych
u srednionych (patrz 4.2). Schemat na rysunku 4.8.
4.3 Ocena stosowanego schematu bazy danych
Podany schemat bazy danych spenia wi ekszo s c kryteriw opisanych w
punkcie 4.1, pozostae kryteria mo ze spenia c po doko nczeniu prac nad
nim

. Jednak takie podej scie do budowania baz danych powoduje pewne


problemy ( zostay one opisane poni zej ), ktre jednak mo zna rozwi aza c.

Stworzenie takiego systemu nie byo celem pracy, udao si e to niejako przy okazji.
Rysunek 4.8: Schemat tabeli POINT_TYPE_META_DATA
TABLE: POINT_TYPE
ID: MEDIUMINT
NAME: VARCHAR
TABLE: POINT_TYPE_METADATA
POINT_TYPE: MEDIUMINT
META_DATA_TYPE: VARCHAR
NORMALIZATION_FACTOR_A: DECIMAL
NORMALIZATION_FACTOR_B: DECIMAL
LOW_BOUND: DECIMAL
HIGH_BOUND: DECIMAL
POINT_TYPE
0..n 0..1
Rodzaj punktu
Pole deniuje czy normalizacja jest dla danych urednionych
i jak urednionych.
Moliwe wartoci:
* DAILY --- dane urednione dziennie
* HOURLY --- dane urednione godzinowo
* NORMAL --- dane nie urednione
META_DATA_TYPE
Rysunek 4.9: Schemat tabel przechowuj acych dane znormalizowane
TABLE: DAILY_AGGREGATE_MATERIALIZED_NORMALIZED
DATE: DATE
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
VIEW: HOURLY_AGGREGATE_NORMALIZED
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
VIEW: DAILY_AGGREGATE_NORMALIZED
DATE: DATE
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
TABLE: DATA_POINT
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
TABLE: HOURLY_AGGREGATE_MATERIALIZED_NORMALIZED
DATE: DATETIME
FK: POINT_TYPE
FK: DATA_SOURCE
VALUE: VALUE
Wylicza dane
Wylicza dane
Cache
Cache
Dane urednione na godzine (projekt)
Dane urednione na dzie
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 38
Zalety przyj etego podej scia
Dodanie nowego zrda danych nie powoduje zmiany sche-
matu. Gwn a zalet a metod modelowania zanieczyszcze n opartych
na eksploracji danych jest relatywna atwo s c wprowadzania w no-
wych miejscach. Konieczno s c modykacji bazy danych dla ka zdego
zrda pomiarw cz e sciowo osabiaaby zalety tego systemu.
Jest do s c wydajny. Przy korzystaniu z kopi podr ecznych u srednio-
nych danych czasy wykonania zapyta n s a rz edu sekund (czasy zale z a
od zo zono sci zapytania zapytanie dokonuj ace treningu sieci na da-
nych kilkuletnich z dwch stacji pomiarowych trwa nieca a minut e).
Zapytania normalizuj ace/u sredniaj ace dane s a proste i dzia-
aj a szybko.
Wady przyj etego podej scia
Niezb edne indeksy zajmuj a du zo miejsca. Przykadowo w bazie
danych Autora dane w tabeli DATA_POINT zajmuj a ok 500mb, nato-
miast indeksy do niej ok 1GB. Nie jest to wielka wada. Baza danych,
podana w przykadzie, ma ju z rozmiar podobny do rozmiaru bazy da-
nych, ktra b edzie u zywana produkcyjnie. Bior ac pod uwag e dzisiej-
sze ceny dyskw twardych, rozmiar bazy danych nie b edzie proble-
mem.
Zapytania pobieraj ace dane dla modeli s a skomplikowane.
Typowe zapytania dla modelu da si e opisa c w nast epuj acy sposb:
Pobierz dane u srednione dziennie, zawieraj ace poziomy zanieczysz-
cze n z poprzednich trzech dni oraz dane pogodowe z danego dnia dla
caego roku 2010. W bie z acym schemacie bazy danych tumacze-
nie tego zapytania na j ezyk SQL wymaga stworzenia wielu komend
JOIN, ktre powoduj a, ze zapytanie to robi si e dugie i atwo w nim
popeni c b ad. By rozwi aza c ten problem w bibliotece dost epu do bazy
danych udost epniono metod e automatyzacji tego procesu (patrz 4.4).
Potrzebne prace
Automatyczne tworzenie/od swie zanie danych u srednionych
Do
wdro zenia systemu do ci agej pracy nale zy stworzy c mechanizm au-
tomatycznego wykonywania u srednionych podr ecznych kopi danych.
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 39
W tej chwili takie u srednienia wykonuje si e poprzez r eczne urucho-
mienie zapytania. Metoda wdro zenia tego rozwi azania zale zy od u zy-
wanego DBMS (niektre DBMS maj a tak a funkcjonalno s c wbudo-
wan a), inne wymagaj a stworzenia odpowiedniego podprogramu dzia-
aj acego w bazie danych.
Przygotowanie bazy danych do przetrzymywania srednich go-
dzinowych.
Umo zliwienie r ecznego poprawiania danych wraz z przecho-
wywaniem historii zmian poszczeglnych punktw.
4.4 Biblioteka dost epu do bazy danych
Biblioteka dost epu do bazy danych oparta jest o mechanizm JPA 1.0

.
Parametryzowane zapytania SQL
Bezpo srednim powodem wdro zenia funkcjonalno sci parametryzowanych
zapyta n SQL by fakt, ze Matlab nie udost epnia takiej funkcjonalno sci
(mo zna tylko wykonywa c kwerendy

podane jako cao s c), a w opinii Au-


tora tego typu udogodnienie, jest absolutnie fundamentalne dla komfortu
pracy. Dodatkowe funkcjonalno sci:
konwersja parametrw zamiast klucza gwnego mo zna, przy odnosze-
niu si e do danych z tabel opisanych w 4.2, u zywa c ich nazw, ktre
zostan a zmienione na odpowiedni a warto s c klucza.
domy slne warto sci parametrw parametry mog a mie c domy slne war-
to sci.
parametry opcjonalne nie wszystkie parametry opisane w kwerendzie
musz a by c podane. Je sli parametr nie zosta podany i jest zaznaczony
jako opcjonalny, w budowanej kwerendzie nie zostan a uwzgl ednione
elementy wykorzystuj ace go.
Przykad takiej kwerendy (opisanej dodatkowo w j ezyku XML) znajduje
si e w listingu 4.1.

Termin informatyczny wyja snienie w dodatku E.

Termin informatyczny wyja snienie w dodatku E.


ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 40
Automatyzacja tworzenia zapyta n dla kwerend modeli
Typowe zapytania dla modelu da si e opisa c w nast epuj acy sposb: Pobierz
dane u srednione dziennie, zawieraj ace poziomy zanieczyszcze n z poprzed-
nich trzech dni oraz dane pogodowe z danego dnia dla caego roku 2010.
W bie z acym schemacie bazy danych tumaczenie tego zapytania na j ezyk
SQL wymaga stworzenia wielu komend JOIN, ktre powoduj a, ze zapyta-
nie to robi si e dugie i atwo w nim popeni c b ad.
Wdro zono rozwi azanie pozwalaj ace na automatyczne tworzenie tego
typu zapyta n. Pozwala ono automatycznie tworzy c zapytania wybieraj ace
srednie dzienne

, r znych typw parametrw z r znymi wzgl ednymi prze-


suni eciami.
Przykad takiej kwerendy zawarto w listingu 4.2
Generowane w locie typy danych
Funkcjonalno s c ta pozwala te z pobiera c parametry z wirtualnych kolumn,
takich jak skadowe x i y wiatru, temperatura odczuwalna.
Zapisywanie kwerend do plikw XML

Stworzono rwnie z mechanizm zapisywania wszystkich wymienionych ro-


dzajw kwerend do pliku XML. Pozwala to w ogle nie umieszcza c zapyta n
w programach dokonuj acych modelowania. Pliki XML odczytywane s a za
pomoc a mechanizmu JAXB

. Tego typu mechanizm powoduje, i z modele


w ogle nie odnosz a si e do bazy danych i mo zliwa jest zmiana jej schematu
bez zmian w programach modeluj acych.
Przykady dwch zapyta n, u zywanych w ramach niniejszej pracy, opi-
sanych w j ezyku XML zawarto na listingach 4.2 i 4.1.
4.5 Framework importu danych
Framework importu danych udost epnia nast epuj ace funkcjonalno sci:
uruchamianie w jednolity sposb odpowiednich importerw Pozwala
zarwno uruchomi c wszystkie importery, jak i uruchomi c pojedynczy
importer.

Dodanie srednich godzinnych nie b edzie stanowi c problemu.

Termin informatyczny wyja snienie w dodatku E.

Termin informatyczny wyja snienie w dodatku E.


ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 41
Listing kodu 4.1: Przykad prostego zapytania zapisanego w pliku XML
<query name = "GET_GARANTY_DATA">
<select>
SELECT dayn.DATE, dayn.pm_10 AS PM10 DAY N, dayn1.
pm_10 AS PM10 DAY N-1, dayn2.pm_10 AS PM10 DAY
N-2, dayn.wind_x, dayn.wind_y, dayn.temp, dayn.
wilg, dayn.cisn, dayn.weekend, dayn.month
FROM GARANTY_LEARN_MATERIALIZED dayn
LEFT JOIN GARANTY_LEARN_MATERIALIZED dayn1 ON(DATE(
DATE_ADD(dayn.date, INTERVAL 1 DAY)) = DATE(dayn1
.date) AND dayn.data_source = dayn1.data_source)
LEFT JOIN GARANTY_LEARN_MATERIALIZED dayn2 ON(DATE(
DATE_ADD(dayn.date, INTERVAL 2 DAY)) = DATE(dayn2
.date) AND dayn.data_source = dayn2.data_source)
</select>
<order-by-set>
<orderBy>dayn.date</orderBy>
</order-by-set>
<where-set>
<where>dayn.data_source = :data_source</where>
<where>dayn.date &gt; :date_from</where>
<where>dayn.date &lt; :date_to</where>
</where-set>
<group-by-set/>
<having-set/>
<parameters>
<parameter name="data_source" type="data-source"
required="true"/>
<parameter name="date_from" type="string"
required="false"/>
<parameter name="date_to" type="string"
required="false"/>
</parameters>
</query>
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 42
zapis stanu importu do bazy danych Pozwala automatycznie, atwo, za-
pisywa c stan importu do bazy danych tak, by przy ponownymurucho-
mieniu program importuj acy wiedzia gdzie zako nczy import.
4.6 Framework modelowania zanieczyszcze n
Framework ten napisany jest cakowicie w Matlabie i ma na celu atwe
udost epnienie modelom bibliotek stworzonych w Javie, oraz stworzenie
bazy kodu, na ktrej oparte b ed a pozostae modele.
We frameworku tym osi agni eto nast epuj ace zamierzenia:
Ustalenie kontraktwAPI dla poszczeglnych elementwsys-
temu
Ustalenie oglnych algorytmwwykonywania poszczeglnych
krokw modelowania. Przykady takich algorytmw s a w roz-
dziale 4.8. Pewne algorytmy s a takie same dla ka zdego modelu, inne
Listing kodu 4.2: Przykad prostego zapytania zapisanego w pliku XML
<aggregate name="TEST_TEMP_ODCZ_2" aggregationType="
daily"
normalizationType="if-possible" acceptNulls="
exclude-row-if-null">
<element pointType="PM_10" dataSource="/wios/warszawa/
warszawa_komunikacyjna" intervalOffset="0"/>
<element pointType="PM_10" dataSource="/wios/warszawa/
warszawa_komunikacyjna" intervalOffset="1"/>
<element pointType="PM_10" dataSource="/wios/warszawa/
warszawa_komunikacyjna" intervalOffset="2"/>
<element pointType="TEMP_ODCZ"
dataSource="/warszawa/fizyka/"/>
<selects>
<select>
:main_as.DATE
</select>
<select>
WEEKDAY(:main_as.DATE) AS WEEKDAY
</select>
<select>
WEEKOFYEAR(:main_as.DATE) AS WEEK
</select>
</selects>
</aggregate>
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 43
dla ka zdej klasy modeli. Wymuszenie stosowania takich algoryt-
mw powinno powodowa c uzyskanie bardziej jednorodnych wynikw.
Opakowanie biblioteki napisanej w j ezyku JAVA tak, by po-
szczeglne modele nie musiay odnosi c si e do klas JAVA. Jest
to potrzebne tak na prawd e dla wygody. Matlab, mimo bardzo dobrej
integracji z Jav a, troch e inaczej odnosi si e do obiektwwbudowanych,
ni z do obiektw Java. Autor chcia unikn a c problemw przez to spo-
wodowanych.
Separacja modeli od kodu bazodanowego. Jest to po z adana
cecha ka zdej aplikacji tego typu Autor ni jest bowiem w stanie
wykluczy c konieczno sci wprowadzenia przyszych zmian w bazie da-
nych.
Predyktor

Jest to klasa Matlaba, ktra wydziela operacje i wasno sci wsplne dla
ka zdego modelu, oraz implementuje cz e s c tych operacji.
Deniowane wasno sci to:
nazwa nazwa predyktora
non_model_params metaparametry modelu: s a to parametry, ktrych
nie pobieramy bezpo srednio z danych. Dla perceptronu b edzie to ilo s c
warstw, dla sieci SVM parametry C, i .
Te operacje to:
trening Funkcja trenuj aca, ktra pobiera zestaw danych treningowych.
predykcja Funkcja dokonuj aca modelowania
optymalizacja metaparametrw Wi ekszo s c modeli umo zliwia optyma-
lizacj e metaparametrw w oparciu o testowy zbir danych.
Dodatkowo predyktor implementuje operacj e treningu i walidacji, ktra
jest dokadniej opisana w rozdziale 4.8.
Predyktor oparty o SVM
Jest to klasa Matlaba realizuj aca predyktor oparty o SVM. Jej du za zalet a
jest mo zliwo s c wydajnej (a zatem cz estej) optymalizacji metaparametrw,
opisana w rozdziale 4.8.

Poprawniej byoby nazwa c t a klas e modelem, jednak z przyczyn technicznych, zmiana


tej nazwy w kodzie MATLABA byaby czasochonna.
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 44
Klasy managerw
S a to klasy realizuj ace zao zenie separacji kodu Matlaba od kodu Javy.
Maj a one na celu umo zliwia c zarz adzanie poszczeglnymi, wa znymi, aspek-
tami modelowania.
S a one stworzone w j ezyku Java, a ka zda z nich ma bli zniacz a klas e
Matlaba, ktra opakowuje kod Javy
Gwn a klas a, ktra stanowi punkt dost epu do wszystkich pozostaych
funkcjonalno sci jest klasa HajmonConnector (patrz te z rys. 4.11), klasa
ta stanowi bezpo sredni punkt dost epu do kwerend SQL, oraz udost epnia
one pozostae klasy managerw. Jej poszczeglne mo zliwo sci opisane s a w
nast epnych akapitach:
zarz adza kwerendami SQL Jest to klasa zarz adzaj aca zapytaniami SQL,
ktre wykonuj a podprogramy modeluj ace. Pozwala ona na tworze-
nie parametryzowanych kwerend oraz na pobieranie kwerend zapi-
sanych w pliku XML. Funkcjonalno s c ta jest dokadniej opisana w
rozdziale 4.6.
udost epnia klas e Database Projekt ten u zywa dwch rwnolegych me-
tod dost epu do bazy danych JPA (b ed acego rozwi azaniem Javy)
Rysunek 4.10: Schemat klas su z acych do modelowania danych
Predictor
Wasnoci:
name: char
non_model_params:
trainded_data_path: Long
train( predict_data, reason_data)
predicted_data = predict(reason_data)
train_result = train_validate(...)
instanceOf
SVMPredictor
Wasnoci:
name: char
non_model_params:
trainded_data_path: Long
Operacje:
train( predict_data, reason_data)
predicted_data = predict(reason_data)
optimize_non_model_params(...)
Taki wasnoci powinien
mie kady predyktor
Klasa implementujca cz
operacji wspln dla kadego
predyktora
Predyktor SVM
instanceOf
Kontrakt predyktora
Wasnoci:
name: char
non_model_params:
Operacje:
train( predict_data, reason_data)
predicted_data = predict(reason_data)
train_result = train_validate(...)
optimize_non_model_params(...)
SVMOptimizator
Dokonuje optymalizacji
metaparametrw sieci SVM
SVMOptimizatorExternal
Dokonuje optymalizacji
metaparametrw sieci SVM
omijajc problemy
wydajnociowe przy zych
zestawach parametrw
Uywa
instanceOf
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 45
oraz Database Toolbox (b ed acego rozwi azaniem Matlaba). Klasa Da-
tabase aczy te dwa rozwi azania i pozwala by posugiway si e jednym
zestawem konguracji

, co uatwia wsplne dziaanie. W przypadku


dost epu do bazy danych za pomoc a SSL klasa database dokonuje rw-
nie z niezb ednych konguracji w srodowisku JRE.
Zapytania do bazy danych
Zapytania opisane w rozdziale 4.4 udost epniane s a poprzez klas e Hajmon-
Connector (patrz rys. 4.13). Framework matlaba udost epnia klas e Data-
Query ktra pracuj ac w tandemie z jedn a z klas oprogramuj acych zapyta-
nia w Javie, uatwia proces wykonywania zapytania. Zao zenia i dziaanie
zapyta n opisane s a w rozdziale 4.4. Proces wykonywania zapytania za-
warty jest na wykresie 4.14.

Jest to mo zliwe, poniewa z obie te technologie acz a si e z baz a danych za pomoc a JDBC
niskopoziomow a bibliotek a dost epu do bazy danych w j ezyku Java.
Rysunek 4.11: Klasy managerw
HajmonConnector
query_manager
point_type_manager
data_source_manager
database
HajmonEntryPoint
query_manager
point_type_manager
data_source_manager
database
MATLAB JAVA
Rwnie pozostae
managery maj swoje
matlabowe odowiedniki
QueryManager
Zawiera
QueryManager
QueryManager
PointTypeManager
Udostpnia
Udostpnia
Udostpnia
Udostpnia
Rysunek 4.12: Manager bazy danych
Database
url_jdbc
nazwa_uytkownika
haso
sterownik_jdbc
Konguracja JPA
Pobiera dane
JRE
konguracja dostpu
do SSL (jeli jest
potrzebna)
API dostpu
do bazy danych
matlaba
Konguraja
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 46
4.7 Analiza opracowanego systemu
Opracowany system nie jest, zadn a miar a, gotowy do produkcyjnego wdro-
zenia powsta on w ramach pracy magisterskiej i brakuje w nim wielu
niezb ednych funkcjonalno sci. Jednak jest on funkcjonuj acym systemem, a
wdro zenie tych funkcjonalno sci nie b edzie utrudnione, poniewa z pozostaa
cz e s c systemu by a pisana z my sl a o ich przyszym w wdro zeniu.
Najwi eszymbrakiemjest niezaprzeczalnie (opisany ju z wrozdziale 4.3),
brak automatycznego u sredniania danych przy ich imporcie. Gwnym
powodem nie zaimplementowania takiej funkcjonalno sci jest fakt, ze naj-
prawdopodobniej wykracza ona poza to, co da si e osi agn a c posuguj ac si e
kodem SQL, zatem taka funkcjonalno s c b edzie z konieczno sci przywi azana
do konkretnego DBMS, a co za tym idzie, niejako, przywi a ze projekt do da-
nego DBMS. Dodatkowo tego typu funkcjonalno sci s a wbudowane w naj-
bardziej zaawansowane DBMS .
Du z a wag e przyo zono do tego by proponowany system by elastyczny
zarwno pod wzgl edem atwo sci wprowadzania nowych zrde danych, czy
parametrw,jak i pod wzgl edem czysto informatycznym. Poniewa z rela-
cje pomi edzy poszczeglnymi komponentami s a jasno zdeniowane to wy-
miana cz e sci elementw nie powinna zaburza c cao sci systemu.
Najwi eksz a wad a proponowanego systemu jest fakt, ze zawiera on kod
w trzech j ezykach (a po dodaniu mo zliwo sci wy swietlania wynikw mode-
lowania na stronie WWWdojdzie czwarty j ezyk)

. Wada ta jednak, wopinii

Tymi j ezykami s a: SQL, JAVA, j ezyk MATLABA i (dla aplikacji WWW) Python.
Rysunek 4.13: Schemat klas udost epniaj acych parametryzowane zapyta-
nia SQL.
HajmonConnector
getQueryFromSQL(String sql)
getQuery(String name)
Java: Query
Ustawianie parametrw:
Object = getParameter(String name)
setParameter(String name, Object value)
Pobieranie tekstu zapytania
String getSQL
Matlab: Query
Wasnoci:
query: klasa implementujca zapytanie w Javie
Ustawianie parametrw:
Object = getParameter(String name)
setParameter(String name, Object value)
Wykonanie zapytania
execute
execute_cell_array
Tworzy
Zawiera
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 47
Model
stwrz
zapytanie
HajmonConnector
stwrz
Kwerenda:matlaba Kwerenda:Java
return
stwrz
Query lifecycle
ustawianie parametrw
Ustaw
parametr
Pobierz gotowy
kod SQL
Sprawd warto i
konwertuj parametr
Wykonaj zapytanie
Wykonaj
zapytanue
Pobierz gotowy
kod SQL
kod SQL
Sprawd warto
czy wszystkie parametry
podane
Database
Toolbox
Ustaw preferencje
bazy danych
Wykonaj zapytanie
Zwrc wyniki Zwrc wyniki
return
Rysunek 4.14: Schemat wykonywania zapytania
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 48
autora, bya nie do unikni ecia j ezyk MATLABA jest mocno nakierowany
na obliczenia numeryczne i ma on du zo ogranicze n przy innych zastosowa-
niach. MATLAB ponadto ma ograniczon a integracj e z baz a danych. By
omin a c wady MATLABA wprowadzono bibliotek e JAVA. Ponadto jako pro-
gramista ktry pracowa zarwno przy aplikacjach webowych opartych o
j ezyk JAVA

, jak i tymi opartymi o Pythona, stwierdzam zdecydowanie


szybciej b edzie wdro zy c tego typu rozwi azania w Pythonie.
Jedn a z kluczowych decyzji, jaka musi by c podj eta w dalszym rozwoju
systemu, ktra mo ze rozwi aza c problem nakre slony w poprzednim para-
grae, jest odej scie od MATLABA jako srodowiska modelowania. Trafno s c
takiej decyzji zale zy od bardzo wielu czynnikw takich jak:
Mo zliwo s c odej scia od MATLABA, kluczowymelementemb edzie ilo s c
dobrze dziaaj acych implementacji sieci neuronowych w docelowym
rozwi azaniu.
Prbie samodzielnego wdra zania predyktorw. Je sli planuje si e za-
kupi c predyktory to koszt integracji predyktora z pozostaymi syste-
mami poniesie zapewne instytucja dostarczaj aca predyktor, ona te z
podejmie decyzje o srodowisku wdra zania predyktora.
Osoby, ktre b ed a pracowa c nad tym oprogramowaniem (i ich do-
swiadczenie z Matlabem).
Warunki nansowe Matlab jednak jest drogim oprogramowaniem.
Warunki sprz etowe licencje do Matlaba obowi azuj a na okre slon a
ilo s c stanowisk i przy konieczno sci uruchomieniu predyktora na du-
zej ilo sci komputerw mo ze si e okaza c, ze jest to nansowo nieopa-
calne.
Ilo s c osb w projekcie im b edzie ich wi ecej, tym bardziej opaca
si e u zywa c rozwi aza n otwartych (nie tylko z przyczyn nansowych).
Du ze zespoy mog a wi ecej czasu po swi eci c na tworzenie wasnych na-
rz edzi.
Wprowadzanie do projektu studentw(magistrantw, in zynierantw).
atwiej wdra za c studentw w projekt, w ktrym nie musz a oni u zy-
wa c bardzo drogiego, jak na standardy studenckie, oprogramowania.
Autor osobi scie przychylaby si e do podj ecia decyzji o prbie wdro zenia roz-
wi azania opartego na otwarte biblioteki w j ezyku Python; wiem ju z, ze na

Pracowaem rwnie z z bardzo wieloma frameworkami WWW.


ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 49
pewno da si e odtworzy c zawarto s c niniejszej pracy w kodzie opartym o roz-
wi azania Pythonowe.
4.8 Stosowane w systemie algorytmy
Algorytm normalizacji danych
Normalizacja danych przebiega w dwch etapach. Pierwszym jest wyzna-
czenie wspczynnikw normalizacji (t a cz e s c pracy wykonuje skrypt Ma-
tlaba), drug a sama normalizacja warto sci. Normalizacja jest wykony-
wana na poziomie bazy danych, cho c istnieje rwnie z klasa Matlaba potra-
aca dokonywa c normalizacji i denormalizacji danych pobranych z bazy
danych.
Dane s a normalizowane wzgl edem punktu danych i rodzaju u srednia-
nia czyli co wa zne, wszystkie zrda danych normalizowane s a razem.
Docelowo lepiej byoby normalizowa c dane z poszczeglnych zrde danych
oddzielnie, jednak skomplikowaoby to normalizacj e i denormalizacj e da-
nych po stronie Matlaba i z pragmatycznych wzgl edw zrezygnowano z
tego.
Dany jest wektor v warto sci reprezentuj acych pomiary dla konkretnego
parametru i rodzaju u sredniania. Chcemy z niego uzyska c zbir warto sci
v

, ktry jest do s c dobrze znormalizowany na odcinku (0, 1).


Do u sredniania posugujemy si e funkcj a liniow a:
v

i
= a v
i
+b (4.1)
Nale zy zatem wyznaczy c parametry a i b. By wyznaczy c te parametry
posugujemy si e wzorami:
a =
1
v
max
v
min
(4.2)
b =
v
min
v
max
v
min
(4.3)
gdzie parametry v
max
i v
min
to grny i dolny przedzia, ktry normali-
zujemy do przedziau (0, 1).
Najprostsz a metod a normalizacji jest wzi ecie odpowiednio warto sci mi-
nimalnej i maksymalnej, ma to jednak jedn a zasadnicz a wad e: praktycz-
nie w tej bazie danych znajdowa c si e b ed a warto sci b edne, w tym warto sci
bardzo wysokie i bardzo niskie, ktrych uwzgl ednienie mo ze powodowa c,
ze normalizacja b edzie przebiega c de facto do odcinka w e zszego ni z (0, 1),
co mo ze wprowadza c SSN w b ad.
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 50
Zdecydowano si e przyj a c nast epuj ac a metod e wyznaczania v
max
i v
min
:
Dzieli si e dane na zbir danych mniejszych od sredniej i wi ekszych
od sredniej ( v).
Oddzielnie wyznacza si e ich odchylenia standardowe
min
i
max
Odpowiednie warto sci wyznacza si e ze wzorw:
v
min
= v 5
min
(4.4)
v
max
= v + 5
max
(4.5)
W ten sposb zarwno wpyw pojedynczych pomiarw na warto sci v jest
may, oraz zapewnia si e, ze wi ekszo s c danych b edzie w przedziale (0, 1).
Algorytm treningu i walidacji sieci
Najistotniejszym warunkiem uzyskania miarodajnych wynikw dokadno-
sci danej SSN jest wyznaczanie dokadno sci przy u zyciu danych wej scio-
wych, ktre nie bray udziau w procesie uczenia.
Pierwszym krokiem algorytmu jest wi ec podzielenie zbioru uzyskanych
danych na dwa podzbiory: zbir danych do uczenia i zbir su z acy do te-
stowania. Dane testuj ace nale zy wybra c w sposb losowy. Przyj eto, ze
stosunek danych testuj acych do danych ucz acych wynosi 0.2. Dane ucz ace
su z a do uczenia sieci, ktra jest wykorzystana do przewidzenia danych w
serii testuj acej. Schemat blokowy algorytmu podano na rys. 4.15, opis w
pseudokodzie do aczono jako alg. 4.1.
Po takiej procedurze otrzymuje si e dwa ci agi danych: ci ag danych prze-
widzianych przez sie c oraz danych zarejestrowanych przez stacj e pomia-
row a pomiarow a.
Rysunek 4.15: Schemat blokowy pojedynczej iteracji trenowania i walida-
cji predyktor
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 51
Wybr danych do testowania ma wpyw na otrzyman a dokadno s c mo-
delowania. W naszym przypadku wynika to z tego ze st e zenia zanieczysz-
cze n zmieniaj a si e wsposb skokowy. Zmian tych sie c dziaaj aca na danych
imisyjnych nie ma szans przewidzie c. Je sli do danych testuj acych dostanie
si e wi ecej takich punktw danych, to wyznaczona dokadno s c sieci spad-
nie. By zminimalizowa c takie efekty ca a procedur e testowania i walidacji
nale zy powtrzy c kilkukrotnie. Przyj eto ze, przy otrzymywaniu wynikw,
ktre tra a do niniejszej pracy

testowanie sieci b edzie powtarza c si e dwu-


dziestokrotnie. Ci agi danych otrzymanych z poszczeglnych prb nale zy
skonkatenowa c. Opis algorytmu w pseudokodzie umieszczono na alg. 4.2.
Algorytm optymalizacji sieci SVM
Dla sieci SVM metaparametrami s a parametry C, i . Ich poprawne wy-
znaczenie jest kluczowe dla otrzymania miarodajnych wynikw. Jedynym
algorytmem daj acym pewne wyniki wyznaczenia parametrw jest spraw-
dzenie wszystkich mo zliwych kombinacji parametrw[44]

, czyli wytreno-

W innych przypadkach b edziemy upraszcza c t a procedur e. Na przykad przy optyma-


lizacji parametrw sieci SVM ze wzgl edu na zmniejszenie czasochonno sci oblicze n zmniej-
szymy ilo s c powtrze n.

Dodatkowo algorytm ten mo ze dziaa c szybko na urz adzeniach wieloprocesorowych, po-


niewa z ka zdy punkt mo zna wyznacza c oddzielnie. W przypadku wielu innych numerycznych
algorytmw wyznaczania minimum funkcji rwnolege przeprowadzanie oblicze n jest trudne.
Algorytm 4.1 Pojedyncza iteracja trenowania i walidacji predyktora
1: procedure TRAINVALIDATE(macierzDanych)
2: [uczace, testowe] = DZIELDANE(macierzDanych)
3: [wnioskowane, wnioskujace] = WYBIERZWNIOSKUJACE(testowe)
4: model = TRENUJSIEC(uczace)
5: predykcja = PREDYKCJA(model, wnioskujace)
6: return wnioskowane, predykcja
1: procedure TRAINVALIDATE(macierzDanych, powtorzenia, prog =
1000%)
2: wyniki
3: for ii (0 : powtorzenia) do
4: wnioskowane, predykcja TRAINVALIDATE(macierzDanych)
5: wynik FUNKCJACELU(wnioskowane, predykcja)tu
6: wyniki CONCAT(wyniki, wynik)
7: if wynik > prog then
8: break
9: return MEAN(wynik)
Algorithm 4.2 Peny algorytm trenowania i predykcji
ROZDZIA 4. OPRACOWANIE SYSTEMU MODELOWANIA
ZANIECZYSZCZE

N 52
wanie sieci dla ka zdej kombinacji i wybranie tej kombinacji, ktra daje
najdokadniejsze wyniki modelowania.
Przeszukiwania nale zy dokona c na do s c du zym zakresie: C (2
5
; 2
15
),
(2
15
; 2
3
), (10
3
, 10
1
)

. Proponuje si e dwie fazy przeszukiwania:


Powierzchown a, w ktrej wybiera si e parametry ze zbioru
C {2
5
, 2
3
, ..., 2
15
}, {2
15
, 2
13
, ..., 2
3
} i {10
3
, 10
2
, 10
1
}
Dokadn a, wktrej przeszukuje si e region wokolicy najlepszego punktu
z poszukiwania zgrubnego.
Algorytm treningu dla pojedynczego zestawu parametrw zawarty jest w
punkcie 4.8.
Zasadniczym problemem w wykonaniu tego algorytmu jest to, ze dla
niektrych zestawwparametrwprocedura treningu sieci trwaa zbyt dugo.
Postanowiono wi ec, opracowa c metod e przerywania oblicze n dla takich punk-
tw, bowiem, jak si e okazywao dla tych warto sci parametrw sieci okazy-
way si e niepoprawnie modelowa c. Poniewa z w srodowisku Matlab nie ma
metody przerwania dziaaj acego procesu zdecydowano si e posu zy c rozwi a-
zaniem opisanym poni zej.
Wykonano skrypt matlaba, ktry wyznacza kolejne sprawdzane punkty
zapisuj ac do pliku zarwno fakt rozpocz ecia oblicze n, jak i ich wynik. Skrypt
ten uruchamiany jest przez skrypt Pythona, ktry co minut e przerywa
dziaanie skryptu Matlaba i uruchamia go ponownie. Rozwi azanie to w
praktyce powoduje, ze jeden punkt liczy si e najwy zej przez minut e.
Opisuj e to rozwi azanie gwnie dlatego, ze ma ono jedn a istotn a wad e
wprowadza do procesu optymalizacji sieci czynnik niedeterministyczny,
tj. dla tych samych danych mog a za pomoc a tego algorytmu zosta c wytre-
nowane r zne sieci.

W [44] proponuje si e nie przeszukiwa c . Jednak okazuje si e ze jego uwzgl ednienie


poprawia dokadno s c sieci.
Rozdzia 5
Wykorzystanie sieci
neuronowych
Gupot a wprost wewn etrznie sprzeczn a, byoby
mniemanie, ze czego nigdy dot ad nie robiono, tego
mo zna inaczej ni z za pomoc a dot ad nieznanych
sposobw.
Francis Bacon Novum Organum
5.1 Wst epna ekstrapolacja przestrzenna
Mo zliwe jest zbudowanie modelu, ktry b edzie w stanie poda c poziom za-
nieczyszczenia w jakim s punkcie (na jakie s stacji pomiarowej) na pod-
stawie parametrw pogodowych na pobliskich stacjach i poziomw zanie-
czyszcze n na pobliskich stacjach. Model ten by testowany dla PM
10
. By
wytrenowa c ten model nale zy mie c niewielk a ilo s c pomiarw PM
10
w stacji
ekstrapolowanej (dane te nazwiemy danymi wska znikowymi), wi ec model
ten ma gwne zastosowanie do uzupeniania luk w danych. Luki takie
mog a powstawa c w punktach pomiarw ci agych na skutek np. awarii
technicznej, model ten mo ze te z wypenia c luki w pomiarach wska zniko-
wych

.
By zbada c mo zliwo sci tego modelu, musimy zbada c takie charaktery-
styki jak:

By uzupenia c pomiary wska znikowe nale zy jeszcze uzyska c dost ep do danych pogodo-
wych zbieranych w sposb ci agy w ekstrapolowanym punkcie. Problem ten wymaga dalszych
bada n najprawdopodobniej mo zliwe jest zast apienie danych pomiarowych numeryczn a
analiz a pogody.
53
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 54
Czy wdro zenie tego modelu wprowadza dodatkowe dane do zbioru
danych wska znikowych tj. czy uzupenienie danych wska zniko-
wych wynikami modelowania polepsza jako s c estymacji takich para-
metrw srednie roczne, czy ilo s c przekrocze n w roku.
Jaka jest maksymalna odlego s c mi edzy stacjami wspieraj acymi eks-
trapolacj e i stacj a ekstrapolowan a.
Jaka jest minimalna ilo s c danych o poziomie zanieczyszczenia powie-
trza na stacji ekstrapolowanej, ktr a model potrzebuje do poprawnej
pracy.
Czy mo zna przeprowadza c ekstrapolacj e mi edzy stacjami r znych ty-
pw (na przykad ekstrapolowa c poziomy na stacji ta regionalnego
na podstawie stacji ta miejskiego).
By zbada c te informacje stworzono modele ekstrapoluj ace opisane na ta-
beli 5.1.
Schemat sieci ekstrapoluj acych
Sieci ekstrapoluj ace otrzymuj a nast epuj ace dane wej sciowe:
Poziom PM
10
na stacjach wspieraj acych ekstrapolacj e.
Temperatur e na wszystkich stacjach na bie z acy dzie n oraz wilgotno s c
na dzie n bie z acy oraz poprzedni.
Opady na stacji ekstrapolowanej na dzie n bie z acy oraz poprzedni

.
Schemat modelu na rys 5.1.
Badane wasno sci modeli ekstrapoluj acych
By odpowiedzie c na pytania okre slone w powy zszym paragrae spraw-
dzimy modele wedug nast epuj acego schematu:
1. Do testw ekstrapolacji wybierzemy stacje, ktre zbieraj a dane w try-
bie ci agym.
2. Z penego zbioru danych stacji ekstrapolowanej b edziemy losowa c pe-
wien odsetek danych, ktre b ed a u zywane do treningu modelu. Pozo-
stae dane u zyte b ed a do werykacji.

Wybrano takie, a nie inne parametry pogodowe tylko w celu ujednolicenia zbioru para-
metrw, na ktrych operuj a r zne modele
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 55
3. Ca a procedur e testowania powtarza c b edziemy 80 razy dla r znych,
wylosowanych zestaww danych treningowych (by otrzymane wyniki
reprezentoway sredni MAPEmodeli wytrenowanych dla danego wsp-
czynnika wypenienia).
Zanimwska zemy jakie rodzaje danych sprawdzimy wprowadzimy denicje
poszczeglnych serii danych.
peny zbir danych f
i
cay zbir danych z ekstrapolowanej stacji
dane wska znikowe w
i
dane u zyte do treningu modeli. U zywam tej na-
zwy mimo, ze jest to merytorycznie w atpliwe dlatego, i z model ten
b edzie mg su zy c do uzupeniania luk w danych wska znikowych.
dane sprawdzaj ace s
i
seria danych z dni, dla ktrych mamy pomiar w
penych danych, a ktre nie zostay wybrane jako dane wska znikowe.
dane modelowane m
i
seria danych, w ktrej zawieraj a si e modelowane
wyniki z dni znajduj acych si e wpenymzbiorze danych a nie znajduj a
si e w danych wska znikowych.
dane ekstrapolowane e
i
seria danych skadaj aca si e z danych wska zni-
kowych, w ktrych luki uzupeniono wynikami modelowana.
wspczynnik wypenienia F
f
ilo s c danych wybranych jako dane wska z-
nikowe w stosunku do penego zbioru danych F
f
=
w
i
f
i
.
Model
ekstrapolujcy
Poziomy PM_10
na stacjach
wspomagajcych
interpolacj dla dnia N
Temperatura dla
dnia N, wilgotno
dla dni N, N-1, dla
wszystkich stacji
Opady dla dni N,
N-1 dla stacji
ekstrapolowanej
Poziom
PM_10 na
dzie N dla
stacji
ekstrapolowanej
Rysunek 5.1: Schemat modelu ekstrapoluj acego
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 56
Testowane wasno sci sieci:
MAPE mi edzy danymi sprawdzaj acymi a modelowanymi
korelacja mi edzy danymi sprawdzaj acymi a modelowanymi
wzgl edna r znica w srednim poziomie zanieczyszcze n mi edzy danymi
ekstrapolowanymi a danymi wska znikowymi. Je sli oznaczymy przez
x
i
sredni a zbioru danych to b edzie to:
wsk
=
w
i

f
i
,
extra
=
e
i
f
i
. Je-
sli parametr ten dla ekstrapolowanego zbioru danych b edzie lepszy
ni z dla zbioru wska znikowego oznacza to, ze model ekstrapoluj acy
wprowadza dodatkowe dane do zbioru danych wska znikowego i dane
te polepszaj a dokadno s c wyznaczenia sredniego poziomu.
wzgl edna r znica mi edzy ilo sci a przekrocze n mi edzy danymi ekstra-
polowanymi danymi wska znikowymi. Je sli przez p(x
i
) ilo s c przekro-
cze n w serii danych x
i
to
wsk
=
1
F
f
p(w
i
)
p(f
i
)
,
extra
=
p(e
i
)
p(f
i
)
. Ilo s c prze-
krocze n w zbiorze wska znikowym wyznaczamy zakadaj ac, ze dane
wska znikowe s a reprezentatywne dla caego zbioru danych i otrzy-
mamy rozs adn a estymacj e. Je sli w zbiorze zawieraj acym 20% danych
jest 5 przekrocze n, to w penym zbiorze mo zemy oczekiwa c 25.
Wszystkie te parametry zbieramy w funkcji wspczynnika wypenienia.
Zbadane modele opisano w tablicy 5.1, mapk e sytuacyjn a przedstawia-
j ac a poo zenie stacji zamieszczono na rys. 5.2.
Analiza wynikw
Wyniki analizowanych modeli zamieszczono w tabeli 5.1 oraz na rys. 5.3
5.6.
Wida c spadek dokadno sci ekstrapolacji wraz ze wzrostem odlego sci
stacji ekstrapolowanej od stacji wspieraj acych nie jest to jednak prosta
zale zno s c. Mog a nad ni a dominowa c inne czynniki. Dokadno s c modelu
Radom II, ktry pracuje na danych z Pocka i Ursynowa jest lepsza od mo-
delu Radom, ktry opiera si e na warszawskich stacjach.

Srednia odlego s c
od stacji wspieraj acych jest ni zsza dla modelu Radom, jednak zdaje si e, i z
wa zniejszym czynnikiem jest to, ze stacja w Pocku mo ze by c nieczua na
pewne zdarzenia wpywaj ace na emisj e charakterystyczne dla Warszawy
takie jak korki czy roboty budowlane.
Dla wszystkich stacji (nawet dla Belska) w aczenie danych ekstrapolo-
wanych wzbir danych wska znikowych podnioso dokadno s c wyznaczania
takich parametrw jak sredni poziom pyu zawieszonego, czy srednia ilo s c
przekrocze n. Interpretujemy to jako potwierdzenie zao zenia o tym, ze
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 57
E
k
s
t
r
a
p
o
l
o
w
a
n
a
T
y
p
e
k
s
t
r
a
p
o
l
o
w
a
n
e
j
S
t
a
c
j
e
O
d
l
e
g

o
s
c
M
A
P
E
w
y
z
n
a
c
z
a
n
i
a
s
t
a
c
j
a
s
t
a
c
j
i
w
s
p
i
e
r
a
j

a
c
e
m
i
e
d
z
y
s
t
a
c
j
a
m
i
s
r
e
d
n
i
c
h
d
z
i
e
n
n
y
c
h
2
0
%
w
y
p
e

n
i
e
n
i
a
8
0
%
w
y
p
e

n
i
e
n
i
a
1
K
o
m
u
n
i
k
a
c
y
j
n
a
k
o
m
u
n
i
k
a
c
y
j
n
a
U
r
s
y
n

w
,
P

o
c
k
7
;
1
0
0
2
0
%
1
8
%
2
K
o
m
u
n
i
k
a
c
y
j
n
a
I
I
k
o
m
u
n
i
k
a
c
y
j
n
a
U
r
s
y
n

w
,
T
a
r
g

w
e
k
7
;
7
1
3
%
1
2
%
3
R
a
d
o
m
t

a
m
i
e
j
s
k
i
e
g
o
U
r
s
y
n

w
,
T
a
r
g

w
e
k
8
0
;
1
0
1
1
8
%
1
7
%
4
R
a
d
o
m
I
I
t

a
m
i
e
j
s
k
i
e
g
o
U
r
s
y
n

w
,
P

o
c
k
8
0
;
1
6
3
2
7
%
2
3
%
5
U
r
s
y
n

w
t

a
m
i
e
j
s
k
i
e
g
o
T
a
r
g

w
e
k
,
K
o
m
u
n
i
k
a
c
y
j
n
a
1
5
;
7
1
2
%
1
1
%
6
U
r
s
y
n

w
I
I
t

a
m
i
e
j
s
k
i
e
g
o
T
a
r
g

w
e
k
,
P

o
c
k
7
;
1
0
0
1
3
%
1
3
%
7
B
e
l
s
k
t

a
r
e
g
i
o
n
a
l
n
e
g
o
T
a
r
g

w
e
k
,
P

o
c
k
5
4
;
1
1
0
4
5
%

8
B
e
l
s
k
I
I
t

a
r
e
g
i
o
n
a
l
n
e
g
o
T
a
r
g

w
e
k
,
U
r
s
y
n

w
5
4
;
4
2
4
2
%
4
4
%
9
P

o
c
k
t

a
m
i
e
j
s
k
i
e
g
o

(
a
)
P
o
d
s
t
a
w
o
w
e
d
a
n
e
o
m
o
d
e
l
a
c
h
e
k
s
t
r
a
p
o
l
u
j

a
c
y
c
h
E
k
s
t
r
a
p
o
l
o
w
a
n
a
T
y
p
e
k
s
t
r
a
p
o
l
o
w
a
n
e
j

S
r
e
d
n
i
b

a
d
w
y
z
n
a
c
z
e
n
i
a

S
r
e
d
n
i
b

a
d
w
y
z
n
a
c
z
e
n
i
a
s
t
a
c
j
a
s
t
a
c
j
i
s
r
e
d
n
i
e
g
o
p
o
z
i
o
m
u
P
M
1
0
i
l
o
s
c
i
p
r
z
e
k
r
o
c
z
e

n
e
k
s
t
r
a
p
o
l
a
c
j
a
w
s
k
a
z
n
i
k
o
w
e
e
k
s
t
r
a
p
o
l
a
c
j
a
w
s
k
a
z
n
i
k
o
w
e
1
K
o
m
u
n
i
k
a
c
y
j
n
a
k
o
m
u
n
i
k
a
c
y
j
n
a
2
%
3
.
1
%
6
%
8
%
2
K
o
m
u
n
i
k
a
c
y
j
n
a
I
I
k
o
m
u
n
i
k
a
c
y
j
n
a
1
.
5
%
3
%
5
%
8
%
3
R
a
d
o
m
t

a
m
i
e
j
s
k
i
e
g
o
4
.
3
%
4
.
3
%
1
1
%
1
5
%
4
R
a
d
o
m
I
I
t

a
m
i
e
j
s
k
i
e
g
o
2
.
1
%
3
.
9
%
9
%
1
2
%
5
U
r
s
y
n

w
t

a
m
i
e
j
s
k
i
e
g
o
1
.
2
%
3
.
6
%
8
%
1
4
%
6
U
r
s
y
n

w
I
I
t

a
m
i
e
j
s
k
i
e
g
o
1
.
9
%
4
.
3
%
5
%
1
3
%
7
B
e
l
s
k
t

a
r
e
g
i
o
n
a
l
n
e
g
o
2
.
5
%
3
.
1
%
1
2
%
1
7
%
8
B
e
l
s
k
I
I
t

a
r
e
g
i
o
n
a
l
n
e
g
o
1
.
9
%
1
.
9
%
1
1
%
1
5
%
(
b
)
P
o
r

w
n
a
n
i
e
d
o
k

a
d
n
o
s
c
i
w
y
z
n
a
c
z
a
n
i
a
p
a
r
a
m
e
t
r

w
s
e
r
i
i
d
a
n
y
c
h
z
u
z
y
c
i
e
m
e
k
s
t
r
a
p
o
l
a
c
j
i
i
z
u
z
y
c
i
e
m
s
a
m
y
c
h
t
y
l
k
o
d
a
n
y
c
h
w
s
k
a
z
-
n
i
k
o
w
y
c
h
,
d
l
a
w
s
p

c
z
y
n
n
i
k
a
w
y
p
e

n
i
e
n
i
a
2
0
%
.
T
a
b
l
i
c
a
5
.
1
:
S
t
w
o
r
z
o
n
e
m
o
d
e
l
e
d
o
k
o
n
u
j

a
c
e
e
k
s
t
r
a
p
o
l
a
c
j
i
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 58
Warszawa Targwek
Warszawa Komunikacyjna /
Warszawa Ursynw
yrardw
Belsko
Radom
Pock
Wydzia Fizyki
Rysunek 5.2: Poo zenie stacji bior acych udzia w ekstrapolacji
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 59
model ekstrapoluj acy wprowadza do zbioru danych wska znikowych nowe
informacje.
Wywnioskowanie ilo sci przekrocze n z danych ekstrapolowanych jest
trudne, mo zliwe, ze trudno s c ta wynikaa z tego, ze model ten modelo-
wa srednie dzienne, z ktrych w nast epnej kolejno sci wyznaczano fakt
przekroczenia. Model, ktry modeluje fakt przekroczenia bezpo srednio po-
winien dziaa c zdecydowanie lepiej.
Stacja w Belsku nie dostarczaa danych meteorologicznych co bardzo
utrudniao ekstrapolacj e.
Mo zemy te z pokusi c si e o stwierdzenie, ze dla dugich zbiorw danych
prg ilo sci danych treningowych, dla ktrego model zaczyna dziaa c dobrze
to okoo 120 dni, natomiast poni zej 50 dni model ten nie daje sensownych
wynikw.
Model ten jest jeszcze na bardzo wczesnymetapie bada n, jednak wydaje
si e, i z mo ze on by c z powodzeniem u zywany do uzupeniania luk w pomia-
rach dla pomiarw staych. U zywanie go do uzupeniania luk w pomiarach
wska znikowych wymaga dodatkowych bada n, w szczeglno sci nale zaoby
stworzy c procedur e wprowadzania takiego modelu do nowej stacji pomia-
rowej, na ktrej rozpocz eto dopiero pomiary wska znikowe tj. nale zaoby
zbada c w jaki sposb nale zy prowadzi c pomiary by maksymalnie szybko
zgromadzi c dostateczny materia ucz acy.
Rysunek 5.3:

Sredni b ad wyznaczania srednich dziennych dla wybranych
modeli ekstrapoluj acych (dane pomiarowe z lat 2009 2010).
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 60
Rysunek 5.4: Porwnanie dokadno sci wyznaczenia sredniej z caego
okresu przy u zyciu modeli ekstrapoluj acych i przy u zyciu samych tylko
danych wska znikowych dla dwch wybranych modeli (dane pomiarowe z
lat 2009 2010).
Rysunek 5.5: Porwnanie b edu w wyznaczeniu ilo sci przekrocze n z u zy-
ciem modeli ekstrapoluj acych i samych tylko danych wska znikowych. Mo-
dele pracoway na danych z lat 2009 2010.
ROZDZIA 5. WYKORZYSTANIE SIECI NEURONOWYCH 61
(a) Kwiecie n 2010 (b) Maj 2010
(c) Czerwiec 2010 (d) Lipiec 2010
Rysunek 5.6: Porwnanie zmierzonych i modelowanych poziomw
PM
10
dla modelu Ursynw dwa dla czterech kolejnych miesi ecy (miesi ace
te zostay wybrane ze wzgl edu na podobny do caego zbioru danych MAPE)
Rozdzia 6
Podsumowanie
Py zawieszony jest jednym z najgro zniejszych zanieczyszcze n powietrza,
nie z powodu jego toksyczno sci, lecz z powodu jego powszechno sci (poziomy
PM s a przekraczane w wielu bardzo miejscowo sciach).
Modele s a jednym z niezb ednych narz edzi do efektywnego zarz adza-
nia poziomami zanieczyszcze n powietrza. Modele mog a wspiera c zarwno
dugo, jak i krtkoterminowe dziaania zapobiegaj ace przekroczeniom od-
powiednich poziomw zanieczyszcze n oraz wspiera c proces pomiarw tych
poziomw. Ze wzgl edu na rozproszon a natur e emisji pyu zawieszonego
(wi ekszo s c cz e s c emisji tego zanieczyszczenia pochodzi z transportu oraz
ogrzewania domw) zanieczyszczenie to sprawia du ze problemy modelom
emisyjnym. Praca ta koncentrowaa si e na modelach modeluj acych po-
ziomy PM opartych na metody eksploracji danych.
6.1 Zawarto s c pracy
W pracy zbadano jeden nowy typ modelu emisyjnego model dokonu-
j acy ekstrapolacji przestrzennej poziomwzanieczyszcze n. Model ten mo ze
mie c praktyczne zastosowanie do uzupeniania luk w pomiarach pyu za-
wieszonego.
Wpracy opracowano podstawy koncepcyjne systemu dedykowanego jako
srodowisko, w ktrym uruchamiane b ed a modele eksploruj ace dane. Sys-
tem przeznaczony jest do pracy on line. W prazy zaimplementowano du z a
cz e s c proponowanego systemu.
Praca zawiera rwnie z obszern a cz e s c teoretyczn a, w ktrej opisane s a
Sztuczne Sieci Neuronowe (element dokonuj acy modelowania) oraz dys-
kretna transformata falkowa su z aca do wst epnego przetwarzania da-
nych dla SSN.
62
ROZDZIA 6. PODSUMOWANIE 63
6.2 Wnioski
Modele oparte na eksploracj e danych s a bardzo cennym narz edziem, ktre
jest w stanie kompleksowo wspiera c pomiar i zarz adzanie poziomami pyu
zawieszonego (oraz innych zanieczyszcze n).
Zaproponowany system wymaga jeszcze wiele prac programistycznych
jednak wykorzystanie go w niniejszej pracy do stworzenia wielu modeli
DMM, wykazao jego przydatno s c. Posiadanie takiego systemu powoduje:
Znaczne zmniejszenie ilo sci pracy wykonywanej przez czowieka w
przygotowywaniu serii danych ucz acych model.
Znaczne zmniejszenie ryzyka b edwwprowadzanych przez czowieka
w tym procesie.
Umo zliwienie pracy w cakowicie automatycznym trybie.
Znaczne przy spieszenie procesu wdra zania nowych modeli opartych
o eksploracj e danych.
Dodatek A
Sownik poj e c
BAM (z ang. beta attenuation monitor) mierniki mierz ace poziom PM
dokonuj ace pomiaru masy osadzonej na ltrze za pomoc a pomiaru,
jak w ltr osabia promieniowanie . Patrz te z 3.3.
cecha Patrz sekcja B.3.
CTM (z ang. Chemical Transport Model) S a to metody oparte na ana-
litycznych modelach propagacji zanieczyszcze n oraz ich chemicznych
przemian. Danymi wej sciowymi do modeli tego typu s a szacunki emi-
sji badanych zanieczyszcze n, topograa terenu, przewidywania para-
metrw pogodowych na kolejne dni. Kluczowa dla dokadno sci tych
modeli jest baza danych emisyjnych, ktrej uzyskanie jest trudne i
do s c kosztowne.
FDMS (z ang. Filter Dynamic Measurement System) system pomiaru wy-
korzystuj acy miernik TEOM, ktry jednak jest rwnowa zny pomia-
rom referencyjnym.
funkcja celu Funkcja celu

jest miar a tego jak dokadnie sie c odwzoro-


wuje badany proces. Wyja snienie patrz strona 75.
instancja Instancja

danych wej sciowych to jeden punkt danych. Ilo s c


pojedy nczych danych zawartych w instancji to jej wymiar. W przy-
padku predyktora przewiduj acego dzienne srednie zanieczyszczenie
instancj a danych b ed a dzienne srednie parametry pogodowe dla da-
nego dnia oraz poziomy zanieczyszcze n z dni poprzednich. Termin
ten wprowadzam, by jasno oddzieli c terminy na pojedynczy punkt
danych ucz acych (instancj e wa snie) oraz cay zbir danych ucz acych.

Inaczej mwi si e rwnie z: funkcja wydajno sci/efektywno sci sieci.

Termin ten zaczerpn aem z pi smiennictwa angielskiego z tej dziedziny, nie znalazem
odpowiednika polskiego.
64
DODATEK A. SOWNIK POJ E

C 65
LRTAP (z ang. Long Range Transbounary Air Pollution) mi edzynaro-
dowy traktat kontroluj acy pewne kwestie zwi azane z ochron a srodo-
wiska w Europie. Dokadniejszy opis patrz 2.1.
MAE (z ang. mean absolute error) funkcja celu dla sieci neuronowych.
Wzr patrz strona 75.
MAPE (z ang. mean absolute percentage error) funkcja celu dla sieci neu-
ronowych. Wzr patrz strona 75.
metaparametr modelu Metaparametr modelu jest to parametr, ktry
nie jest ustalany w procesie treningu a przed nim. Nie zale zy
on zatem od konkretnych danych treningowych i jest wsplny dla
caej klasy modeli, maj acych t a sam a struktur e i pracuj acych na po-
dobnych zestawach danych. W SSN metaparametry okre sla c b ed a
struktur e sieci i np. rodzaj funkcji aktywacji.
MLP (z ang. Multilayer perceptron) Perceptron wielowarstwowy. Rodzaj
SSN.
model Model oparty na technikach eksploracji danych to narz edzie, ktre
maj ac pewien korpus danych historycznych jest w stanie odtwarza c
dane nale z ace do tej samej klasy, do ktrej nale z a dane z korpusu
historycznego, ktrych to jednak w owym korpusie nie ma.
parametr modelu Jest to parametr
parametr kompozytowy (pogodowy) parametr pogody, ktry mo zna wy-
liczy c z innych parametrw pogodowych. Przykadowo mo ze by c to
punkt rosy, czy temperatura odczuwalna.
PCA (z ang. principial component analysis) metoda obni zania ilo sci wy-
miarw instancji danych z minimaln a utrat a informacji.
PM (z ang. particulate matter) py zawieszony to okre slenie drobin ciaa
staego, ktre s a zawieszone w powietrzu (ze wzgl edu na rozmiar pro-
ces ich grawitacyjnego osiadania jest albo bardzo powolny, albo wr ecz
nie jest gwnym kanaem ich usuwania ze srodowiska).
poziom st e zenie danego zanieczyszczenia w powietrzu
punkt rosy (dokadniej temperatura punktu rosy) taka temperatura, dla
ktrej przy danym skadzie mieszaniny gazw i ustalonym ci snieniu
mo ze rozpocz a c skraplanie si e jednego z jej skadnikw. U nas przez
ten termin b edziemy rozumie c punkt rosy pary wodnej w powietrzu
DODATEK A. SOWNIK POJ E

C 66
czyli temperatur e przy jakiej para wodna zawarta w powietrzu
mogaby si e skropli c. Przybli zony wzr pozwalaj acy wyznaczy c tem-
peratur e punktu rosy to[?]:
T
d
=
8
_
H
100
[112 + (0, 9 T)] + (0, 1 T) 112 (A.1)
gdzie T
d
to temperatura punktu rosy (

C), H to wilgotno s c wzgl edna


(%) a T to temperatura (

C).
predyktor Model su z acy do krtkoterminowej prognozy jakiego s feno-
menu.
SSN Sztuczna sie c neuronowa
srednica aerodynamiczna cz astki

Srednica kuli o g esto sci 1
g
cm
3
o ta-
kiej samej, jak cz astka badana, pr edko sci opadania w nieruchomym
powietrzu, w wyniku dziaania si grawitacji, w identycznych warun-
kach temperatury, ci snienia i wilgotno sci wzgl ednej[23].
srednica dyfuzyjna cz astki

Srednica kuli o g esto sci 1
g
cm
3
o takim sa-
mym, jak cz astka badana, wspczynniku dyfuzji w identycznych wa-
runkach temperatury, ci snienia i wilgotno sci wzgl ednej[23]
temperatura odczuwalna Temperatura odczuwalna odwzorowuje odczu-
cie temperatury w danych warunkach otoczenia, jednak nie jest to
cakowicie antropomorczny parametr bowiem badania nad nim
wzi ey si e z badania pr edko sci zamarzania wody w danych warun-
kach na arktyce (pr edko s c ta zale zaa od temperatury otoczenia i
pr edko sci wiatru). Istnieje kilka wzorw pozwalaj acych przybli zy c
t a wielko s c, jednak zaden z nich nie daje dobrych wynikw na caym
spektrum temperatur.
TEOM (z ang. tapered element oscillating microbalance) metoda pomiaru
poziomu PM
trening Operacja, w ktrej model oparty o eksploracj e danych uczy si e
historii pomiarw. Dla SSNb edzie to operacja ustalenia wag w
i
predyktor
WIO

S Wojewdzki Inspektorat Ochrony



Srodowiska
DODATEK A. SOWNIK POJ E

C 67
Poj ecia u zywane w rozumieniu dyrektywy 2008/50/WE[14]
warto s c dopuszczalna Oznacza poziom substancji w powietrzu usta-
lany (...) w celu zapobiegania lub ograniczenia szkodliwego wpywu
na zdrowie ludzkie lub srodowisko, (...) ktry powinien by c osi agni ety
w okre slonym terminie i po tym terminie nie powinien by c przekra-
czany
poziom krytyczny Oznacza poziom substancji w powietrzu (...) po prze-
kroczeniu, ktrego mog a wyst api c bezpo srednie niepo z adane skutki
w odniesieniu do niektrych receptorw, takich jak drzewa, inne ro-
sliny lub ekosystemy naturalne, jednak nie w odniesieniu do czo-
wieka

prg informowania oznacza poziom substancji w powietrzu, powy zej


ktrego istnieje zagro zenie dla zdrowia ludzkiego wynikaj ace z krt-
kotrwaego nara zenia na dziaanie zanieczyszcze n szczeglnie wra z-
liwych grup ludno sci i w przypadku ktrego niezb edna jest natych-
miastowa i wa sciwa informacja
pomiary stae oznacza pomiary przeprowadzane wstaych punktach po-
miarowych, zarwno w trybie ci agym, jak i na zasadzie wyrywko-
wych prb, w celu okre slenia poziomw substancji w powietrzu zgod-
nie z zao zonymi stosownymi celami dotycz acymi jako sci danych
pomiary wska znikowe oznaczaj a pomiary, dla ktrych wymagania do-
tycz ace jako sci danych s a mniej restrykcyjne w porwnaniu z pomia-
rami staymi
grny prg oszacowania oznacza poziom substancji w powietrzu, po-
ni zej ktrego do oceny jako sci powietrza mo ze by c stosowana kombi-
nacja pomiarw staych i technik modelowania lub pomiarw wska z-
nikowych
dolny prg oszacowania oznacza poziom substancji w powietrzu, po-
ni zej ktrego do oceny jako sci powietrza mo ze by c stosowana kombi-
nacja pomiarw staych i technik modelowania lub pomiarw wska z-
nikowych

Podkre slenie moje


Dodatek B
Sztuczne sieci neuronowe
B.1 Wst ep
Sztuczne sieci neuronowe (SSN) s a jedn a z metod tworzenia systemw
komputerowych, ktre zdolne s a do nauki. Kanoniczn a denicj e uczenia
maszynowego poda T. Mitchell:
Mwi si e, ze program uczy si e wykonywania pewnej klasy za-
da n T, bazuj ac na do swiadczeniu E, wykonanie tych zada n jest
oceniane metryk a P, je sli jego wydajno s c we wszystkich zada-
niach T, mierzona przez P, ro snie wraz z do swiadczeniem E[45]
Sieci neuronowe w pierwszych swych zao zeniach miay modelowa c dzia-
anie ukadu nerwowego istot zywych, jednak w trakcie ich rozwoju po-
rzucono ten pomys. Teraz mwi si e co najwy zej o czerpaniu inspiracji z
funkcjonowania ukadu nerwowego

.
Poniewa z z punktu widzenia niniejszej pracy sieci neuronowe s a tylko
narz edziem, a nie przedmiotem bada n, ich opis b edzie mo zliwie skrcony
i b edzie koncentrowa c si e na praktycznych aspektach ich funkcjonowania.
W tym wprowadzeniu Autor korzysta gwnie z [46, 45, 51].
Cechy sieci neuronowych
Zdolno s c do generalizacji danych. Wszystkie systemy ucz ace musz a
by c w stanie generalizowa c dane ucz ace, tj. umie c reagowa c na dane
podobne do danych ucz acych, ale z nimi nie to zsame.

Wynika to z przynajmniej dwch powodw: po pierwsze koncentrowano si e raczej na


osi aganiu efektywnych ukadw ucz acych si e; po drugie samo funkcjonowanie ukadu ner-
wowego nie jest dobrze zbadane i wcale nie jest pewne (a byo to milcz ace zao zenie wszyst-
kich modeli sieci neuronowych), ze neurony nie reaguj a na przykad na ksztat impulsu ner-
wowego czy na cae ich sekwencje.
68
DODATEK B. SZTUCZNE SIECI NEURONOWE 69
Odporno s c na b edy w danych ucz acych. Sieci neuronowe potra a
sobie radzi c z zaszumionymi kanaami wej sciowymi. Zarwno w da-
nych ucz acych, jak i danych wej sciowych podczas pracy sieci mog a
pojawia c si e b edy, ktre nie wpywaj a znacz aco na zdolno s c sieci do
generalizacji, ani na jej wydajno s c.
Zdolno s c do rwnolegego przetwarzania. Sieci neuronowe zdolne s a
do przetwarzania sygnaw w sposb zrwnoleglony

. Jako cieka-
wostk e mo zna poda c, ze ta wa snie cecha ukadu nerwowego bya
jedn a z pierwszych przyczyn zainteresowania sztucznymi sieciami
neuronowymi

. Oczywi scie sieci neuronowe wykonywane na zwy-


kym komputerze mog a w danym momencie wykonywa c co najwy-
zej tyle operacji ile komputer ten posiada rdzeni obliczeniowych, jed-
nak buduje si e rwnie z specjalne, dedykowane do sieci neuronowych,
ukady sprz etowe pozwalaj ace na bardzo silne zrwnoleglenie.
Dugie czasy treningu. Czasy treningu SSN s a generalnie du zsze
od czasw treningu innych metod uczenia maszynowego i zawieraj a
si e w czasie od kilku sekund do kilku dni, w zale zno sci od czynni-
kw takich jak typ sieci neuronowej, metoda treningu, ilo s c danych
wej sciowych itp
Szybka praca po wytrenowaniu. SSN dziaaj a bardzo szybko po wy-
trenowaniu (rwnie z bez u zycia zrwnoleglonych ukadw sprz eto-
wych)
Czowiek nie jest w stanie zrozumie c sposobu, w jaki sie c odwzoro-
wuje dane. Sie c w procesie uczenia dostosowuje odpowiednie licz-
bowe wagi (te poj ecia b ed a wyja snione dalej). Inaczej mwi ac wyni-
kiem uczenia sieci jest wektor liczb obrazuj acych pewne parametry
neuronw i po acze n mi edzy nimi. Bardzo trudno jest z takiej po-
staci danych zrozumie c, jaka cecha danych wej sciowych odpowiada
za taki, a nie inny wynik. Mwi ac j ezykiem zwi azanym z tematyk a

Oznacza to ze poszczeglne fragmenty oblicze n s a od siebie niezale zne i mog a by c


wykonywane w tym samym czasie.

Bardzo dobrze obrazuje t a cech e cytat: Czas jaki neuron potrzebuje na zmian e stanu [a
zatem na przetworzenie informacji przyp. mj] jest rz edu 10
3
s do s c wolno w porw-
naniu z systemami komputerowymi, dla ktrych czasy te s a rz edu 10
10
s. Jednak czowiek
jest w stanie dokona c bardzo skomplikowanych decyzji, bardzo szybko. Dla przykadu prze-
ci etna osoba potrzebuje ok 10
1
s by rozpozna c wasn a matk e. Zauwa zmy, ze maksymalna
dugo s c a ncucha neuronw, ktry mo ze w tym czasie zareagowa c to co najwy zej kilkaset. Ta
obserwacja spowodowaa, ze zdolno sci do przetwarzania informacji przez biologiczne systemy
nerwowe musz a mie c swoje zrdo w wysokim zrwnolegleniu procesw wykonywanych na
reprezentacjach rozproszonych na wielu neuronach. Jedn a z motywacji SNN jest uchwycenie
takiej zrwnoleglonej metody oblicze n (...).[45] (tumaczenie moje)
DODATEK B. SZTUCZNE SIECI NEURONOWE 70
pracy maj ac wytrenowan a sie c neuronow a poprawnie przewidu-
j ac a przysze st e zenia zanieczyszcze n, nie koniecznie musimy by c w
stanie powiedzie c dlaczego sie c przewidziaa taki, a nie inny poziom
zanieczyszcze n. Da si e posuguj ac si e wieloma sieciami neuronowymi
wywnioskowa c takie informacje, jednak nie s a to metody ani proste,
ani stuprocentowo pewne.
Dane wej sciowe da si e przedstawi c jako wektor liczb rzeczywistych.
Dane wyj sciowe da si e przedstawi c jako wektor liczb rzeczywistych.
Poszczeglne atrybuty danych wej sciowych mog a by c ze sob a silnie
skorelowane.
Ocena SSN do zastosowania w modelowaniu zanieczyszcze n
powietrza
Cz e s c podanych wpoprzedniej cz e sci cech sieci neuronowych nie jest istotna
dla zastosowania SSN do modelowania zanieczyszcze n powietrza, inne na-
tomiast przes adziy o ich wyborze do tego zadania.
Bardzo istotna jest odporno s c SSN na du ze szumy w danych wej scio-
wych. Dyrektywa 2008/50/WE zakada, ze niepewno s c pomiaru poziomu
PM dla pomiarw staych musi by c mniejsza ni z 25%[17], inaczej mwi ac:
mierniki tego zanieczyszczenia mog a si e myli c wa snie o tyle. Ju z sam
fakt dopuszczenia takiej niepewno sci powoduje, ze dane wej sciowe s a bar-
dzo zaszumione (jak na standardy uczenia maszynowego). Zdolno s c do
generalizacji jest sine qua non zastosowania w tej dziedzinie jakiejkolwiek
metody.
Wymagania SSN co do postaci danych s a atwe w tej dziedzinie do spe-
nienia dane nie wymagaj a zadnej obrbki do tej postaci.
Zupenie nie istotne s a dla nas metryki wydajno sciowe SSN sieci
dziaaj a wyznaczaj ac srednie st e zenia dzienne b ad z godzinowe, a godzina
na wyznaczenie srednich dla kilku stacji to bardzo du zo czasu.
Zasadnicz a wad a SSN w tym zastosowaniu jest fakt, ze bardzo trudno
jest czowiekowi zrozumie c, to w jaki sposb sie c odwzorowuje dane
maj ac dziaaj acy predyktor chcieliby smy mc na jego podstawie wywnio-
skowa c proste zale zno sci (albo potwierdzi c te znajdowane w literaturze).
Chcieliby smy mc powiedzie c: Pr edko s c wiatru ma bardzo istotny wpyw
na poziomy zanieczyszcze n powietrza, jednak sieci neuronowe nie pozwa-
laj a na atwe uzyskanie takich informacji (jeden ze sposobw wyci agni ecia
takich wnioskw w ??).
DODATEK B. SZTUCZNE SIECI NEURONOWE 71
Wreszcie sieci s a najlepiej przebadan a metod a eksploracji danych do
podobnych zastosowa n.
B.2 Podstawy teoretyczne
Budowa neuronu w SSN
Sie c neuronowa jest w oglno sci pewnym ukadem po aczonych ze sob a
neuronw.
Neuron jest to struktura posiadaj aca wiele wej s c oraz jedno wyj scie.
Wyj scie to opisywane jest funkcj a:
w
out
= F
_
N

i=0
w
i
x
i
, p
_
(B.1)
gdzie:
F to tzw. funkcja aktywacji,
p to wektor parametrw tej funkcji,
x
i
to warto s c sygnau wej sciowego na i-tym wej sciu,
w
i
to waga i-tego wej scia.
By wyznaczy c warto s c wyj sciow a neuronu musimy wysumowa c wszystkie
jego wej scia (po pomno zeniu ich przez wspczynniki wag), a nast epnie
wykona c na tej liczbie jednoargumentow a funkcj e aktywacji.
Mo zliwe s a r zne funkcje aktywacji:
Funkcja signum Jest ona opisana wzorem
sgn(x) =
_

_
1 x < 0
1
2
x = 0
1 x > 0
(B.2)
Ta funkcja aktywacji bya u zywana w jednej z pierwszych prac nauko-
wych na temat sieci neuronowych[84].
Funkcja skokowa Heavisidea Jest ona opisana wzorem
H(x) =
_
_
_
1 x 0
0 x < 0
(B.3)
Funkcji tej u zywa si e w najprostszych modelach perceptronu
DODATEK B. SZTUCZNE SIECI NEURONOWE 72
Funkcja sigmoidalna Jest to w zasadzie uoglnienie funkcji signum:
f(x) =
1
1 +e
x
(B.4)
Jest to jedna z najcz e sciej u zywanych funkcji aktywacji. Ma ona jeden
parametr .
Nieunormowana funkcja Gaussa Jest to funkcja u zywana w sieciach
RBF oraz niektrych SVM:
f(x) = exp
_
(x a)
2
b
_
(B.5)
Sie c neuronowa
Rozwa zmy perceptron wielowarstwowy b ed acy jedn a z prostszych sieci
neuronowych. Ma on nast epuj ac a struktur e:
Perceptron skada si e z kilku warstw (przynajmniej z jednej) .
Neurony na s asiednich warstwach po aczone s a na zasadzie ka zdy z
ka zdym.
Neurony le z ace na tej samej warstwie oraz na warstwach nie s asia-
duj acych ze sob a nie s a po aczone.
Po aczenia w sieci perceptronu s a jednokierunkowe w kierunku
warstwy wyj sciowej, tj. stan neuronu na warstwie n nie ma wpywu
na stan neuronu na warstwach m > n.
W ostatniej warstwie, zwanej warstw a wyj sciow a, jest tyle neuronw,
ile sie c ma parametrw wyj sciowych.
Rysunek B.1: Symboliczny schemat neuronu
x
1
x
2
x
n
w
1
w
n
w
out
DODATEK B. SZTUCZNE SIECI NEURONOWE 73
Rysunek B.2: Przykady funkcji sigmoidalnej dla r znych warto sci para-
metrw
10 8 6 4 2 0 2 4 6 8 10
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
x

Funkcja sigmoidalna dla parametru = 0.5
Funkcja sigmoidalna dla parametru = 2
Funkcja sigmoidalna dla parametru = 10
Rysunek B.3: Przykady funkcji Gaussa dla r znych warto sci parametru a
10 8 6 4 2 0 2 4 6 8 10
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1


Zdenormalizowana funkcja gaussa dla parametru a = 0.5 i b = 0
Zdenormalizowana funkcja gaussa dla parametru a = 3 i b = 0
Zdenormalizowana funkcja gaussa dla parametru a = 15 i b = 0
DODATEK B. SZTUCZNE SIECI NEURONOWE 74
Pozostae warstwy nazywamy warstwami ukrytymi.
By wyznaczy c odpowied z sieci na okre slone wej scie nale zy:
Ustawi c warto sci na wej sciu pierwszej warstwy neuronw
Po kolei wyznacza c warto sci w poszczeglnych warstwach.
By stworzy c funkcjonuj ac a sie c neuronow a nale zy najpierw wybra c odpo-
wiedni a struktur e sieci. W przypadku perceptronu trzeba wybra c ilo s c
warstw ukrytych oraz wybra c ilo s c neuronu w ka zdej warstwie. Nast ep-
nie nale zy przeprowadzi c trening czyli operacj e, ktra ustali wagi po acze n
mi edzy neuronami oraz warto sci ewentualnych parametrw funkcji akty-
wacji.
Budowanie struktury sieci
Jest to najtrudniejsza i najbardziej czasochonna operacja. Jest najtrud-
niejsza, poniewa z jest niewiele twierdze n, ktre pozwalaj a rozstrzygn a c
kiedy jaka struktura sieci jest najlepsza i w zasadzie w wi ekszo s c me-
tod sprowadza si e do sprawdzenia wszystkich mo zliwych struktur sieci.
Jednak w wi ekszo sci przypadkw s a albo twierdzenia matematyczne, albo
dobrze dziaaj ace heurystyczne zasady, ktre pozwalaj a na ustalenie roz-
s adnych granic problemowi poszukiwania najlepszej struktury.
Dla perceptronu nale zy najpierw ustali c ilo s c warstw a nast epnie
ilo s c neuronw w ka zdej warstwie. Przy czym dane s a nast epuj ace twier-
dzenia matematyczne:
Twierdzenie 1 ((Hornik 1989)) Je sli : R R jest funkcj a aktywacji
funkcji, ktra nie jest funkcj a sta a, oraz : R
N
R
M
to funkcja ci aga

to istnieje sie c MLP posiadaj aca jedn a warstw e ukryt a, ktra aproksymuje
dowolnie dobrze. [56]
Do s c istotne w tym twierdzeniu jest to, ze rodzaj przyj etej funkcji akty-
wacji nie gra roli. Oczywi scie w mo ze on uatwia c, b ad z utrudnia c uczenie
sieci, jednak w praktyce starczy dla wszystkich neuronw wybra c funkcj e
sigmoidaln a z rozs adnym parametrem .
Twierdzenie 2 ((Hornik 1991) Je sli : R R jest funkcj a aktywacji
funkcji, ktra nie jest funkcj a sta a, oraz : R
N
R
M
to istnieje sie c
MLP, ktra aproksymuje dowolnie dobrze. [52, 53]

Dokadniej mwimy starczy zeby funkcja ta bya mierzalna w sensie Borela.


DODATEK B. SZTUCZNE SIECI NEURONOWE 75
O ile mamy matematyczny dowd, ze dwie warstwy starczaj a by aprok-
symowa c ka zd a nawet nieci ag a funkcj e

, to w praktyce stosuje si e sieci


MLP, ktra maj a wi ecej warstw. Po prostu niejednokrotnie atwiej jest
tak a sie c wytrenowa c.
Twierdzenie 3 (Kurkova 1992) Je sli : R R jest funkcj a aktywacji
funkcji, ktra nie jest funkcj a sta a, oraz : R
N
R
N
to funkcja ci aga to
do aproksymowania istnieje sie c o czterech warstwach, ktra aproksymuje
t a funkcj e.
Dodatkowo Kurkova podaje ograniczenia na ilo s c neuronw w poszcze-
glnych warstwach w zale zno sci od rodzaju funkcji i dokadno sci aproksy-
macji. [54, 55]
Funkcja celu
Funkcja celu

jest miar a tego jak dokadnie sie c odwzorowuje badany pro-


ces.
W praktyce u zywa si e kilku r znych funkcji celu.
Sposb w jaki predyktor generalizuje dane ucz ace zale zy od zdanej mu
funkcji celu (dlatego te z nie mo zna powiedzie c ze istnieje jaka s jedna kon-
kretna funkcja celu).
Przykady funkcji celu
We wzorach z
i
oznacza dan a zmierzon a a p
i
dan a przewidzian a.
Dla klasykatora:
err =
niepoprawne klasywikacje
wszystkie klasykacje
(B.6)

Sredni b ad absolutny (MAE

):

W przypadku modelowania zanieczyszcze n powietrza mo zemy zakada c ze (o ile w ogle


mo zna mwi c ze mamy do czynienia z funkcj a) funkcja ta jest ci aga.

Inaczej mwi si e rwnie z: funkcja wydajno sci/efektywno sci sieci.

Obok nazw podano obowi azuj ace w literaturze skrty


Require: sprawdz wektor liczb (prawdziwe dane pomiarowe dla odpowie-
nich punktw)
Require: przewid wektor liczb (dane przewidziane przez model)
Ensure: wynik skalar
1: wynik FUNKCJACELU(sprawdz, przewid)
Algorytm B.1 Deklaracja funkcji wydajno sci sieci
DODATEK B. SZTUCZNE SIECI NEURONOWE 76
err =
1
N
N

i=0
|p
i
z
i
| (B.7)

Sredni b ad wzgl edny (MAPE):


err =
1
N
N

i=0
|p
i
z
i
|
z
i
(B.8)
Jak atwo zauwa zy c, by MAPE by dobrze okre slony musi zachodzi c
z
i
= 0, w niniejszej pracy dane wprowadzane do sieci b ed a normalizowane
do zakresu (0, 1], jednak sposb normalizacji danych wej sciowych

powo-
duje, ze w z
i
mog a si e tra c zerowe elementy (jednak b edzie ich niewiele).
Metod e liczenia MAPE nale zy wi ec zmodykowa c:
err =
1
N

i=0
_
_
_
|p
i
z
i
|
z
i
z
i
= 0
0 z
i
= 0
(B.9)
przy czym N

to liczba elementw dla ktrych z


i
= 0.
Odchylenie standardowe:
err =
_

(z
i
p
i
)
2
N
(B.10)
W niniejszej pracy gwnie u zywan a funkcj a celu b edzie B.9.
Uczenie sieci
Uczenie sieci jest procesem takiego doboru wag po acze n pomi edzy neuro-
nami (oraz ewentualnych parametrw funkcji aktywacji) by funkcja celu
bya na zbiorze danych minimalna. Przy czym to, w jaki sposb sie c b edzie
odwzorowywa c dane, zale zy od minimalizowanej funkcji celu to jakie
sie c b edzie dawaa wyniki istotnie zale zy od podanej funkcji celu. Przykad
dotycz acy pola tematu pracy: je sli funkcj a celu b edzie MAPE, to sie c b e-
dzie popeniaa mniejsze absolutne b edy przy predykcji niskich st e ze n, a
je sli b edzie to MAE to absolutne b edy b ed a podobne dla caego spektrum
st e ze n.
W oglnym przypadku do uczenia sieci mo zna u zy c dowolnego algo-
rytmu z dziedziny teorii optymalizacji, ktry w przypadkach praktycznych
radzi sobie z silnie nieliniowymi funkcjami, ktre posiadaj a wiele mini-
mw lokalnych. W tej, wst epnej, cz e sci poprzestaniemy na takim opisie
problemu. Podam pewne praktyczne uwagi, ktre s a bardzo wa zne bez
wzgl edu na to jaki algorytm si e stosuje.

Opis algorytmu normalizacji w 4.8.


DODATEK B. SZTUCZNE SIECI NEURONOWE 77
Wybr pocz atkowych warto sci wag
By mc rozpocz a c trening sieci musimy mie c punkt pocz atkowy warto sci
wag. W j ezyku teorii optymalizacji musimy mie c punkt startowy, z kt-
rego rozpoczynamy optymalizacj e. Jedyn a metod a wyboru pocz atkowych
warto sci wag po acze n, ktra dziaa w przypadku oglnym, jest losowy wy-
br wag. Warto sci wag powinny by c losowane z rozkadu rwnomiernego,
najlepsze wyznaczenie granic owego rozkadu jest przedmiotem bada n teo-
retycznych (w [47] podano r zne mo zliwe wyznaczane przez teoretykw
warto sci).
Problem przeuczenia sieci
Immanentn a cz e sci a ka zdego zestawu danych empirycznych jest jaka s ilo s c
szumu, ktra mu towarzyszy

. O przeuczeniu mwimy kiedy sie c zamiast


poprawnie generalizowa c dane zaczyna przystosowywa c si e do szumw,
ktre s a ich cz e sci a[48]. Zjawisko to jest gro zne poniewa z mo ze powodo-
wa c spadek zdolno sci generalizacyjnej sieci. Praktyczn a konsekwencj a ist-
nienia tego problemu jest konieczno s c wprowadzenia algorytmu treningu
i walidacji sieci, ktry jest opisany w sekcji 4.8.
B.3 Poj ecie cechy
Rozwa zmy problem modelowania zanieczyszcze n powietrza. Danymi wej-
sciowymi do modelowania musz a by c parametry pogodowe z danej chwili
czasu oraz z chwil poprzednich (lub nast epnych). Instancja

b edzie miaa
du zy wymiar, jednak dane te b ed a ze sob a w jaki s sposb skorelowane.
Niskie zachmurzenie, b edzie powodowao wzrost nasonecznienia a zatem
temperatury; deszcz powoduje spadek temperatury; wysokie ci snienie b e-
dzie budowao ukady wy zowe ktre wpyn a na pozostae parametry (do-
kadny opis tych zjawisk jest w tej cz e sci pracy nieistotny). Mwi ac ogl-
niej mamy problem ktry da si e opisa c tak: dane maj a wiele wymiarw
oraz poszczeglne wymiary s a ze sob a skorelowane

. Cz esto SSN gorzej


generalizuj a silnie skorelowane sygnay, wi ec chcieliby smy jako s ograni-
czy c wymiar instancji wej sciowej jednak bez istotnej utraty informacji.
Stosuje si e wtedy ukady wst epnie przetwarzaj ace dane wej sciowe, ktre

W przypadku modelowania zanieczyszcze n srodowiska jest to szczeglny problem jak


byo wspominane dyrektywa[14] dopuszcza 25% niepewno sci pomiaru poziomu PM.

Termin zwi azany z SSN, wyja snienie w dodatku w dodatku A.

Przykad jest troch e naci agany stacje pomiaru zanieczyszcze n powietrza cz esto daj a
tylko podstawowe parametry pogodowe wi ec nie mamy tutaj kl eski urodzaju.
DODATEK B. SZTUCZNE SIECI NEURONOWE 78
dokonuj a takich operacji jak kompresja stratna, odszumowanie i wyzna-
czenie istotnych cech sygnau

.
Wynik pracy takiego ukadu dokonuj acego wst epnego przetwarzania
dalej stanowi dane wej sciowe do SSN i jest nazywany instancj a cech

. Opis
dziaania takiego ukadu na rys. B.4. Fakt, ze tego typu ukady s a z r z-
nych przyczyn implementowane jako SSN nie jest istotny dla dalszej ana-
lizy.
Przykadami metod wst epnego przetwarzania danych s a takie metody
jak PCA, BSS, transformata falkowa. PCA i BSS s a metodami, ktre po-
zwalaj a zmniejszy c wymiar instancji z minimaln a utrat a informacji, wy-
korzystuj a one korelacje pomi edzy poszczeglnymi elementami instancji.
Transformata falkowa b edzie szerzej opisana w C.
B.4 Kroki potrzebne do zbudowania modeli opartego
na SSN
By zbudowa c dziaaj acy model oparty o SSN

, nale zy wykona c nast epu-


j ace kroki:

Zauwa zmy ze wszystkie te operacje s a do siebie bardzo podobne. Dla przykadu, do do-
konaniu kompresji stratnej obrazu pozbywamy si e z niego gwnie szumw. Po kompresji
zbioru instancji o wymiarze N do takiego o wymiarze M N poszczeglne elementy skom-
presowanego zbioru b ed a bardziej istotne.

Nie znalazem w polskim pi smiennictwie odpowiadaj acego terminu. Sowo cecha jest
tumaczeniem terminu feature zaczerpni etego z pi smiennictwa angloj ezycznego.

Poni zsze uwagi mo zna rwnie z zastosowa c do dowolnego modelu opartego na eksploracj e
danych.
Rysunek B.4: Sie c z ukadem wst epnie przetwarzaj acym dane. Ilustracja
poj ecia cecha.
Wstpne
przetwarzanie
(PCA, BSS,
transformata falkowa)
SSN
Instancja wejciowa
danych o wymiarze
np. 100 000
Instancja cech o
o znacznie mniejszym
wymiarze (np. 50)
DODATEK B. SZTUCZNE SIECI NEURONOWE 79
Ustalenie typu modelu Ustalenie jakiej sieci neuronowej u zy c itp.
Ustalenie danych wej sciowych i wyj sciowych do modelu Pierwszy krok
to ustalenie z jakich danych model korzysta i jakie parametry model
b edzie modelowa c.
Ustalenie przestrzeni cech ktre b ed a traa c do SSN Model mo ze do-
konywa c pewnych przeksztace n na danych wej sciowych. Na przy-
kad dokonywa c PCA, albo dyskretnej transformaty falkowej.
Ustalenie metaparametrw modelu Przed rozpocz eciemtreningu sieci
neuronowej nale zy ustali c wszystkie metaparametry

modelu. Dla
sieci SVM b ed a to parametry C, i , dla transformaty falkowej b e-
dzie to decyzja na ile falek dokona c rozkadu etc.
Wytrenowanie modelu Dokonanie treningu SSN.
B.5 Sieci SVM
B ed e koncentrowa si e na aspektach dotycz acych praktycznego wykorzy-
stania tych sieci. Szczeglny nacisk kad ac na wskazanie jak a rol e peni a
metaparametry w procesie budowania i treningu sieci.
Wprowadzenie do sieci SVM za [49].
Sieci SVM w zadaniu klasykacji problemu separowalnego
liniowo
Klasykacja problemu separowalnego liniowo jest najprostszym proble-
mem z jakim radz a sobie sieci SVM. Danych jest p par ucz acych w postaci
(x
i
, d
i
), gdzie x
i
to wsprz edne punktu natomiast d
i
to warto s c ze zbioru
{1, 1}.
W problemie tym mamy dwie klasy (przynale zno s c punktu x
i
do da-
nej klasy jest determinowana przez warto s c d
i
) punktw w przestrzeni N
wymiarowej, przy czym istnieje paszczyzna ktra te klasy rozdziela tj.
paszczyzna o rwnaniu:
g(x) = 0,
gdzie:
g(x) = w
T
x +b. (B.11)

Termin zwi azany z SSN, wyja snienie w dodatku w dodatku A.


DODATEK B. SZTUCZNE SIECI NEURONOWE 80
Paszczyzna ta okre sla przynale zno s c do dwch grup w nast epuj acy
taki sposb ze je sli dla punktu ze:
d
i
= sgn(g(x
i
)) (B.12)
By separacja klas bya mo zliwie dobra, chcieliby smy by paszczyzna se-
paracji le zaa mo zliwie daleko od punktw nale z acych do obu klas, wpro-
wadzamy wi ec tzw. margines separacji czyli obszar wok paszczyzny
separacji w ktrym nie ma zadnych punktw. By stworzy c tzw. margines
separacji mi edzy tymi klasami zmieniamy warunek B.12 na:
d
i
=
_
_
_
1 g(x
i
)
1 g(x
i
)
(B.13)
dla zwi ezo sci notacji opuszcza si e zmienn a odpowiednio dziel ac przez
ni a obie strony nierwno sci przez, a nast epnie modykuj ac warto sci w
T
oraz b. Warunek B.13 mo zemy wi ec zapisa c jako:
d
i
=
_
_
_
1 g(x
i
) 1
1 g(x
i
) 1
(B.14)
Warunek mo zna przepisa c do postaci do postaci:
d
i
g(x
i
) 0 (B.15)
Je sli para (x
i
, d
i
) spenia warunek:
g(x
i
)| {1, 1}, (B.16)
wtedy le zy ona na brzegu marginesu separacji i nazywany jest wekto-
rem wsparcia

. Punkty takie s a najtrudniejsze w klasykacji, dodatkowo


tylko one uczestnicz a w procesie maksymalizacji marginesu separacji.
W praktyce poszukuje si e nie dowolnej paszczyzny separacji a optymal-
nej paszczyzny separacji, tj takiej paszczyzny dla ktrej margines sepa-
racji jest najwi ekszy. Odlego s c od mi edzy wektorem

podtrzymuj acym a
paszczyzn a separacji wyra za si e wzorem:
r =
g(s
sv
)
x
, (B.17)
DODATEK B. SZTUCZNE SIECI NEURONOWE 81
Wyznaczenie szeroko sci marginesu separacji
Wprowad zmy oznaczenia g
+
(x) to paszczyzna okre slaj aca grn a granic e
marginesu separacji, g

doln a granic e. Ustalamy dowolny punkt x


+
na
paszczy znie g
+
, oraz x

czyli najbli zszy do x


+
punkt na paszczy znie g

.
Podane oznaczenia rwnie z na rys B.5.
Stwierdzamy nast epuj ace fakty [65]:
w jest prostopade do g(x), g

(x), g
+
(x) (B.18)
x
+
= x

+w (B.19)
Mamy wi ec:
g(x
+
) = 1
w
T
x
+
+b = 1 (B.20)
wstawiamy do B.20 warunek B.19 i otrzymujemy:

Z ang. support vector

Mimo nazwy, wektor podtrzymuj acy to punkt.


P

a
s
z
c
z
y
z
n
a

s
e
p
a
r
a
c
j
i
g
+
g-
x+
x-
m
a
r
g
i
n
e
s

s
e
p
a
r
a
c
j
i
s
z
e
r
o
k
o

m
a
r
g
i
n
e
s
u

s
e
p
a
r
a
c
j
i
punkt klasy A
punkt klasy B
wektor wsparcia
specjalny punkt
Rysunek B.5: Margines separacji
DODATEK B. SZTUCZNE SIECI NEURONOWE 82
w
T
x

+b
. .
=g(x

)=1
w
T
w = 1, (B.21)
mamy zatem:
=
2
w
T
w
. (B.22)
Szeroko s c marginesu separacji wyra za si e zatem wzorem:
M =

x
+
x

= |w| = |w| =
2 |w|
w
T
w
=
2

w
T
w
=
2
|w|
(B.23)
Uczenie liniowego klasykatora SVM
Klasykator SVM d a zy do maksymalizacji marginesu separacji, wi ec by go
wytrenowa c nale zy rozwi aza c problem:
max{M} min
_
w
T
w
_
przy dodatkowym warunku B.14, ktry mo zna zapisa c te z w postaci:
d
i
g(x
i
) 1. (B.24)
Jest to problem programowania kwadratowego i jest on rozwi azywany
metod a mno znikw Lagrangea, polegaj acej na minimalizacji funkcji La-
grangea:
J(w, b, ) =
1
2
w
T
w
p

i=0

i
_
d
i
_
w
T
x
i
+b
_
1
_
(B.25)
Problem ten mo zna rozwi aza c, rozwi azuj ac tzw. problem dualny

, ktry
okre sla si e nast epuj aco:
max
_
_
_
p

i=0

i

1
2
p

i=0
p

j=0

j
d
i
d
j
x
T
i
x
j
_
_
_
(B.26)
przy warunkach:

i
0 (B.27)
p

i=1

i
d
i
= 0 (B.28)

Dokadne wyprowadzenie w [49]


DODATEK B. SZTUCZNE SIECI NEURONOWE 83
Rozwi azanie tego problemu pozwala wyznaczy c wektor wagw i wsp-
czynnik b optymalnej paszczyzny za pomoc a zale zno sci:
w =
p

i=0

i
d
i
x
i
(B.29)
b = 1 w
T
x
sv
(B.30)
Liniowe klasykatory SVM dla problemw
nieseparowalnych liniowowo
Nawet dla problemw w ktre co do zasady powinny by c separowalne li-
niowo, szum wyst epuj acy w danych mo ze spowodowa c to ze pewne punkty
tra a na z a stron e paszczyzny separacji. Algorytmy opisane w poprzed-
nim paragrae nie radz a sobie z takim przypadkiem (warunek B.13 nie
uwzgl ednia mo zliwo sci wyst epowania punktw w marginesie separacji).
Wproblemie tymstara si e znale z c paszczyzn e ktra minimalizuje szans e
b ednej klasykacji, w tym celu przeksztaca si e rwnanie B.15 do postaci:
d
i
g(x
i
) 1
i
, (B.31)
Parametr
i
pozwala efektywnie zmienia c rozmiar marginesu toleran-
cji dla ka zdego punktu i jest z zao zenia wi ekszy od zera.
i
z zakresu
(0; 1) oznacza ze dany punkt jest wewn atrz marginesu tolerancji, jednak
po prawidowej stronie paszczyzny separacji (tj. b edzie prawidowo skla-
sykowany. Je sli
i
> 0 punkt zostanie b ednie sklasykowany.
Problem znalezienia wag sieci sprowadza si e wi ec do rozwi azania zmo-
dykowanego problemu B.26:
min {(w, )}
1
2
w
T
w+C
p

i=1

i
, (B.32)
przy ograniczeniach:
d
i
g(x
i
) 1
i
, (B.33)

i
0 (B.34)
Problem ten rozwi azujemy analogicznie jak B.26.
Parametr C jest pierwszym ustalanym przez u zytkownika metapara-
metrem. Kontroluje on rwnowag e pomi edzy dwoma czonami minima-
lizowanego wyra zenia B.32, im wi ekszy parametr C, tym model rzadziej
b edzie pozwala c punkty pojawiaj ace si e wewn atrz marginesu separacji.
DODATEK B. SZTUCZNE SIECI NEURONOWE 84
Jego poprawna warto s c zale zy od tego jak bardzo podane klasy si e prze-
krywaj a tj. jak cz esto w naturalny sposb punkty ktre s a w klasie
d
i
= 1 traaj a do obszaru drugiej klasy. Zbyt maa warto s c parametru C
b edzie powodowaa ze model b edzie szed na skrty i b edzie pozwala na
zbyt wiele b ednych klasykacji, zbyt du za jego warto s c mo ze prowadzi c
do przeuczenia sieci.
Klasykatory SVM dla problemw nieliniowych
Problem nieseparowalny liniowo zdeniowany przestrzeni oryginalnej o N
wymiarach mo ze by c separowalny liniowo w innej przestrzeni o K wymia-
rach (nazwanej przestrzeni a cech

). Przy czym zazwyczaj N K.


Zastosowanie sieci SVMdo problemu nieseparowalnego liniowo ma dwa
kroki w pierwszym dokonuje si e transformacji do przestrzeni cech, a w
drugim rozwi azuje problem ju z separowany liniowo z u zyciem algorytmw
opisanych w B.5 i B.5.
W tym problemie rwnanie B.11 przyjmuje posta c:
g

(x) = w
T
(x) +b, (B.35)
gdzie jest funkcj a wektorow a : R
N
R
K
, ktra deniuje odwzo-
rowanie do przestrzeni cech. Problem ten rozwi azuje si e analogicznie jak
problemy poprzednie. Problem pierwotny mo zna zapisa c jako (jest on taki
sam jak w B.32):
min {(w, )}
1
2
w
T
w+C
p

i=1

i
, (B.36)
przy warunkach (tutaj zmiana w pierwszym warunku):
d
i
g

(x
i
) 1
i
, (B.37)

i
0 (B.38)
Problem dualny

, mo zna natomiast przedstawi c jako:


max
_
_
_
p

i=1

i

1
2
p

i=1
p

j=1

j
d
i
d
j
K(x
i
T
, x
j
)
_
_
_
(B.39)
przy warunkach:

Patrz te z B.3.

Pene wyprowadzenie w [49]


DODATEK B. SZTUCZNE SIECI NEURONOWE 85
C
i
0 (B.40)
p

i=1

i
d
i
= 0 (B.41)
Gdzie K (x
i
, x
j
) =
T
(x
i
) (x
j
), jest skalarn a funkcj a, zwan a funkcj a
j adra

. Po rozwi azaniu problemu dualnego mo zemy wrazi c g

(x) w j ezyku
wspczynnikw Lagrangea
1
oraz funkcji j adra:
g

(x) =
N
sv

i=0

i
d
i
K(x, x
i
) +b (B.42)
Wprowadzenie funkcji j adra powoduje ze nie trzeba bezpo srednio obli-
cza c warto sci funkcji wektorowej , co przy spiesza obliczenia.
Najcz e sciej u zywane funkcje j adra[44]
Liniowe:
K (x
i
, x
j
) = x
T
i
x
j
+ (B.43)
Wielomianowe:
K (x
i
, x
j
) =
_
x
T
i
x
j
+
0
_

1
(B.44)
Radialne:
K (x
i
, x
j
) = exp
_
x
i
x
j

2
_
(B.45)
Sigmoidalne:
K (x
i
, x
j
) = tgh
_

1
x
T
i
x
j
+
0
_
(B.46)
Parametry
n
s a traktowane jako metaparametry sieci.
Sieci SVM dla nieliniowego problemu regresji
Do tej pory pokazano wykorzystanie sieci SVMjako klasykatora, tj. ukadu
ktry jest w stanie przypisywa c sygnay wej sciowe do pewnych klas. Przy-
kadowo ukady tego typu s a w stanie stwierdzi c czy w danym dniu nast api
przekroczenie poziomw dopuszczalnych czy nie, jednak nie s a wstanie po-
da c poziomu zanieczyszczenia. Mwi ac sci slej r znica mi edzy problemem
klasykacji a regresji jest taka ze w parach ucz acych (x, d
i
), warto s c d
i
dla

z ang. kernel function.


DODATEK B. SZTUCZNE SIECI NEURONOWE 86
problemu klasykacji mo ze przyjmowa c warto sci {1; 0}, podczas gdy dla
problemu klasykacji d
i
R.
By sprowadzi c problem regresji do problemu programowania kwadra-
towego wprowadza si e nast epuj ac a funkcj e celu:
L

(d, g

(x)) =
_
0 dla |d g

(x)|
|d g

(x)| dla |d g

(x)|
(B.47)
Przy czym g

(x) jest deniowane tak samo jak w B.35:


g

(x) = w
T
(x) +b, (B.48)
Parametr jest metaparametrem sieci.
Dalsze wyprowadzenie nie przebiega w sposb istotnie r zny od wypro-
wadze n z poprzednich paragrafw, wi ec dla ustalenia uwagi ominiemy je.
Dodatek C
Dyskretna transformata
falkowa
Analiza falkowa zostaa wielokrotnie niezale znie odkryta przez specjali-
stw wielu dziedzin (matematykw, zykw, elektronikw, geologw)[59],
znalaza te z zastosowanie we wczesnych prbach modelowania ukadu per-
cepcji czowieka przy problemach takich jak: rozpoznawanie kraw edzi[61],
g ebi i ruchu. Jest ona zwi azana ze stosowaniem SSN, tylko w tym sensie,
ze jest powszechnie u zywan a technik a wst epnego przetwarzania zo zonych
sygnaw.
Wspcze snie jest stosowana do:
kompresji obrazw
analizy sygnaw w przestrzeni cz estotliwo sci i czasu
redukcji ilo sci sygnaw wej sciowych Mi edzy innymi przy przetwa-
rzaniu obrazw. Wysoko rozdzielcze obrazy przed podaniem sieci mu-
sz a by c przetworzone tak, by sie c ta miaa rozs adn a ilo s c neuronw
wej sciowych.
tworzenie cech Przy zo zonych problemach SSN cz esto nie s a w stanie
odpowiednio generalizowa c
Powy zszy rozdzia stanowi gwnie wprowadzenie terminw i poj e c, ktre
s a niezb edne do zrozumienia dyskretnej analizy falkowej, ni z samo for-
malne wprowadzenie tej analizy. Zrozumienie tych poj e c jest kluczowe do
stosowania tego narz edzia.
Punktem wyj scia do omawiania transformaty falkowej b edzie jej pre-
kursor Transformata Fouriera

W dalszej cz e sci tekstu zakadam ze Czytelnik zna transformat e Fouriera


87
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 88
C.1 Transformata Fouriera
Transformata Fouriera jest narz edziem pozwalaj acym przeksztaci c funk-
cj e dziaaj ac a w domenie czasu do domeny cz estotliwo sci. Ma ona nast e-
puj ac a denicj e:
F : C C (C.1)
Ff() =

f(x)e
2ix
dx (C.2)
gdzie F to transformata Fouriera przypisuj aca ka zdej funkcji f(x) funk-
cj e Ff().
Pozwala ona rozdzieli c funkcj e na skadniki o r znych cz estotliwo sciach.
Inaczej mwi ac, pozwala ona wyrazi c dowoln a funkcj e jako kombinacj e li-
niow a funkcji nale z acych do pewnej konkretnej bazy

. Wad a tego narz e-


dzia, ktra spowodowaa wprowadzenie do u zycia transformaty falkowej,
jest fakt, ze funkcje u zywane funkcje bazowe nie maj a ograniczonego no-
snika

, zatem bardzo utrudnione jest badanie przebiegw, w ktre zmie-


niaj a swj charakter w czasie, np. ich widmo cz estotliwo sci zmienia si e
w czasie, albo maj a periodyczn a struktur e, na ktr a nao zono punktowe
szumy. Lokalne szumy w sygnale s a w stanie zaburzy c cae furierowskie
widmo. Z tego samego powodu bardzo trudno jest u zywaj ac tego narz edzia
odtworzy c w widmie lokalne fenomeny.
Formalizm transformaty Furiera mo zna zastosowa c do takich proble-
mw jak: wyznaczenie ci agej transformaty funkcji ci agej (transformata
Fouriera), rozkad ci agej funkcji na przeliczalnie wiele funkcji bazowych
(szereg Fouriera), rozkad dyskretnego szeregu na dyskretny szereg (dys-
kretna transformata Fouriera).
Transformata falkowa dziaa, co do zasady, bardzo podobnie rwnie z
dokonuje rozkadu funkcji na funkcje bazowe, jednak te funkcje bazowe
maj a ograniczony no snik. Co za tym idzie, s a w stanie wydajniej analizo-
wa c funkcje, ktrych widmo cz estotliwo sciowe zale zy od czasu. Przykad
rozkadu funkcji maj acej r zne zmienne widmo cz estotliwo sci na rys. C.1.

Je sli baza ta b edzie ci aga mwimy o transformacie Fouriera, je sli baza ta b edzie
skada c ze sko nczonej ilo sci elementw mwimy o szeregi Fouriera.

No snik (termin topologiczny): domkni ecie zbioru argumentw funkcji, w ktrych ma ona
warto sci mniejsze od zera.
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 89
C.2 Porwnanie transformaty Fouriera i falkowej
ilo s c mo zliwych baz Wtransformacie Fouriera jest to zawsze jedna baza
zawieraj ace funkcje trygonometryczne. Dla transformaty falkowej
istnieje wiele r znych baz funkcji.
no snik funkcji bazowych Dla transformaty Fouriera jest to zawsze (; +).
Dla transformaty Fouriera natomiast no snik jest zawsze ograniczony
i r zny, dla r znych funkcji bazowych.
C.3 Budowanie rodziny falek
Falk a macierzyst a (x) nazywamy funkcj e, ktra spenia nast epuj ace warunki[57]:

(x) = 0 (C.3)
Rysunek C.1: Przykad ci agej transformaty falkowej
t
f(t)
(a) Funkcja transformowana
t

(b) Wynik transformacji


a
a
Kolor obrazuje warto s c transformaty w tym punkcie. Na osi odci etych
dany jest czas, na osi rz ednych cz estotliwo s c
Ilustracja ta jest zmodykowan a wersj a obrazu pobranego z
http://commons.wikimedia.org/wiki/File:Continuous_wavelet_transform.svg.
Plik oryginalnie wykonano za pomoc a srodowiska MATLAB
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 90
(x) = 1 (C.4)
Dodatkowo wymagamy, by funkcja ta nie miaa momentw o dowolnie
maych cz estotliwo sciach, inaczej mwi ac:

F()

< (C.5)
gdzie F() to transformata Fouriera falki macierzystej.
Z funkcji tej budujemy rodzin e falek:{
u,s
: j, k R}, ktra ma nast e-
puj ace wa sciwo sci:

u,s
= 2

s
2

_
t u
s
_
(C.6)
Wspczynniki u i s s a w ci agej transformacie falkowej rzeczywiste.
Dodatkowo wymagamy by:

j,k
;
u,s
= (j u)(k s) (C.7)
C.4 Ci aga transformata falkowa
Denicja ci agej transformaty falkowej:
W : C C (C.8)
Wf(u, s) = f,
u,s
=

f(t)

_
t u
s
_
dt (C.9)
Transformata odwrotna:
f(t) =

Wf(u, s)

_
t u
s
_
duds (C.10)
C.5 Analiza wielorozdzielcza
Analiza wielorozdzielcza pozwala rzutowa c sygna na ci ag przestrzeni funk-
cyjnych (V
j
), ktre mog a aproksymowa c okre slon a funkcj e. Przestrzenie te
intuicyjnie odpowiadaj a coraz wi ekszym stopniom szczegowo sci analizy.
Przybli zenie funkcji f w rozdzielczo sci 2
j
jest reprezentowane jako siatka
przybli ze n srednich funkcji f w obszarach o rozmiarze proporcjonalnym do
2
j
. Przestrze n V
j
zawiera wszystkie mo zliwe przybli zenia w rozdzielczo sci
2
j
, dodatkowo deniuje si e projekcj e f
j
V
j
, ktra jest funkcj a tak a, ze
f f
j
jest najmniejsze. Funkcja ta jest interpretowana jako przybli zenie
f na poziomie dokadno sci V
j
.
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 91
Przestrzenie V
j
speniaj a nast epuj ace aksjomaty[58]:
V
j
L
2
(R) (C.11)
V
j
jest podprzestrzeni a funkcji o sko nczonej energii, tj. dla ka zdej funk-
cji f nale z acej do V
j
speniony jest warunek

+

|f(t)|
2
dt < .
j Z, f(t) V
j
f
_
t
2
_
V
j+1
(C.12)
Intuicyjnie wraz ze wzrostem indeksu j maleje dokadno s c aproksyma-
cji funkcji (ro snie cz estotliwo s c prbkowania). Przy dwukrotnym podnie-
sieniu cz estotliwo sci funkcji przenosimy j a do wy zszej przestrzeni V
j
.
j Z, V
j+1
V
j
(C.13)
Przestrze n funkcji o ni zszej rozdzielczo sci zawiera si e w przestrzeni
funkcji o wy zszej rozdzielczo sci.
(j, k) Z
2
, f(t) V
j
f(t 2
j
k) V
j
(C.14)
Funkcje s a niewra zliwe na translacje o 2
j
.
lim
j+
V
j
=
+

j=infty
V
j
= {0} (C.15)
W bardzo niskiej skali nie mo zemy nic powiedzie c o aproksymowanej
funkcji.
lim
j
V
j
= domkniecie
_
_
+
_
j=
V
j
_
_
= L
2
(R) (C.16)
Dla dowolnie du zej skali aproksymacje zbiegaj a do aproksymowanej
funkcji f.
C.6 Funkcja skaluj aca
Najlepsza aproksymacja funkcji f w rozdzielczo sci 2
j
jest deniowana
jako ortogonalna projekcja P
v
j
f w V
j
. Wyra za si e ona za pomoc a funk-
cji skaluj acej , ktrej przeskalowania i przesuni ecia
j,n
tworz a ortonor-
maln a baz e V
j
. Metod e otrzymywania mo zna znale z c w [58].

j,n
(t) = 2

j
2

_
t n
2
j
_
(C.17)
gdzie n Z.
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 92
Najlepsz a aproksymacj a f w rozdzielczo sci 2
j
jest:
P
v
j
f =
+

n=
a
j
[n]
j,n
(C.18)
gdzie a
j
[n] = f,
j,n
=

f(t)
j,n
dt
Dodatkowo funkcje skaluj ace mo zna powi aza c z ltrami pasmowoprze-
pustowymi.
Poniewa z V
j
V
j1
oraz poniewa z
0,n
tworz a ortonormaln a baz e V
0
mo zemy napisa c:
1

_
t
2
_
=

nZ
h[n](t n) (C.19)
gdzie:
h[n] = f,
0,n
(C.20)
Wspczynniki h[n] b ed a interpretowane jako ltr pasmowoprzepustowy.
Rysunek C.2: Podzia przestrzeni czasu i cz estotliwo sci na poszczeglne
funkcje bazowe w dyskretnych transformatach

exp(i)
exp(2i)
exp(3i)
exp(4i)
exp(5i)
x
(a) Zwyka transformata Furie-
rowska

x
exp(i)
exp(2i)
exp(3i)
exp(4i)
exp(5i)
(b) Okienkowa transformata Fu-
rierowska

x
W(4,1)
W(3,1)
W(2,1)
W(3,2)
W(2,2) W(2,3) W(2,4)
W
(
1
,
1
)
W
(
1
,
2
)
W
(
1
,
3
)
W
(
1
,
4
)
W
(
1
,
5
)
W
(
1
,
6
)
W
(
1
,
7
)
W
(
1
,
8
)
(c) Dyskretna transformat fal-
kowa
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 93
C.7 Transformata falkowa a analiza wielorozdzielcza
Formalizm analizy falkowej jest blisko powi azany z analiz a wielorozdziel-
cz a. Zdeniujmy przestrze n W
j
, ktra stanowi r znic e pomi edzy przestrze-
niami V
j
i V
j1
. Intuicyjnie przestrze n W
j
b edzie zawiera c szczegy aprok-
symacji funkcji, ktre s a obecne w przestrzeni V
j1
, natomiast nie ma ich
w przestrzeni V
i
.
V
ji
= V
j
W
j
(C.21)
Zatem ortogonalna projekcja aproksymowanej funkcji f w V
j1
mo ze zo-
sta c napisana jako:
P
V
j1
f = P
V
j
f +P
W
j
f (C.22)
Dodatkowo mo zna udowodni c, ze da si e skonstruowa c baz e W
j
za po-
moc a przeskalowanej i przesuni etej falki . Baz a t a jest:
_

j,n
(t) = 2

j
2

_
t 2
j
n
2
j
__
(j,n)Z
(C.23)
Dla funkcji falkowych da si e rownie z zbudowa c powi azany z nimi ltr
pasmowoprzepustowy (oznaczany g[n]), ktry jest sci sle powi azany z l-
trem budowanym dla funkcji skaluj acej.
W analizie falkowej przedstawiamy aproksymacj e funkcji na poziomie
j 1 jako:
P
V
j1
f = P
V
j
f +P
W
j
f, (C.24)
co mo zna rwnie z zapisa c jako:
P
V
j1
=

j,k

j,k
+

j,k

j,k
, (C.25)
gdzie element:

k

k

j,k
(powi azany z funkcj a skaluj ac a) interpretu-
jemy jako aproksymacja funkcji na poziomie j, natomiast element

k

k

j,k
powi azany z funkcj a falkow a interpretujemy jako wzrost dokadno sci aprok-
symacji na poziomie j + 1.
Analogicznie mo zna post api c dla poziomu j, j + 1 itp, buduj ac w ten
sposb piramid e wielorozdzielczych aproksymacji sygnau. Algorytm szyb-
kiej transformaty falkowej pozwala badzo efektywnie wyznaczy c wsp-
czynniki
j,n
i
j,k
(zo zono s c obliczeniowa O(n), gdzie n to ilo s c prbek w
rozkadanym sygnale).
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 94
C.8 Szybka dyskretna transformata falkowa
Funkcja skaluj aca
Poj ecie funkcji skaluj acej mo zna te z wprowadzi c z poziomu samej transfor-
maty falkowej.
Celem naszych dziaa n jest wprowadzenie metody rozkadu funkcji na
sko nczon a liczb e falek. Ze wzgl edu na wyra zenie 2
j
x we wzorze ka zda
falka ma dwa razy mniejsz a cz estotliwo s c gwnej harmonicznej oraz zaj-
muje dwa razy mniejszy obszar pasma cz estotliwo sci. By pokry c w ten spo-
sb cae pasmo cz estotliwo sci nale zaoby u zy c niesko nczonej ilo sci falek,
co w praktycznych zastosowaniach oznaczaoby konieczno s c zastosowania
zbyt du zej ilo sci falek do osi agni ecia rozs adnej dokadno sci aproksymacji
sygnau. Stosuje si e wi ec funkcj e skaluj ac a, ktra przy danej ilo sci falek,
zapenia luk e w widmie cz estotliwo sciowym[61].
Dodatkowo uznajemy ze:

j,k
;
l,m
=
j,l

k,m
(C.26)
gdzie to funkcja skaluj aca.
Algorytm szybkiej transformaty falkowej
Ze wzgl edu na warunek C.5 falki s a blisko powi azane z poj eciem ltrw
pasmowo przepustowych. Filtry pasmowo przepustowe s a to narz edzia,
ktre dany sygna przeksztacaj a na sygna, z ktrego usuni eto zadane
cz e sci jego widma cz estotliwo sciowego. Intuicyjnie mo zna powiedzie c, ze
warunek C.5, ktry mwi ze widmo cz estotliwo sciowe falki ma ograniczony
no snik powoduje, ze operacja falki dziaaj a jak ltry pasmowoprzepustowe.
Rysunek C.3: Przykady falek falka Haara
0.2 0 0.2 0.4 0.6 0.8 1 1.2
1.5
1
0.5
0
0.5
1
1.5
(a) Falka Haara
0.2 0 0.2 0.4 0.6 0.8 1 1.2
0.4
0.2
0
0.2
0.4
0.6
0.8
1
1.2
1.4
(b) Funkcja skaluj aca Haara
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 95
Filtr h[n]

powi azany z funkcj a skaluj ac a b edziemy interpretowa c jako


powkowy ltr dolnoprzepustowy, natomiast ltr g[n], b edziemy interpre-
towa c jako powkowy ltr grnoprzepustowy. Sygna b edziemy oznacza c
jako f[n].
W pierwszym kroku algorytmu przepuszczamy sygna f przez ltry g i
h, po przeltrowaniu sygnau operujemy sygnaami o poowie mniejszym
widmie cz estotliwo sci to zgodnie z regu a Nyquista mo zemy odrzuci c co
drugi punkt z przeltrowanego sygnau. Operacjom tym odpowiadaj a ma-
tematyczne operacje
f
high
[n

] =

kZ
g[k]f[2n

k] (C.27)
f
low
[n

] =

kZ
h[k]f[2n

k] (C.28)
gdzie n

przebiega od 1 do
n
2
.
Skadniki f
high
[n

] stanowi a ju z gotowe wspczynniki rozkadu funkcji


f na najwy zszym poziomie dokadno sci. Do skadnikw f
low
[n

] stosujemy
podany algorytm ponownie.
C.9 Praktyczne aspekty transformaty falkowej
Pierwszym krokiem jest wybranie falki

oraz stopnia dekompozycji (czyli


ilo sci poziomw cz estotliwo sci falek

).

Dokadniej: h[n] oznacza n-ty czynnik w ci agu deniuj acym ten ltr.

W [62] zawarto list e falek i ich wasno sci i ktra mo ze stanowi c dobry pocz atek w tym
wyborze.

Na rysunku C.3c podano przykad transformaty falkowej dla stopnia dekompozycji rw-
nego 4.
Rysunek C.4: Przykady funkcji falkowych falka DB16
0 5 10 15 20 25 30 35
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
1
(a) Falka DB16
0 5 10 15 20 25 30 35
0.5
0
0.5
1
(b) Funkcja skaluj aca dla falki DB16
DODATEK C. DYSKRETNA TRANSFORMATA FALKOWA 96
Wybr stopnia dekompozycji
W naszym przypadku wybr stopnia dekompozycji jest ograniczony ilo sci a
dost epnych punktw pomiarowych. Dla dziesi ecioletniej historii pomiarw
przy 90% uzysku danych mamy ok 3100 punktw pomiarowych. P ka zdym
kolejnym kroku falka ma dwa razy mniejszy no snik atwo zauwa zy c ze
przy tej ilo sci punktw przy 13 falkach no snik najmniejszej funkcji b edzie
mniejszy ni z pojedynczy punkt. Wiemy rwnie z ze falki nie startuj a z ca-
ego zakresu

, wreszcie dziesi ecioletnia historia pomiarw to, w polskich


warunkach, wariant bardzo optymistyczny w praktyce pracujemy rw-
nie z na danych rocznych.
W praktyce wi ec b edziemy stosowa c rozkad na 5 6 falek.

Mwi ac formalniej: no sniki najwi ekszej falki jest mniejszy od caego zakresu danych.
Dodatek D
Teksty cytatw w tumaczeniu
wasnym w j ezyku oryginau
D.1 Cytaty z rozdziau pierwszego
Cytat ze strony 4
The body of evidence on health effects of PM at levels cur-
rently common in Europe has strengthened considerably over
the past few years. Both epidemiological and toxicological evi-
dence has contributed to this strengthening; the latter provides
newinsights into possible mechanisms for the hazardous effects
of air pollutants on human health and complements the large
body of epidemiological evidence. The evi- dence is sufcient
to strongly recommend further policy action to reduce levels of
PM. It is reasonable to assume that a reduction in air pollution
will lead to considerable health benets. [6]
Cytat ze strony 6
According to RAINS model estimates, cur- rent exposure to
PM from anthropogenic sources leads to the loss of 8.6 months
of life expectancy in Europe. The impacts vary from around 3
months in Finland to more than 13 months in Belgium.
The total number of premature deaths attributed to expo-
sure amounts to around 348 000 annually in the EU (25 coun-
tries).
Apart from effects on mortality, some 100 000 hospital ad-
missions per year can be attributed to exposure. Several other
97
DODATEK D. TEKSTY CYTATW W TUMACZENIU WASNYM W
J EZYKU ORYGINAU 98
impacts on morbidity are also expected to occur but the existing
database is weak, affecting the precision and reliability of the
estimates.
Current legislation related to the emission of pollutants is
expected to reduce impacts by around one third. A further re-
duction, down to around 50% of those estimated for current pol-
lution levels, could be achieved by implementing all currently
feasible emission reduction measures (the maximum feasible
reduction (MFR) scenario).[10]
D.2 Cytaty z rozdziau drugiego
Cytat ze strony 18[35]
A schematic description of a system, theory, or phenomenon
that accounts for its known or inferred properties and may be
used for further study of its characteristics: a model of genera-
tive grammar; a model of an atom; an economic model.
D.3 Cytaty z dodatkw
Oryginalny tekst cytatu ze strony 69
The fastest neuron switching times are known to be on the
order of 10
3
seconds quite slowcompared to computer switch-
ing speeds of 10
10
. Yet humans are able to make surpris-
ingly complex decisions, surprisingly quickly. For example, it
requires approximately 10
1
seconds to visually recognize your
mother. Notice that sequence of neuron rings that can take
place during this 10
1
second interval cannot be possibly longer
that few hundred steps, given the switching speed of single neu-
rons. This observation has led many to speculate that the infor-
mation processing abilities of biological neural systems must
follow from highly parallel processed operating on representa-
tions that are distributed on many neurons. One motivation for
ANN systems is to capture this kind of highly parallel compu-
tation based on distributed representations.[45]
Dodatek E
Sownik terminw
informatycznych
Wszystkie okre slenia cytowane s a za Wikipedi a. Autor pozwoli sobie na
u zycie tego zrda tutaj poniewa z:
Informacje te nie dotycz a gwnej tre sci pracy, a jedynie wyja sniaj a
informatyczne poj ecia u zywane w tym rozdziale.
Autor uznaje, ze jest w stanie sam zwerykowa c poprawno s c tych
artykuw w encyklopedii.
API (z ang Application Interface) sci sle okre slony zestaw regu, za po-
moc a ktrego programy si e komunikuj a.
framework (z ang. rusztowanie) framework jest szkieletem do budowy
aplikacji. Deniuje on struktur e aplikacji oraz oglny mechanizm jej
dziaania, a tak ze dostarcza zestaw komponentw i bibliotek ogl-
nego przeznaczenia do wykonywania poszczeglnych zada n.
ORM (z ang. Object Relational Mapping odwzorowywanie obiektw na
relacje) to sposb odwzorowywania danych mi edzy systemem napi-
sanym w j ezyku programowania orientowanym obiektowo, oraz rela-
cyjn a baz a danych
JAVA Wspczesny, wieloplatformowy, j ezyk programowania.
JRE (z ang Java Runtime Enviorment) srodowisko uruchomieniowe pro-
gramw napisanych w j ezyku Java, skadaj ace si e z maszyny wirtu-
alnej oraz obszernej biblioteki klas
99
DODATEK E. SOWNIK TERMINW INFORMATYCZNYCH 100
JDBC (z ang Java Database connectivity) niskopoziomowe API pozwa-
laj ace na aczenie si e z bazami danych z programw napisanych w
j ezyku Java. API to jest standardow a cz e sci a JRE.
JPA (z ang. Java Persistence API) wysokopoziomowe API pozwalaj ace
na aczenie si e z bazami danych. Zapewnia ono ORM. API to jest
standardow a cz e sci a JRE[82].
XML (z ang Extensible Markup Language) rozszerzalny format danych,
ktry ma dobre metody integracji z wi ekszo sci a wspczesnych j ezy-
kw
JAXB (z ang Java architecture for XML binding) wysokopoziomowe API
pozwalaj ace na przetwarzanie danych w formacie XML z poziomu
programu Java
DBMS (z ang. database management system system zarz adzaj acy ba-
zami danych) to program umo zliwiaj acy innym programom dost ep do
danych i ich modykacj e.[73]
SQL (z ang. structured query language strukturalny j ezyk zapyta n)
j ezyk pozwalaj acy tworzy c zapytania, ktre pobieraj a dane z bazy da-
nych, modykuj a dane wniej zawarte oraz zmieniaj a jej struktur e[74]
schemat bazy danych opis systemu bazodanowego w formalnym j ezyku
wspieranym przez konkretny DBMS, ktry okre sla sposb organiza-
cji danych, wi ezy spjno sci itp.[71]
kwerenda (inaczej zapytanie) precyzyjne okre slenie zestawu danych jaki
ma zosta c pobrany
klucz gwny poj ecie z zakresu baz danych. Oznacza minimaln a infor-
macj e na temat wiersza danej tabeli ktra jednoznacznie w wiers
normalizacja bazy danych Celem normalizacji bazy danych jest mini-
malizowanie redundancji (nadmiarowo sci) informacji czyli likwido-
wanie sytuacji, w ktrych albo ta sama informacja przechowywana
jest w wielu miejscach, jak rwnie z minimalizowanie ilo sci informa-
cji, ktre od siebie wspzale z a.
logika aplikacji (synonimicznie: logika biznesowa

) zestaw zachowa n,
ktre powoduj a, ze aplikacja realizuje swoje zadania (w przypadku
aplikacji biznesowej jest to realizacja odpowiednich zada n w rmie;

Po angielsku spotyka si e te z termin domain logic


DODATEK E. SOWNIK TERMINW INFORMATYCZNYCH 101
w naszym przypadku b ed a to zachowania powoduj ace, ze baza da-
nych b edzie spenia c wymagania opisane w 4.1). [75, 76]
funkcja skrtu Jest to matematyczna funkcja, ktra dowolnie dug a liczb e

przetwarza na liczb e staej dugo sci zwan a skrtem[77, 78]. Funkcje


skrtu maj a nast epuj ace wa sciwo sci:
pseudolosowo s c: Maa zmiana w warto sci oryginalnej powo-
duje du z a zmian e w skrcie jej przypisanej.
jednorodno s c: Dla rozs adnego

zbioru liczb wej sciowych ich


skrty b ed a tworzyy rozkad jednorodny.
metadane Dane opisuj ace dane ich pochodzenie, kontekst, zawarto s c.
[80]
index Wbazach danych jest to metoda przy spieszaj aca wykonywanie kwe-
rend dziaaj acych na jakiej s kolumnie (lub zestawie kolumn) kosztem
zwolnionego zapisu do tej kolumny oraz zwi ekszenia ilo sci informacji
przechowywanych na dysku.
widok danych (inaczej nazywany rwnie z perspektyw a) Jest to wirtu-
alna tabela, ktrej warto sci wyliczane s a na bie z aco z zawarto sci in-
nych tabel w bazie danych. [79]

A zatem w dowolny rodzaj danych.

W scisym, matematycznym, sensie zawsze da si e tak wybra c dane wej sciowe, by warto-
sci skrtw tych danych miay nierwnomierny rozkad. Jednak wymaga si e, by dla prawdzi-
wych danych, na jakich dana funkcja skrtu ma pracowa c rozkad ten by rwnomierny.
Dodatek F
Zawarto s c pyty i
uruchomienie projektu
F.1 Zawarto s c pyty
Pyta zawiera nast epuj ace katalogi:
hajmon Gwny projekt Java, zawieraj acy gwne elementy systemu do-
st epne z poziomu j ezyka Matlab.
hajmon-importer Projekt zawieraj acy kod importuj acy dane z poszcze-
glnych zrde.
hajmon-mysql Schemat bazy danych.
hajmon-matlab Projekt matlaba.
praca-mgr Elektroniczna wersja pracy magisterskiej.
F.2 Uruchomienie projektu
Kompilacja kodu Java
Wszystkie projekty budowane s a za pomoc a systemu budowania Maven.
Wszystkie wspczesne IDE Java zawieraj a wtyczki obsuguj ace ten sys-
tem.
By zbudowa c ten konkretny projekt nale zy b ed ac w jego katalogu gw-
nym wpisa c polecenie mvn install. By zbudowa c projekt hajmon nale zy
wykona c nast epuj ace polecenia:
cd hajmon
mvn install
102
DODATEK F. ZAWARTO

C PYTY I URUCHOMIENIE PROJEKTU103


By zbudowa c projekt hajmon-importer nale zy najpierw zbudowa c pro-
jekt hajmon.
Uruchomienie bazy danych
Tworzenie podstawowego schematu bazy danych
Podstawowy schemat bazy danych tworzony jest przez projekt hajmon. By
go stworzy c nale zy:
wpliku hajmon/hajmondb-beans/src/main/resources/META-INF/
persistence.xml ustawi c odpowiednie dane dost epowe do bazy da-
nych,
wykona c jak akolwiek czynno s c ktra spowoduje ze kod Java otworzy
po aczenie do bazy danych (np. wykona c jakie s zapytanie z poziomu
Matlaba).
Stworzenie tabel u srednionych
By stworzy c tabele zawieraj ace u srednione dane nale zy wykona c skrypt
add-to-schema.sql z katalogu hajmon-matlab.
Uruchomienie projektu matlaba
By uruchomi c projekt matlaba nale zy doda c do scie zki classpath Matlaba
plik entrypoint-1.0-jar-with-dependencies.jar, ktry znajduje si e
w katalogu gwnym projektu.
Plik ten mo zna stworzy c uruchamiaj ac polecenie:
cd hajmon
mvn install assembly:single
po wykonaniu tej sekwencji polece n plik ten b edzie si e znajdowa c w kata-
logu hajmon/target.
Bibliograa
[1] C A Pope 3rd: Epidemiology of ne particulate
air pollution and human health: biologic mechani-
sms and whos at risk?; W: Enviormental Health
Perspectives [online]; Nr. 108 Sierpie n 2000 str 713-
723 [dost ep 22 kwietnia 2011]; Dost epny w internecie:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1637679/

.
[2] Tam ze str. 715
[3] Tam ze str. 714 715
[4] C A Pope, 3rd, D V Bates oraz M E Raizenne, He-
alth effects of particulate air pollution: time for
reassessment?; W: Enviormental Health Perspecti-
ves [online]; Nr. 103(5) Maj 1995 str 473-480 [do-
st ep 22 kwietnia 2011]; Dost epny w internecie:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1523269/

[5] Joint WHO / Convention Task Force on the Health


Aspects of Air Pollution: Health risks of particulate
matter from long-range transboundary air pollution
[online]; WHO Europe 2006 [dost ep z 15 marca 2011];
Dost epny w Internecie: http://www.euro.who.int/en/what-
we-do/health-topics/environmental-health/air-
quality/publications/pre2009/health-risks-of-particulate-
matter-from-long-range-transboundary-air-pollution

[6] Tam ze str. 11


[7] Tam ze str. 15

Skrcony link: http://tinyurl.com/ehp-epid

Skrcony link: http://tinyurl.com/pm10-health

Mo zna si e te z otworzy c ten dokument za pomoc a skrconego URL: http://tinyurl.


com/who-transbound.
104
BIBLIOGRAFIA 105
[8] Tam ze str. 17
[9] Tam ze str. 12 15
[10] Tam ze str. 89
[11] Tam ze rozdzia 5.3 str. 44 49
[12] Tam ze str. 46
[13] Tam ze str. 51
[14] Parlament Europejski i rada Unii Europejskiej; Dy-
rektywa Parlametu Europejskiego i Rady Europy
2008/50/WE z dnia 21 maja 2008 r. w sprawie jako sci
powietrza i czystszego powietrza dla Europy [dost ep
z dnia 12 lutego 2011] W: Dziennik Urz edowy L 152
, 11/06/2008 P. 0001 - 0044; Dost epny w Internecie:
http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=
OJ:L:2008:152:0001:0044:PL:PDF

.
[15] Tam ze artyku 1 dyrektywy; strona 152/3
[16] Tam ze artyku 2 dyrektywy; strona 152/3 152/6
[17] Tam ze za acznik I; strona 152/14
[18] Tam ze; punkt 11 na stronie 152/2
[19] Aneta Duda: Zastosowanie modelu numerycznego do ana-
lizy rozprzestrzeniania si e zanieczyszcze n w Lublinie; Po-
st epy Nauki i Techniki nr 2; str. 62 70; 2001
[20] . A. Sahin, C. Bayat, and O. N. Uan: Application of cel-
lular neural network (CNN) to the prediction of missing air
pollutant data; Atmospheric Research, vol. 101, no. 1-2, pp.
314-326, Mar. 2011.
[21] L. O srdka, M. Wojtylak, E. Krajny, and K. Klejnowski:
Proposal method of estimation PM2.5 concenrtaion on base
measurements PM10 for application in short-range air qu-
ality forecast in gornoslaska agglomeration, in Ochrona po-
wietrza w teorii i praktyce Vol. 2, vol. II, J. Konieczy nski,
Ed. Instytut Podstaw In zynierii

Srodowiska PAN w Zabrzu,
2008, pp. 115-122.

Link skrcony tinyurl.com/eu-pm10


BIBLIOGRAFIA 106
[22] J. H. Garca, W.-W. Li, N. Crdenas, R. Arimoto, J. Wal-
ton, and D. Trujillo, Determination of PM2.5 sources using
time-resolved integrated source and receptor models., Che-
mosphere, vol. 65, no. 11, pp. 2018-27, Dec. 2006.
[23] Norma PN-ISO 7708: Jako s c powietrza. Denicje frakcji
pyu stosowane przy pobieraniu prbek do oceny zagro zenia
zdrowia.
[24] Autorzy Wikipedii; Haso: "Particulate" [on-
line],; W: Wikipedia, The Free Encyclopedia [do-
st ep 15 marca 2011] Dost epny w Internecie:
http://en.wikipedia.org/w/index.php?title=Particulate&oldid=
405969186

.
[25] Sekretariat traktatu LRTAP; Non-compliance by
Spain with the Protocol on Volatile Organic Com-
pounds or their Transboudary Fluxes to the Co-
nvention on Long-range Transboundary Air Pollu-
tion [dost ep 8 sierpnia 2011]; dost epny w Internecie
http://live.unece.org/leadmin/DAM/env/lrtap/ExecutiveBody
/CLRTAP%20Spain%20Violation%20of%20VOC%20Protocol.
edited.ae.pdf.
[26] Tekst traktatu o transgranicznym przenoszeniu za-
nieczyszcze n powietrza na dalekie odlego sci [on-
line]; Ekonomiczna Komisja ONZ dla Europy [do-
st ep z dnia 23 kwietnia 2011]; Dost epny w Internecie
http://www.unece.org/env/lrtap/full%20text/1979.CLRTAP.e.pdf

[27] Protokoy do traktatu o transgranicznym przenosze-


niu zanieczyszcze n powietrza na dalekie odlego sci [on-
line]; Ekonomiczna Komisja ONZ dla Europy; [do-
st ep z dnia 23 kwietnia 2011]; Dost epny w internecie
http://www.unece.org/env/lrtap/status/lrtap_s.htm

[28] Parlament Europejski i rada Unii Europejskiej; Dy-


rektywa 2004/107/WE Parlamentu Europejskiego i
Rady z dnia 15 grudnia 2004 r. w sprawie arsenu,

Link skrcony: http://tinyurl.com/wiki-particulate

Skrcony link: http://tinyurl.com/emep-lrtap

Skrcony link: http://tinyurl.com/emep-lrtap


BIBLIOGRAFIA 107
kadmu, rt eci, niklu i wielopier scieniowych w eglo-
wodorw aromatycznych w otaczaj acym powietrzu;
W: Dz.U. L 23 z 26.1.2005, str. 316 [dost ep z dnia
15 marca 2011]; Dost epny w Internecie: http://eur-
lex.europa.eu/LexUriServ/LexUriServ.do?uri=CELEX
:32004L0107:PL:NOT

[29] K. Siwek, S. Osowski, and M. Sowi nski: Neural Predictor


Ensemble for accurate forecasting of PM10 pollution; w In-
ternational Joint conference on Neural Networks, 2010.
[30] M. Tainio et al., Uncertainty in health risks due to anth-
ropogenic primary ne particulate matter from different so-
urce types in Finland, Atmospheric Environment, vol. 44,
no. 17, pp. 2125-2132, Jun. 2010.
[31] J. Hooyberghs, C. Mensink, G. Dumont, F. Fierens, and O.
Brasseur: A neural network forecast for daily average PM
concentrations in Belgium; Atmospheric Environment, vol.
39, no. 18, pp. 3279-3289, Jun. 2005.
[32] Strona internetowa

Sl askiego Wojewodzkiego Inspektoratu
Ochrony

Srodowiska; http://spjp.katowice.pios.gov.pl/; Do-
st ep z dnia 16-01-2011r
[33] Strona internetowa

Sl askiego Wojewodz-
kiego Inspektoratu Ochrony

Srodowiska;
http://spjp.katowice.pios.gov.pl/model_prognozy_jakosci_
powietrza.aspx; Dost ep z dnia 16-01-2011r
[34] Strona internetowa fundacji ARMAAG ;
http://armaag.gda.pl/indeks_jakosci_powietrza/prognoza.htm;
Dost ep z dnia 16-01-2011r
[35] The Free Dictionary: Model [18 sierpnia 2011];
http://www.thefreedictionary.com/model
[36] Norma BS EN 12341:1999: Air quality. Determination of
the PM10 fraction of suspended particulate matter. Refe-
rence method and eld test procedure to demonstrate re-
ference equivalence of measurement methods

Skrcony link: http://tinyurl.com/eu-arsen


BIBLIOGRAFIA 108
[37] Norma PN-EN 12341: Jako s c powietrza. Oznaczanie frak-
cji PM10 pyu zawieszonego. Metoda odniesienia i procedura
badania terenowego do wykazania rwnowa zno sci metody
pomiarowej z metod a odniesienia
[38] Andrew S. Brown, Rachel E. Yardley, Paul G. Quin-
cey and David M. Buttereld: NPL REPORT DQL-
AS 015 Ambient Air Particulate Matter: Quantify-
ing Errors in Gravimetric Measurements [online]; Sty-
cze n 2005; ISSN 1744-0602; Dost epny w Internecie:
http://publications.npl.co.uk/npl_web/pdf/dql_as15.pdf; Do-
st ep z dnia 14 maja 2011
[39] Paul Quincey: Issues with reference PM and PM2.5 mo-
nitoring methods; Konferencja IAPSC

; 11 grudnia 2008
[40] David Buttereld, Paul Quincey: Measurement science is-
sues relating to PM10 and PM2.5 airborne particle [do-
st e 20 sierpnia 2011], Raport NPL; Dost epny w Internecie:
http://publications.npl.co.uk/npl_web/pdf/as15.pdf
[41] Peter H. McMurry: A review of atmospheric aerosol me-
asurements; Atmospheric Environment; Volume 34; Issues
12-14; 2000; Pages 1959-1999; ISSN 1352-2310;
[42] David Gobeli, Herbert Schloesser, Thomas Pottber: Met
One Instruments BAM-1020 Beta Attenuation Mass Moni-
tor US-EPA PM2.5 Federal Equivalent Method Field Test
Results; Met One Instruments Incorporated
[43] David C. Green, Gary W. Fuller, Timothy Baker: Deve-
lopment and validation of the volatile correction model for
PM10 - An empirical method for adjusting TEOM measu-
rements for their loss of volatile particulate matter; Atmo-
spheric Environment; Volume 43; Issue 13; April 2009; Pa-
ges 2132-2141; ISSN 1352-2310
[44] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin: A
Practical Guide to Support Vector Classication [online];
http://www.csie.ntu.edu.tw/cjlin/papers/guide/guide.pdf;
Dost ep z dnia 8 maja 2011;

Uwaga! Konferencja ta zawiera nierecenzowane materiay, jednak wi ekszo s c wnioskw


z tej prezentacji pokrywa si e z [40].
BIBLIOGRAFIA 109
[45] Tom M. Mitchell: Machine Learning; McGraw Hill. 1997
ISBN 0070428077
[46] Stanisaw Osowski: Sieci neuronowe do przetwarzania in-
formacji wydanie II; Ocyna wydawnicza Politechniki War-
szawskiej 2006; ISBN 8772076154
[47] Tam ze, str. 85 87.
[48] Tam ze, rozdzia 4.1 4.5
[49] Tam ze, rozdzia 6
[50] Tam ze, str. 317
[51] Robert Kosi nski: Sztuczne sieci neuronowe; WNT 2009;
ISBN 8320429838
[52] Kurt Hornik: Approximation capabilities of multilayer fe-
edforward networks; Neural Networks, Volume 4, Issue 2,
1991, Pages 251-257, ISSN 0893-6080,
[53] Vera Kurkova, Kolmogorovs theorem and multilayer neural
networks, Neural Networks, Volume 5, Issue 3, 1992, Pages
501-506, ISSN 0893-6080,
[54] Franco Scarselli, Ah Chung Tsoi, Universal Approxima-
tion Using Feedforward Neural Networks: A Survey of
Some Existing Methods, and Some New Results, Neural Ne-
tworks, Volume 11, Issue 1, 12 January 1998, Pages 15-37,
ISSN 0893-6080,
[55] Kurkova, V., 1992. , Kolmogorovs theorem and multilayer
neural networks. Neural Networks 5, pp.
[56] Kurt Hornik, Maxwell Stinchcombe, Halber White: Multi-
layer Feedforward Networks are Universal Approximators;
Neural Networks, vol 2 1989; ISSN: 0893-6080
[57] Mallat S: A Wavelet Tour of Signal Processing: The Sparse
Way; 2009; ISBN: 978-0-12-374370-1; str. 102;
[58] Tam ze; Rozdzia 7.1.1; str. 264 i nast epne
[59] Graps, A.: "An introduction to wavelets" W: Computational
Science & Engineering IEEE; Vol.2, No.2 [Lato 1995] Strony
5061
BIBLIOGRAFIA 110
[60] Gargour C., Gabrea M., Ramachandran V., Lina, J.-M. : "A
short introduction to wavelets and their applications" W:
Circuits and Systems Magazine IEEE; Vol.9, No.2 [Drugi
kwarta 2009]; Strony: 5768
[61] Mallat, S.G: "A theory for multiresolution signal decompo-
sition: the wavelet representation" W: Pattern Analysis
and Machine Intelligence, IEEE Transactions on [Czerwiec
1989]; Vol.11, No.7; str: 674-693; ISSN: 0162-8828
[62] Wavelet Browser by pyWawelets [online]; [dost ep: 8 maja
2011]; strona internetowa: http://wavelets.pybytes.com/
[63] Wavelet Tutorial [online]; [online]; [do-
st ep: 8 maja 2011]; strona internetowa:
http://users.rowan.edu/polikar/WAVELETS/WTtutorial.html
[64] Strona internetowa The atmospheric studies group;
http://www.src.com/calpuff/calpuff1.htm; Dost ep z dnia 16-
01-2011r
[65] Andrew Moore: Tutorial slides, Support Vector Machi-
nes [dost ep: 17 sierpnia 2008]; Dost epny w internecie:
http://www.autonlab.org/tutorials/svm.html;
[66] Neep Hazarika, Jean Zhu Chen, Ah Chung Tsoi, Alex Serge-
jew: Classication of EEG signals using the wavelet trans-
form W: Signal Processing; Vol. 59, Issue 1 [Maj 1997];
strony 6172
[67] Twrcy Wikipedii: API [online];
http://en.wikipedia.org/w/index.php?title=Application_
programming_interface&oldid=428037577; Dost ep z dnia
26 kwietnia 2011
[68] Twrcy Wikipedii: Mapowa-
nie obiektowo-relacyjne [online];
http://pl.wikipedia.org/w/index.php?title=Mapowanie_
obiektowo-relacyjne&oldid=26375247; Dost ep z dnia 26
kwietnia 2011
[69] Twrcy Wikipedii: JRE [online];
http://pl.wikipedia.org/wiki/JRE; Dost ep z dnia 26 kwietnia
2011
BIBLIOGRAFIA 111
[70] Twrcy Wikipedii: Framework [online];
http://pl.wikipedia.org/w/index.php?title=Framework&oldid=
25332682; Dost ep z dnia 26 kwietnia 2011
[71] Twrcy Wikipedii: Database schema [online];
http://en.wikipedia.org/w/index.php?title=Database_schema
&oldid=426024081; Dost ep z dnia 26 kwietnia 2011
[72] Twrcy Wikipedii: Database normalization [online];
http://en.wikipedia.org/w/index.php?title=Database_ nor-
malization&oldid=426729978; Dost ep z dnia 8 maja 2011
[73] Twrcy wikipedii: Database
Management System [online];
http://en.wikipedia.org/w/index.php?title=Database_mana
gement_system&oldid=426211233; Dost ep z dnia 27
kwietnia 2011
[74] Twrcy Wikipedii: SQL [online];
http://pl.wikipedia.org/w/index.php?title=SQL &ol-
did=25953531; Dost ep z dnia 1 maja 2011
[75] Twrcy Wikipedii: Business logic [online];
http://en.wikipedia.org/w/index.php?title=Business_logic
&oldid=426360725; Dost ep z dnia 1 maja 2011
[76] Twrcy Wikipedii: Business logic layer [online];
http://en.wikipedia.org/w/index.php?title=Business_logic_layer
&oldid=403860234; Dost ep z dnia 1 maja 2011
[77] Twrcy Wikipedii: Funkcja skrtu [online];
http://pl.wikipedia.org/w/index.php?title=Specjalna: Cy-
tuj&page=Funkcja_skr%C3%B3tu &id=26224368; Dost ep z
dnia 1 maja 2011
[78] Twrcy Wikipedii: Hash function [online];
http://en.wikipedia.org/w/index.php?title=Hash_function
&oldid=423702053; Dost ep z dnia 1 maja 2011
[79] Twrcy Wikipedii: View (data base) [online];
http://en.wikipedia.org/w/index.php?title=View_(database)
&oldid=425704227; Dost ep z dnia 1 maja 2011
[80] Twrcy Wikipedii: Metadata [online];
http://en.wikipedia.org/w/index.php?title=Metadata &ol-
did=426712501; Dost ep z dnia 1 maja 2011
BIBLIOGRAFIA 112
[81] Twrcy Wikipedii: Index [online];
http://en.wikipedia.org/wiki/Index_(database); Dost ep z
dnia 1 maja 2011
[82] Bill Burke, Richard MonsonHafel: Enterprise JavaBeans
3.0; Helion 2007; ISBN 879-83-246-0726-6; Strony: 100
101
[83] Ed Ort, Bhakti Mehta: Java Architec-
ture for XML Binding (JAXB) [online];
http://www.oracle.com/technetwork/articles/javase/index-
140168.html#introjb; Dost ep z dnia 8 maja 2011;s
[84] W. S. McCulloch, W. H. Pitts: A logical calculus of ideas im-
manent in nervous activity; Bulletin of Mathematical Bio-
physics, vol 5 1945; ISSN: 0007-4985
[85] Konrad Garanty: Zastosowanie sieci neuronowych do pre-
dykcji zanieczyszcze n atmosferycznych; praca magisterska
na Wydziale Elektrycznym Politechniki Warszawskiejp
Lista ilustracji
1.1 Zale zno s c wzrostu smiertelno sci przy wzro scie st e zenia PM
10
o
10
g
m
3
od sredniego st e zenia PM
10
.[7] Wykres ten obrazuje fakt
istnienia w przybli zeniu liniowej zale zno sci mi edzy st e zeniem
pyw zawieszonych a ich skutkami zdrowotnymi. . . . . . . . . 5
1.2 Skrcenie sredniej dugo sci zycia spowodowane ekspozycj a po-
pulacji na produkowany przez czowieka py zawieszony. . . . . 7
2.1 Korelacje pomiarw i wynikw modelu EMEP . . . . . . . . . . 16
2.2 Porwnanie wynikwmodelu EMEP z poziomami zanieczyszcze n[11] 16
4.1 Schemat systemu modelowania zanieczyszcze n . . . . . . . . . 30
4.2 Przepyw danych w systemie . . . . . . . . . . . . . . . . . . . . 31
4.3 Zale zno sci programistyczne w systemie . . . . . . . . . . . . . . 32
4.4 J ezyki w jakich wykonano poszczeglne komponenty systemu.
Na szaro cz e sci nie zaimplementowane. . . . . . . . . . . . . . . 33
4.5 Tabele opisuj ace dane sownikowe . . . . . . . . . . . . . . . . . 34
4.6 Schemat tabeli DATA_POINT . . . . . . . . . . . . . . . . . . . 36
4.7 Tabele i widoki przechowuj ace dane u srednione . . . . . . . . . 36
4.8 Schemat tabeli POINT_TYPE_META_DATA . . . . . . . . . . . . . 37
4.9 Schemat tabel przechowuj acych dane znormalizowane . . . . . 37
4.10 Schemat klas su z acych do modelowania danych . . . . . . . . . 44
4.11 Klasy managerw . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.12 Manager bazy danych . . . . . . . . . . . . . . . . . . . . . . . . 45
4.13 Schemat klas udost epniaj acych parametryzowane zapytania SQL.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.14 Schemat wykonywania zapytania . . . . . . . . . . . . . . . . . 47
4.15 Schemat blokowy pojedynczej iteracji trenowania i walidacji pre-
dyktor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.1 Schemat modelu ekstrapoluj acego . . . . . . . . . . . . . . . . . 55
5.2 Poo zenie stacji bior acych udzia w ekstrapolacji . . . . . . . . . 58
113
5.3

Sredni b ad wyznaczania srednich dziennych dla wybranych mo-
deli ekstrapoluj acych (dane pomiarowe z lat 2009 2010). . . . 59
5.4 Porwnanie dokadno sci wyznaczenia sredniej z caego okresu
przy u zyciu modeli ekstrapoluj acych i przy u zyciu samych tylko
danych wska znikowych dla dwch wybranych modeli (dane po-
miarowe z lat 2009 2010). . . . . . . . . . . . . . . . . . . . . . 60
5.5 Porwnanie b edu w wyznaczeniu ilo sci przekrocze n z u zyciem
modeli ekstrapoluj acych i samych tylko danych wska znikowych.
Modele pracoway na danych z lat 2009 2010. . . . . . . . . . 60
5.6 Porwnanie zmierzonych i modelowanych poziomw PM
10
dla
modelu Ursynw dwa dla czterech kolejnych miesi ecy (miesi ace
te zostay wybrane ze wzgl edu na podobny do caego zbioru da-
nych MAPE) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
B.1 Symboliczny schemat neuronu . . . . . . . . . . . . . . . . . . . 72
B.2 Przykady funkcji sigmoidalnej dla r znych warto sci parame-
trw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
B.3 Przykady funkcji Gaussa dla r znych warto sci parametru a . . 73
B.4 Sie c z ukadem wst epnie przetwarzaj acym dane. . . . . . . . . . 78
B.5 Margines separacji . . . . . . . . . . . . . . . . . . . . . . . . . . 81
C.1 Przykad ci agej transformaty falkowej . . . . . . . . . . . . . . 89
C.2 Podzia przestrzeni czasu i cz estotliwo sci na poszczeglne funk-
cje bazowe w dyskretnych transformatach . . . . . . . . . . . . 92
C.3 Przykady falek falka Haara . . . . . . . . . . . . . . . . . . . 94
C.4 Przykady funkcji falkowych falka DB16 . . . . . . . . . . . . 95
Lista tabel
1.1 Wzrost zgonw podzielony na szerokie kategorie medyczne spo-
wodowany wzrostem st e zenia PM
2,5
o 50
g
m
3
(na podstawie sze-
regu bada n przeprowadzonych na przykadach okreswpodwy z-
szonych st e ze n zanieczyszcze n w XX wieku w USA).[1] . . . . . 5
114
LISTA TABEL 115
2.1 Korelacje mi edzy danymi pomiarowymi a wynikami modelu[12] 15
2.2 Systematyczne niedoszacowanie poziomwzanieczyszcze n wmo-
delu EMEP[6] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5.1 Stworzone modele dokonuj ace ekstrapolacji . . . . . . . . . . . 57
Lista algorytmw
4.1 Pojedyncza iteracja trenowania i walidacji predyktora . . . . 51
4.2 Peny algorytm trenowania i predykcji . . . . . . . . . . . . 51
B.1 Deklaracja funkcji wydajno sci sieci . . . . . . . . . . . . . . . 75
116
Listingi kodu
4.1 Przykad prostego zapytania zapisanego w pliku XML . . . . 41
4.2 Przykad prostego zapytania zapisanego w pliku XML . . . . 42
117
Indeks
zrdo danych
denicja, 28
2008/50/WE
seedyrektywa 2008/50/WE, 67
analityczne modele, Porwnaj CTM
analiza falkowa, 8796
funkcja skaluj aca, 94
baza danych, 2829, 3439
schemat, 34
wymagania, 28
cecha
denicja, 64
celu funkcja, Porwnaj funkcja celu
CTM, 12
denicja, 64
dane pomiarowe
normalizacja, 36
u srednianie, 36
dane u sredniane, 36
DBMS, Porwnaj baza danych
denicja, 100
normalizacja, 34
schemat, Porwnaj schemat
bazy danych
spjno s c danych, 34
dolny prg oszacowania, 67
dopuszczalna warto s c, Porwnaj
warto s c dopuszczalna
dyrektywa 2008/50/WE, 67
Dyskretna transformata falkowa,
Porwnaj analiza falkowa
EMEP, 13
dokadno s c, 15
Model, 1315
Program, 13
emisyjne modele, 15
funkcja
celu, 7576
Heavisidea, 71
j adra, 85
sigmoidalna, 72
signum, 71
skrtu, 35
denicja, 101
funkcja haszuj aca, Porwnaj funk-
cja skrtu
grny prg oszacowania, 67
Hornik, 74
instancja danych wej sciowych
denicja, 64
klucz gwny, 100
legislacja, Porwnaj dyrektywa 2008/50/WE
logika aplikacji
denicja, 101
118
INDEKS 119
LRTAP, 14
MAE, 75
MAPE, 76
MD5, 35
metaparametr modelu, Porwnaj
model
MLP, 72
denicja, 65
struktura, 72
model
CTM, Porwnaj CTM
denicja, 65
EMEP, 1315
metaparametr modelu, 65
modele emisyjne, 15
modele oparte o eksploracj e
danych, 15
parametr modelu, 65
RAINS, 6
modelowanie, 12
neuron, 71
funkcja aktywacji, 71
normalizacja danych, 36, 37
ograniczenie emisji, 6
parametr modelu, Porwnaj mo-
del
perceptron, Porwnaj MLP, 71, Po-
rwnaj MLP
perspektywa, 101
PM, 2
denicja, 65
ograniczenie emisji, 6
wpyw zdrowotny, 26
smiertelno s c, 4
oddziaywania dugotermi-
nowe, 4
oddziaywania krtkotermi-
nowe, 4
wnioski z bada n, 3
pomiary
stae, 67
wska znikowe, 9, 67
poziom krytyczny, 67
poziom zanieczyszcze n
denicja, 65
prg informowania, 67
prg oszacowania, 67
predykcja, 12
predyktor
denicja, 66
przeuczenie, 77
punkt rosy, 65
Py zawieszony, Porwnaj PM
regulacje prawne
dyrektywa 2008/50/WE, 6, 70
LRTAP, Porwnaj LRTAP
Traktat o transgranicznymprze-
noszeniu, Porwnaj LRTAP
wpyw na modelowanie, 9
schemat bazy danych
denicja, 100
Sieci Neuronowe, Porwnaj SSN
signum Heavisidea, 71
smiertelno s c, 4
SQL, 29
denicja, 100
kwerenda, 100
SSN, 68
cecha, Porwnaj cecha
cechy, 68
czas treningu, 69
denicja, 66
funkcja aktywacji, 7172
funkcja celu, Porwnaj funk-
cja celu
instancja, 64
neuron, Porwnaj Neuron
INDEKS 120
perceptron, Porwnaj MLP
przeuczenie, Porwnaj prze-
uczenie
struktura, 72
SVM, Porwnaj SVM
uczenie, 76
wagi, 69
SVM, 7986
funkcja j adra, Porwnaj funk-
cja j adra
margines separacji, 81
Sztuczne Sieci Neuronowe, Porw-
naj SSN
temperatura
odczuwalna, 66
punktu rosy, Porwnaj punkt
rosy
TEOM, 25
Traktat o transgranicznym prze-
noszeniu zanieczyszcze n,
Porwnaj LRTAP
Transformata Fouriera, 88
trening
denicja, 66
Uczenie maszynowe, 68
warto s c dopuszczalna, 67
widok, 36
denicja, 101
WIO

S
denicja, 66

You might also like