Predstavte si, že máte k dispozícii veľké množstvo dát (napr. v našom skúmanom prípade z dvoch rokov prevádzky) nameraných z priemyselného procesu a chcete ich analyzovať a hľadať v nich rôzne trendy. Je nutné uvedomiť si, že niektoré merania môžu byť chybné či systematicky vychýlené, napríklad v prípade, že prestal fungovať snímač. Ako však takéto merania spracovať?
V rámci semestrálneho projektu sme pracovali s normalizovanými dátami, ktoré nám poskytli priemyselní partneri zo Slovnaft, a.s. Zamerali sme sa na rektifikačnú kolónu - depropanizér, a to konkrétne na varák. Úlohou je zanalyzovať dáta a získať model, ktorý by dostatočne opisoval vzťah medzi prietokom ohrevného média a tepelným príkonom vo varáku. Pomocou získaného vzťahu by napríklad bolo možné v reálnom čase zaznamenať zanášanie varáka a predísť závažným výkyvom či výpadkom vo výrobe.
Pred samotným modelovaním procesu si však môžeme nižšie na grafe všimnúť, že niektoré merania nezodpovedajú vyvíjajúcemu sa trendu. V takomto prípade je potrebné dáta ‘očistiť‘, teda detekovať tzv. outliery.
Pomocníkom pri detekcii je milovaná aj nenávidená štatistika. Najdôležitejším ukazovateľom je kovariančná matica, ktorá zohľadňuje závislosť merania jednej veličiny od druhej. Graficky môžeme takúto maticu zobraziť ako elipsu. V závislosti od nastavených parametrov môžeme detekovať outliery (štatisticky nevysvetliteľné úkazy), teda body, ktoré sa nenachádzajú vo vnútri elipsy.
Po vylúčení outlierov sme pristúpili k samotnej identifikácii procesu. Prvým krokom je voľba štruktúry modelu. V našom prípade ide o statický model, čiže vhodnou voľbou je lineárny model. Druhým krokom je náhodné rozdelenie vyčistených dát na dve časti. Prvá časť zahŕňa dáta potrebné na trénovanie modelu a druhá na jeho testovanie zahŕňajúce predikciu. Načo je však tvorba takéhoto modelu užitočná? Je samozrejmé, že model nebude opisovať vlastnosti skúmanej veličiny stopercentne. Odchýlky modelu môžu byť spôsobené napríklad zmenou vlastností systému. V priemysle možno potom využiť takýto model na detekciu zmeny správania zariadení a zabrániť tak zvýšeniu nákladov na energiu či zníženiu životnosti zariadenia.