Support Vector Machine ako základ mojej práce, alebo, ako som sa dostala k téme svojho Bc. projektu.

Na úvod, **Support Vector Machine**, skrátene **SVM**, je optimalizačná metóda slúžiaca na analýzu a binárnu klasifikáciu rozličných typov dát. Binárna klasifikácia znamená, že dáta sú triedené do dvoch skupín alebo kategórii, pričom každá skupina obsahuje dáta s rovnakými vlastnosťami. Na začiatku je daný set tzv. tréningových vzoriek, z ktorého každá vzorka prináleží do jednej z dvoch skupín (jablká a hrušky, ženy a muži, zelené a červené). Najjednoduchšie je predstaviť si to na 2D alebo 3D modeli.
![](/content/images/2015/04/image44.png)
Tréningový algoritmus použitím týchto vzoriek vytvorí separátor, ktorý v priestore oddelí vzorky tak, že jedna skupina sa nachádza na jednej jeho strane, druhá na druhej. Separátor je umiestnený tak, aby bola vytvorená čo najširšia medzera medzi klasifikovanými dátami a súčasne sa vyskytoval čo najmenší počet zle klasifikovaných dát. Klasifikačný algoritmus potom každú novú vzorku zaradí do jednej zo skupín, na jednu alebo druhú stranu separátora.
Support Vector Machine má v bežnom živote veľmi široké využitie, medzi najvýznamnejšie aplikácie SVM patrí napr. rozpoznávanie proteínov v medicíne a farmaceutike, rozpoznávanie rukopisu alebo identifikácia objektov a osôb na obrazových záznamoch.
**Asi toľko k teórii**. Ja sama som sa s SVM stretla po prvýkrát na predmete Optimalizácia v letnom semestri druhého ročníka. Práve v prednáške na túto tému ma zaujalo vyššie spomenuté aplikovanie SVM na identifikáciu osôb, v angličtine známe ako "*facial recognition*". Hneď som si spomenula na všetkých tých CSI forenzných expertov z Kriminálky Las Vegas alebo Miami, tiež na Felicity Smoak, najtalentovanejšiu fiktívnu IT girl, ktorá denne trávi svoj čas vyhľadávaním zločincov cez vlastný rozpoznávací softvér v záujme hájenia spravodlivosti na tomto svete (pozn. autorky, Felicity Smoak je charakter vytvorený spoločnosťou DC Comics, v súčasnosti sa vyskytuje v televíznom seriáli Arrow, kde patrí medzi tých "good guys").

alt

Na začiatku som o SVM premýšľala ako o zmesi škaredých odstrašujúcich rovníc a nerovníc, ktoré nechcem dostať ako skúškové zadanie, po čase však ako o elegantnom algoritme, ktorý má obrovský potenciál, keď mu človek dobre porozumie. Veď zamyslime sa, na stupnici od 1 do 10, aké super je vytvoriť svoj vlastný softvér na identifikáciu? (pozn. autorky, 10 )
Moja skutočná skúsenosť s SVM začala v lete minulého roku, kedy som dostala ponuku pracovať na projekte podľa vlastného výberu vďaka mojim dobrým výsledkom z optimalizácie. Ako ťažisko projektu som si zvolila práve SVM. Môj projekt spočíval v biometrickej identifikácii osôb využitím dát z akcelerometra, čo je prístroj na meranie negravitačných zrýchlení. Takýto akcelerometer je dnes súčasťou napríklad smartfónov. Idea projektu bola taká, že každý človek na mikroúrovni vykazuje iné, pre neho špecifické pohyby. Na základe týchto pohybov by preto bolo možné osobu identifikovať. Takáto identifikácia by mala využitie napr. v mobilnom priemysle alebo inteligentných domoch, ktoré sú stále populárnejšie (alebo pri čomkoľvek inom, čo nás napadne).
Keďže na konci leta bol tento projekt rozpracovaný, ani zďaleka však nie dokončený, rozhodla som sa v ňom pokračovať v tomto letnom semestri a zapísala si ho oficiálne ako bakalársky projekt.
V mojom prvom príspevku som chcela priblížiť svoj výber a hlavne motiváciu spracovávať túto tému a posúvať sa v nej ďalej. V tom ďalšom by som rada konkrétne priblížila moju prácu na projekte, ciele, ktoré sa mi doposiaľ podarilo dosiahnuť a taktiež tie, ku ktorým by som sa rada dopracovala v budúcnosti.

Takže pokračovanie nabudúce...

*Ďalší príspevok bude (pravdepodobne) obsahovať*: zber a spracovanie akcelerometrických dát, použité metódy, doterajšia úspešnosť klasifikácie a identifikácie.