Ing. Dominik Soukup

Závěrečné práce

Bakalářské práce

Detekce WireGuard provozu pomocí Active Learning

Autor
Štěpán Jílek
Rok
2023
Typ
Bakalářská práce
Vedoucí
Ing. Dominik Soukup
Oponenti
Ing. Jaroslav Pešek
Anotace
Tato bakalářská práce se zabývá problematikou detekce šifrovaného provozu protokolu WireGuard, který se používá pro šifrované VPN spojení. K detekci je využit framework Active Learning Framework, který využívá výhod strojového učení a který je vylepšen o obecný modul Anotátor. Využitím tohoto frameworku vznikne jednoduchá datová sada pro natrénování modelu. Vedlejším cílem práce je vytvořit takový modul Anotátor, který půjde snadno upravit i na jiné protokoly. V první části je čtenář seznámen s principy monitorování sítí a protokolem WireGuard. V dalších částech pak návrhem a implementací. Na konci je vyhodnocena výkonnost a přesnost detekce. Výkonost klasifikace dosahuje v mnoha případech až 95%.

Diplomové práce

Concept drift and model degradation in network traffic classification

Autor
Lukáš Jančička
Rok
2024
Typ
Diplomová práce
Vedoucí
Ing. Dominik Soukup
Oponenti
Ing. Josef Koumar
Anotace
Strojové učení představuje vysoce efektivní a v současnosti oblíbený přístup ke~klasifikaci síťového provozu. Vytvořené modely ale mohou po nasazení rychle degradovat, jelikož síťový provoz představuje náročnou doménu. Kromě zkreslení přítomných během sběru dat a vytváření modelu (tzv. bias) představuje concept drift hlavní zdroj degradace modelu. Vzory v datech objevené při trénování mohou přestat být přesné kvůli vývoji distribucí. Z tohoto důvodu se práce zaměřila na vytvoření základů frameworku pro detekci a analýzu driftu na míru pro doménu síťového provozu. Chování síťového provozu bylo zkoumáno pomocí různých experimentů studujících vývoj distribucí a simulujících nasazení modelu a zkoumajících jeho degradaci modelu v čase. Byla zjištěna přítomnost opakujících se konceptů s víkendovým provozem odlišným od provozu v pracovním týdnu. Když se drift neřešil, F1 skóre kleslo z 0,92 na přibližně 0,7 během několika dní. Jelikož byly případy kdy zdrojem degradace modelu bylo pouze několik silně driftovaných příznaků, byl vynalezen nový přístup vážení výsledků testů driftu podle důležitostí příznaků. Vytvořený detektor může být rozšířen o moduly pro dodatečnou analýzu detekovaného driftu. Je představena nová myšlenka klasifikace typů driftu pro lepší pochopení vývoje provozu. Vytvořený detektor byl testován na experimentu, kde sloužil k přetrénování modelu po detekci a byl schopen nejen zabránit degradaci modelu, ale také zlepšit jeho výkon v průběhu času.

Framework pro automatické zlepšování klasifikace síťového provozu

Autor
Jaroslav Pešek
Rok
2022
Typ
Diplomová práce
Vedoucí
Ing. Dominik Soukup
Oponenti
Ing. Simona Fornůsek, Ph.D.
Anotace
Tato diplomová práce se zabývá problematikou klasifikace především šifrovaného síťového provozu pomocí algoritmů strojového učení. Strojové učení je podoblast umělé inteligence, která silně závisí na dostatečně obsáhlých a obecných datových sadách. Prvním cílem je analýza metod, které v průběhu času takovou klasifikaci nejen vylepšují, ale zároveň s tím iterativně tvoří aktuální datovou sadu. Druhým cílem je vytvořit prototyp softwarového frameworku, který je toho schopen a zároveň je schopen klasifikaci vyhodnocovat. V analytické části je čtenář seznámen s metodou aktivního učení a analyzuje a diskutuje state-of-the-art a vhodnost metod pro oblast síťového provozu. V návrhové části definujeme požadavky a navrhujeme architekturu řešení. Poslední část práce je věnována experimentům. Výstupem práce je prototyp softwarového frameworku a vyhodnocení jednotlivých metod aktivního učení pro oblast síťového provozu.

Automatická optimalizace datových sad síťového provozu

Autor
Petr Skružný
Rok
2022
Typ
Diplomová práce
Vedoucí
Ing. Dominik Soukup
Oponenti
doc. Ing. Tomáš Čejka, Ph.D.
Anotace
S rostoucím objemem šifrovaného provozu v síti narůstá potřeba korektní identifikace a monitorování tohoto provozu. Pro řešení toho problému se využívá algoritmů strojového učení, které je ale nejdříve nutné naučit na trénovací datovou sadu. Nejvhodnější je pak pro učení používat i záznamy z reálného provozu. Cílem této práce je analýza možných metod optimalizace datových sad síťového provozu, následný návrh možných algoritmů pro optimalizaci datových sad, jejich implementace a experimentální vyhodnocení těchto algoritmů. Výstupem práce pak je srovnání experimentálních výsledků navržených metod a jejich softwarový prototyp implementovaný v programovacím jazyce Python.