Ing. Richard Plný

Závěrečné práce

Bakalářské práce

Rozšíření knihovny WIF o nový Machine Learning klasifikátor

Autor
Jáchym Hudlický
Rok
2025
Typ
Bakalářská práce
Vedoucí
Ing. Richard Plný
Oponenti
Mgr. Martin Jureček, Ph.D.
Anotace
Práce se zabývá problematikou monitorování počítačových sítí na úrovni síťových toků (IP flows), konkrétně klasifikací síťového provozu a možnostmi detekce hrozeb s využitím metod strojového učení. Hlavním cílem práce je rozšířit knihovnu WIF o nový klasifikátor založený na strojovém učení. Velký důraz je kladen na efektivitu a rychlost zpracování. Po důkladné analýze dostupných C++ knihoven pro strojové učení byla vybrána knihovna Mlpack, která byla použita při implementaci nového klasifikátoru v knihovně WIF. Rychlost tohoto klasifikátoru byla porovnána s již existujícím WIF klasifikátorem využívající strojové učení (pomocí knihovny scikit-learn), přičemž se ukázalo, že nový klasifikátor využívající Mlpack je 21x až 190x rychlejší, v závislosti na modelu. Nový klasifikátor je dostupný v oficiálním WIF repozitáři na GitHubu. Součástí práce je také návrh a implementace detektoru proxy serverů, včetně detektoru rezidenčních proxy, využívající nově vytvořený klasifikátor. Detektor je testován na reálných datech zachycených v národní síti CESNET3, která má denně až půl milionu aktivních uživatelů.