Bakalářské práce
Čištění dat pomocí pravděpodobnostního programování
Autor
Tomáš Jungman
Rok
2022
Typ
Bakalářská práce
Vedoucí
Mgr. Vojtěch Rybář
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
Práce zahrnuje rešerši z oblasti čištění a doplňování datových sad a zaměřuje se na konkrétní přístup s využitím pravděpodobnostního programování. Pro praktickou část práce je využíván pravděpodobnostní programovací jazyk PClean naprogramovaný v jazyce Julia. Jsou vysvětleny principy, na kterých funguje, a popsány konkrétní části nutné pro sepsání programu. Následně je v PClean napsán program pro doplnění a opravu hodnot v datové sadě se záznamy automobilů (cena, výkon, palivo, atd.)
S touto opravenou sadou dat se provádí odhad ceny za pomocí regrese a kvalita výsledku se porovnává s výsledky při použití neupravených dat se sjednocenou doplňovanou hodnotou pro každý sloupec, anebo doplněných na základě odborných znalostí. Model naučený daty doplněných s PClean nedosahuje kvalit modelu založeného na odborných znalostech. Ale na druhou stranu PClean nabízí rychlý způsob doplnění chybějících kategorických hodnot s kvalitou přesahující dnes běžně používané triviální doplnění.
Modelování proudění kolem leteckého profilu pomocí grafových neuronových sítí
Autor
David Horský
Rok
2022
Typ
Bakalářská práce
Vedoucí
Mgr. Vojtěch Rybář
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
V bakalářské práci podáváme přehled využití strojového učení ve výpočetní
dynamice tekutin. Implementovali jsme nejmodernější grafovou neuronovou
síť pro simulaci proudění vzduchu kolem profilu křídla ve 2D. Trénujeme model na nižších rychlostech a úhlech náběhu, následně extrapolujeme na vyšší.
Natrénovali jsme model, který extrapoluje s malou chybou přesnosti a zůstává
stabilní po dlouhý počet simulačních kroků.
Machine Learning Explainability Methods
Autor
Danila Makulov
Rok
2024
Typ
Bakalářská práce
Vedoucí
Mgr. Vojtěch Rybář
Oponenti
Ing. Magda Friedjungová, Ph.D.
Katedra
Anotace
Strojové učení se stále více používá v mnoha citlivých aplikacích, kde je nezbytné pochopit, proč se modely chovají tak, jak se chovají. Takový rychlý nárůst zvýšil poptávku po vysvětlitelném strojovém učení a nových metodách vysvětlení. Tyto metody však nezaručují konzistentní výstupy.
Tato práce podává stručný přehled současného stavu vysvětlitelného strojového učení a jeho metod se zaměřením především na metody lokálního vysvětlení (např. SHAP a LIME) a globální metody vykreslování pro tabulková data a metody specifické pro modely neuronových sítí. Ukazujeme příklady nekonzistentních vysvětlení SHAP a LIME, ilustrujeme a vysvětlujeme, jak jsou některé metody ovlivněny korelací, a ukazujeme praktické příklady použití metod pro neuronové sítě k analýze modelu a nalezení jeho biasů. Na závěr uvádíme několik doporučení při řešení nekonzistentních výstupů na základě provedeného výzkumu a vlastních experimentů.
Metody vysvětlitelnosti pro Vision Transformery
Autor
Miroslav Jára
Rok
2024
Typ
Bakalářská práce
Vedoucí
Mgr. Vojtěch Rybář
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
Tato práce se podrobně věnuje architektuře Vision Transformer (ViT) a možnostem vysvětlitelnosti této architektury. Teoretická část se zabývá důkladným rozborem struktury a principů fungování ViT a mechanismu pozornosti. Dále je v teoretické části rozbor aktuálního stavu metod vysvětlitelnosti pro ViT, zkoumající základy jejich fungování, jejich dělení a metriky pro porovnávání jejich vlastností. Praktická část se zaměřuje na hodnocení tří metod vysvětlitelnosti: Beyond Intuition, GradientExplainer a ViT-Shapley. Tyto metody byly aplikovány na PyTorch ViT modely, které byly předtrénované na datasetu ImageNet21K a poté dolaďovány na trénovacích datech dvou datasetů. V experimentech byly zkoumány vlastnosti daných metod, jako věrohodnost, robustnost a složitost pomocí několika metrik.
Srovnání interpretovatelných modelů s post-hoc vysvětlitelnými black-box modely
Autor
Mikuláš Kočí
Rok
2024
Typ
Bakalářská práce
Vedoucí
Mgr. Vojtěch Rybář
Oponenti
Ing. Ivo Petr, Ph.D.
Katedra
Anotace
Hlavním cílem této práce bylo poskytnout další důkazy, že interpretovatelných modely jsou schopné dosáhnout podobných, ne-li lepšího výkonu, než černé skříňky. V našem experimentu jsme zjistili, že pro ani jeden dataset nedosahovala černá skříňka výrazně lepších výsledků, než její interpretovatelné protějšky, kde nejvyšší zaznamený rozdíl z hlediska F1 skóre byl 0.02. Tato výhoda však rozhodně není natolik významná, aby prevážila výhody, které přináší ze své podstaty interpretovatelný model. To platí zejména pro rozhodování s vysokou mírou riyika, kde bychom museli využít nějakou metodu vysvětlitelnosti, která by však nemusela odhalit zaujatost modelu, což by mohlo vést ke špatnému výkonu v reálném světě.
Diplomové práce
Prediktivní údržba automobilů na základě zašumněných historických dat z autoservisů
Autor
Filip Miškařík
Rok
2025
Typ
Diplomová práce
Vedoucí
Mgr. Vojtěch Rybář
Oponenti
Dr. Rodrigo Augusto da Silva Alves
Katedra
Anotace
Prediktivní údržba automobilů se primárně zaměřuje na předpovídání poruch konkrétních součástí vozidla pomocí dat ze senzorů. Tato diplomová práce zkoumá možnosti využití historických dat z autoservisů pro prediktivní údržbu vozidel. Široké spektrum těchto dat umožňuje předpovídat poruchy napříč různými částmi vozidla.
Práce představuje tři modelovací přístupy pro prediktivní údržbu: odhad životnosti jednotlivých komponent pomocí regresních modelů, klasifikaci budoucích oprav v různých časových horizontech a využití doporučovacích systémů pro předpověď pravděpodobných úkonů při další opravě.
Ve všech případech dosahují navržené modely lepších výsledků než základní referenční metody, čímž prokazují potenciál využití reálných servisních dat pro účely prediktivní údržby. Tento přístup může vést k optimalizaci nákladů a snížení provozních výpadků jak pro firmy, tak pro řidiče.
Grafové neuronové sítě pro modelování evropské elektrické sítě
Autor
David Horský
Rok
2025
Typ
Diplomová práce
Vedoucí
Mgr. Vojtěch Rybář
Oponenti
Ing. Miroslav Čepek, Ph.D.
Katedra
Anotace
Evropská elektrická síť je složitý, propojený systém, který se rozprostírá přes mnoho zemí a podporuje přeshraniční obchod s energií. Přesné předpovědi toků elektřiny jsou zásadní pro udržení stability sítě a optimalizaci obchodních strategií. Tato diplomová práce zkoumá využití grafových neuronových sítí (GNN), konkrétně message passing neuronových sítí (MPNN), k predikci toků elektřiny s jednodenním předstihem napříč evropskými obchodními zónami. Studie využívá proprietární i open-source data, které zahrnují předpovědi výroby z obnovitelných zdrojů, zbytkové zatížení a tržní ukazatele, jako jsou teplota a ceny paliv. Byly vyvinuty a vyhodnoceny tři varianty modelu: základní MPNN, model s Monte Carlo dropoutem a bayesovská neuronová síť s kvantifikací nejistoty. Experimentální výsledky ukazují, že zatímco základní model dosáhl nejvyšší predikční přesnosti, modely zohledňující nejistotu poskytly cenné intervaly spolehlivosti, i když s výzvami v kalibraci. Analýza chyb předpovědi napříč hranicemi a denními dobami odhalila klíčové zdroje chyb související s volatilitou obnovitelných zdrojů a objemy regionálních toků. Tato zjištění demonstrují potenciál GNN pro modelování sítě a zdůrazňují oblasti pro budoucí zlepšení, včetně rozmanitosti ensamble modelů a adaptace v reálném čase.