Znalostní inženýrství

Explainability in deep learning-based medical image analysis

Autor

Martin Lank

Rok

2024

Typ

Diplomová práce

Vedoucí

Ing. Magda Friedjungová, Ph.D.

Oponenti

Ing. Daniel Vašata, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

V této práci aplikujeme metody vysvětlitelnosti Grad-CAM++, LayerCAM a SmoothGrad na konvoluční neuronovou síť založenou na EfficicientNetV2 a doučenou na mikroskopických histologických snímcích. Tato neuronová síť predikuje průměrnou difuzivitu (MD) a frakční anizotropii (FA), původně získanou technikou difuzního tenzorového zobrazování (DTI). Cílem této práce je odhalit, které histologické vlastnosti mají vliv na zvýšení MD a FA. Naše síť dosahuje více než 98.5 % R2 na trénovací, validační i testovací množině, čímž o desítky procentních bodů překonává síť navrženou v předešlé práci. Aplikované metody vysvětlitelnosti na mikroskopické snímky se ukázaly být méně užitečné, než jsme předpokládali. Sice naznačují určitý vliv buněčných jader, nicméně detaily tohoto vztahu zůstávají i nadále nejasné.

Práce na DSpace

Machine Learning Techniques for Laser-Plasma Acceleration Optimization

Autor

Matěj Jech

Rok

2024

Typ

Diplomová práce

Vedoucí

Mgr. Alexander Kovalenko, Ph.D.

Oponenti

doc. Ing. Ivan Šimeček, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Práce se zabývá analýzou dat z laser-plasmového urychlovače částic ve spolupráci s vědeckou institucí ELI Beamlines. V rámci práce byl navržen proces předpřipravení dat a vyvinut generativní model simulující průběh fyzikálních experimentů. Model je podmíněn vektorem parametrů experimentu a generuje obrazová data zobrazující energetické spektrum paprsku urychlených elektronů. Vyvinutý model lze využít jako částečnou náhradu skutečných experimentů, které jsou časově i finančně nákladné. Rovněž jej lze použít jako simulaci skutečných experimentů pro různé optimalizační metody. Práce definuje proces trénování i testování kandidátních modelů se třemi různými architekturami a na základě čtyř hyperparametrů. Výsledný model dokáže generovat data rychlostí 1.8 obrázků za sekundu a byl vyhodnocen na základě řady metrik včetně expertního názoru vědců jako věrohodný způsob simulace průběhu accelerace elektronů.

Práce na DSpace

Detekce a odstranění vodoznaků z obrazových dat

Autor

Tomáš Halama

Rok

2023

Typ

Diplomová práce

Vedoucí

Ing. Miroslav Čepek, Ph.D.

Oponenti

Ing. Magda Friedjungová, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Digitální obrazové vodoznaky jsou široce používanou technikou pro ochranu duševního vlastnictví nebo ověřování digitálních médií, ale mohou mít negativní vliv na kvalitu a použitelnost obrázků. To motivuje potřebu odstraňovat vodoznaky z obrázků a hluboké učení představuje potenciální řešení. V této práci je vyvinutá metoda pro odstraňování vodoznaků pomocí hlubokého učení, včetně rešerše stávajících technik a návrhu architektury. Úspěšnost metody je vyhodnocena z hlediska přesnosti detekce vodoznaků a kvality rekonstrukce původních obrázků.

Práce na DSpace

Krátkodobá předpověd srážek ze satelitních dat pomocí strojového učení

Autor

Jiří Pihrt

Rok

2023

Typ

Diplomová práce

Vedoucí

Mgr. Petr Šimánek

Oponenti

doc. Ing. Kamil Dedecius, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Geostacionární meteorologické satelity jsou zdrojem globálních a častých pozorování počasí, ale nepozorují přímo srážky. V této práci zkoumáme metody odhadování a předpovídání srážek ze satelitních dat. Cílem této práce je předpovědět až 8 hodin radarových snímků srážek s vysokým rozlišením z multispektrálních satelitních snímků s větším kontextem ale menším rozlišením. Pro tento úkol jsme vyvinuli nový model hlubokého učení s využitím neuronových sítí U-Net a PhyDNet. Nazvali jsme jej WeatherFusionNet, protože slučuje tři různé způsoby zpracování satelitních dat; předpovídání budoucích satelitních snímků, odhadnutí srážek ve vstupní sekvenci a přímé použití vstupní sekvence. Pro trénování a vyzkoušení modelu na reálných datech jsme se zúčastnili NeurIPS soutěže Weather4cast 2022, která poskytuje prostorově a časově srovnané satelitní snímky a cílová radarová data. WeatherFusionNet dosáhla prvního místa v hlavní části soutěže. Dále jsme experimentovali s několika dalšími modely, zkusili zahrnout statická data do vstupu a porovnali náš model s předpovídáním přímo z radaru.

Práce na DSpace

Programování s omezeními v rozvrhování pro autoservis

Autor

Petr Švec

Rok

2023

Typ

Diplomová práce

Vedoucí

prof. RNDr. Pavel Surynek, Ph.D.

Oponenti

Ing. Daniel Vašata, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Tato diplomová práce se zabývá implementací systému pro rozvrhování dílenských prací v autoservisu. Práce analyzuje požadavky zákazníka podle kterých, s využitím programování s omezeními, definuje model. Na základě navrženého modelu jsem implementoval řešič pomocí knihovny choco. Řešič jsem ověřil na syntetických datech a datech motivovaných praxí. Na testovaných instancích jsem provedl měření různých vlastností generovaných řešení pro testovací instance. Důraz byl kladen na univerzální použití s maximální možnou parametrizací pro potřeby jednotlivých klientů a integrací.

Práce na DSpace

Škálovatelné gausovské procesy jako náhradní modely v bayesovské optimalizaci

Autor

Iveta Šárfyová

Rok

2023

Typ

Diplomová práce

Vedoucí

Ing. Jiří Vošmik

Oponenti

Ing. Daniel Vašata, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Bayesovská optimalizace je globální optimalizační metoda vhodná pro hledání extrémů black-box účelových funkcí drahých na vyhodnocení. Jako modely pro aproximaci takových funkcí se často používají Gaussovské procesy. Jejich kubická časová složitost však omezuje jejich nasazení na aplikace v režimech s malým počtem dat. Tato práce poskytuje přehled moderních škálovatelných Gaussových procesů pro regresi. Experimenty provedené v rámci této práce se zabývají úlohami regrese a bayesovské optimalizace, přičemž v obou případech se využívá několik vybraných modelů založených na Gaussových procesech. Vyhodnocení se provádí pomocí více metrik, z nichž některé jsou zvláště vhodné pro pravděpodobnostní modely. Naše výsledky naznačují, že některé z modelů konzistentně překonávají ostatní v obou úkolech.

Práce na DSpace

Detekce anomálií v monitoringu datového centra CERN

Autor

Antonín Dvořák

Rok

2022

Typ

Diplomová práce

Vedoucí

Mgr. Alexander Kovalenko, Ph.D.

Oponenti

doc. Ing. Kamil Dedecius, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Jednou z mnoha úloh CERN cloud manažerů je zajistit požadovaný výpočetní výkon všem uživatelům dané vědecké komunity. Toho je dosaženo pečlivě nastaveným statickým alarming systémem nad výkonostními metrikami infrastruktury. Pro dosažení maximální efektivity cloudové infrastruktury a ulehčení práce cloud operátorům jsme vytvořili plně automatizovaný systém pro detekci anomálií, který využívá metody nesupervizovaného učení nad časovými řadami. Konkrétně používá kombinaci tradičních metod strojového učení (Isolation forest) a metod hlubokého učení (Gated recurrent unit/Long short-term memory autoencodery). Tato práce zahrnuje popis monitorovací infrastruktury CERNU, formulaci problému, design systému pro detekci anomálií, použité modely, tvorbu datasetu a porovnání výsledků implementovaných modelů vůči aktuálnímu alarming systému.

Práce na DSpace

Líná kompilace v klasickém plánování

Autor

Zuzana Fílová

Rok

2022

Typ

Diplomová práce

Vedoucí

prof. RNDr. Pavel Surynek, Ph.D.

Oponenti

Ing. Daniel Vašata, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Předmětem této diplomové práce je problematika líné kompilace v klasickém plánování. V teoretické části práce jsou nejprve shrnuty základní informace o klasickém plánování, definovány důležité pojmy klasické reprezentace plánovacích problémů a představeny základní algoritmy pro jejich řešení, zejména prohledávání plánovacího stavového prostoru a techniky využívající plánovací graf. Poslední sekce se věnuje převodu plánování na problém výrokové splnitelnosti (SAT). Na základě zjištění z teoretické části byla navržena metoda pro línou kompilaci plánovacích problémů do SAT, při které na rozdíl od klasické kompilace dochází k postupnému vytváření a úpravám formule výrokové logiky. V rámci praktické části práce byl implementován plánovač využívající dvě varianty kompilace -- navrženou metodu pro línou kompilaci a kompilaci klasickou. Plánovač byl testován na úlohách ze soutěže IPC (International Planning Competition). Experimenty se zaměřovaly na vyhodnocení úspěšnosti plánovače s línou kompilací a porovnání výsledků s plánovačem využívajícím klasický způsob kompilace. Celkem bylo využito 79 problémů různé obtížnosti ze čtyř domén, 63 z nich dokázal plánovač s línou kompilací vyřešit rychleji než plánovač s klasickou kompilací. Provedené experimenty poukázaly na výhody a možné nevýhody líné kompilace. Výsledky experimentů naznačují, že využití líné kompilace má potenciál ke zlepšení výkonu plánovače.

Práce na DSpace

Správa vegetace v okolí elektrického vedení za pomocí snímků z dronu

Autor

Radek Ježek

Rok

2022

Typ

Diplomová práce

Vedoucí

Ing. Lukáš Brchl

Oponenti

doc. Ing. Štěpán Starosta, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Provozovatelé elektrických distribučních sítí vynakládají každoročně velké množství peněz a úsilí, aby zajistili plynulou a bezpečnou dodávku elektřiny. Nejčastějším zdrojem výpadků proudu je poškození drátů vysokého napětí zásahem vegetace, například spadaných stromů. Z toho důvodu provozovatelé provádějí údržbu a pravidelné inspekce koridorů s elektrickým vedením, především v lesích a hustě zarostlých oblastech. Tím vytváří poptávku po nenákladných a vysoce automatizovaných metodách pro průzkum ochranných pásem elektrického vedení. Cílem této práce je vytvořit robustní algoritmus pro automatickou detekci zásahů vegetace do ochranného pásma elektrického vedení pomocí bezpilotních letadel (dronů), s využitím metod z fotogrammetrie a počítačového vidění. Studie pokrývá celý pracovní postup pro inspekci ochranného pásma drátů vysokého napětí, od obsáhlých pokynů pro sběr dat, přes 3D rekonstrukci elektrického vedení, až po detekci zásahů vegetace a vizualizaci výsledků.

Práce na DSpace

Studium lineárního self-attention mechanismu v transformerech

Autor

Uladzislau Yorsh

Rok

2022

Typ

Diplomová práce

Vedoucí

Mgr. Alexander Kovalenko, Ph.D.

Oponenti

doc. Ing. Pavel Kordík, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Vzhledem k tomu, že kvadratická složitost mechanizmu vnímaní architektury Transformer způsobuje velké náklady na zpracování dlouhých posloupností, cílem dané práce je prozkoumat lineární varianty architektury a implementovat několik nových metod.

Práce na DSpace

Vylepšení krátkodobé předpovědi srážek s využitím metod deep learning pomocí předchozích znalostí o chování počasí

Autor

Matej Choma

Rok

2022

Typ

Diplomová práce

Vedoucí

Mgr. Petr Šimánek

Oponenti

Mgr. Petr Novák, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Pri krátkodobých predpovediach zrážok s vysokým rozlíšením z hľadiska chyby predpovede dominujú metódy hlbokého učenia. Avšak, ich operatívne používanie je obmedzené problémami s vysvetliteľnosťou dynamiky za predpoveďami. Tieto sú zároveň vyhladené a chýbajú im vysokofrekvenčné prvky v dôsledku optimalizácie pre stratové funkcie založené na strednej chybe. V tejto práci je zhrnutý náš pokrok pri riešení týchto problémov. V prvej časti predstavujeme Intensity Classification Loss na zlepšenie predpovede silných zrážok. Model je natrénovaný vytvárať sekundárny výstup predpovedajúci pravdepodobnosť zrážok s intenzitou nad 40 dBZ, ktorý sa porovnáva s binárnou skutočnosťou. Experimenty ukázali, že tento prístup pomáha predpovedať silné zrážky, ale nepredpovedá zrážky s vyššou intenzitou, ako je zvolený prah. V druhej časti experimentujeme s ručným vkladaním diferenciálnej rovnice advekcie-difúzie do PhyCell. Cieľom je vniesť lepšiu apriornú znalosť o fyzike do modelu PhyDNet, ktorý oddeľuje fyzikálnu a reziduálnu dynamiku. Výsledky naznačujú, že zatiaľ čo sa PhyCell dokáže naučiť zamýšľanú dynamiku, tréning modelu PhyDNet zostáva riadený optimalizáciou stratovej funkcie. Toto vedie k modelu s nezmenenými predikčnými vlastnosťami.

Práce na DSpace

Bayesovská filtrace stavových modelů s neznámými kovariancemi

Autor

Tomáš Vlk

Rok

2021

Typ

Diplomová práce

Vedoucí

doc. Ing. Kamil Dedecius, Ph.D.

Oponenti

Ing. Ondřej Tichý, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Tato závěrečná práce se věnuje problému distribuovaného Baysovského sekvenčního odhadu neznámých stavů stavových modelů s neznámými kovariačními maticemi šumu procesu i měření. Tento problém je velmi častý v reálných případech, kde specifické informace o kovariačních maticích šumu pro jednotlivé senzory nemusí být dostupné. Řešení navržené v této práci je postavené na teorii variačního Bayese, ta je využitá jak k odhadu stavů, tak i k odhadu kovariační matice šumu měření. Z důvodu zlepšení sdílíme jak měření, tak i posteriorní odhady mezi sousedními uzly v síti. Práce zároveň ukazuje způsob optimalizace kovariační matice procesního šumu.

Práce na DSpace

Detekce anomalií pomocí Extended Isolation Forest algoritmu

Autor

Adam Valenta

Rok

2020

Typ

Diplomová práce

Oponenti

doc. Ing. Pavel Kordík, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Práce se zabývá různými typy algoritmů pro detekci anomálií, podrobně pak algoritmem Extended Isolation Forest. Extended Isolation Forest rozšiřuje svého předchůdce Isolation Forest. Původní Isolation Forest přináší zcela nový přístup k detekci, ale trpí zaujetím (bias) plynoucím ze způsobu, jakým vytváří stromy. Rozšířená verze algoritmu se tohoto zaujetí zbavuje úpravou větvení a původní algoritmus je jeho speciálním případem. Extended Isolation Forest je v rámci práce implementován do H2O-3 Machine Learning open-source platformy pro strojové učení. Základním požadavkem implementace je schopnost jejího spuštění na systému s distribuovaným výpočtem pomocí Map/Reduce knihovny.

Práce na DSpace

Doménová adaptace ve spektroskopických přehlídkách oblohy založená na neuronových sítích

Autor

Ondřej Podsztavek

Rok

2020

Typ

Diplomová práce

Vedoucí

RNDr. Petr Škoda, CSc.

Oponenti

Ing. Kamil Dedecius, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Představujeme analýzu dopadu doménové adaptace založené na neuronových sítích v astronomické spektroskopii. Doménové adaptace řeší problém použití dříve získaných znalostí na nová data. Analýzu ukazujeme na problému identifikace kvasarů v přehlídce Large Sky Area Multi-Object Fiber Spectroscopic Telescope pomocí anotovaných dat z přehlídky Sloan Digital Sky Survey. Pro experimenty jsme vybrali čtyři modely založené na neuronových sítích pro doménovou adaptaci: Deep Domain Confusion, Deep Correlation Alignment, Domain-Adversarial Network and Deep Reconstruction-Classification Network. Výsledky experimentů ukázaly, že tyto modely nejsou schopné vylepšit klasifikační přesnost v porovnání s konvoluční neuronovou sítí, která doménovou adaptaci nebere v potaz. S využitím redukce dimensionality, statistik zmíněných metod a chyb v klasifikaci ukazujeme, že zvolené metody doménové adaptace nejsou dostatečně robustní, abychom je mohli aplikovat na komplexní a nevyčištěná astronomická data.

Práce na DSpace

Doporučovací modely založené na rekurentních neuronových sítích

Autor

Ladislav Martínek

Rok

2020

Typ

Diplomová práce

Vedoucí

Ing. Tomáš Řehořek, Ph.D.

Oponenti

Ing. Mgr. Ladislava Smítková Janků, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Tato diplomová práce řeší problematiku doporučovacích systémů. Cílem je predikce následujících položek na základě sekvenčních dat z chování uživatelů pomocí rekurentních neuronových sítí (LSTM, GRU). Reprezentace položek je tvořena pomocí maticové faktorizace upravené pro datasety s implicitní zpětnou vazbou. V práci je navržen a implementován algoritmus pro tvorbu rekurentních modelů využívající vytvořenou reprezentaci položek. Navržen je také způsob vyhodnocování respektující sekvenční povahu dat. Metoda vyhodnocování využívá metriky recall a catalog coverage. Experimenty jsou prováděny systematicky s cílem zjistit závislosti na sledovaných metodách a hyperparametrech. Měření je prováděno na třech datových sadách. Na největším datasetu se podařilo dosáhnout více jak dvojnásobného recallu proti dalším metodám, které byly zastoupeny kolaborativním filtrováním, reminder modelem a popularity modelem. Na závěr práce jsou diskutovány zjištěné poznatky, možné zlepšení hyperparametrizací a další možné směry vylepšení modelů.

Práce na DSpace

Sekvenční bayesovská poissonovská regrese

Autor

Radomír Žemlička

Rok

2020

Typ

Diplomová práce

Vedoucí

Ing. Kamil Dedecius, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Poissonovská regrese je populární zobecněný lineární model používaný k modelování diskrétních náhodných veličin, typicky počtů. Tato práce je zaměřena na problematiku jejího sekvenčního odhadování s regresními koeficienty potenciálně pomalu proměnnými v čase. Je použita vhodná aproximace normálním rozdělením, aby tak bylo možné učinit v Bayesovském kontextu. Rovněž je diskutována kalibrační technika pro zvýšení kvality odhadů. Na závěr je navržen případ použití představeného přístupu v doméně zpracování signálu, zejména jeho použití v difuzních sítích (diffusion networks) pro realizaci distribuovaného kolaborativního odhadování.

Práce na DSpace

Neurální faktorizační modely pro doporučovací systémy

Autor

Radek Bartyzal

Rok

2019

Typ

Diplomová práce

Vedoucí

Ing. Tomáš Řehořek, Ph.D.

Oponenti

MSc. Juan Pablo Maldonado Lopez, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Doporučovací systémy nám napomáhají objevit zajímavé produkty v široké nabídce. Jedním z typů algoritmů generujících doporučení jsou faktorizační modely. V této práci popisujeme moderní faktorizační modely založené na neuronových sítích. Čtyři z nich také implementujeme. Dále představujeme nový faktorizační model Hybrid cSDAE založený na neuronových sítích, který dokáže zpracovat, jak interakční informace, tak různé druhy atributů. Všechny implementované modely jsou porovnány na standardních datasetech za stejných podmínek.

Práce na DSpace

Detekce materiálových vad na izolačních deskách z napěněného skla

Autor

Tomáš Duda

Rok

2018

Typ

Diplomová práce

Vedoucí

doc. RNDr. Ing. Marcel Jiřina, Ph.D.

Oponenti

doc. Ing. Ivan Šimeček, Ph.D.

Katedra

Katedra aplikované matematiky

Anotace

Tato diplomová práce se zabývá automatizovanou detekcí materiálových vad na deskách z pěnového skla prostřednictvím analýzy snímků materiálu. Popsán je proces výroby pěnového skla a současný způsob kontroly kvality pracovníkem výroby. Je vysvětlen princip fungování instalované techniky pro snímání desek. Součástí práce je rešerše systémů pro detekci materiálových vad a analýza metod pro popis textur. Dále je proveden konceptuální návrh detekčního systému. Je navržen proces předzpracování snímků a aplikace pro anotaci snímků desek. Metody uvedené v rešerši jsou otestovány na reálných datech a na základě výsledků je sestaven detekční algoritmus pokrývající jednotlivé typy vad. Navržený algoritmus je implementován, ověřen na reálných datech a výsledky měření jsou diskutovány. Práce nakonec navrhuje několik způsobů, kterými by šel systém dále rozvíjet v budoucnosti. Vyvinutá aplikace byla úspěšně nasazena do produkčního prostředí.

Práce na DSpace

Metody pro přibližné vyhledávání vzorků v řídkých multidimensionálních polích pomocí metod strojového učení

Autor

Anna Kučerová

Rok

2017

Typ

Diplomová práce

Vedoucí

Ing. Luboš Krčál

Oponenti

prof. Ing. Jan Holub, Ph.D.

Katedra

Katedra teoretické informatiky

Anotace

Hlavním cílem této práce je navrhnout řešení přibližného vyhledávání vzorů, které používá některou z metod strojového učení. Toho je dosaženo využitím hashování a již existujících algoritmů. Hashování se používá k nalezení pozic potenciálních výsledků. Následné ověření bylo provedeno stejným způsobem jako u existujících řešení pro lepší porovnání. Předchozí výzkum byl zaměřen především na vyhledávání v prostorech s malým počtem dimenzí. Výstupem této práce je algoritmus, který je porovnán s již existujícími řešeními. Některé z porovnávaných algoritmů byly zatím pouze teoreticky navrženy a dosud neimplementovány. Algoritmy také používají binární formát používaný v komerčních databázích.

Práce na DSpace

Predikce kriminality

Autor

Veronika Maurerová

Rok

2017

Typ

Diplomová práce

Vedoucí

doc. Ing. Pavel Kordík, Ph.D.

Katedra

Katedra teoretické informatiky

Anotace

S důrazem na efektivitu práce a s vzrůstajícím zájmem o zpracování dat, strojové učení a umělou inteligenci, se prediktivní analýza stává součástí policejních aktivit, predevším v oblasti prevence kriminality. Například policejní hlídky jsou plánováné pomocí prediktivní analýzy nejvíce ohrožených oblastí ve městě. Tato práce se zabývá především využitím metod supervizovaného učení při dolování skrytých vzorců z historických kriminálních dat. Cílem je s určitou jistotou indikovat ohrožená místa pro budoucí spáchání trestného činu či přestupku s vyžitím metod založených na rozhodovacíh stromech a neuronových sítích.

Práce na DSpace

Škálovatelnost prediktivních modelů

Autor

Tomáš Frýda

Rok

2017

Typ

Diplomová práce

Vedoucí

doc. Ing. Pavel Kordík, Ph.D.

Oponenti

Ing. Karel Klouda, Ph.D.

Katedra

Katedra teoretické informatiky

Anotace

Tato práce má dva hlavní cíle - (1) paralelizovat FAKE GAME integrací do open source frameworku H2O, zaměřeného na strojové učení, a (2) hodnocení anytime vlastností algoritmů strojového učení a vlivu optimalizace hyper-parametrů na tyto algoritmy. Tyto cíle jsem realizoval integrací FAKE GAME do H2O. Za účelem vyhodnocení anytime vlastností jsem implementoval nový nástroj nazvaný Benchmarker. Vyhodnocení anytime vlastností ukázalo, že pro některé problémy modely z FAKE GAME překonají modely z H2O, jak v přesnosti, tak i ve výkonu. Na druhou stranu vyhodnocení vlivu optimalizace hyper-parametrů ukázalo poměrně malý úspěch při optimalizaci algoritmů strojového učení z H2O. Domnívám se, že zanedbatelné zvýšení výkonnosti, a pro některé z optimalizovaných modelů dokonce i nižší výkon než u výchozí konfigurace, je způsobeno automatickým laděním některých hyper-parametrů, které se provádí ve výchozím nastavení H2O.

Práce na DSpace

Neuronové sítě s pamětí

Autor

Ondřej Kužela

Rok

2016

Typ

Diplomová práce

Vedoucí

doc. RNDr. Ing. Marcel Jiřina, Ph.D.

Oponenti

Ing. Josef Pavlíček, Ph.D.

Katedra

Katedra teoretické informatiky

Anotace

Neuronové sítě s pamětí jsou rodinou neuronových sítí, které kromě klasické paměti ve formě vah, sloužících pro dlouhodobé závislosti, obsahují také jinou formu paměti. Ta slouží pro uchovávání střednědobých, občas také nazývaných dlouho-krátkodobých, závislostí. Taková paměť může být buď interní nebo externí. V rámci této práce poskytuji souhrnný náhled na rodinu neuronových sítí s pamětí. Na základě analýzy existujících modelů také navrhuji nový model, který nazývám Recurrent Neural Modules with External Memory. Tento model nabízí nový a inovativní přístup k použití externí paměti v rámci neuronových sítí, jelikož nasazuje externí paměť na úrovni částí sítě a tudíž obsahuje několik externích pamětí v rámci jedné sítě. Výkonnost nově navrženého modelu byla testována na Air Travel Information System (ATIS) datasetu.

Práce na DSpace

Automatická sumarizace textu

Autor

Šimon Hlaváč

Rok

2015

Typ

Diplomová práce

Vedoucí

doc. RNDr. Ing. Marcel Jiřina, Ph.D.

Oponenti

doc. Ing. Pavel Kordík, Ph.D.

Katedra

Katedra teoretické informatiky

Anotace

V této práci jsou představeny základní metody využívané v automatické sumarizaci textu a genetických algoritmech. Dále je zde navržen systém automatické sumarizace založený na grafových strukturách a Markovských řetězcích, který byl rovněž implementován a řádně otestován. Práce se dále zabývá učením správného nastavení vah důležitosti jednotlivých metod používaných v sumarizaci pomocí naivního přístupu a genetických algoritmů, které byly rovněž naimplementovány, včetně možnosti paralelního zpracovávání a využití cache pro zrychlení systému, a řádně otestovány.

Práce na DSpace

Textové příznaky pro zlepšení relevance full-textového vyhledávání

Autor

Jan Hnízdil

Rok

2015

Typ

Diplomová práce

Vedoucí

Ing. Jan Šedivý, CSc.

Oponenti

doc. Ing. Pavel Kordík, Ph.D.

Katedra

Katedra teoretické informatiky

Anotace

Ačkoliv se vyhledávání informací na webu stalo standardem a často oblíbenym zdrojem pro hledání informací již před mnoha lety, úloha hledání relevance dokumentů k danému uživatelskému dotazu má stále mnoho slabych míst, které je zapotřebí zlepšit. Tato práce se snaží nalézt takové textové příznaky, které by zlepšily vysledky full-textového vyhledávání, a tím i spokojenost uživatelů, za využití datasetů od společnosti Seznam.cz. Za prvé jsou v rámci této diplomové práce analyzovány hlavní LTR algoritmy, evaluační míry a běžně používané textové signály známé z literatury. Za druhé byl navržen a naimplementován systém pro testování a evaluaci nově přidanych textovych signálů a nakonec byly tyto nově přidané signály porovnány s anonymizovanymi signály, které v současnosti používá Seznam.cz, prostřednictvím velké sady experimentů.

Práce na DSpace

Analýza výsledků absolventů středních škol na VŠ

Autor

Eliška Hrubá

Rok

2014

Typ

Diplomová práce

Vedoucí

doc. Ing. Pavel Kordík, Ph.D.

Oponenti

Ing. Stanislav Kuznetsov, Ph.D.

Katedra

Katedra teoretické informatiky

Podpora diagnostiky boreliózy metodami strojového učení

Autor

Jan Motl

Rok

2013

Typ

Diplomová práce

Vedoucí

doc. Ing. Pavel Kordík, Ph.D.

Oponenti

Ing. Tomáš Bartoň, Ph.D.

Katedra

Katedra teoretické informatiky

Závěrečné práce

Diplomové práce

Explainability in deep learning-based medical image analysis

Machine Learning Techniques for Laser-Plasma Acceleration Optimization

Detekce a odstranění vodoznaků z obrazových dat

Krátkodobá předpověd srážek ze satelitních dat pomocí strojového učení

Programování s omezeními v rozvrhování pro autoservis

Škálovatelné gausovské procesy jako náhradní modely v bayesovské optimalizaci

Detekce anomálií v monitoringu datového centra CERN

Líná kompilace v klasickém plánování

Správa vegetace v okolí elektrického vedení za pomocí snímků z dronu

Studium lineárního self-attention mechanismu v transformerech

Vylepšení krátkodobé předpovědi srážek s využitím metod deep learning pomocí předchozích znalostí o chování počasí

Bayesovská filtrace stavových modelů s neznámými kovariancemi

Detekce anomalií pomocí Extended Isolation Forest algoritmu

Doménová adaptace ve spektroskopických přehlídkách oblohy založená na neuronových sítích

Doporučovací modely založené na rekurentních neuronových sítích

Sekvenční bayesovská poissonovská regrese

Neurální faktorizační modely pro doporučovací systémy

Detekce materiálových vad na izolačních deskách z napěněného skla

Metody pro přibližné vyhledávání vzorků v řídkých multidimensionálních polích pomocí metod strojového učení

Predikce kriminality

Škálovatelnost prediktivních modelů

Neuronové sítě s pamětí

Automatická sumarizace textu

Textové příznaky pro zlepšení relevance full-textového vyhledávání

Analýza výsledků absolventů středních škol na VŠ

Podpora diagnostiky boreliózy metodami strojového učení