Ing. Miroslav Čepek, Ph.D.

Závěrečné práce

Bakalářské práce

Identifikace kompatibilních produktů z popisu produktu

Autor
Tomáš Bánhegyi
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Ing. Luděk Kopáček, Ph.D.
Anotace
Táto bakalárska práca sa zameriava na získavanie kompatibility produktov z produktových popisov. Riešenie využíva známe modely strojového učenia z oblasti spracovania prirodzeného jazyka. Špecificky sa práca zameriava na úlohy rozpoznávania pomenovaných entít, extrakcie vzťahov a odpovedania na otázky. Vhodný dataset musí obsahovať anotácie pre pomenované entity a vzťahy medzi nimi. Po vytvorení datasetu sa aplikujú vybrané modely strojového učenia. Podarilo sa mi extrahovať informácie o kompatibilite produktov so skóre 62.30 %, pričom som aplikoval len rozpoznávanie pomenovaných entít a extrakciu vzťahov. Rozhodli sme sa vynechať úlohu odpovedania na otázky, pretože by sme presiahli rozsah bakalárskej práce. Táto práca prináša riešenie pre využitie predtrénovaných modelov, za účelom analýzy popisov produktov a záskania informácie o ich kompatibilite. V závere sú popísané možnosti pre ďalší výskum. A ako príloha je uvedený podrobný popis konfiguračného súboru použitého pre náš model.

Generování tabulkových dat se zachováním závislostí

Autor
Jakub Renc
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Ing. Magda Friedjungová, Ph.D.
Anotace
Tato práce se zabývá problematikou generování tabulkových dat se zachováním závislostí. Cílem práce je vytvoření generátoru, který umožní syntézu dat se stejnými statistickými vlastnostmi jako mají data původní. Dále musí být model schopný generovat jak numerická, tak i kategorická data. Práce se podrobněji věnuje implementaci dvou generativních modelů, a to variačnímu autoenkodéru a Generative adversarial networks. V experimentální části práce jsou tyto modely porovnávány s vybranými generátory z knihovny Synthetic data vault. Výstupy z jednotlivých modelů jsou hodnoceny na základě úspěšnosti při klasifikačních a regresních úlohách. Přesto, že Generative adversarial networks opakovaně dosáhly nejlepších výsledků, nelze jednoznačně určit lepší model. Oba generátory prokázaly, že jsou schopné úspěšně syntetizovat tabulková data se zachováním potřebných vlastností.

Prieskum techník grafových neurónových sietí

Autor
Barbara Bobeničová
Rok
2023
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Mgr. Vojtěch Rybář
Anotace
Táto práca sa venuje rozboru metód grafových neurónových sietí pre klasifikáciu vrcholov a grafov. Skúma súčasné knižnice na prácu s grafovými neurónovými sieťami ako StellarGraph, PyTorch Geometric a DGL. Na vybraných datasetoch z Open Graph Benchmark sú otestované a porovnané grafové algoritmy Graph Convolutional Networks, GraphSAGE a Graph Attention Networks. Dosiahnuté výsledky sú porovnané so state of the art výsledkami.

Detekce a rozpoznání SPZ

Autor
Patrik Vodila
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
doc. Ing. Kamil Dedecius, Ph.D.
Anotace
Práce se zabývá automatickým rozpoznáváním registračních značek vozidel. Výsledkem této práce je program, který je schopen rozpoznávat text na jednořádkových registračních značkách s tmavým textem na světlém pozadí. Výstupem programu je fotografie s označenými všemi detekovanými registračními značkami i s rozpoznaným textem. Program je napsán v programovacím jazyce Python a používá YOLO verzi 4 implementovanou za pomoci TensorFlow pro lokalizaci značky a Tesseract pro rozpoznávání znaků. Použitím knihovny OpenCV moje implementace zlepšila počátečné výsledky používající pouze Tesseract OCR a YOLO. Zlepšení správného rozpoznávání bylo více než desetkrát lepší. Správné rozpoznání značek dosáhlo až do 31,5%. Našel jsem také více případů použití, kde se implementace osvědčila.

Průzkum technik pro generování grafů

Autor
Kirill Poligach
Rok
2023
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
doc. Ing. Ivan Šimeček, Ph.D.
Anotace
Z různých důvodů - například z důvodu ochrany soukromí nebo bezpečnosti - není vždy možné pracovat přímo s původním grafem, například s grafem bankovních transakcí nebo interakcí na sociálních sítích. Tyto grafy jsou nezbytné pro ML projekty, jako jsou bankovní bezpečnostní systémy pro detekci abnormálních transakcí, doporučovací systémy sociálních sítí a mnoho dalších podobných projektů. Cílem této práce je prozkoumat současné existující techniky generování grafů a posoudit, nakolik syntetické grafy statisticky odpovídají vlastnostem grafů původních. Posuzuje také možnost využití strukturních embeddingových modelů pro klasifikační problémy s využitím syntetických grafů.

Jízda vozítka AWS DeepRacer na neznámých tratích

Autor
Vincent Jakl
Rok
2023
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Ing. Zdeněk Buk, Ph.D.
Anotace
AWS Deepracer je oblíbená platforma pro vývoj autonomních závodních vozů s využitím posilovacího učení. Cílem této práce je vyvinout model pro AWS Deepracer, který dokáže navigovat na tratích, které dosud neviděl. Metoda, která byla použita k dosažení takového modelu, zahrnovala použití kombinace technik včetně augmentace dat a ladění hyperparametrů. Model byl natrénován na sadě tratí, které nebyly zahrnuty do sady vyhodnocovacích dat, a jeho výkon byl vyhodnocen na samostatné sadě tratí. Výsledkem této práce jsou dva modely AWS Deepracer, jeden pomalejší, ale pečlivější, a jeden rychlejší, ale méně přesný. Oba tyto modely jsou však schopny fungovat poměrně přesně na široké škále tratí, včetně těch na kterých se netrénoval. Výstupy této práce umožňují budoucím vývojářům AWS Deepracer, kteří by mohli chtít vytvořit obecný model, začít s některými poznatky o tomto procesu nebo použít již natrénované modely z této práce jako základ pro své vlastní modely.

Model autonomního řízení pro vyhýbání se překážkám na trati

Autor
Peter Kosorín
Rok
2023
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Ing. Zdeněk Buk, Ph.D.
Anotace
V rámci této práce byl proveden literární průzkum různých metodik autonomního řízení a architektur modelů strojového učení se zaměřením na vyhýbání se objektům. Práce dále zkoumá možnosti platformy autonomního závodního vozu AWS DeepRacer. Tato platforma je využita ke zkoumání proveditelnosti trénování end-to-end modelů autonomního řízení zaměřených na vyhýbání se objektům pomocí posilovaného učení. Byly porovnávány dvě architektury samořídicích modelů, a to třívrstvá konvoluční neuronová síť a pětivrstvá konvoluční neuronová sít. Dále byl porovnáván vliv volby senzorů na úlohu autonomního vyhýbání se objektům. Experimenty v simulovaném prostředí ukázaly, že nejlépe si vedla architektura třívrstvé konvoluční neuronové sítě, která byla vybavena stereokamerou a LiDAR senzorem. Model byl následně nasazen do vozidla DeepRacer a demonstrován v reálném světě. Práce úspěšně prokázala proveditelnost trénování end-to-end autonomních modelů s využitím AWS DeepRacer platformy a simulovaného prostředí.

Detekce a trasování pohybu spermií ve videu pomocí metod umělé inteligence

Autor
Jakub Hořenín
Rok
2024
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Mgr. Alexander Kovalenko, Ph.D.
Anotace
Tato práce představuje novou metodiku založenou na strojovém učení pro automatickou detekci a sledování spermií v rámci mikroskopických videozáznamů, jejímž cílem je objasnit dynamiku a vzorce pohybu jednotlivých spermií a shlulku spermií. Metoda nejprve identifikuje jednotlivé spermie v po sobě jdoucích snímcích videosekvence, což usnadňuje rekonstrukci trajektorie každé buňky v čase. Následně nasazji klasifikační algoritmus, který rozlišuje mezi jednotlivými spermiemi, shluky sousedících buněk, shluků spermií a znečištením, čímž řeším mezeru ve stávajících metodikách. Nakonec používám tři konvenční metriky pro hodnocení rychlosti: Straight Line Velocity (VSL), Average Path Velocity (VAP), and Curvilinear velocity (VCL), aby bylo možné kvantifikovat rychlost pohybu jednotlivých spermií a shluků spermií. Tento přístup představuje významný pokrok v automatické analýze pohyblivosti a agregačních jevů spermií a poskytuje výzkumníkům robustní nástroj pro studium chování spermií s vyšší přesností a efektivitou. Bylo vytvořeno webové uživatelské rozhraní a nejnovější verze programu využívajícího tuto metodiku je veřejně dostupná na adrese https://apps.datalab.fit.cvut.cz/sperm_tracking/, přičemž zdrojový kód je k dispozici na gitlabu: https://gitlab.fit.cvut.cz/horenjak/sperm_cell_tracking_app/.

Predikce pohybu spermií z videozáznamů a identifikace způsobů pohybu

Autor
Matej Kulháň
Rok
2024
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Mgr. Alexander Kovalenko, Ph.D.
Anotace
Táto práca skúma využitie techník strojového učenia na predikciu budúcej trasy spermií, klasifikáciu ich smerovej orientácie a predikciu ich rotácie z videí. Výskum je motivovaný potrebou lepšieho porozumenia správania a pohybu spermií, ktoré zohrávajú kľúčovú úlohu v biomedicínskom výskume a štúdiách reprodukcie človeka.

Průzkum strategií trénování samořídících vozítek AWS DeepRacer pro lepší jízdu v reálném prostředí

Autor
Yelizaveta Tskhe
Rok
2024
Typ
Bakalářská práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Ing. Zdeněk Buk, Ph.D.
Anotace
Cílem této práce je prozkoumat kroky potřebné k přenosu řídicí jednotky se strojovým učením ze simulovaného prostředí do reálného vozidla, aby bylo možné bezpečně a spolehlivě navigovat po trati navzdory vizuálním rozdílům. Hlavní výzva spočívá v překlenutí rozdílu mezi ideálními podmínkami v simulovaném prostředí a dynamickým, hlučným scénářem reálného světa. Šum se projevuje ve světelných podmínkách, odrazech světla, přítomnosti cizích objektů v záběru kamery vozidla a také v nejistotě rychlosti a chování řízení v důsledku stavu baterie. Provedla jsem vyčerpávající přehled stávající literatury o technikách a strategiích pro autonomně řízená vozidla, abych získala hlubší porozumění této oblasti. Poté jsem natrénovala a vyhodnotila model učení s posilováním, který sloužil jako měřítko pro další experimenty. Na jeho základě jsem navrhla možná vylepšení: trénování s náhodným výběrem domény a použití hlubší pětivrstvé neuronové sítě. Tato vylepšení byla aplikována na modely s cílem zvýšit výkonnost vozidla v reálném prostředí. Byla důkladně otestována a ve výsledku se ukázalo, že doménová randomizace je užitečná, zatímco použití 5vrstvé neuronové sítě zřejmě nepřineslo významné zlepšení z řady důvodů.

Diplomové práce

Detekce a odstranění vodoznaků z obrazových dat

Autor
Tomáš Halama
Rok
2023
Typ
Diplomová práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Ing. Magda Friedjungová, Ph.D.
Anotace
Digitální obrazové vodoznaky jsou široce používanou technikou pro ochranu duševního vlastnictví nebo ověřování digitálních médií, ale mohou mít negativní vliv na kvalitu a použitelnost obrázků. To motivuje potřebu odstraňovat vodoznaky z obrázků a hluboké učení představuje potenciální řešení. V této práci je vyvinutá metoda pro odstraňování vodoznaků pomocí hlubokého učení, včetně rešerše stávajících technik a návrhu architektury. Úspěšnost metody je vyhodnocena z hlediska přesnosti detekce vodoznaků a kvality rekonstrukce původních obrázků.

Design and Implementation of Machine Learning Operations

Autor
Michal Bacigál
Rok
2023
Typ
Diplomová práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Rodrigo Augusto da Silva Alves, Ph.D.
Anotace
Rast popularity a významu aplikácie strojového učenia v rôznych odvetviach viedol k postupnému rozšireniu principov DevOps o koncepty súvisiace s dátami a modelmi, výsledkom čoho došlo k vzniku paradigmy známej ako MLOps. Táto diplomová práca skúma jej dôležitost', hlavné principy a fázy, ktoré s ňou súvisia. V práci poskytujeme prehl'ad MLOps nástrojov a ich hlavných funkcionalit, na základe ktorého vyberáme tie najvhodnejšie pre účely využitia v procese výuky. Výsledkom tejto analýzy je "proof of concept" riešenie, ktoré môže slúžit' ako základ pre d'alši výskum možnosti začlenenia operácii strojového učenia za účelmi zjednodušenia procesu vývoja modelov pre študentov a výskumnikov na našej univerzite.

Průzkum modifikací Fourierovy transformace a jejich vliv na přesnost modelů strojového učení pro klasifikaci EKG dat

Autor
Bogdan Buliakov
Rok
2024
Typ
Diplomová práce
Vedoucí
Ing. Miroslav Čepek, Ph.D.
Oponenti
Ing. Tomáš Kalvoda, Ph.D.
Anotace
Tato práce si klade za cíl prozkoumat techniky strojového učení a možnosti zpracování časových signálů se zaměřením na EKG. Práce zkoumá vliv modifikací Fourierovy transformace na výkonnost modelů strojového učení a porovná přesnost modelů ve frekvenční oblasti s jednotlivými modifikacemi modelů pracujících v časové oblasti. Jednotlivé kroky: 1) Přezkoumat modely strojového učení pro klasifikaci časových signálů (částečné a celé) a techniky pro předzpracování časových signálů. 2) Popsat a prozkoumat vhodný soubor dat. Například CODE-15 pro klasifikaci EKG. 3) Projít si Fourierovu transformaci, její úpravy a navrhnout své úpravy. 4) Vytvořit základní model a experimentovat s upravenými modely a zdokumentovat dopad úprav na přesnost modelu. 5) Porovnovat výsledky s technikami přímo pomocí dat v časové oblasti.