doc. Ing. Kamil Dedecius, Ph.D.

Závěrečné práce

Bakalářské práce

Predikce výsledků UFC na základě statistik a sentimentu

Autor
Roman Isaev
Rok
2023
Typ
Bakalářská práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
RNDr. Vladimíra Sečkárová, Ph.D.
Anotace
Tato práce se zabývá rešerší teorie oboru jenž se nazývá Analýza Sentimentů a studuje možnosti použití sentimentů uživatelů kteří je nechávají na online platformách ve formě komentářů k predikci budoucích výsledků zápasů v UFC. Dále, tato práce používá již známe metody založené na minulých statistikách a dosahuje výsledků porovnatelných s předchůdci. Nakonec, tato práce slouží jako důkaz toho, že sentimenty můžou mít vysokou hodnotu k predikci výsledků UFC, neboť dosahuje vysoké přesnosti na studovaném případě při predikci pomocí příspěvků na Twitteru.

Porovnání národních časových řad vývoje COVID-19

Autor
Michael Kolínský
Rok
2021
Typ
Bakalářská práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Radomír Žemlička
Anotace
Tato práce se zabývá analýzou národních časových řad denního počtu nově nakažených virem COVID-19. Data jsou převzatá ze Světové zdravotnické organizace. Ve fázi předzpracování dat jsou národní řady přeškálovány na počet obyvatel v dané zemi. Datům je snížena dimenzi s pomocí metody Piecewise aggregate approximation a jsou odstraněny všechny složky časových řad s vyjímkou trendu. V práci jsou definovány čtyři metody porovnání časových řad jako Dynamic Time Warping (DTW), Edit Distance With Real Penalty (ERP), Longest Common Subsequence Similarity (LCSS) a Diskrétní Fréchetova vzdálenost. V další fázi je na předzpracovaná data aplikován algoritmus aglomerativního hierarchického shlukování s použitím průměrné párové vzdálenosti a využitím předchozích metrik. V poslední fázi jsou zvoleny výsledné počety shluků pro všechny metriky s využitím dendrogramu. V závěru práce se nachází vykreslené shluky, které jsou diskutovány spolu s vlastnostmi použitých metod měření vzdálenosti.

Sledování více cílů pomocí PHD filtrů

Autor
Petr Jechumtál
Rok
2023
Typ
Bakalářská práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Tomáš Vlk
Anotace
Tato práce se zaměřuje na problém sledování více cílů, což je stále velmi náročná disciplína. Zabývá se nejistotou spojení mezi měřením a cílem v prostředí se zvýšeným šumem. Cíle se navíc mohou objevovat a mizet víceméně náhodně. Řešení popsané v této práci je založeno na bayesovské inferenci a sestává z filtrů hustoty pravděpodobnostních hypotéz. Tento přístup zahrnuje modelování příslušných množin cílů a měření jako náhodné konečné množiny. K šíření aposteriorní intenzity, což je statistika prvního řádu náhodné konečné množiny cílů v čase, se používají rekurze hustoty pravděpodobnosti.

Modelování a vlastnosti autoregresních procesů

Autor
Artem Tokarevskikh
Rok
2021
Typ
Bakalářská práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Problematika streamovaných dat přitahuje v poslední době mnoho pozornosti v odvětvích jako jsou IoT, sociální sítě či elektronický obchod. Jde o data, která jsou svými zdroji kontinuálně generovaná a je potřeba je zpracovávat v reálném čase. Vzhledem k vysoké frekvenci jejich získávání je potřeba využívat metody, které jsou výpočetně minimálně náročné a zároveň mají minimální požadavky na paměť. Autoregresni (AR) modely jsou jedním ze základních přístupů k modelování časových řad. Myšlenka autoregresních modelů spočívá v tom, že současná hodnota řady je lineárně závislá na hodnotách předchozích. Díky své struktuře AR modely umožňují efektivně zpracovávat streamovaná data i v situacích, kdy složitější modely nemohou být kvůli související výpočetní a paměťové náročnosti využity. Tato práce zkoumá AR procesy a jejich vlastnosti, nastiňuje teorii, která za nimi stojí, a uvádí příklad AR modelování na reálných datech týkajících se průběhu pandemie COVID-19 v České republice.

Aproximace v logistické regresi

Autor
Eliáš El Frem
Rok
2022
Typ
Bakalářská práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Ondřej Tichý, Ph.D.
Anotace
Logistická regrese je klasifikační metoda používaná při strojovém zpracování dat. Tato práce se zabývá optimalizací Bayesovského odhadu parametrů logistického modelu pomocí Laplaceovské aproximace. Dosavadní metody většinou spoléhají na suboptimální Laplaceovské aproximace. Tato práce jde ještě o krok dále. Zkoumá dopad přesnější aproximace na kvalitu odhadu. Výsledky výpočetně náročných optimalizací jsou zde porovnány s tradičními optimalizacemi, jež jsou sice výpočetně jednodušší, ale také méně přesné.

Statistické modelování časových řad souvisejících s Covid-19

Autor
Oleh Kuznetsov
Rok
2021
Typ
Bakalářská práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Radomír Žemlička
Anotace
V letech 2020-2021 zažívá celý svět potíže způsobené globální epidemií nového viru SARS-CoV-2. Cílem této práce je statistická analýza časových řad souvisejících s pandemií COVID-19 v České republice a zkoumání využitelnosti modelů Facebook Prophet a Seasonal Autoregressive Integrated Moving Average (SARIMA) k analýze a predikci vývoje pandemických procesů. Tato práce propojuje globální změny, které nastaly ve vybraných časových řadách, s poskytnutými vládními omezeními (lockdown, nošení obličejové masky apod.).

Návrh a implementace doporučovacího systému pro knihy

Autor
Damián Baraník
Rok
2023
Typ
Bakalářská práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
RNDr. Vladimíra Sečkárová, Ph.D.
Anotace
Odporúčacie systémy sú skoro každodennou súčasťou našich životov. Je potrebné vynaložiť značné úsilie an hľadanie nového knižného titulu an základe osobných preferencií. Na zjednodušenie tohto procesu, väčšina online predajcov využíva schopnosti odporúčacích systémov na propagáciu ďalších produktov pre ich zákazníkov. V práci ukazujeme najmoderjenšie riešenia a analyzujeme rozdielne prístupy k odporúčaciemu procesu. Na základe analýzy vytvárame odporúčací systém pre knihy. Náš systém kombinuje viaceré odporúčacie algoritmy a dáva užívateľovi možnosť nastaviť špecifickosť odporúčania.

Diplomové práce

Distribuovaná Kalmanovská filtrace při částečně heterogenních modelech

Autor
Thanh Quang Mai
Rok
2021
Typ
Diplomová práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Ondřej Tichý, Ph.D.
Anotace
Tato práce se zabývá problémem distribuovaného Kalmanovského filtrování při částečně heterogenních modelech. Je navrhnuta modifikace existujícího difuzního Kalmanova filtru, umožňující v difuzních sítích použití částečně heterogenních modelů. Výkon méně komplexních modelů je také zvýšen implementací heuristiky umožńující detekci selhávajících uzlů sítě, selhávající uzly jsou restartovány a je jim dána šance se zotavit.

Předpověď cen elektřiny v závislosti na počasí

Autor
Jan Dejdar
Rok
2019
Typ
Diplomová práce
Vedoucí
Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Tomáš Vondra, Ph.D.
Anotace
Tato diplomová práce se zabývá předpovídáním ceny elektřiny v závislosti na počasí. Výzkum tohoto tématu je předmětem velkého zájmu, protože na přesných předpovědích cen elektřiny závisí provozovatelé elektráren i velké podniky, které elektřinu spotřebovávají. Vzhledem k nemožnosti efektivního ukládání většího množství elektřiny a nutnosti vyvažovat v síti mezi produkcí a spotřebou cena elektřiny na krátkodobých trzích velmi výrazně kolísá, což činí její přesné předpovídání náročným. Cenu elektřiny ovlivňuje mnoho faktorů. Zejména ve střední a západní Evropě je jedním z nich počasí, kvůli stále se zvyšujícímu množství solárních a větrných elektráren. Cílem této práce je analyzovat dostupná data o počasí a cenách elektřiny na burze a vytvořit pro tato data prediktivní model.

Network anomaly detection based on traceroute data

Autor
Jan Peřina
Rok
2024
Typ
Diplomová práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
doc. Ing. Tomáš Čejka, Ph.D.
Anotace
Detekce anomálií v síti je klíčová pro identifikaci problémů v počítačových sítích, zvláště pro počítačové sítě globálního rozsahu, jako je Worldwide LHC Computing Grid, který slouží k zpracování dat z experimentů prováděných v CERNu. Tato práce si klade za cíl zdokonalit nebo nahradit stávající heuristický algoritmus pro detekci anomálií v síti, který byl původně navržen pro identifikaci změn v síťovém směrování na základě traceroute měření mezi centry po celém světě, která jsou generována prostřednictvím softwaru perfSonar. Práce demonstruje informační bohatost traceroute měření a navrhuje několik modelů založených na Bayesovském učení, které mají za cíl zlepšit detekci anomálií na základě traceroute dat.

Vysvětlitelnost v klasifikaci časových řad

Autor
Narek Vardanjan
Rok
2023
Typ
Diplomová práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
RNDr. Vladimíra Sečkárová, Ph.D.
Anotace
Klasifikace časových řad má rozsáhlé využití v různých oblastech, od zdravotnictví po zajišťování kvality potravin. Navzdory širokému použití však není snadné interpretovat predikční modely. Tato diplomová práce se zaměřuje na návrh nového klasifikačního modelu s jednodušší vysvětlitelností. Model je založen na ARIMA modelech, které jsou často používány pro předpovídání časových řad. Dataset problému je transformován z surových časových řad na hodnoty koeficientů ARIMA modelu a následně klasifikován pomocí haldy rozhodovacích stromů. Vysvětlitelnost je zajištěna pomocí existujících modelů pro klasifikaci tabulkových dat. Kromě navržených ARIMA modelů práce obsahuje také metodu pro vysvětlení chování modelu nad surovými daty časových řad, která vychází z metody LIME.

Analýza vlastností a robustnosti bayesovských filtrů

Autor
Mykyta Boiko
Rok
2023
Typ
Diplomová práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Tomáš Vlk
Anotace
Jak je známo, stavové modely se široce používají k modelování různých pozorovatelných procesů v různých oblastech, od financí až po biologii. Na základě pozorované posloupnosti je hlavním zájmem odvodit posloupnost skrytých stavů, které je vyvolaly. Hlavním cílem této práce je studovat výkonnost a robustnost různých Bayesovských algoritmů používaných pro online filtraci stavů při dobře specifikovaných i chybně specifikovaných stavových modelech. Důvodem je skutečnost, že v praxi z různých důvodů často chybí znalost šumu procesu nebo měření. Tato práce se dotýká zejména poměrně populárního případu, kdy je model měření chybně specifikován. V rámci této práce je kladen důraz na seznámení s filtry z nejpopulárnější rodiny, Kalmanovy rodiny, a uvažuje se o nich z Bayesovského hlediska, přičemž nechybí ani částicový filtr, který je v souvislosti s aplikací na chybně specifikované modely považován za stabilnější. Pozornost bude věnována také a budou provedeny experimenty s tzv. přibližnými Bayesovskými filtry, které umožňují úplnou neznalost šumového rozdělení měření. Výsledkem práce by mělo být pokrytí teorie všeho výše uvedeného a výsledky experimentů, nevyjímaje stanovení plánů pro další rozvoj tématu.

Bayesovská filtrace stavových modelů s neznámými kovariancemi

Autor
Tomáš Vlk
Rok
2021
Typ
Diplomová práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Ondřej Tichý, Ph.D.
Anotace
Tato závěrečná práce se věnuje problému distribuovaného Baysovského sekvenčního odhadu neznámých stavů stavových modelů s neznámými kovariačními maticemi šumu procesu i měření. Tento problém je velmi častý v reálných případech, kde specifické informace o kovariačních maticích šumu pro jednotlivé senzory nemusí být dostupné. Řešení navržené v této práci je postavené na teorii variačního Bayese, ta je využitá jak k odhadu stavů, tak i k odhadu kovariační matice šumu měření. Z důvodu zlepšení sdílíme jak měření, tak i posteriorní odhady mezi sousedními uzly v síti. Práce zároveň ukazuje způsob optimalizace kovariační matice procesního šumu.

Sledování více cílů s využitím externí informace

Autor
Andrey Babushkin
Rok
2023
Typ
Diplomová práce
Vedoucí
doc. Ing. Kamil Dedecius, Ph.D.
Oponenti
Ing. Tomáš Vlk
Anotace
Tato práce se zaměřuje na problém sledování více cílů v prostředí s vysokým množstvím rušení a nejistotou ohledně počtu sledovaných objektů pomocí Bayesovské inference. V této práci se hlavně zaměřujeme na populární Gaussian mixture probability hypothesis density (GM-PHD) filtr a představujeme techniku, jak zahrnout dodatečné informace pro případy, kdy senzor nedokáže detekovat sledované objekty z důvodu fyzických nebo prostředkových omezení. Poskytujeme veškeré potřebné teoretické pozadí od základů teorie pravděpodobnosti až po diskusi o různých metodách sledování více cílů a představení rámce Finite Set Statistics (FISST). Dále zahrnujeme rozsáhlé měření výkonnosti a analýzu výsledků, kde ukazujeme, že navržená technika fúze výrazně zlepšuje sledovací výsledky. Nakonec diskutujeme omezení filtru a navrhujeme možné způsoby, jak je překonat.

Sekvenční bayesovská poissonovská regrese

Autor
Radomír Žemlička
Rok
2020
Typ
Diplomová práce
Vedoucí
Ing. Kamil Dedecius, Ph.D.
Anotace
Poissonovská regrese je populární zobecněný lineární model používaný k modelování diskrétních náhodných veličin, typicky počtů. Tato práce je zaměřena na problematiku jejího sekvenčního odhadování s regresními koeficienty potenciálně pomalu proměnnými v čase. Je použita vhodná aproximace normálním rozdělením, aby tak bylo možné učinit v Bayesovském kontextu. Rovněž je diskutována kalibrační technika pro zvýšení kvality odhadů. Na závěr je navržen případ použití představeného přístupu v doméně zpracování signálu, zejména jeho použití v difuzních sítích (diffusion networks) pro realizaci distribuovaného kolaborativního odhadování.

Fúze heterogenních modelů v sítích spolupracujících agentů

Autor
Martin Šmíd
Rok
2020
Typ
Diplomová práce
Vedoucí
Ing. Kamil Dedecius, Ph.D.
Anotace
Tato práce se zabývá možnostmi zlepšení lokálních predikcí v agentních sítích pomocí sdílení informací se sousedními uzly. Agenti používají různé modely, v důsledku čehož je omezen typ informací, které si mohou vyměnit se sousedy. Je navrženo několik variant ke zlepšení predikce, některé z nich umožňují zahrnutí jistoty predikce. Varianty jsou následně implementovány a porovnány na simulovaných i reálných datech.