Bakalářské práce
Předpověď statistik fotbalových zápasů založená na strojovém učení
Autor
Ondřej Herman
Rok
2023
Typ
Bakalářská práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
Ing. Petr Kasalický
Katedra
Anotace
Fotbal, nejrozšířenější a nejsledovanější sport na světě, poutá pozornost miliard fanoušků po celém světe. Předpovídání výsledků zápasů se dostalo pozornosti statistiků, výzkumníků strojového učení a nadšených sázkařů. Nicméně, zatímco byl učiněn podstatný pokrok ve strojovém učení pro předpověď výsledků zápasů, relativně malý důraz byl kladen na předpovídání statistických aspektů daných zápasů. Tato studie si klade za cíl řešit tento nedostatek prozkoumáním metod strojového učení k analýze a odhadu různých statistik jako regresních problémů. Konkrétně zkoumám šest statistik: rohy, střely, střely na branku, fauly, žluté karty a červené karty. Prováděním experimentů na čtyřech datových souborech z různých fotbalových lig postupně porovnám a vyhodnotím výsledky osmi různých modelů. Má zjištění ukazují, že různé metody se více hodí na určité statistiky a také, že různé statistiky vykazují různé chování v různých ligách. Kromě toho jsem si všiml, že určité vlastnosti, jako je počet rohů nebo střel, jsou předvídatelnější díky jejich vyšší míře výskytu během zápasů ve srovnání například s počtem karet.
Víceúlohové učení pro analýzu trojic v kognitivních vědách
Autor
Tsimafei Stambrouski
Rok
2024
Typ
Bakalářská práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
Mgr. Alexander Kovalenko, Ph.D.
Katedra
Anotace
Tato bakalářská práce se zabývá analýzou triplet problému, jehož úkolem je identifikovat lichý objekt ze tří. Existují různé metodologické přístupy k řešení tohoto problému, které se liší základním zaměřením - některé metody hodnotí, které dva objekty jsou si nejvíce podobné, zatímco jiné identifikují objekt, který je nejvíce odlišný. Cílem této práce je integrace těchto dvou perspektiv a analýza výsledků. V rámci řešení byla vyvinuta neuronová síť s využitím knihovny TensorFlow v programovacím jazyku Python. Momentální výzkum ukázal, že kombinace obou přístupů nepřinesla lepší výsledky než jednotlivé metody o samotě. Hlavním výstupem práce je objasnění, jak kombinace opačných pohledů ovlivňuje finální volbu lichého objektu.Například v množině (Auto, Pes a Dům) je třeba vybrat jednu položku jako lichou. Dům a Auto jsou si nejpodobnější, nebo je Auto liché?
Využití velkých jazykových modelů pro regionalizované doporučovací systémy
Autor
Adam Čapka
Rok
2025
Typ
Bakalářská práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato práce zkoumá využití embeddingů generovaných velkými jazykovými modely (LLM) pro analýzu nestrukturovaných textových dat s cílem odhalit regionální vzorce v lidském chování a lokálních characteristikách. S využitím těchto embeddingů je aplikován algoritmus regionalizace, který definuje prostorově souvislé oblasti vykazující podobné jazykové vzorce. Tento přístup umožňuje identifikaci organicky vznikajících zón zájmů, které překračují arbitrární administrativní hranice. Dále jsou využity řídké autoenkodéry (sparse autoencoders) k izolaci klíčových tématických prvků z embeddingů, což umožňuje provádět regionalizaci na základě specifických aspektů textových dat, jako jsou například podmínky prostředí, sentiment nebo infrastruktura. Výsledky ukazují, že kombinace embeddingů založených na LLM a řídkých autoenkodérů představuje účinný nástroj pro porozumění regionálním rozdílům, s možným využitím v doporučovacích systémech, tržních analýzách nebo udržitelném plánování využití krajiny.
Framework využívající velké jazykové modely pro předpověď fotbalových událostí
Autor
Dmytro Borovko
Rok
2025
Typ
Bakalářská práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
Ing. Miroslav Čepek, Ph.D.
Katedra
Anotace
Tato bakalářská práce představuje framework pro predikci následující události ve fotbalových zápasech pomocí velkých jazykových modelů (LLM), které integrují sémantické embeddingy z nestrukturovaných textových komentářů se strukturovanými záznamy událostí. Výzkum zkoumá, zda embeddingy odvozené z LLM mohou zlepšit přesnost predikce ve srovnání s tradičními sekvenčními modely, které se spoléhají výhradně na tabulková data. Metodologie zahrnuje získávání a předzpracování dat, extrakci embeddingů a vývoj dopředné neuronové sítě, která je hodnocena pomocí metrik, jako je přesnost a průměrná reciproční hodnota (MRR). Ačkoli modely založené na LLM nepřekonaly konvenční přístupy, navržený framework identifikuje klíčová omezení a ukazuje silný potenciál pro obohacení modelování událostí o sémantický kontext. Jeho modulární design umožňuje rozsáhlé experimentování a slouží jako reprodukovatelný referenční bod pro budoucí výzkum. Tato práce přispívá k rozvíjejícímu se propojení zpracování přirozeného jazyka a sportovní analytiky a poskytuje základ pro další vývoj v oblasti využití LLM pro lepší porozumění a predikci událostí ve fotbalových zápasech.
Systém založený na umělé inteligenci pro automatickou generaci reflexních otázek ve vzdělávacím prostředí.
Autor
Ondřej Holub
Rok
2025
Typ
Bakalářská práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
Bc. Ondřej Brém, MSc.
Katedra
Anotace
Tato práce se zabývá systémem pro generování reflexivních otázek ve vzdělávacím prostředí pomocí velkých jazykových modelů (LLM). Systém využívá Sokratovskou metodu v dialogu mezi dvěma samostatnými instancemi LLM, z nichž každá má své vlastní jedinečné parametry, aby zlepšil kvalitu generovaných otázek. Jako LLM byl použit model 4o-mini ChatGPT pro snadné testování a hodnocení. Konečný systém vykazuje slibné výsledky při generování vysoce kvalitních reflexivních otázek - použití sokratického dialogu zlepšuje kvalitu výsledků. Existuje několik oblastí pro zlepšení, zejména v hodnocení kvality konečných otázek a určení vhodné doby pro ukončení dialogu. Výzvy vytvořené během vývoje systému jsou k dispozici v přílohách.
Diplomové práce
Předpovídání výsledků fotbalu pomocí funkcí doplňování tenzorů
Autor
Martin Kostrubanič
Rok
2023
Typ
Diplomová práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
Ing. Karel Klouda, Ph.D.
Katedra
Anotace
Fotbal je velmi populární sport s více než 3,5 miliardy fanoušků po celém světě a predikce výsledků zápasů je stále důležitější. Zatímco k tomuto účelu bylo použito několik metod strojového učení, personalizované metody strojového učení, jako je kompletace matice, byly opomíjeny. V této práci představuji metody kompletace tenzoru pro predikci výsledků fotbalových zápasů, přičemž využívám dva experimentální okruhy: (1) kompletaci tenzoru jako metodu predikce a (2) extrakci embeddingů kompletace tenzoru. Využívám data z pěti různých lig, čtyř z Evropy a jedné z Jižní Ameriky. Výsledky ukazují, že kompletace tenzoru se vyrovná nebo překonává ostatní nejmodernější metody predikce a je schopna zlepšit výkonnost umělých neuronových sítí v této úloze.
Využívání prostorového kontextu pro doporučení položek
Autor
Vendula Švastalová
Rok
2024
Typ
Diplomová práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato práce se zabývá vývojem doporučovacího systému který využívá polohová data uživatelů. Námi navržená architekrura kombinuje přístup kódování polohy se skupinami uživatelů a jejich preferencemi. Naše architektura se odlišuje tím, že zeměpisnou šířku a změpisnou délku kóduje do vektorového prostoru vyšší dimenze. Tento přístup umožňuje systému dynamicky generovat doporučení kategorií pro nové zájmové body, jako jsou události, místa, nebo aktivity v konkrétních lokalitách. Provedli jsme řadu experimentů, které ukazují, že navrhovaná architektura dosahuje zlepšení oproti základním modelům. Naše modely mohou být využity v sociálních sítích, kde mohou zvýšit zapojení jednotlivých uživatelů i komunity.
Detekce falešných recenzí v rekomendačních systémech
Autor
Daniel Bohuněk
Rok
2024
Typ
Diplomová práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Podvodníci se snaží své chování maskovat, aby zůstali skrytí. To může mít za následek náročný návrh modelů, které je mají spolehlivě detekovat, jelikož část podvodníků může zůstat ukrytá v množině označené za ne-podvodníky. Existující výzkum ukazuje, že grafová konvoluce může přinést vylepšení díky její schopnosti využít vztahy mezi jednotlivými případy. Tato práce navrhuje siamskou grafovou neuronovou síť, kterou lze trénovat semi-supervizovaným učením, kdy je k dispozici jen malá množina známých podvodníků. Tento model projevuje lepší výkon než existující metody a vyšší odolnost proti maskovaným podvodníkům.
Lidská shoda s modely zpracování přirozeného jazyka
Autor
Anastasiia Solomiia Hrytsyna
Rok
2024
Typ
Diplomová práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
Mgr. Alexander Kovalenko, Ph.D.
Katedra
Anotace
Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo. Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt. Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam quaerat voluptatem. Ut enim ad minima veniam, quis nostrum exercitationem ullam corporis suscipit laboriosam, nisi ut aliquid ex ea commodi consequatur? Quis autem vel eum iure reprehenderit qui in ea voluptate velit esse quam nihil molestiae consequatur, vel illum qui dolorem eum fugiat quo voluptas nulla pariatur?
Doporučování založené na segmentaci
Autor
Patrik Malý
Rok
2025
Typ
Diplomová práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Představujeme přístup k doporučování segmentů, který řeší dosud neprozkoumanou oblast v oblasti doporučovacích systémů. Náš hlavní přínos spočívá ve vývoji metody výpočtu distribuce preferencí segmentů (SPDC) s integrovaným maskovacím procesem a v systematické úpravě tradičních i skupinových doporučovacích modelů. Experimenty na třech odlišných datových sadách (MovieLens, Amazon Electronics, Food.com) ukazují, že účinnost modelů výrazně závisí na charakteristikách dat. Výsledky potvrzují, že naše upravené modely překonávají standardní metody.
Zkoumání skórování a řazení ve vícestupňových doporučovacích systémech pro doporučování knih s využitím velkých jazykových modelů
Autor
Maksim Spiridonov
Rok
2025
Typ
Diplomová práce
Vedoucí
Dr. Rodrigo Augusto da Silva Alves
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato práce představuje vícestupňový doporučovací systém, který kombinuje klasický přístup kolaborativního filtrování s rozsáhlými jazykovými modely pro vyhledávání a řazení kandidátních položek na základě preferencí uživatele. Velký jazykový model je vyladěn pomocí Prompt Tuning a Fine Tuning s LoRA. Konečné přerankování poskytuje také vysvětlení. Výsledky experimentů ukazují, že navrhovaná metoda překonává vybrané základní modely, jako je nevyladěný model a další. Na závěr je navržena a diskutována budoucí práce.