Ing. Tomáš Řehořek, Ph.D.

Závěrečné práce

Bakalářské práce

Framework pro vyhodnocování úspěšnosti algoritmů častých sekvencí v doporučovacích systémech

Autor
Michal Bajer
Rok
2017
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Tato bakalářská práce pojednává o analýze sekvenčních dat, hledání častých vzorů v časově uspořádaných datech a jeho využití k doporučování produktů zákazníkům internetových obchodů na základě jejich historie nákupů. Cílem práce je navrhnout a implementovat framework, který umožňuje zpracovat nasbíraná data, najít v nich vzory a určit na jejich základě pravděpodobné pokračování sekvence nákupů zákazníka. Dalším cílem je umožnit vyhodnocení úspěšnosti několika různých algoritmů a vybrat nejvhodnější pro specifický účel. Výsledkem práce je návrh, diskuze možností a implementace funkčního frameworku pro doporučování produktů a vyhodnocení úspěšnosti. Na konec proběhla analýza kvality doporučení za použití implementovaných algoritmů. Implementace práce proběhla v jazyce Java.

Evaluace využitelnosti distribuovaných databázových systémů v oblasti doporučování

Autor
Filip Křesťan
Rok
2016
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Anotace
Cílem této práce je provést výkonnostní měření distribuovaných databázových systémů na dvou případech užití, které blízce sledují item-based collaborative filtering rekomendační algoritmus. První případ se zaměřuje na cache přepočítaných predikcí. Druhým případem je reprezentace řídké matice se zaměřením na selekci řádků a sloupců této matice. V první části práce je představen výše zmíněný rekomendační algoritmus a zasazen do kontextu této bakalářské práce. V další části jsou prozkoumány možné reprezentace řídké matice se zaměřením na specifikované operace. Na základě získaných informací byly vybrány čtyři distribuované databázové systémy vhodné pro tyto účely: Aerospike, Couchbase, Riak, MemSQL. Dále byl vybrán Yahoo! Cloud Serving Benchmark jako vhodný nástroj pro měření výkonnosti vybraných systémů. V následující části je popsána metodologie použitá při výkonnostním měření, rozšíření provedená ve zvoleném nástroji potřebná pro tento experiment a prostředí, ve kterém byl experiment proveden. Zvolená metodologie je aplikována v poslední části této sekce, která popisuje průběh výkonnostního měření. Výsledky měření, které jsou představeny v poslední kapitole, ukazují, že Aerospike podal nejlepší výsledek mezi zvolenými databázovými systémy v obou případech užití. Výsledky také poukazují na možnou kombinaci obou zátěží do jednoho databázového clusteru, která se v případě Aerospike jeví velice výhodně.

Webové prostředí pro algoritmy nad binárními stromy

Autor
Jakub Melezínek
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Jiří Chludil

Doporučování obsahu s využitím metod text miningu

Autor
Martin Barus
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.

Analýza vlivu kontextu interakcí při doporučování kolaborativním filtrováním

Autor
Martin Scheubrein
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Kamil Dedecius, Ph.D.
Anotace
Kolaborativní filtrování je jednou z nejúspěšnějších technik používaných v doporučovacích systémech. Základní algoritmy využívají historické interakce mezi uživateli a předměty, nicméně doporučovací systémy nasazené v produkčním prostředí mají často k dispozici minimálně jednu další dimenzi dat - časová razítka těchto interakcí. Tyto okolnosti interakcí nazýváme kontextem. Tato práce využívá dosud často opomíjené informace v datech ke zlepšení přesnosti doporučování. Je navrženo několik nových přístupů k začlenění kontextu do tradičních metod kolaborativního filtrování. K evaluaci těchto vylepšení je navržen a implementován testovací framework. Navržené metody jsou rozsáhle testovány na několika datasetech, s různými parametry a kontexty. Výsledky ukazují, že metody beroucí v úvahu kontext vykazují i na převážně statických datasetech zlepšení metriky recall o 5-25 % oproti tradidičním algoritmům kolaborativního filtrování.

Interaktivní geometrický náčrtník v prostředí webového klienta

Autor
David Šenkýř
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Pavel Štěpán

Nástroj pro analýzu chování umělých neuronových sítí

Autor
Vít Steklý
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Ivo Petr, Ph.D.

Návrh a implementace modulu pro feature selection v doporučovacím systému Modgen

Autor
Michal Režnický
Rok
2016
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Tato bakalářská práce se zabývá rozšířením existujícího doporučovacího systému o novou funkcionalitu ve formě modulu podle požadavků zadavatele. Práce má reprezentovat běžný scénář využití softwarového inženýrství. V tomto případě má zadavatel zájem rozšířit doporučovací systém Modgen o modul implementující výběr atributů. Práce začíná zadáním a sběrem požadavků na rozšiřující modul dle metod softwarového inženýrství. Následuje analýza již stávajícího systému pro lepší představu o prostředí, do kterého je třeba modul implementovat. Další analýze jsou podrobena možná řešení - metody a algoritmy, které by bylo možné použít. Na základě analýz představím návrh podoby nového modulu a jeho umístění v systému, modul je poté podle návrhu implementován. Následně je provedena evaluace na různých testovacích datech, na závěr jsou diskutovány a shrnuty výsledky.

Doporučovací systém pro online herní slevový portál

Autor
Tomáš Fedor
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.

Evaluace algoritmů lokálně senzitivního hashování (LSH) v doporučovacích systémech

Autor
Ladislav Martínek
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Tato práce se zabývá aproximací algoritmu k-nejbližších sousedů orientovaného na uživatele pomocí metod lokálně senzitivního hashování a aplikací těchto metod do doporučovacích systémů. Práce nejprve teoreticky popisuje doporučovací systémy, kolaborativní filtrování, algoritmy hledání k-nejbližších sousedů a metody jejich aproximace pomocí metod lokálně senzitivního hashování. Na základě analýzy dané problematiky je navrhnut a implementován framework, který umožňuje testovat různé parametrizace metod lokálně senzitivního hashování. Ve frameworku lze testovat přesnost na k-nejbližších sousedů nebo úspěšnost doporučování použitím míry recall v závislosti na catalog coverage. Popsané metody jsou pomocí frameworku otestovány na dvou odlišných databázích. Z testů jednotlivých metod a parametrizací jsou vyvozeny možnosti jejich kombinace k dosažení optimálních modelů. Při testování optimálních modelů se podařilo dosáhnout velice uspokojivých výsledků. Při čase modelu LSH okolo 3 % času referenčního řešení se podařilo dosáhnout úspěšnosti doporučování mezi 97 a 99 %. Na závěr jsou diskutovány výsledky a různé poznatky z testování jednotlivých metod.

Doporučovací modely založené na obrázcích

Autor
Martin Pavlíček
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Cílem této práce je navrhnout, implementovat a porovnat několik content-based doporučovacích modelů, založených na různých metodách predikce obsahové podobnosti doporučovaných položek z jejich obrázků, se zaměřením na doporučování na webu a v prostředí online e-shopu. Tyto modely jsou navrženy jako alternativa k hojně využívaným modelům kolaborativního filtrování, které trpí řadou problémů jako je například cold-start problem. Pro predikci obsahové podobnosti obrázků jsou mimo jiné použity moderní přístupy založené na algoritmu ORB nebo učení umělých neuronových sítí. Úspěšnosti implementovaných modelů jsou následně offline testovány na reálných datasetech zaznamenaných uživatelských interakcí několika významných online e-shopů pomocí technik recall a catalog coverage. Model založený na umělé neuronové síti prokázal v offline testování nejlepší úspěšnost z navrhovaných modelů a byl nasazen do online A/B testu proti produkčnímu algoritmu, založeném na kolaborativním filtrování. Na testovaném vzorku 7435 uživatelů prokázal nově navržený model srovnatelnou proklikovost jako produkční algoritmus.

Pokročilé techniky gradientní optimalizace umělých neuronových sítí v programu RapidMiner 5

Autor
Tomáš Richtr
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
prof. Dr. Ing. Petr Kroha, CSc.
Anotace
Tato bakalářská práce se zabývá vývojem zásuvného modulu do programu RapidMiner 5, který realizuje operátor umělé neuronové sítě s pokročilými algoritmy učení. Realizovaný operátor rozšiřuje funkcionalitu programu RapidMiner 5 o možnost naučení umělé neuronové sítě pomocí algoritmů Delta-Bar-Delta, Quickprop a Rprop. Tato práce obsahuje analýzu jednotlivých učících algoritmů a analýzu současného řešení v programu RapidMiner 5, návrh zásuvného modulu, implementaci zásuvného modulu a závěrečná testování vytvořeného zásuvného modulu nad různými množinami dat.

Webový framework pro krokování a současnou vizualizaci algoritmů

Autor
David Šolc
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
prof. Ing. Pavel Tvrdík, CSc.

Porovnání různých metod měření úspěšnosti v kolaborativním filtrování

Autor
Martin Hak
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.

Klient-server aplikace pro dvouhráčové hry s využitím WebSocket

Autor
Radmir Usmanov
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Petr Jendele

Atributový doporučovací model trénovaný s využitím interakční podobnosti

Autor
Petr Kasalický
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Tato bakalářská práce se zabývá doporučovacimi systémy a jejich základnimi přistupy: Kolaborativni filtrováni a Atributové doporučováni. Je představen nový hybridni přistup, který kombinuje tyto dva přistupy. Tato metoda zvyšuje recall atributového doporučováni až o 216% a umožňuje přesnějši doporučováni pro nově přidané věci, které trpi cold-start problémem. Tento navržený a implementovaný přistup využivá metod strojového učeni jako je embedding nebo umělé neuronové sitě, které budou taktéž stručně představeny, spolu se způsobem vyhodnocováni kvality doporučováni.

Vektorový grafický editor v prostředí webového klienta

Autor
Michal Kvasnička
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Mgr. Peter Franek, Ph.D.

Porovnání neuroevolučních algoritmů na různých problémových doménách

Autor
Tomáš Frýda
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Jan Drchal, Ph.D.

Diplomové práce

Analýza algoritmů kolaborativního filtrování nad multimediálními daty

Autor
Jakub Pištěk
Rok
2013
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.

Doporučovací modely založené na rekurentních neuronových sítích

Autor
Ladislav Martínek
Rok
2020
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Mgr. Ladislava Smítková Janků, Ph.D.
Anotace
Tato diplomová práce řeší problematiku doporučovacích systémů. Cílem je predikce následujících položek na základě sekvenčních dat z chování uživatelů pomocí rekurentních neuronových sítí (LSTM, GRU). Reprezentace položek je tvořena pomocí maticové faktorizace upravené pro datasety s implicitní zpětnou vazbou. V práci je navržen a implementován algoritmus pro tvorbu rekurentních modelů využívající vytvořenou reprezentaci položek. Navržen je také způsob vyhodnocování respektující sekvenční povahu dat. Metoda vyhodnocování využívá metriky recall a catalog coverage. Experimenty jsou prováděny systematicky s cílem zjistit závislosti na sledovaných metodách a hyperparametrech. Měření je prováděno na třech datových sadách. Na největším datasetu se podařilo dosáhnout více jak dvojnásobného recallu proti dalším metodám, které byly zastoupeny kolaborativním filtrováním, reminder modelem a popularity modelem. Na závěr práce jsou diskutovány zjištěné poznatky, možné zlepšení hyperparametrizací a další možné směry vylepšení modelů.

Kontrafaktuální učení řazení výsledků v personalizovaném vyhledávání

Autor
Michael Kolínský
Rok
2023
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Rodrigo Augusto da Silva Alves, Ph.D.
Anotace
Tato práce se zabývá oblastí vyhledávačů, s důrazem na kontrafaktuální metody Learning to Rank, zkreslení způsobené pozicí dokumentů a zkreslení způsobené výběrem dokumentů v historických interakcích, personalizaci vyhledávacích výsledků a úspěšnostní metriky pro offline vyhodnocení seřazených dokumentů. Cílem studie je navrhnout a implementovat framework pro učení vhodných modelů s využitím kontrafaktuálních Learning to Rank metod, které se používají pro srovnání úspěšnosti řazení těchto modelů a k jejich tréninku. Navíc jsou navrženy některé specifické vyhledávací příznaky pro dokumenty i uživatele, které mají zlepšit úspěšnost těchto modelů. Off-line experimenty byly prováděny na dvou významně odlišných průmyslových datasetech s cílem posoudit úspěšnost řazení různých modelů pomocí vybraných metod. Část experimentů je věnována srovnání různých příznaků k personalizaci pro konkrétního uživatele. Úspěšnost těchto modelů byla hodnocena pomocí vhodných úspěšnostních metrik pro off-line kontrafaktuální vyhodnocení i s dalšími metrikami pro offline vyhodnocení. Toto dílo přispívá k optimalizaci vyhledávačů. Zjištění mohou být použita pro personalizaci vyhledávácích výsledků a vývoj efektivnějších modelů pro vyhledávání.

Doporučovací algoritmy pro hierarchická data

Autor
Kryštof Zindulka
Rok
2023
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Klasické doporučovací přístupy se zabývají doporučováním položek uživatelům. Nad těmito položkami často existuje nějaká hierarchická struktura, případně více takových struktur. V této práci je představen způsob doporučování prvků hierarchické struktury, které označuje jako segmenty. Existuje několik praktických situací, kdy má smysl doporučovat prvky hierarchické struktury, například doporučování seriálů místo epizod. V práci je navržen nový způsob převodu položek na segmenty. Pro doporučování segmentů se používají upravené klasické doporučovací algoritmy. Kvalita navrženého řešení je prezentována pomocí experimentů provedených na dvou průmyslových datasetech ze streamingových platforem.

Evaluace algoritmů maticové faktorizace v kolaborativním filtrování

Autor
Tomáš Richtr
Rok
2016
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Tato práce se zabývá metodami maticové faktorizace v kolaborativním filtrování. Po počáteční analýze metod maticové faktorizace je navržen postup pro vyhodnocení faktorizačních modelů z hlediska metrik recall a catalog coverage. Tento návrh je realizován a je provedena sada experimentů na datasetech MovieLens a GoOut s algoritmem stochastického gradientního sestupu implementovaného knihovnami LIBMF a Apache Mahout. Výsledkem práce jsou výstupy provedených experimentů a připravený proces pro efektivní vyhodnocování faktorizačních algoritmů.

Neurální faktorizační modely pro doporučovací systémy

Autor
Radek Bartyzal
Rok
2019
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Anotace
Doporučovací systémy nám napomáhají objevit zajímavé produkty v široké nabídce. Jedním z typů algoritmů generujících doporučení jsou faktorizační modely. V této práci popisujeme moderní faktorizační modely založené na neuronových sítích. Čtyři z nich také implementujeme. Dále představujeme nový faktorizační model Hybrid cSDAE založený na neuronových sítích, který dokáže zpracovat, jak interakční informace, tak různé druhy atributů. Všechny implementované modely jsou porovnány na standardních datasetech za stejných podmínek.

Comparison of online and offline evaluation metrics in Recommender Systems

Autor
Petr Kasalický
Rok
2021
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Cílem práce je prozkoumat doporučovací systémy a způsoby jejich vyhodnocení. Je kladen důraz na porovnání online a offline způsobů vyhodnocení, neboť jejich vztah je velmi sporný. Při výzkumu se běžně používá recall pro optimalizaci doporučovacích algoritmů. Avšak recall může trpět různými problémy a nemusí vždy odpovídat online metrikám, jako je míra prokliku. Toto tvrzení je experimentálně ověřeno za použití produkčního doporučovacího systému s cílem změřit korelaci mezi recallem a mírou prokliku. Jak ukazuje sada vyčerpávajících experimentů s velkým množstvím modelů a metrik na několika průmyslových datasetech, tak korelace mezi recallem a mírou proklikou není vždy zaručena. Vzniká tak velká otázka nad současnými metodami porovnávání modelů ve výzkumu. Jako částečné zlepšení offline metrik je představena nová metoda měření recallu, která lépe reflekujte sekvečnost interakcí stejně jako jejich nenáhodné rozdělení, a tím zvyšuje její podobnost s mírou prokliku.