Bakalářské práce
Framework pro vyhodnocování úspěšnosti algoritmů častých sekvencí v doporučovacích systémech
Autor
Michal Bajer
Rok
2017
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato bakalářská práce pojednává o analýze sekvenčních dat, hledání častých
vzorů v časově uspořádaných datech a jeho využití k doporučování produktů
zákazníkům internetových obchodů na základě jejich historie nákupů.
Cílem práce je navrhnout a implementovat framework, který umožňuje
zpracovat nasbíraná data, najít v nich vzory a určit na jejich základě pravděpodobné
pokračování sekvence nákupů zákazníka. Dalším cílem je umožnit
vyhodnocení úspěšnosti několika různých algoritmů a vybrat nejvhodnější pro
specifický účel.
Výsledkem práce je návrh, diskuze možností a implementace funkčního
frameworku pro doporučování produktů a vyhodnocení úspěšnosti. Na konec
proběhla analýza kvality doporučení za použití implementovaných algoritmů.
Implementace práce proběhla v jazyce Java.
Evaluace využitelnosti distribuovaných databázových systémů v oblasti doporučování
Autor
Filip Křesťan
Rok
2016
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Katedra
Anotace
Cílem této práce je provést výkonnostní měření distribuovaných databázových systémů na dvou případech užití, které blízce sledují item-based collaborative filtering rekomendační algoritmus. První případ se zaměřuje na cache přepočítaných predikcí. Druhým případem je reprezentace řídké matice se zaměřením na selekci řádků a sloupců této matice.
V první části práce je představen výše zmíněný rekomendační algoritmus a zasazen do kontextu této bakalářské práce. V další části jsou prozkoumány možné reprezentace řídké matice se zaměřením na specifikované operace. Na základě získaných informací byly vybrány čtyři distribuované databázové systémy vhodné pro tyto účely: Aerospike, Couchbase, Riak, MemSQL. Dále byl vybrán Yahoo! Cloud Serving Benchmark jako vhodný nástroj pro měření výkonnosti vybraných systémů.
V následující části je popsána metodologie použitá při výkonnostním měření, rozšíření provedená ve zvoleném nástroji potřebná pro tento experiment a prostředí, ve kterém byl experiment proveden. Zvolená metodologie je aplikována v poslední části této sekce, která popisuje průběh výkonnostního měření.
Výsledky měření, které jsou představeny v poslední kapitole, ukazují, že Aerospike podal nejlepší výsledek mezi zvolenými databázovými systémy v obou případech užití. Výsledky také poukazují na možnou kombinaci obou zátěží do jednoho databázového clusteru, která se v případě Aerospike jeví velice výhodně.
Webové prostředí pro algoritmy nad binárními stromy
Autor
Jakub Melezínek
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Jiří Chludil
Katedra
Doporučování obsahu s využitím metod text miningu
Autor
Martin Barus
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Analýza vlivu kontextu interakcí při doporučování kolaborativním filtrováním
Autor
Martin Scheubrein
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Kamil Dedecius, Ph.D.
Katedra
Anotace
Kolaborativní filtrování je jednou z nejúspěšnějších technik používaných v doporučovacích systémech. Základní algoritmy využívají historické interakce mezi uživateli a předměty, nicméně doporučovací systémy nasazené v produkčním prostředí mají často k dispozici minimálně jednu další dimenzi dat - časová razítka těchto interakcí. Tyto okolnosti interakcí nazýváme kontextem.
Tato práce využívá dosud často opomíjené informace v datech ke zlepšení přesnosti doporučování. Je navrženo několik nových přístupů k začlenění kontextu do tradičních metod kolaborativního filtrování. K evaluaci těchto vylepšení je navržen a implementován testovací framework. Navržené metody jsou rozsáhle testovány na několika datasetech, s různými parametry a kontexty.
Výsledky ukazují, že metody beroucí v úvahu kontext vykazují i na převážně statických datasetech zlepšení metriky recall o 5-25 % oproti tradidičním algoritmům kolaborativního filtrování.
Interaktivní geometrický náčrtník v prostředí webového klienta
Autor
David Šenkýř
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Pavel Štěpán
Katedra
Nástroj pro analýzu chování umělých neuronových sítí
Autor
Vít Steklý
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Ivo Petr, Ph.D.
Katedra
Návrh a implementace modulu pro feature selection v doporučovacím systému Modgen
Autor
Michal Režnický
Rok
2016
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato bakalářská práce se zabývá rozšířením existujícího doporučovacího systému o novou funkcionalitu ve formě modulu podle požadavků zadavatele. Práce má reprezentovat běžný scénář využití softwarového inženýrství. V tomto případě má zadavatel zájem rozšířit doporučovací systém Modgen o modul implementující výběr atributů.
Práce začíná zadáním a sběrem požadavků na rozšiřující modul dle metod softwarového inženýrství.
Následuje analýza již stávajícího systému pro lepší představu o prostředí, do kterého je třeba modul implementovat. Další analýze jsou podrobena možná řešení - metody a algoritmy, které by bylo možné použít. Na základě analýz představím návrh podoby nového modulu a jeho umístění v systému, modul je poté podle návrhu implementován.
Následně je provedena evaluace na různých testovacích datech, na závěr jsou diskutovány a shrnuty výsledky.
Doporučovací systém pro online herní slevový portál
Autor
Tomáš Fedor
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Evaluace algoritmů lokálně senzitivního hashování (LSH) v doporučovacích systémech
Autor
Ladislav Martínek
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato práce se zabývá aproximací algoritmu k-nejbližších sousedů orientovaného na uživatele pomocí metod lokálně senzitivního hashování a aplikací těchto metod do doporučovacích systémů.
Práce nejprve teoreticky popisuje doporučovací systémy, kolaborativní filtrování, algoritmy hledání k-nejbližších sousedů a metody jejich aproximace pomocí metod lokálně senzitivního hashování.
Na základě analýzy dané problematiky je navrhnut a implementován framework, který umožňuje testovat různé parametrizace metod lokálně senzitivního hashování. Ve frameworku lze testovat přesnost na k-nejbližších sousedů nebo úspěšnost doporučování použitím míry recall v závislosti na catalog coverage.
Popsané metody jsou pomocí frameworku otestovány na dvou odlišných databázích. Z testů jednotlivých metod a parametrizací jsou vyvozeny možnosti jejich kombinace k dosažení optimálních modelů. Při testování optimálních modelů se podařilo dosáhnout velice uspokojivých výsledků. Při čase modelu LSH okolo 3 % času referenčního řešení se podařilo dosáhnout úspěšnosti doporučování mezi 97 a 99 %. Na závěr jsou diskutovány výsledky a různé poznatky z testování jednotlivých metod.
Doporučovací modely založené na obrázcích
Autor
Martin Pavlíček
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Cílem této práce je navrhnout, implementovat a porovnat několik content-based doporučovacích modelů, založených na různých metodách predikce obsahové podobnosti doporučovaných položek z jejich obrázků, se zaměřením na doporučování na webu a v prostředí online e-shopu. Tyto modely jsou navrženy jako alternativa k hojně využívaným modelům kolaborativního filtrování, které trpí řadou problémů jako je například cold-start problem.
Pro predikci obsahové podobnosti obrázků jsou mimo jiné použity moderní přístupy založené na algoritmu ORB nebo učení umělých neuronových sítí. Úspěšnosti implementovaných modelů jsou následně offline testovány na reálných datasetech zaznamenaných uživatelských interakcí několika významných online e-shopů pomocí technik recall a catalog coverage.
Model založený na umělé neuronové síti prokázal v offline testování nejlepší úspěšnost z navrhovaných modelů a byl nasazen do online A/B testu proti produkčnímu algoritmu, založeném na kolaborativním filtrování. Na testovaném vzorku 7435 uživatelů prokázal nově navržený model srovnatelnou proklikovost jako produkční algoritmus.
Pokročilé techniky gradientní optimalizace umělých neuronových sítí v programu RapidMiner 5
Autor
Tomáš Richtr
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
prof. Dr. Ing. Petr Kroha, CSc.
Katedra
Anotace
Tato bakalářská práce se zabývá vývojem zásuvného modulu do programu RapidMiner 5, který realizuje operátor umělé neuronové sítě s pokročilými algoritmy učení. Realizovaný operátor rozšiřuje funkcionalitu programu RapidMiner 5 o možnost naučení umělé neuronové sítě pomocí algoritmů Delta-Bar-Delta, Quickprop a Rprop. Tato práce obsahuje analýzu jednotlivých učících algoritmů a analýzu současného řešení v programu RapidMiner 5, návrh zásuvného modulu, implementaci zásuvného modulu a závěrečná testování vytvořeného zásuvného modulu nad různými množinami dat.
Webový framework pro krokování a současnou vizualizaci algoritmů
Autor
David Šolc
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
prof. Ing. Pavel Tvrdík, CSc.
Katedra
Porovnání různých metod měření úspěšnosti v kolaborativním filtrování
Autor
Martin Hak
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Klient-server aplikace pro dvouhráčové hry s využitím WebSocket
Autor
Radmir Usmanov
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Petr Jendele
Katedra
Atributový doporučovací model trénovaný s využitím interakční podobnosti
Autor
Petr Kasalický
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato bakalářská práce se zabývá doporučovacimi systémy a jejich základnimi přistupy: Kolaborativni filtrováni a Atributové doporučováni. Je představen nový hybridni přistup, který kombinuje tyto dva přistupy. Tato metoda zvyšuje recall atributového doporučováni až o 216% a umožňuje přesnějši doporučováni pro nově přidané věci, které trpi cold-start problémem. Tento navržený a implementovaný přistup využivá metod strojového učeni jako je embedding nebo umělé neuronové sitě, které budou taktéž stručně představeny, spolu se způsobem vyhodnocováni kvality doporučováni.
Vektorový grafický editor v prostředí webového klienta
Autor
Michal Kvasnička
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Mgr. Peter Franek, Ph.D.
Katedra
Porovnání neuroevolučních algoritmů na různých problémových doménách
Autor
Tomáš Frýda
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Jan Drchal, Ph.D.
Katedra
Diplomové práce
Analýza algoritmů kolaborativního filtrování nad multimediálními daty
Autor
Jakub Pištěk
Rok
2013
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Doporučovací modely založené na rekurentních neuronových sítích
Autor
Ladislav Martínek
Rok
2020
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Mgr. Ladislava Smítková Janků, Ph.D.
Katedra
Anotace
Tato diplomová práce řeší problematiku doporučovacích systémů. Cílem je predikce následujících položek na základě sekvenčních dat z chování uživatelů pomocí rekurentních neuronových sítí (LSTM, GRU). Reprezentace položek je tvořena pomocí maticové faktorizace upravené pro datasety s implicitní zpětnou vazbou. V práci je navržen a implementován algoritmus pro tvorbu rekurentních modelů využívající vytvořenou reprezentaci položek. Navržen je také způsob vyhodnocování respektující sekvenční povahu dat. Metoda vyhodnocování využívá metriky recall a catalog coverage. Experimenty jsou prováděny systematicky s cílem zjistit závislosti na sledovaných metodách a hyperparametrech. Měření je prováděno na třech datových sadách. Na největším datasetu se podařilo dosáhnout více jak dvojnásobného recallu proti dalším metodám, které byly zastoupeny kolaborativním filtrováním, reminder modelem a popularity modelem. Na závěr práce jsou diskutovány zjištěné poznatky, možné zlepšení hyperparametrizací a další možné směry vylepšení modelů.
Comparison of online and offline evaluation metrics in Recommender Systems
Autor
Petr Kasalický
Rok
2021
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Katedra
Anotace
Cílem práce je prozkoumat doporučovací systémy a způsoby jejich vyhodnocení. Je kladen důraz na porovnání online a offline způsobů vyhodnocení, neboť jejich vztah je velmi sporný. Při výzkumu se běžně používá recall pro optimalizaci doporučovacích algoritmů. Avšak recall může trpět různými problémy a nemusí vždy odpovídat online metrikám, jako je míra prokliku. Toto tvrzení je experimentálně ověřeno za použití produkčního doporučovacího systému s cílem změřit korelaci mezi recallem a mírou prokliku. Jak ukazuje sada vyčerpávajících experimentů s velkým množstvím modelů a metrik na několika průmyslových datasetech, tak korelace mezi recallem a mírou proklikou není vždy zaručena. Vzniká tak velká otázka nad současnými metodami porovnávání modelů ve výzkumu. Jako částečné zlepšení offline metrik je představena nová metoda měření recallu, která lépe reflekujte sekvečnost interakcí stejně jako jejich nenáhodné rozdělení, a tím zvyšuje její podobnost s mírou prokliku.
Evaluace algoritmů maticové faktorizace v kolaborativním filtrování
Autor
Tomáš Richtr
Rok
2016
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato práce se zabývá metodami maticové faktorizace v kolaborativním filtrování. Po počáteční analýze metod maticové faktorizace je navržen postup pro vyhodnocení faktorizačních modelů z hlediska metrik recall a catalog coverage. Tento návrh je realizován a je provedena sada experimentů na datasetech MovieLens a GoOut s algoritmem stochastického gradientního sestupu implementovaného knihovnami LIBMF a Apache Mahout. Výsledkem práce jsou výstupy provedených experimentů a připravený proces pro efektivní vyhodnocování faktorizačních algoritmů.
Neurální faktorizační modely pro doporučovací systémy
Autor
Radek Bartyzal
Rok
2019
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Katedra
Anotace
Doporučovací systémy nám napomáhají objevit zajímavé produkty v široké nabídce. Jedním z typů algoritmů generujících doporučení jsou faktorizační modely. V této práci popisujeme moderní faktorizační modely založené na neuronových sítích. Čtyři z nich také implementujeme. Dále představujeme nový faktorizační model Hybrid cSDAE založený na neuronových sítích, který dokáže zpracovat, jak interakční informace, tak různé druhy atributů. Všechny implementované modely jsou porovnány na standardních datasetech za stejných podmínek.