doc. Ing. Pavel Kordík, Ph.D.

Závěrečné práce

Dizertační práce

Algoritmy a architektury doporučovacích systémů

Stupeň
Téma dizertační práce
Popis tématu

U doporučovacích systémů v současné době zaměřujeme výzkum na několik otevřených problémů, které mají hluboké teoretické základy, ale jejichž řešení mají současně velmi konkrétní praktické aplikace. Zkoumáme využitenost hlubokých neuronových sítí pro redukci cold start problému doporučovacího systému, konstrukci transformerů pro predikci nákupních košíků. V oblasti obecného strojového učení se zaměřujeme na posilované učení pro optimalizaci dlouhodobějších metrik, jako je spokojenost uživatele, na metody transfer learningu pro začlenění nových doporučovacích databází, a na využití AutoML pro optimalizaci architektury a hyperparametrů doporučovacího systému.

Bakalářské práce

Převod textu na dotaz pomocí rozsáhlých jazykových modelů na místní infrastruktuře

Autor
Patrik Laurinc
Rok
2023
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Mgr. Alexander Kovalenko, Ph.D.
Anotace
Ve světě plném digitálních dat je zjednodušení lidské interakce s databázemi stále naléhavou výzvou. Tato bakalářská práce se zabývá potenciálem velkých jazykových modelů (LLM) transformovat přirozený text na dotazovací jazyky, jako je SQL.

Algoritmy pro strojové odpovídání na dotazy v přirozeném jazyce

Autor
Matúš Žilinec
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Magda Friedjungová
Anotace
Tato bakalářská práce zkoumá nejmodernější algoritmy pro strojové odpovídání na dotazy v přirozeném jazyce se zaměřením na porozumění textu a modely založené na hlubokém učení. Architektura transformer je prozkoumána a vyhodnocena na nově vydaném datasetu NaturalQuestions. Práce analyzuje konkrétní chyby a omezení současných algoritmů a zabývá se jejich možnými vylepšeními.

Deep learning pro algoritmické obchodování

Autor
Vojtěch Mikšů
Rok
2014
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Zdeněk Konfršt, Ph.D.

Odezírání ze rtů pomocí hlubokých neuronových sítí

Autor
Jan Horák
Rok
2018
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Anotace
Problém odezírání ze rtů, tedy umění odhadu vysloveného slova, popř. celé věty, pouze z vizuální informace, je vzhledem k vysoké různorodosti artikulace lidí, počtu jazyků a slov v každém z nich, velmi složitá, ale zajímavá úloha. V této Bakalářské práci analyzuji doposud známé způsoby odezírání ze rtů, zjišťuji jejich přesnosti a mou snahou je ověření zda je použití metod umělé inteligence, konkrétně hlubokých neuronových sítí, vhodným kandidátem pro řešení tohoto problému. V praktické části se zaměřuji na prezentaci výsledků a to jednak v podobě přesnosti mnou vytrénované neuronové sítě na testovacích datech, jednak vytvořením webové aplikace pro zjištění, jak náročné by bylo takový nástroj využít v praxi pro rozpoznávání řeči v reálném čase metodou odezírání ze rtů.

Klasifikace webových adres pomocí hlubokých neuronových sítí

Autor
Matyáš Skalický
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Anotace
Tato bakalářská práce se zabývá problémem automatické klasifikace internetových adres. Důraz je kladen na hluboké neuronové sítě, konkrétně na modely, které pracují se vstupem na úrovni jednotlivých znaků. V práci je shrnutý současný stav řešení a je navržen model vhodný pro nasazení do produkce reálného firemního prostředí.

Doporučování hudby

Autor
Ondřej Šofr
Rok
2018
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Kalvoda, Ph.D.
Anotace
Tato práce se zabývá problematikou personalizovaného doporučování hudebních skladeb posluchačům. Jsou zde představeny přístupy využívané v současnosti, zejména metody kolaborativního filtrování. Důraz je kladen na zpracování časových informací o jednotlivých akcích uživatelů a jejich využití pro zkvalitnění doporučovacích systémů. Nejdůležitější částí je rozbor modelů predikujících aktivitu uživatelů. Je zde porovnána přesnost a výkonnost jednotlivých řešení i s ohledem na jejich využitelnost v praxi. Práce obsahuje výsledky experimentálního vyhodnocení představených metod nad daty reálných uživatelů.

Škálovatelnost algoritmu nejbližších sousedů

Autor
Antonín Dvořák
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. Ing. Ivan Šimeček, Ph.D.
Anotace
Tato práce se zabývá efektivními algoritmy pro hledání k nejbližších sousedů. Představili jsme tři konkrétní přístupy. Prvním z nich je použití k-means shlukování pro kNN, druhým tvorba aproximativního kNN grafu za použití lokálně senzitivní hashování a posledním kNN na grafické kartě. Implementace jsou z podstatné části psány v jazyce C++. V práci je nakonec provedeno měření skutečné efektivity jednotlivých algoritmů.

Softwarový modul pro vyhledávání studentů na základě jejich dovedností

Autor
Adam Jankovec
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Michal Valenta, Ph.D.
Anotace
Tato práce se zaměřuje na vytvořeni webové aplikace pro vyhledáváni studentů podle dovednosti, která generuje studentům dovednosti ze známek, sesbiraných během studia na Fakultě informačnich technologii Českého vysokého učeni technického v Praze. Výsledkem práce je koncept, přinášejici možnost filtrovat studenty podle jejich množiny dovednosti, který mohou firmy a učitelé využit při vyhledáváni kandidátů pro svá zadáni.k

Efektivní algoritmy pro učení polynomiálních modelů

Autor
Martin Procházka
Rok
2013
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Anotace
Tato práce zahrnuje kompilaci několika metod polynomiální regrese. Rešerše se zaměřuje na induktivní GMDH metody, evoluční tehcniky a kombinace těchto dvou přístupů- Součástí je také srovnání algoritmů na třech typech syntetických množin dat. Z výsledků lze vypozorovat efekty různých složitostí a počtu trénovacích prvků na úspěšnosti algoritmů. Pro 2-D případy jsou vyhotoveny vizualizace dat a výsledků jejich predikce regresními modely.

Optimalizace doporučovacích systémů

Autor
Radek Bartyzal
Rok
2016
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
prof. Ing. RNDr. Martin Holeňa, CSc.
Anotace
Tato práce popíše typy doporučovacích systémů, algoritmy stojící za nimi a způsoby hodnocení těchto systémů se zaměřením na online metodiky. Dále představí nový SAOOA algoritmus inspirovaný evolučními strategiemi, který s využitím modelu z gaussovké směsi optimalizuje nasazené doporučovací systémy za běhu. Fungování algoritmu bude objasněno na simulovaných problémech a nakonec otestováno na skutečných doporučovacích systémech. Spolu s algoritmem budou také představeny metody zobrazení jeho vnitřního stavu nebo kvalit jednotlivých konfigurací optimalizovaného systému.

Algoritmy pro skládání origami

Autor
Jiří Nádvorník
Rok
2013
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. Ing. Ivan Šimeček, Ph.D.

Zlepšování algoritmů pro učení se řadit

Autor
Huy Hoang Vu
Rok
2018
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Anotace
V této práci se zabývám existujícími algoritmy pro úlohu přeřazení URL podle relevance na základě uživatelského dotazu do vyhledávače a metodami kolaborativního filtrování, které uvádím v rešerši. Vybrané algoritmy, což jsou ES-Rank a maticová faktorizace, pak implementuji a použiji na dataset poskytnutý společností Yandex v rámci soutěže Personalized Web Search Challenge na Kaggle.com. Poté porovnávám přesnost řazení s ostatními řešeními na Kaggle.com. Následně testuji, jestli kolaborativní filtrování metodou maticové faktorizace významně zvyšuje přesnost řazení. Nakonec analyzuji časovou složitost svého řešení.

Odhadování hodnoty návštěvníka pro mediální domy

Autor
Bekbolot Khudaiberdiev
Rok
2022
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Mgr. Ladislava Smítková Janků, Ph.D.
Anotace
Cı́lem této práce je prozkoumat metody predikce CLV v obchodnı́m prostředı́ založeném na předplatném, porovnat výkon těchto metod na veřejně dostupném souboru dat a implementovat rozšı́řenı́ open-source projektu, které pomůže mediálnı́m domům odhadnout CLV. Modely sBG/NBD, posı́lený regersnı́ strom a neuronová sı́t’ jsou porovnávány na veřejně dostupné datové sadě z hudebnı́ streamovacı́ služby KKBox. Na základě experimentů je nejlepšı́m modelem v predikci CLV na úrovni jednotlivce a kohorty je posı́lený regresnı́ strom, který je následně integrován do rozšı́řenı́ s otevřeným zdrojovým kódem. Konečným produktem této práce je widgetové rozšı́řenı́ projektu REMP - open-source software, který pomáhá mediálnı́m domům monetizovat jejich obsah.

Predikce počtu odpovědí na inzerát

Autor
Martin Šmíd
Rok
2017
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
RNDr. Kateřina Trlifajová, Ph.D.
Anotace
Tato práce se zabývá metodami prediktivního modelování a vytěžování znalostí z textu. Na základě dat o pracovních inzerátech je cílem predikovat počet odpovědí na inzerát. Jednotlivé atributy jsou prozkoumány a zajímavé vztahy v datech prezentovány. Následuje návrh prediktivních modelů, jejich vytvoření a porovnání. Na základě jistoty modelu je vylepšena jejich úspěšnost. Nakonec je diskutována důležitost jednotlivých proměnných pro nejlepší model.

Personalizace uživatelských rozhraní pro vizualizaci dat

Autor
Martin Endršt
Rok
2016
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Řehořek, Ph.D.
Anotace
Tato bakalářská práce se zabývá zkoumáním využitelnosti interaktivní evoluce k personalizaci zobrazení dat. Během řešení byly nejprve prozkoumány některé aplikace využívající interaktivní evoluci a analyzován jejich přístup k uživatelské interakci s evolucí. Na základě poznatků získaných z ostatních aplikací byla vyvinuta webová aplikace demonstrující tři různá řešení, která byla napsána v jazyce JavaScript s využitím knihovny D3.js k vykreslení zobrazení.

Detekce uživatelských podúčtů pro lepší doporučování

Autor
Tomáš Vopat
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Anotace
Sdílení účtů ve streamovacích službách má negativní dopad na doporučovací systémy a následně i na kvalitu služeb poskytovanou jejich uživatelům. Tato práce má za cíl navrhnout metodu schopnou detekce takových uživatelských účtu. Navrhli jsme tedy a následně implementovali algoritmy založené na kolaborativním filtrování a metodě klouzajícího okénka, které jsou schopné odhalit sdílené účty. Představené algoritmy umožňují detekovat aktivitu jiných osob s vysokou přesností. Tato aktivita může být z účtu odfiltrována tak, aby doporučovací systém obdržel pouze relevantní data. Kromě toho se uživatelé snaží sdílením účtu vyhnout platbě předplatného, a tak mohou být takové účty omezeny.

Webová služba pro pokročilou analýzu textu

Autor
Jan Švejda
Rok
2017
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Mnoho statistických modelů a modelů strojového učení, které se snaží pokořit problémy zpracování přirozeného jazyka, mají potenciál asistovat lidem v mnoha oborech. V rámci této práce je vytvořena aplikace, která zpřístupňuje takové modely aplikované na doménu článků z internetu prostřednictvím webové služby a webové stránky. Tím je novinářům a editorům článků poskytnuta možnost získat více informací o jejich článku, umožňuje to integraci těchto modelů s externími systémy a nabízí to interaktivní experimentování s nimi také lidem, kteří se o zpracování přirozeného jazyka zajímají. Jak webová služba tak stránka byly úspěšně navrhnuty a implementovány, a to s důrazem na bezpečnost a škálovatelnost. Aplikace je navržena takovým způsobem, aby bylo možné ji v budoucnu snadno rozšířit o novou funkcionalitu.

Gramatická interaktivní evoluce grafických rozhraní

Autor
Petr Hanzl
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. RNDr. Pavel Surynek, Ph.D.
Anotace
Tato bakalářská práce se zabývá možnostmi využití evolučních algoritmů pro generování grafických rozhraní na základě uživatelových preferencí. Tato grafická rozhraní mohou být popsána gramatikou, což je sada pravidel, která umožňuje popsat všechna jejich možná nastavení. Dalším cílem je využítí zjištěných znalostí k vytvoření prototypu, který bude generovat grafové vizualizace nad danými datasety. Na vytvořeném prototypu byly provedeny měření počtu iterací na vytvoření požadované vizualizace. Jelikož jsou interaktivní evoluční algoritmy závislé na náhodě a na uživatelových preferencích, nelze jasně říci, že by počet dosažených iterací měl vyšší vypovídající hodnotu. Tudíž měření slouží spíše jako proof of concept.

Doporučování filmů k akvizici

Autor
Tatiana Lekýrová
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Táto bakalárska práca sa zaoberá problémom doporučovania filmov k akvizícii. Navrhuje dve riešenia problému cold-start, ktorý sa objavuje pri predikcii popularity nového obsahu. Prvou navrhovanom metódou je filtrovanie založené na obsahu a druhou metódou sú embeddingy s využitím neurónovej siete. Implementácia je podložená analýzou najmodernejších postupov. Evaluácia metód ukazuje, že filtrovanie založené na obsahu dosahuje lepšie výsledky oproti metóde embeddingov neurónovej siete.

Diplomové práce

Strojové učení pro hraní her s vizuálním vstupem

Autor
Martin Brázdil
Rok
2016
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Anotace
Hraní her z visuálního vstupu je komplexní problém, který se dotýká prakticky všech tématických oblastí strojového učení. Přesto jde o zjednodušenou variantu ultimátního cíle, univerzálního inteligentního agenta. Tato práce si klade několik cílů. Vytvoření konzistentní fundamentální teorie. Popis moderních technik řešící problém. Návrh vlastního dílčího přístupu a experimentální ověření správnosti.

Visualizace chování skupin modelů

Autor
Jan Fabián
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jaroslav Kuchař, Ph.D.

Systém pro doporučování založený na metodách pro extrakci znalostí z textu

Autor
Radovan Lupták
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Mgr. Ondřej Háva, Ph.D.

Panel pro vizualizaci pedagogických výkonů

Autor
Marie Remešová
Rok
2015
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Michal Valenta, Ph.D.
Anotace
Tato práce se zabývá metodami vývoje portletů pro portál Liferay. Věnuje se popisu, získávání a následné vizualizaci dat z fakultou shromažďované databáze úvazků. V teoretické části se dále věnuje pro úlohu vhodným metodám vizualizace a volbě barev pro tvorbu barevných škál. Podstatnou část práce tvoří zpracování a následná vizualizace dat za využití knihovny D3.js. V rámci práce byla vytvořena sada dashboardů, které zaměstnancům fakulty umožní zorientovat se v úvazcích a díky nově implementovanému mechanismu porovnávání pomůže managerům při řízení chodu fakulty i jednotlivých kateder.

Vyhledávání ve velkých grafech

Autor
Petr Šuták
Rok
2016
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Mgr. Martin Podloucký
Anotace
Cílem této práce je prozkoumat metody pro vyhledávání v grafech. Na základě jejich analýzy poté vybrat vhodný algoritmus, který bude součástí implementace vizuálního vyhledávání nad grafy. Modul bude součástí nástroje SVAT, což je produkt sloužící k vizuální analýze dat. Na základě požadavků na systém bude navrženo řešení, jehož úspěch je v závěru otestován. Výstupem práce je funkční modul, připravený pro použití v průmyslu.

Posílení zpětné vazby z průmyslu na univerzitu

Autor
Aleš Fišer
Rok
2014
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Marcel Hlopko

Infrastruktura pro sdílení a elektronický oběh dokumentu

Autor
Filip Rajnoch
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Vladimír Mezera

Analytický framework nad interakčními daty z eshopů

Autor
Lukáš Dvořák
Rok
2016
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Řehořek, Ph.D.
Anotace
Tato diplomová práce se zabývá specifiky e-shopů a průzkumem vhodných metod pro provádění analýz nad transakčními daty. Výsledkem je návrh analytického frameworku pro účely reportování majitelům transakčních a prodejních dat, který je možné nasadit pro využití v e-shopech libovolného typu, velikosti a nezávisle na implementaci. Součástí práce jsou dvě případové studie aplikující navrhovaný framework nad daty z reálných e-shopů.

Datový sklad fakulty

Autor
Stanislav Kuznetsov
Rok
2012
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Michal Valenta, Ph.D.

Přístupy k automatizaci 3D tisku

Autor
Marek Žehra
Rok
2014
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jan Trávníček, Ph.D.

Algoritmus pro tvorbu asociačních pravidel z častých sekvencí

Autor
Martin Hadáček
Rok
2012
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Miroslav Čepek, Ph.D.

Srovnání statistického a dataminingového přístupu k chemometrické analýze ropných derivátů

Autor
František Hána
Rok
2014
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Bartoň, Ph.D.

Aplikační rozhraní k portálu fakulty

Autor
Tomáš Králík
Rok
2012
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Vladimír Mezera

Doporučování na základě obrázků produktů

Autor
Kristýna Tauchmanová
Rok
2020
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Kalvoda, Ph.D.
Anotace
Cílem této diplomové práce je analýza doporučovacích sytémů a návrh takových systémů s použitím obrázků produktů. Práce obsahuje analýzu poskytnutých dat a návrh doporučovacích algoritmů pro různé scénáře. Součástí práce je i teoretický úvod do problematiky doporučovacích sytémů a zpracování obrazu. V závěru se práce také zabývá offline vyhodnocením navržených modelů.

Algoritmy pro lepší porozumění doporučovaného obsahu a segmentů uživatelů

Autor
Pavel Hlubík
Rok
2021
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Studium vztahu mezi publikem a obsahem, který konzumuje, je pro tvůrce obsahu zásadní. V této práci navrhujeme a experimentálně vyhodnocujeme různé metody vizualizace aspektů publika. Zavádíme novou techniku vkládání uživatelů a položek do stejného latentního vektorového prostoru, která dosahuje slibných výsledků na známé datové sadě Movielens. K vizualizaci publika dále využíváme samoorganizační mapy, jejichž použití pro tento typ úlohy je podle našich nejlepších znalostí novým přístupem. Poslední metodou tohoto druhu je nově publikovaný framework MDE, který překonává mnohé nevýhody t-SNE, a přitom neohrožuje kvalitu, což ukážeme experimentálně. Zabýváme se také dalšími pohledy na interakce uživatelů. Uživatelé a položky jsou propojeni pomocí Sankeyho diagramů, které nabízejí komplexní pohled na to, které skupiny uživatelů interagují s jakým obsahem, a jsou informativnější než prosté zařazení uživatelů do jedné kategorie. Navrhujeme také přístup k vizualizaci interakcí uživatelů v čase, který může pomoci analyzovat časové závislosti.

Prostředí pro distribuované výpočty

Autor
Adam Činčura
Rok
2014
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
prof. Ing. Pavel Tvrdík, CSc.

Portál pro podporu studia a klasifikace studentů

Autor
Zdeněk Balák
Rok
2017
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jiří Hunka
Anotace
Tato práce se zabývá návrhem systému pro řízení výuky, konkrétněji systému pro použití na FIT ČVUT. Práce popisuje tvorbu systému od analýzy, přes návrh až po realizaci. Využito bylo standardních webových technologií a metod pro návrh softwarového díla. Výsledkem práce je fungující prototyp aplikace, která již může sloužit ke správě výuky. Aplikace byla navržena s ohledem na možnost budoucího rozšiřování. Využít se dá praktická část pro další rozvoj systému pro správu obsahu nebo přímo text práce jako inspirace pro tvorbu webové aplikace.

Vytěžování vědeckovýzkumných dat

Autor
Vojtěch Medonos
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Martin Šlapák, Ph.D.

Metody pro konstrukci trénovací množiny

Autor
Tomáš Borovička
Rok
2012
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. RNDr. Ing. Marcel Jiřina, Ph.D.

Moderní metody klasifikace zpravodajských článků

Autor
Martin Pirkl
Rok
2014
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Bartoň, Ph.D.

Porozumění dokumentům pomocí metod text miningu

Autor
Sergii Stamenov
Rok
2017
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Mgr. Petr Paščenko
Anotace
Klíčová slova jsou výrazy které popisují téma dokumentu. Používají se také pro shrnutí dokumentu nebo při optimalizaci jejich vyhledávaní. Cílem této práce je prozkoumat možnosti vylepšení extrakce klíčových slov a jejich použití při shlukování a klasifikaci dokumentu. Podařilo se prozkoumat možnosti vytváření ontologie na základě klíčových slov a modelování klíčových slov v čase. Navíc bylo v práci ukázáno, že metody text-miningu lze v omezené míře použít i pro predikci délky života článku. Dále byl navržen a implementován text miningový systém, který je prostřednictvím webových služeb schopný extrahovat klíčová slova z novinových článků a shlukovat je dle postupů, které byly vyhodnoceny jako nejúspěšnější.

Personalizované doporučovnání pro studenty

Autor
Čeněk Žid
Rok
2022
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Rodrigo Augusto da Silva Alves, Ph.D.
Anotace
Diplomová práce poskytuje analýzu doporučovacích systémů pro studenty. Teoretická část popisuje současné nejmodernější metody v oblasti doporučovacích systémů. Dále se zabývá analýzou současného výzkumu pro profilování studentů. Experimentální část se zaměřuje na implementaci různých metod popsaných v rešeršní části. Tyto metody jsou testovány a je vybrána nejvhodnější metoda, specificky metoda založená na term frequency-inverse document frequency algoritmu s využitím vlastního výběru klíčových slov. Obecně je navržen model, který se zabývá doporučováním na základě interakcí a je rozšířen o doporučování na základě profilů studentů pomocí vybrané metody. Prezentovaný rekomendační systém je otestován ve dvou experimentech. Celkové výsledky naznačují výrazné zlepšení při použití navrhované metody.

Prediktivní modely v logistice: srovnání tradičních přístupů a neuronových sítí

Autor
Ruhi Ravichandran
Rok
2015
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jan Motl
Anotace
Tato práce zabývá srovnáním tradičních metod analýzy časových řad; konkrétně pak Holt-Wintersovou metodou, exponenciálním vyrovnáváním a autoregresivními intergrovanými modely klouzavých průměrů (ARIMA) s umělou neuronovou sítí za účelem prognózy úrovně zásob více skladových jednotek (SKU - Stock Keeping Unit) na konci dodavatelského řetězce - v maloobchodní prodejně. Komparace je provedena za pomoci různých ukazatelů přesnosti prognóz. Je zde zkoumáno, jaký přístup je vhodné zvolit při prognóze úrovně zásob v prodejně na příkladu společnosti vyrábějící více SKUs. Práce rovněž objasňuje rozličné faktory, které ovlivňují kvalitu zvolených modelů; například události spojené s prodejem jako je reklama, období dovolené, víkendy atp. či četnost prognóz; zda jsou vyhotovovány týdně nebo měsíčně. Modelování a analýza byly provedeny v programovacím jazyku R. Data zde použitá jsou reálná a byla získána od přední společnosti z oblasti rychloobrátkového zboží. Výzkum se proto zaměřuje právě na toto odvětví a nabízí řešení ke zlepšení prognóz poptávky výše uvedené společnosti.

Interaktivní panely pro hodnocení pedagogických a výzkumných aktivit

Autor
Petr Dušek
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jiří Mlejnek

Vehicle Routing Problem řešený pomocí strojového učení a heuristických optimalizačních metod

Autor
Adam Zvada
Rok
2021
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Mgr. Ladislava Smítková Janků, Ph.D.
Anotace
Pro řešení vehicle routing problému byly navrženy nové přístupy v oblasti strojového učení, ale téměř žádná pozornost nebyla věnována variantě vehicle routing problému s časovými okny s mírným omezením (VRPTW). I přesto, že tato varianta je nutná řešit v každém produkčním řešení plánovacího logistického systému. Tato práce navrhuje novou metodu řešení VRPTW pomocí hlubokého posilovaného učení. Model je postaven na architektuře Transformer využívající Graph Attention Network pro vložení vstupní instance. Model používá nově navrženou funkci odměny, která zahrnuje omezení časových oken. Práce také zkoumá další metaheuristické metody pro řešení VRPTW, které slouží ke vyhodnocení výsledného modelu. Výsledkem této práce je end-to-end model hlubokého učení, který řeší VRPTW, který ale stále předčí metaheuristiké metody.

Reportování pro efektivní řízení fakulty

Autor
Adam Kučera
Rok
2012
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Michal Valenta, Ph.D.

Algoritmy pro analýzu časoprostorového chování podezřelých osob

Autor
Ján Tkačík
Rok
2016
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Zdeněk Buk, Ph.D.
Anotace
Mnoho studií prokázalo, že vzorce lidského pohybu mají vysoký stupeň jak prostorové, tak i časové pravidelnosti. Tento fakt nás ujišťuje, že je možné vytvořit model lidského chování pro extrakci vzorů chování a predikci pohybu. Detektivové vybaveni těmito modely budou schopní odhalit potenciální hrozby rychleji, stejně jako automaticky odhalit podezřelé chování sledovaných osob. Implementovali jsme aplikaci umožňující detekci důležitých míst pro jednotlivce s následnou možností predikce pohybu mezi těmito místy jen z osobní historie polohy. Pro detekci důležitých míst byl navržen nový algoritmus AgarClust. Na predikci pohybu byl použit model založnený na rekurentní neuronové síti, Neural Turing Machine. Ukázali jsme, že prediktor založený na NTM je schopný modelovat mnohé vzorce pohybu s přesnosí blížící se maximální prediktabilitě. Vytvořená aplikace pomůže zefektivnit práci detektívů Policie České Republiky pri analýze dat o sledovaných osobách.

Podpora diagnostiky boreliózy metodami strojového učení

Autor
Jan Motl
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Bartoň, Ph.D.

Portál pro absolventy

Autor
Tomáš Janda
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Daniel Matocha, MSc.

Analytické webové služby pro portál spolupráce s průmyslem

Autor
Jiří Maroušek
Rok
2016
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Aleš Fišer
Anotace
Práce se zabývá implementací analytických metod využivajících algoritmů text miningu, které mají za úkol usnadnit a zautomatizovat činnost uživatelů fakultního portálu Spolupráce s průmyslem. Druhou částí práce je návrh a implementace webových služeb, které zpřístupňují výstupy analytických metod. Text práce se zabývá teoretickou částí použitých text miningových algoritmů, analýzou externích dat využitelných pro analytické metody, dokumentuje implementaci obou částí práce a na závěr se věnuje diskuzi nad kvalitou výsledků.

Doporučování obrázků k článkům

Autor
Matouš Pištora
Rok
2019
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Tato diplomová práce se soustřeďuje na nejnovější algoritmy zpracování obrazu a vytěžování textu včetně metod hlubokého učení a neuronových sítí. Je navržen systém, který je schopen na základě textu novinového článku navrhnout obrázky související s jeho obsahem. Součástí systému jsou moderní algoritmy na vytěžování informací z textu a obrázků, které byly testovány společně s regresními algoritmy. Tento systém je rozšířen na více jazyků.

Neuronové autoencodery pro doporučování

Autor
Michal Bajer
Rok
2019
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jaroslav Kuchař, Ph.D.
Anotace
Tato práce se zabývá možnostmi využití autoencoderů v rámci doporučovacích systémů, jejich potenciálem pro předpovídání chování uživatelů a rozdíly mezi různými variantami těchto modelů. Cílem práce je zmapovat možné přístupy, stanovit vhodné metriky pro posouzení kvality doporučení, implementovat slibné varianty a porovnat jejich úspěšnost na dostupných datech. Výsledkem práce je analýza a diskuze možných řešení, zmapování vlivu hyperparametrů na kvalitu doporučení a výběr nejvhodnějšího modelu na základě provedených pokusů.

Analýza dotazů online zdravotní kliniky pomocí strojového učení

Autor
Adam Jankovec
Rok
2021
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jitka Hrabáková, Ph.D.
Anotace
Tato práce se zaměřuje na aplikaci strojového učení pro automatizaci procesů online lékařské kliniky s použitím metodologie Cross-industry standard process for data mining. Výsledkem je úspěšné nasazení služby, která na základě dotazů pacientů předpovídá lékařské obory, do produkčního prostředí a navázání spolupráce mezi Fakultou informačních technologií a společností uLékaře.cz.

Nástroje a postupy pro žurnalistiku nové generace

Autor
Jakub Bartel
Rok
2015
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
prof. Dr. Ing. Petr Kroha, CSc.
Anotace
Tato práce popisuje praktické nasazení přístupů z oblasti strojového učení v oboru online žurnalistiky. Zabývá se sběrem, zpracováním a dalším použitím textových dat, sociálních signálů a dat z analytických systémů pro sledování návštěvnosti webů. Systém je následně schopen personalizovat sledování světového dění - aktuálně populární témata a události - a navíc predikovat budoucí popularitu jednotlivých témat. K tomu používá nástroj pro obsahové doporučování, který netriviálním způsobem kombinuje s ná- strojem prediktivního modelování.

Analýza výsledků absolventů středních škol na VŠ

Autor
Eliška Hrubá
Rok
2014
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Stanislav Kuznetsov, Ph.D.

Visualní detekce vztahů v databázích

Autor
Matyáš Krutský
Rok
2012
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jaroslav Kuchař, Ph.D.

Automatické nastavování velikosti neuronových sítí v omezeném čase

Autor
Vojtěch Cahlík
Rok
2022
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
prof. Ing. RNDr. Martin Holeňa, CSc.
Anotace
Algoritmy označované jako anytime slouží k produkování aproximativních výsledků, jejichž kvalita se s výpočetním časem zlepšuje. Tato diplomová práce se zaměřuje na aplikaci anytime algoritmů v úlohách strojového učení za využití metody auto-sizing, která umožňuje efektivní prořezávání komponent umělých neuronových sítí pomocí gradientní optimalizace. V rámci diplomové práce je původní auto-sizing rozšířen do metody nazvané dynamický auto-sizing, která umožňuje měnit velikost a strukturu modelů během tréninku upravováním aplikované síly regularizace, a tato technika je dále začleněna do několika anytime algoritmů strojového učení. Výsledky experimentů ukazují, že dynamický auto-sizing může být úspěšně použit v různorodých klasifikačních a regresních úlohách, často s lepšími výsledky než za použití tradičních přístupů.

Informační podpora klinických studií

Autor
Václav Čadek
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Borovička

Aplikace pro analýzu textových zpráv pro potřeby vyšetřovatelů

Autor
Štěpán Škorpil
Rok
2015
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Cílem práce je navrhnout a implementovat software pro zpracování textových dokumentů v českém jazyce, který by mohla Policie České republiky využít v boji se zločinem. Výsledkem je první část komplexního řešení, která se zabývá prohledáváním dokumentů, automatickým tříděním do shluků a hledáním podobných dokumentů. Práce se snaží dosáhnout cílů hledáním vhodných algoritmů pro stemizaci českého textu.

Metody pro identifikaci vzorků z hutní výroby

Autor
Juraj Leškanič
Rok
2012
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
prof. Ing. Michal Haindl, DrSc.

Optimalizace pořadí výsledků našeptávače

Autor
František Hejl
Rok
2016
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Anotace
Tato práce zkoumá problém řazeni výsledků v našeptávači počátečniho a cilového bodu v mobilni aplikaci pro veřejnou dopravu. Bylo navrženo několik metrik pro vyhodnoceni kvality našeptávače a aplikováno při strojovém učeni našeptávače. Byl použit dataset dřive uskutečněných hledáni. Našeptávaci algoritmus s nejlepšimi výsledky dokáže odhadnout počátek i cil který uživatel vyhledá s přesnosti 29 %. Pouze pro start to je 53 %, pro cil 50 %. Tento našeptávač byl implementován jako knihovna pro Android a integrován do aplikace.

Optimalizace doporučovacích algoritmů

Autor
Jakub Drdák
Rok
2018
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Řehořek, Ph.D.
Anotace
V poslednich letech se vyvinulo velké množstvi rozličných doporučovacich al- goritmů. Jednu věc maji ale všechny společnou. Jejich hyper-parametry se musi pečlivě zvolit, aby dosahovaly dobrých výsledků. Tato práce se zabývá výběrem takových algoritmů a navrhnutim optimal- izačni procedury, která bude schopná nalézt vhodné hyper-parametry těchto algoritmů. Výsledky jsou pak ověřeny na reálných datasetech.

Predikce kriminality

Autor
Veronika Maurerová
Rok
2017
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Anotace
S důrazem na efektivitu práce a s vzrůstajícím zájmem o zpracování dat, strojové učení a umělou inteligenci, se prediktivní analýza stává součástí policejních aktivit, predevším v oblasti prevence kriminality. Například policejní hlídky jsou plánováné pomocí prediktivní analýzy nejvíce ohrožených oblastí ve městě. Tato práce se zabývá především využitím metod supervizovaného učení při dolování skrytých vzorců z historických kriminálních dat. Cílem je s určitou jistotou indikovat ohrožená místa pro budoucí spáchání trestného činu či přestupku s vyžitím metod založených na rozhodovacíh stromech a neuronových sítích.

Metody pro detekci anomalit

Autor
Jan Krejcar
Rok
2014
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Anotace
V některých případech je mnohem cennější odhalit v systému odlehlou hodnotu, než hledat normální chování (zdravotní diagnózy, detekce průniku do systému, detekce fraudu platebních karet atd.). Proto je hledání odlehlých hodnot - detekce anomalit - jednou ze základních částí dataminingu. Cílem této práce je rozřadit metody detekcí anomalit, vybrat a implementovat vhodné metody pro potřeby telekomunikační společnosti a navrhnout úpravu těchto metod pro semi-supervizovaný systém detekcí anomalit.

Komunikační infrastruktura v portálu Liferay

Autor
Marcel Mika
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Mgr. Monika Součková

Rozpoznávání památek

Autor
Peter Bábics
Rok
2017
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Tomáš Kalvoda, Ph.D.
Anotace
V tejto práci som sa zameral na analýzu existujúcich prístupov pri rozpoznávaní objektov z fotografií. Analyzoval som možné zdroje dát pre historické budovy v Prahe, vhodným spôsobom som vytvoril súbor fotografií pre strojové učenie, následne som testoval rôzne modely a prístupy pri rozpoznávaní pamiatok, využívajúce hlboké konvolučné siete. Nakoniec som vybraný model implemetnoval do jednoduchého frameworku, ktorý som následne napojil na chatbota Golem a otestoval celkovú integráciu pomocou mobilnej aplikácie Messanger

Portlety pro přístup ke studijním materiálům

Autor
Daniel Heglas
Rok
2015
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. Ing. Jan Schmidt, Ph.D.

Návrh uživatelského rozhraní pro přístup ke studijním materiálům

Autor
Jan Pavlovský
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
doc. Ing. Jan Schmidt, Ph.D.

Regresní modelování pro fulltextové vyhledávání

Autor
Jakub Jirků
Rok
2013
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Jan Černý

Autentizace uživatelů a správa rolí v prostředí fakultních aplikací

Autor
Martin Matuška
Rok
2012
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Martin Bílý

Škálovatelnost prediktivních modelů

Autor
Tomáš Frýda
Rok
2017
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Tato práce má dva hlavní cíle - (1) paralelizovat FAKE GAME integrací do open source frameworku H2O, zaměřeného na strojové učení, a (2) hodnocení anytime vlastností algoritmů strojového učení a vlivu optimalizace hyper-parametrů na tyto algoritmy. Tyto cíle jsem realizoval integrací FAKE GAME do H2O. Za účelem vyhodnocení anytime vlastností jsem implementoval nový nástroj nazvaný Benchmarker. Vyhodnocení anytime vlastností ukázalo, že pro některé problémy modely z FAKE GAME překonají modely z H2O, jak v přesnosti, tak i ve výkonu. Na druhou stranu vyhodnocení vlivu optimalizace hyper-parametrů ukázalo poměrně malý úspěch při optimalizaci algoritmů strojového učení z H2O. Domnívám se, že zanedbatelné zvýšení výkonnosti, a pro některé z optimalizovaných modelů dokonce i nižší výkon než u výchozí konfigurace, je způsobeno automatickým laděním některých hyper-parametrů, které se provádí ve výchozím nastavení H2O.