Umělá inteligence

Závěrečné práce

Bakalářské práce

Abstrakce v posilovaném učení

Autor
Ondřej Bíža
Rok
2019
Typ
Bakalářská práce
Vedoucí
Robert Platt, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Anotace
Abstrakce je důležitý nástroj pro inteligentního agenta. Pomáhá mu řešit složité úlohy tím, že ignoruje nedůležité detaily. V této práci popíši nový algoritmus pro hledání abstrakcí, Online Partition Iteration, který je založený na teorii homomorfismů Markovských rozhodovacích procesů. Můj algoritmus dokáže vytvořit abstrakce ze zkušeností nasbíraných agentem v prostředích s vysokodimenzionálními stavy a velkým množství dostupných akcí. Také představím nový přístup k přenášení abstrakcí mezi různými úlohami, který dosáhl nelpších výsledků ve většině mých experimentů. Nakonec dokážu správnost svého algoritmu pro hledání abstrakcí.

Zpracování a úpravy výstupů automatické transkripce hudby

Autor
Zuzana Fílová
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. RNDr. Pavel Surynek, Ph.D.
Oponenti
Ing. Daniel Dombek, Ph.D.
Anotace
Předmětem této bakalářské práce je problematika automatické transkripce hudby (AMT). V teoretické části práce byly shrnuty základní informace o zmíněné problematice, byl zde představen aktuální stav řešení AMT a nastíněny problémy, se kterými se tato výzkumná oblast potýká. Dále byly popsány různé možnosti zhodnocení výsledků systémů AMT. Bylo zjištěno, že automatická transkripce hudby v současnosti nedosahuje uspokojivých výsledků. Výsledná reprezentace hudby (MIDI soubor nebo notový zápis) obsahuje mnoho chyb, které znemožňují praktické využití této technologie. V praktické části práce proto byla provedena analýza nejčastějších chyb vznikajících při automatické transkripci vlnového zvukového záznamu do formátu MIDI. Na základě této analýzy byla navržena metoda pro automatické odstranění těchto chyb a úpravu získaného MIDI souboru. Cílem těchto úprav bylo vylepšení úspěšnosti systému automatické transkripce hudby. Úspěšnost navržené metody byla hodnocena pomocí F-míry a editační vzdálenosti hudebních řetězců. Experimenty v závěrečné části práce ukázaly, že navržená metoda úprav zvětšuje podobnost výsledných notových záznamů s originálem a zásadním způsobem přispívá k lepší čitelnosti výsledných notových záznamů.

Analýza vlivu kontextu interakcí při doporučování kolaborativním filtrováním

Autor
Martin Scheubrein
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Kamil Dedecius, Ph.D.
Anotace
Kolaborativní filtrování je jednou z nejúspěšnějších technik používaných v doporučovacích systémech. Základní algoritmy využívají historické interakce mezi uživateli a předměty, nicméně doporučovací systémy nasazené v produkčním prostředí mají často k dispozici minimálně jednu další dimenzi dat – časová razítka těchto interakcí. Tyto okolnosti interakcí nazýváme kontextem. Tato práce využívá dosud často opomíjené informace v datech ke zlepšení přesnosti doporučování. Je navrženo několik nových přístupů k začlenění kontextu do tradičních metod kolaborativního filtrování. K evaluaci těchto vylepšení je navržen a implementován testovací framework. Navržené metody jsou rozsáhle testovány na několika datasetech, s různými parametry a kontexty. Výsledky ukazují, že metody beroucí v úvahu kontext vykazují i na převážně statických datasetech zlepšení metriky recall o 5–25 % oproti tradidičním algoritmům kolaborativního filtrování.

Implementace vyhodnocovače lambda výrazu

Autor
Jan Sliacký
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Petr Máj
Oponenti
RNDr. Jiřina Scholtzová, Ph.D.
Anotace
λ-kalkul je stěžejní koncept počítačových věd. Jako takový je učen na většině univerzit vyučujících informatiku a počítačové vědy včetně FIT ČVUT. Pro mnoho studentů může být studium λ-kalkulu a pochopení jeho významu a dopadu na současné programovací jazyky obtížnou úlohou. Tato práce vytváří evaluátor λ-kalkulu a jeho front-end navržený tak, aby prezentoval λ-kalkul jako programovací jazyk a umožnil snadnou integraci do výukových materiálů.

Analýza diskusních komentářů na českých zpravodajských serverech

Autor
Martin Vastl
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Tato práce je zaměřena na možnosti využití metod pro zpracování přirozeného jazyka k analýze komentářů zpravodajského portálu. Hlavním cílem je srovnání modelů BERT, Doc2vec a Doc2vec s předtrénovanými reprezentacemi slov z BERT ke zkoumání relevance komentářů k obsahu článků z portálu. Dalším cílem je aplikace vektorových reprezentací textu k detekci anomálních příspěvků a anomálního chování uživatelů pomocí metody Local outlier factor. Provedenými experimenty bylo zjištěno, že nejvyšší úspěšnosti ke zkoumání relevance je dosaženo pomocí modelu BERT, a že předtrénované slovní reprezentace nemají pozitivní vliv na zachycení sémantické informace textu oproti metodě Doc2vec. Metoda Local outlier factor, která je použita pro detekci anomálií, je schopna detekovat anomální komentáře i uživatele při využití vektorů z modelu BERT. Na druhou stranu, Doc2vec je v případě detekce anomálií nevhodný a často vrací nesprávné výsledky.

Detekce uživatelských podúčtů pro lepší doporučování

Autor
Tomáš Vopat
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Anotace
Sdílení účtů ve streamovacích službách má negativní dopad na doporučovací systémy a následně i na kvalitu služeb poskytovanou jejich uživatelům. Tato práce má za cíl navrhnout metodu schopnou detekce takových uživatelských účtu. Navrhli jsme tedy a následně implementovali algoritmy založené na kolaborativním filtrování a metodě klouzajícího okénka, které jsou schopné odhalit sdílené účty. Představené algoritmy umožňují detekovat aktivitu jiných osob s vysokou přesností. Tato aktivita může být z účtu odfiltrována tak, aby doporučovací systém obdržel pouze relevantní data. Kromě toho se uživatelé snaží sdílením účtu vyhnout platbě předplatného, a tak mohou být takové účty omezeny.

Atributový doporučovací model trénovaný s využitím interakční podobnosti

Autor
Petr Kasalický
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Tato bakalářská práce se zabývá doporučovacı́mi systémy a jejich základnı́mi přı́stupy: Kolaborativnı́ filtrovánı́ a Atributové doporučovánı́. Je představen nový hybridnı́ přı́stup, který kombinuje tyto dva přı́stupy. Tato metoda zvyšuje recall atributového doporučovánı́ až o 216% a umožňuje přesnějšı́ doporučovánı́ pro nově přidané věci, které trpı́ cold-start problémem. Tento navržený a implementovaný přı́stup využı́vá metod strojového učenı́ jako je embedding nebo umělé neuronové sı́tě, které budou taktéž stručně představeny, spolu se způsobem vyhodnocovánı́ kvality doporučovánı́.

Evaluace algoritmů lokálně senzitivního hashování (LSH) v doporučovacích systémech

Autor
Ladislav Martínek
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Tato práce se zabývá aproximací algoritmu k-nejbližších sousedů orientovaného na uživatele pomocí metod lokálně senzitivního hashování a aplikací těchto metod do doporučovacích systémů. Práce nejprve teoreticky popisuje doporučovací systémy, kolaborativní filtrování, algoritmy hledání k-nejbližších sousedů a metody jejich aproximace pomocí metod lokálně senzitivního hashování. Na základě analýzy dané problematiky je navrhnut a implementován framework, který umožňuje testovat různé parametrizace metod lokálně senzitivního hashování. Ve frameworku lze testovat přesnost na k-nejbližších sousedů nebo úspěšnost doporučování použitím míry recall v závislosti na catalog coverage. Popsané metody jsou pomocí frameworku otestovány na dvou odlišných databázích. Z testů jednotlivých metod a parametrizací jsou vyvozeny možnosti jejich kombinace k dosažení optimálních modelů. Při testování optimálních modelů se podařilo dosáhnout velice uspokojivých výsledků. Při čase modelu LSH okolo 3 % času referenčního řešení se podařilo dosáhnout úspěšnosti doporučování mezi 97 a 99 %. Na závěr jsou diskutovány výsledky a různé poznatky z testování jednotlivých metod.

Optimalizace metod pro předzpracování dat pro co nejlepší klasifikaci

Autor
Jan Pancíř
Rok
2018
Typ
Bakalářská práce
Vedoucí
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Práce se zabývá zefektivněním procesu vytěžování znalostí z dat. Zaměřuje se na optimalizaci pořadí metod pro předzpracování dat a jejich parametrů pro daný klasifikátor. Byl navržen algoritmus, který vytvoří plán jak předzpracovat vstupní data, aby naučený klasifikátor dosahoval co nejvyšší přesnosti klasifikace. Pro optimalizaci a nalezení plánu byl využit genetický algoritmus. Byla vytvořena aplikace v jazyce Java implementující tento algoritmus, která nalezne plán předzpracování dat pro libovolný numerický dataset s použitím následujících metod předzpracování dat: diskretizace, normalizace, redukce dimenzionality, odstranění odlehlých hodnot, vyvažování tříd a doplnění chybějících hodnot. Výsledky byly testovány na několika reálných datasetech. Algoritmus zlepšuje přesnost klasifikace v průměru o 4-9 %. Jedná se o nástroj, který umožňuje plně zautomatizovat proces předzpracování dat. Případně lze využít jako pomocný nástroj pro znalostního experta při tvorbě plánu předzpracování dat.

Rozšíření dat pomocí generativních adversariálních sítí

Autor
Iveta Šárfyová
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Většina dat z reálného světa není rovnoměrně rozdělena do odpovídajících tříd, ale je nevyvážená, což může mít velký vliv na kvalitu predikce klasifikačních modelů. Obecný přístup k řešení tohoto problému je modifikace původních datových sad tak, abychom dosáhli vyváženosti jednotlivých tříd. Tato práce se zaobírá vyvážením obrazových dat za pomoci generativních adversariálních sítí. Primární důraz je kladen na generování obrazových dat náležících do tříd s nedostatečným počtem reprezentantů, což je proces známý jako class balancing. Práce se zabývá analýzou a porovnáním různých technik používaných pro rozšíření dat, jako jsou geometrické metody nebo modely založené na principu neuronových sítí. Vyhodnocení je provedeno pomocí klasifikačních modelů, natrénovaných na původních, nevyvážených i uměle vyvážených datových sadách. Dosažené výsledky naznačují, jak schopnost jednotlivých metod rozšířit datové sady klesá se zvětšující mírou nevyvážení a rozmanitostí těchto sad.

Dokreslování obrázků pomocí generativních adversariálních sítí

Autor
Tomáš Halama
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Obnovení poškozených oblastí v obrazových datech je aktuální a náročný problém, jehož obtížnost roste se závažností a velikostí daného poškození. V posledních pár letech lze pozorovat značný pokrok při řešení tohoto problému za pomoci hlubokých neuronových sítí. Tato práce se zabývá ověřením a srovnáním různých přístupů k doplňování obrazových dat. Jelikož generativní adversariální sítě jsou jednou z nejslibnějších architektur, byl v této práci zpracován přehled aktuálních metod a dvě z nich byly reimplementovány pro účely dokreslování. Naše implementace neuronových sítí jsou srovnány s jinými metodami za pomoci klasifikačních modelů. Prezentované výsledky vypovídají o vlivu typu a rozsahu poškození na schopnost jednotlivých metod provést úspěšné dokreslení.

Simulace sledovaní vozidla v prostředí Carla

Autor
Pavel Jahoda
Rok
2020
Typ
Bakalářská práce
Oponenti
doc. RNDr. Pavel Surynek, Ph.D.
Anotace
Pronásledování auta je situace, která vyžaduje dynamické manévry, rychlé reakce a strategické plánování trajektorie. Zároveň nám umožňuje testovat limity autonomního řízení. Vytvořili jsme autonomní řídící systém, který dokáže pronásledovat další vozidlo pouze na základě RGB obrazu z jedné kamery. V jádru tohoto systému je nová víceúlohová konvoluční neuronová síť, která dokáže simultánně detekovat objekty a hrubě sémanticky segmentovat obraz. Tento systém byl nejprve otestován v simulátoru CARLA. Pro tyto účely jsme vytvořili nový veřejně dostupný pronásledovací dataset. Dataset byl vytvořen manuální jízdou pronásledovaného vozidla. Za použití tohoto datasetu jsme ukázali, že systém funguje lépe když využívá hrubou sémantickou segmentaci. Takový systém dokázal pronásledovat druhé vozidlo v průměru o 10% déle než verze systému které sémantické segmentace nevyužívají. Na závěr byl tento systém integrován do platformy nazvané "subscale vehicle platform" připevněné na velmi rychlé RC auto na kterém byl systém testován pronásledováním dalšího RC vozidla.

Diplomové práce

Sekvenční bayesovská poissonovská regrese

Autor
Radomír Žemlička
Rok
2020
Typ
Diplomová práce
Vedoucí
Ing. Kamil Dedecius, Ph.D.
Anotace
Poissonovská regrese je populární zobecněný lineární model používaný k modelování diskrétních náhodných veličin, typicky počtů. Tato práce je zaměřena na problematiku jejího sekvenčního odhadování s regresními koeficienty potenciálně pomalu proměnnými v čase. Je použita vhodná aproximace normálním rozdělením, aby tak bylo možné učinit v Bayesovském kontextu. Rovněž je diskutována kalibrační technika pro zvýšení kvality odhadů. Na závěr je navržen případ použití představeného přístupu v doméně zpracování signálu, zejména jeho použití v difuzních sítích (diffusion networks) pro realizaci distribuovaného kolaborativního odhadování.