Maps of elections
Autor
Jitka Mertlová
Rok
2024
Typ
Bakalářská práce
Vedoucí
doc. RNDr. Dušan Knop, Ph.D.
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
Maps of elections je framework, který umožňuje vizualizovat a analyzovat sady volebních datasetů. Dosud bylo možné pracovat pouze s datasety, ve kterých měly všechny volby stejný počet kandidátů. V této práci framework rozšiřujeme o možnost současného zpracování datasetů s různými počty kandidátů. Toho dosahujeme jednak rozšířením již existující positionwise metriky, a dále zavedením a implementací tzv. feature metriky. Tyto metriky testujeme pomocí syntetických dat generovaných balíčkem Mapel.
Přenos pózy a výrazu mezi portréty
Autor
Petr Jahoda
Rok
2023
Typ
Bakalářská práce
Vedoucí
Ing. Jan Čech, Ph.D.
Oponenti
Ing. Magda Friedjungová, Ph.D.
Katedra
Anotace
Tato práce představuje metodu pro přenos pózy a výrazu mezi portréty. Po
zadání dvou obrázků obličeje, zdrojového a cílového, navržená síť vygeneruje
portrét, kde jsou póza a výraz z obrazu zdrojového obličeje přeneseny na
cílovou identitu. Architektura se skládá ze dvou enkodérů a mapovací sítě,
která mapuje oba vstupy do latentního prostoru sítě StyleGAN2. Ta následně
vygeneruje výsledný obrázek ve vysoké kvalitě. Trénování je "self-supervised"
bez potřeby označených dat. Naše metoda dokáže generovat obrázky téměř v reálném čase a umožňuje syntézu náhodných identit s nezávisle ovladatelnou
pózou a výrazem.
Automatická detekce metrické normy
Autor
Kristýna Klesnilová
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Karel Klouda, Ph.D.
Oponenti
Ing. Magda Friedjungová, Ph.D.
Katedra
Anotace
Tato práce se zabývá automatickou metrickou analýzou českého sylabotonického verše, jenž je metricky otagován ve velkém korpusu básní - v Korpusu českého verše. Práce nejprve reimplementuje přístup založený na datech, který využívá program s názvem KVĚTA. Poté si metrickou analýzu namodeluje jako úlohu tagování sekvencí a řeší ji pomocí strojového učení. Je trénován model BiLSTM-CRF, který reprezentuje aktuálně nejlepší architekturu pro většinu klasických úloh tagování sekvencí. Je otestováno mnoho různých vstupních konfigurací. Ve všech experimentech jsou slabiky nebo tokeny slov na vstupu reprezentovány pomocí Word2Vec embeddingů natrénovaných na trénovacích datech. Výsledky jsou vyhodnoceny pomocí spočítání tří různých přesností predikce: přesnosti pro jednotlivé slabiky, přesnosti pro jednotlivé řádky básní a přesnosti pro celé básně. Je ukázáno, že použití modelu BiLSTM-CRF představuje velký úspěch. S nejlepšími vstupními konfiguracemi vrací BiLSTM-CRF lepší výsledky než reimplementace programu KVĚTA s predikcemi dosahujícími 99.61% přesnosti pro jednotlivé slabiky, 98.86% přesnosti pro jednotlivé řádky básní a 90.40% přesnosti pro celé básně. Nejzajímavější zjištění představuje fakt, že nejlepších výsledků je dosaženo pro vstupní sekvence reprezentují celé básně namísto jednotlivých řádků básní.
Dvojjazyčné vyhledávání v dokumentech
Autor
Lukáš Rynt
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. David Bernhauer, Ph.D.
Oponenti
prof. Dr. Ing. Petr Kroha, CSc.
Katedra
Anotace
Tato práce se zabývá výzkumem modelů získávání informací, nejmodernějších technik vnoření slov (word embedding) a jejich možným využitím pro vícejazyčné vyhledávání. Moderní přístupy k vícejazyčnému vyhledávání, které staví na word embedding technikách, většinou pracují s~urči\-tou transformací, která převádí reprezentace slov z jednoho jazyka do druhého. Cílem této práce je zkoumat model, který s touto transformací nepracuje a namísto toho rovnou získává závislosti mezi překlady. Nad tímto modelem by pak měl být vystavěn prototyp webového vyhledávače.
Práce v tomto dostála všem očekáváním a výsledný model byl schopný reprezentovat dvojjazyčné překlady napřímo bez použití jakékoliv transformace. Toho bylo dosaženo s využitím paralelně přeložených dokumentů Evropské Unie, které byly pro oba jazyky spojeny na úrovni odstavců. Prototyp vyhledávače poté fungoval na základě naučených reprezentací jednotlivých slov, vyvozených z tohoto modelu.
Hierarchické řízení rojů při evakuaci
Autor
Kristýna Janovská
Rok
2022
Typ
Bakalářská práce
Vedoucí
prof. RNDr. Pavel Surynek, Ph.D.
Oponenti
doc. Ing. Pavel Hrabák, Ph.D.
Katedra
Anotace
V této práci se zabývám návrhem hierarchického systému koordinace agentů určeného pro simulaci evakuace. V práci rozeznávám dva typy agentů. Řídící agenti navzájem komunikují pomocí algoritmu konfliktového prohledávání a odvádějí své roje do bezpečné oblasti, zatímco agenti následníci následují svého řídícího agenta.
Představím několik modelů, které se liší jak chováním řídících agentů vůči svým rojům, tak chováním agentů následníků, co se týče pokusu o samostatnou evakuaci.
V práci provádím experimenty, jejichž výsledky ukáží, jak úspěšnost evakuace ovlivňují parametry chování agentů. Výsledky těchto experimentů poukáží na výhody komunikace mezi řídícími agenty, problémy, které mohou při evakuaci nastat a jejich závislost na nevhodném chování agentů.
Modelování proudění kolem leteckého profilu pomocí grafových neuronových sítí
Autor
David Horský
Rok
2022
Typ
Bakalářská práce
Vedoucí
Mgr. Vojtěch Rybář
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
V bakalářské práci podáváme přehled využití strojového učení ve výpočetní
dynamice tekutin. Implementovali jsme nejmodernější grafovou neuronovou
síť pro simulaci proudění vzduchu kolem profilu křídla ve 2D. Trénujeme model na nižších rychlostech a úhlech náběhu, následně extrapolujeme na vyšší.
Natrénovali jsme model, který extrapoluje s malou chybou přesnosti a zůstává
stabilní po dlouhý počet simulačních kroků.
Návrh kamerového systému pro snímání vzorku pneumatiky
Autor
Daniel Bohuněk
Rok
2022
Typ
Bakalářská práce
Vedoucí
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Oponenti
Ing. Tomáš Kalvoda, Ph.D.
Katedra
Anotace
Cílem této práce je navrhnout kamerový systém, který snímá pneumatiky projíždějících vozidel a ze záznamu dále získává vzorky pneumatik ve standardizované podobě.
Jsou prozkoumány existující systémy určené pro snímání vzorků pneumatik a je navržen nový kamerový systém, který pořizuje záznam vozidel na světelné křižovatce a vzorky jejich pneumatik rozvinuje do podoby pásu. Pro nalezení lokace pneumatiky ve snímku je využita konvoluční neuronová síť.
Kamerový systém byl nasazen v reálném provozu na více světelných křižovatkách. Kamera správně nasnímá vzorek pneumatiky u 78 % vozidel. Implementované algoritmy strojového vidění naleznou vzorek pneumatiky v 89 % případů.
Implementovaný kamerový systém lze využít pro sběr velkého množství vzorků pneumatik, které by jinak bylo nepraktické a nákladné získat. Využití těchto dat je například ve forenzní analýze pro spárování vzorku vozidla se zanechanou stopou.
Optimalizace využití tradičních segmentačních algoritmů pro úlohy detekce defektů v průmyslu
Autor
Jiří Szkandera
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Jakub Novák
Oponenti
Ing. Miroslav Čepek, Ph.D.
Katedra
Anotace
Práce porovnává algoritmy určené k segmentaci objektu v obraze. Porovnány jsou tři algoritmy řadící se do kategorie superpixels (felzenszwalb, SLIC a quickshift), dva zástupci active contour models (snakes a level sets), random walker, region adjacency graphs a Otsu prahování. K tomuto účelu jsou zmapovány defekty objevující se v průmyslu. Nad defekty je vytvořena obecnější kategorizace. Následně jsou z každé kategorie vybrány dvě vady. Na první vadě je nalezena vhodná kombinace parametrů. U hledání jsou zohledněny efekty různého předzpracování a reprezentace snímku pomocí odlišných barevných prostorů. S nalezenými parametry je provedena segmentace druhé vady. Tak je otestována schopnost generalizace a vhodnost použití algoritmu pro vady dané kategorie. Úspěšnost segmentace je měřena metrikou IOU. Úspěšnější algoritmy dosáhly průměrného IOU měřeného přes všechny snímky jedné vady 90 %. U testu generalizace bylo v některých případech dosaženo průměrného IOU 53 %.
Klasifikace kvality vozovky
Autor
Martin Lank
Rok
2021
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
Automatické vyhodnocování kvality vozovky může být užitečné jak správním orgánům, tak i těm účastníkům silničního provozu, kteří vyhledávají vozovky s kvalitním povrchem pro co největší potěšení z jízdy. Tato práce se zabývá návrhem modelu, který klasifikuje obrázky silnic do pěti kvalitativních kategorií na základě jejich celkového vzhledu. V práci prezentujeme nový ručně anotovaný dataset, obsahující fotografie ze služby Google Street View. Anotace datasetu byla navržena pro motorkáře, ale může být použita i pro jiné účastníky silničního provozu. Experimentovali jsme jak s předučenými konvolučními neuronovými sítěmi, jako jsou MobileNet či DenseNet, tak s vlastními architekturami konvolučních neuronových sítí. Dále jsme vyzkoušeli různé techniky předzpracování dat, např. odstraňování stínů či kontrastně-limitní adaptabilní histogramovou ekvalizací (CLAHE). Námi navrhovaný klasifikační model využívá CLAHE a na testovací sadě dosahuje 71% přesnosti. Vizuální kontrola ukázala, že navrhovaný model je i s touto přesností využitelný za účelem, pro který byl navržen.
Kompilace multi-agentní kolektivní konstrukce ve hře Minecraft
Autor
Martin Rameš
Rok
2021
Typ
Bakalářská práce
Vedoucí
prof. RNDr. Pavel Surynek, Ph.D.
Oponenti
Dr. techn. Ing. Jan Legerský
Katedra
Anotace
Tato bakalářská práce zkoumá současné přístupy k přesným řešením problému multi-agentní kolektivní konstrukce, s důrazem na tří-rozměrné struktury, postavené agenty přenášejícími v mřížce bloky, za předpokladu přítomnosti gravitace. Zobecnění v současné době nejrychlejšího přesného modelu je navrženo, s použitím smíšeného celočíselného lineárního programování, k přizpůsobení se různému trvání kroků agentů. Uplatnění navrženého modelu je použito v kombinaci s řešičem k přesné optimalizaci stavebního plánování uživatelem navržených struktur. Výsledek je vizualizován v Minecraftu, za použití programu postaveného na Malmo API. Série experimetů je provedena na několika malých instancích, k naměření relativního snížení doby stavění vzhledem k jednokrokovým krokům agentů. Výsledky ukazují na výrazné snížení doby stavění při délkách kroků použitých pro vizualizaci v Minecraftu.
Snímání a následná detekce a klasifikace vad skleněných tyčí
Autor
Matěj Latka
Rok
2021
Typ
Bakalářská práce
Vedoucí
Ing. Jakub Novák
Oponenti
Ing. Magda Friedjungová, Ph.D.
Katedra
Anotace
Práce se zabývá automatizovanou detekcí a klasifikací vad na skleněných tyčích. Jsou analyzována předchozí řešení podobných problémů a popsán vlastní postup, v rámci kterého byly navrženy čtyři snímací soustavy využívající pokročilých optických prvků a osvětlení. Dále byly upraveny a rozšířeny analyzované metody detekce a klasifikace vad. Druhá z nich, využívající model založený na moderní architektuře Faster R-CNN, detekuje správně na jednom z datasetů 83 % vad a správně klasifikuje 77 % z nich.
Dokreslování obrázků pomocí generativních adversariálních sítí
Autor
Tomáš Halama
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
Obnovení poškozených oblastí v obrazových datech je aktuální a náročný problém, jehož obtížnost roste se závažností a velikostí daného poškození. V posledních pár letech lze pozorovat značný pokrok při řešení tohoto problému za pomoci hlubokých neuronových sítí. Tato práce se zabývá ověřením a srovnáním různých přístupů k doplňování obrazových dat. Jelikož generativní adversariální sítě jsou jednou z nejslibnějších architektur, byl v této práci zpracován přehled aktuálních metod a dvě z nich byly reimplementovány pro účely dokreslování. Naše implementace neuronových sítí jsou srovnány s jinými metodami za pomoci klasifikačních modelů. Prezentované výsledky vypovídají o vlivu typu a rozsahu poškození na schopnost jednotlivých metod provést úspěšné dokreslení.
Obrazová detekce a extrakce informací z dokladů
Autor
Matyáš Rousek
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Jakub Novák
Oponenti
Ing. Mgr. Ladislava Smítková Janků, Ph.D.
Katedra
Anotace
Práce se zabývá ziskem textových informací z fotografií osobních dokladů. Je navržen a implementován postup využívající konvoluční neuronové sítě U-Net natrénované na tvorbu segmentační masky pro zisk dokladu z reálné scény. V rámci nalezeného dokladu jsou vyříznuty oblasti s textem, v nichž je text blíže lokalizován na základě barvy a je přečten knihovnou Tesseract. Na testovací sadě 48 fotografií dokladů je dosaženo přesnosti 98,4 % správně přečtených znaků a pokrytí 92,6 %. Přínosem práce je extrakce textových informací i z fotografií dokladů vyskytujících se v obrazově komplikované scéně.
Rozšíření dat pomocí generativních adversariálních sítí
Autor
Iveta Šárfyová
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
Většina dat z reálného světa není rovnoměrně rozdělena do odpovídajících tříd, ale je nevyvážená, což může mít velký vliv na kvalitu predikce klasifikačních modelů. Obecný přístup k řešení tohoto problému je modifikace původních datových sad tak, abychom dosáhli vyváženosti jednotlivých tříd. Tato práce se zaobírá vyvážením obrazových dat za pomoci generativních adversariálních sítí. Primární důraz je kladen na generování obrazových dat náležících do tříd s nedostatečným počtem reprezentantů, což je proces známý jako class balancing. Práce se zabývá analýzou a porovnáním různých technik používaných pro rozšíření dat, jako jsou geometrické metody nebo modely založené na principu neuronových sítí. Vyhodnocení je provedeno pomocí klasifikačních modelů, natrénovaných na původních, nevyvážených i uměle vyvážených datových sadách. Dosažené výsledky naznačují, jak schopnost jednotlivých metod rozšířit datové sady klesá se zvětšující mírou nevyvážení a rozmanitostí těchto sad.
Simulace sledovaní vozidla v prostředí Carla
Autor
Pavel Jahoda
Rok
2020
Typ
Bakalářská práce
Oponenti
doc. RNDr. Pavel Surynek, Ph.D.
Katedra
Anotace
Pronásledování auta je situace, která vyžaduje dynamické manévry, rychlé reakce a strategické plánování trajektorie. Zároveň nám umožňuje testovat limity autonomního řízení. Vytvořili jsme autonomní řídící systém, který dokáže pronásledovat další vozidlo pouze na základě RGB obrazu z jedné kamery. V jádru tohoto systému je nová víceúlohová konvoluční neuronová síť, která dokáže simultánně detekovat objekty a hrubě sémanticky segmentovat obraz. Tento systém byl nejprve otestován v simulátoru CARLA. Pro tyto účely jsme vytvořili nový veřejně dostupný pronásledovací dataset. Dataset byl vytvořen manuální jízdou pronásledovaného vozidla. Za použití tohoto datasetu jsme ukázali, že systém funguje lépe když využívá hrubou sémantickou segmentaci. Takový systém dokázal pronásledovat druhé vozidlo v průměru o 10% déle než verze systému které sémantické segmentace nevyužívají. Na závěr byl tento systém integrován do platformy nazvané "subscale vehicle platform" připevněné na velmi rychlé RC auto na kterém byl systém testován pronásledováním dalšího RC vozidla.
Unsupervised machine translation between Czech and German language
Autor
Ivana Kvapilíková
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Katedra
Anotace
Nedávný výzkum ukázal, že je možné navrhnout překladový systém, který se učí z čistě jednojazyčných textů. Ačkoli kvalita výsledného překladu stále zaostává za standardními systémy trénovanými pomocí textů předem přeložených člověkem, tyto výzkumné snahy otevírají nové možnosti pro datově chudé jazykové páry. Tato práce poskytuje přehled technik pro strojový překlad použitelných právě při nedostatku dat. Nejslibnější přístupy použijeme a porovnáváme jejich výsledky na česko-německém jazykovém páru. Jelikož použité metody závisí na vektorové reprezentaci slov ve vícejazyčném prostoru, zkoumáme tyto reprezentace, abychom ukázali, kolik nesou jazykově neutrální informace.
Využití umělých neuronových sítí při řešení hlavolamu (N^2-1)
Autor
Vojtěch Cahlík
Rok
2020
Typ
Bakalářská práce
Vedoucí
doc. RNDr. Pavel Surynek, Ph.D.
Oponenti
Ing. Daniel Vašata, Ph.D.
Katedra
Anotace
Práce se zaměřuje na využití umělých neuronových sítí při hledání řešení hlavolamu (N^2-1), která jsou blízká řešením optimálním. V první části práce je provedena analýza možností využití umělých neuronových sítí při řešení hlavolamu, a je zjištěno, že nejefektivnější je použít umělou neuronovou síť jako heuristiku pro algoritmy prohledávání stavového prostoru. Později se práce zaměřuje na natrénování několika heuristik založených na hlubokých umělých neuronových sítích, jejichž výkonnost je následně experimentálně změřena. Při využití heuristik spolu s algorithem A* jsou nalezená řešení nejčastěji optimální, a počet expandovaných stavů je výrazně nižší než při použití srovnatelných přípustných i nepřípustných heuristik.
Abstrakce v posilovaném učení
Autor
Ondřej Bíža
Rok
2019
Typ
Bakalářská práce
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Katedra
Anotace
Abstrakce je důležitý nástroj pro inteligentního agenta. Pomáhá mu řešit složité úlohy tím, že ignoruje nedůležité detaily. V této práci popíši nový algoritmus pro hledání abstrakcí, Online Partition Iteration, který je založený na teorii homomorfismů Markovských rozhodovacích procesů. Můj algoritmus dokáže vytvořit abstrakce ze zkušeností nasbíraných agentem v prostředích s vysokodimenzionálními stavy a velkým množství dostupných akcí. Také představím nový přístup k přenášení abstrakcí mezi různými úlohami, který dosáhl nelpších výsledků ve většině mých experimentů. Nakonec dokážu správnost svého algoritmu pro hledání abstrakcí.
Analýza diskusních komentářů na českých zpravodajských serverech
Autor
Martin Vastl
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Katedra
Anotace
Tato práce je zaměřena na možnosti využití metod pro zpracování přirozeného jazyka k analýze komentářů zpravodajského portálu. Hlavním cílem je srovnání modelů BERT, Doc2vec a Doc2vec s předtrénovanými reprezentacemi slov z BERT ke zkoumání relevance komentářů k obsahu článků z portálu. Dalším cílem je aplikace vektorových reprezentací textu k detekci anomálních příspěvků a anomálního chování uživatelů pomocí metody Local outlier factor.
Provedenými experimenty bylo zjištěno, že nejvyšší úspěšnosti ke zkoumání relevance je dosaženo pomocí modelu BERT, a že předtrénované slovní reprezentace nemají pozitivní vliv na zachycení sémantické informace textu oproti metodě Doc2vec. Metoda Local outlier factor, která je použita pro detekci anomálií, je schopna detekovat anomální komentáře i uživatele při využití vektorů z modelu BERT. Na druhou stranu, Doc2vec je v případě detekce anomálií nevhodný a často vrací nesprávné výsledky.
Analýza vlivu kontextu interakcí při doporučování kolaborativním filtrováním
Autor
Martin Scheubrein
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
Ing. Kamil Dedecius, Ph.D.
Katedra
Anotace
Kolaborativní filtrování je jednou z nejúspěšnějších technik používaných v doporučovacích systémech. Základní algoritmy využívají historické interakce mezi uživateli a předměty, nicméně doporučovací systémy nasazené v produkčním prostředí mají často k dispozici minimálně jednu další dimenzi dat - časová razítka těchto interakcí. Tyto okolnosti interakcí nazýváme kontextem.
Tato práce využívá dosud často opomíjené informace v datech ke zlepšení přesnosti doporučování. Je navrženo několik nových přístupů k začlenění kontextu do tradičních metod kolaborativního filtrování. K evaluaci těchto vylepšení je navržen a implementován testovací framework. Navržené metody jsou rozsáhle testovány na několika datasetech, s různými parametry a kontexty.
Výsledky ukazují, že metody beroucí v úvahu kontext vykazují i na převážně statických datasetech zlepšení metriky recall o 5-25 % oproti tradidičním algoritmům kolaborativního filtrování.
Detekce uživatelských podúčtů pro lepší doporučování
Autor
Tomáš Vopat
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Katedra
Anotace
Sdílení účtů ve streamovacích službách má negativní dopad na doporučovací systémy a následně i na kvalitu služeb poskytovanou jejich uživatelům. Tato práce má za cíl navrhnout metodu schopnou detekce takových uživatelských účtu. Navrhli jsme tedy a následně implementovali algoritmy založené na kolaborativním filtrování a metodě klouzajícího okénka, které jsou schopné odhalit sdílené účty. Představené algoritmy umožňují detekovat aktivitu jiných osob s vysokou přesností. Tato aktivita může být z účtu odfiltrována tak, aby doporučovací systém obdržel pouze relevantní data. Kromě toho se uživatelé snaží sdílením účtu vyhnout platbě předplatného, a tak mohou být takové účty omezeny.
Implementace vyhodnocovače lambda výrazu
Autor
Jan Liam Verter
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Petr Máj
Oponenti
RNDr. Jiřina Scholtzová, Ph.D.
Katedra
Anotace
l-kalkul je stěžejní koncept počítačových věd. Jako takový je učen na většině
univerzit vyučujících informatiku a počítačové vědy včetně FIT ČVUT. Pro
mnoho studentů může být studium l-kalkulu a pochopení jeho významu a dopadu na současné programovací jazyky obtížnou úlohou. Tato práce vytváří
evaluátor l-kalkulu a jeho front-end navržený tak, aby prezentoval l-kalkul
jako programovací jazyk a umožnil snadnou integraci do výukových materiálů.
Zpracování a úpravy výstupů automatické transkripce hudby
Autor
Zuzana Fílová
Rok
2019
Typ
Bakalářská práce
Vedoucí
doc. RNDr. Pavel Surynek, Ph.D.
Oponenti
Ing. Daniel Dombek, Ph.D.
Katedra
Anotace
Předmětem této bakalářské práce je problematika automatické transkripce hudby (AMT). V teoretické části práce byly shrnuty základní informace o zmíněné problematice, byl zde představen aktuální stav řešení AMT a nastíněny problémy, se kterými se tato výzkumná oblast potýká. Dále byly popsány různé možnosti zhodnocení výsledků systémů AMT. Bylo zjištěno, že automatická transkripce hudby v současnosti nedosahuje uspokojivých výsledků. Výsledná reprezentace hudby (MIDI soubor nebo notový zápis) obsahuje mnoho chyb, které znemožňují praktické využití této technologie.
V praktické části práce proto byla provedena analýza nejčastějších chyb vznikajících při automatické transkripci vlnového zvukového záznamu do formátu MIDI. Na základě této analýzy byla navržena metoda pro automatické odstranění těchto chyb a úpravu získaného MIDI souboru. Cílem těchto úprav bylo vylepšení úspěšnosti systému automatické transkripce hudby. Úspěšnost navržené metody byla hodnocena pomocí F-míry a editační vzdálenosti hudebních řetězců.
Experimenty v závěrečné části práce ukázaly, že navržená metoda úprav zvětšuje podobnost výsledných notových záznamů s originálem a zásadním způsobem přispívá k lepší čitelnosti výsledných notových záznamů.
Atributový doporučovací model trénovaný s využitím interakční podobnosti
Autor
Petr Kasalický
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato bakalářská práce se zabývá doporučovacimi systémy a jejich základnimi přistupy: Kolaborativni filtrováni a Atributové doporučováni. Je představen nový hybridni přistup, který kombinuje tyto dva přistupy. Tato metoda zvyšuje recall atributového doporučováni až o 216% a umožňuje přesnějši doporučováni pro nově přidané věci, které trpi cold-start problémem. Tento navržený a implementovaný přistup využivá metod strojového učeni jako je embedding nebo umělé neuronové sitě, které budou taktéž stručně představeny, spolu se způsobem vyhodnocováni kvality doporučováni.
Evaluace algoritmů lokálně senzitivního hashování (LSH) v doporučovacích systémech
Autor
Ladislav Martínek
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Tato práce se zabývá aproximací algoritmu k-nejbližších sousedů orientovaného na uživatele pomocí metod lokálně senzitivního hashování a aplikací těchto metod do doporučovacích systémů.
Práce nejprve teoreticky popisuje doporučovací systémy, kolaborativní filtrování, algoritmy hledání k-nejbližších sousedů a metody jejich aproximace pomocí metod lokálně senzitivního hashování.
Na základě analýzy dané problematiky je navrhnut a implementován framework, který umožňuje testovat různé parametrizace metod lokálně senzitivního hashování. Ve frameworku lze testovat přesnost na k-nejbližších sousedů nebo úspěšnost doporučování použitím míry recall v závislosti na catalog coverage.
Popsané metody jsou pomocí frameworku otestovány na dvou odlišných databázích. Z testů jednotlivých metod a parametrizací jsou vyvozeny možnosti jejich kombinace k dosažení optimálních modelů. Při testování optimálních modelů se podařilo dosáhnout velice uspokojivých výsledků. Při čase modelu LSH okolo 3 % času referenčního řešení se podařilo dosáhnout úspěšnosti doporučování mezi 97 a 99 %. Na závěr jsou diskutovány výsledky a různé poznatky z testování jednotlivých metod.
Optimalizace metod pro předzpracování dat pro co nejlepší klasifikaci
Autor
Jan Pancíř
Rok
2018
Typ
Bakalářská práce
Vedoucí
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Katedra
Anotace
Práce se zabývá zefektivněním procesu vytěžování znalostí z dat. Zaměřuje se na optimalizaci pořadí metod pro předzpracování dat a jejich parametrů pro daný klasifikátor. Byl navržen algoritmus, který vytvoří plán jak předzpracovat vstupní data, aby naučený klasifikátor dosahoval co nejvyšší přesnosti klasifikace. Pro optimalizaci a nalezení plánu byl využit genetický algoritmus. Byla vytvořena aplikace v jazyce Java implementující tento algoritmus, která nalezne plán předzpracování dat pro libovolný numerický dataset s použitím následujících metod předzpracování dat: diskretizace, normalizace, redukce dimenzionality, odstranění odlehlých hodnot, vyvažování tříd a doplnění chybějících hodnot. Výsledky byly testovány na několika reálných datasetech. Algoritmus zlepšuje přesnost klasifikace v průměru o 4-9 %. Jedná se o nástroj, který umožňuje plně zautomatizovat proces předzpracování dat. Případně lze využít jako pomocný nástroj pro znalostního experta při tvorbě plánu předzpracování dat.