Ing. Daniel Vašata, Ph.D.

Předsedající Akademického senátu

Závěrečné práce

Bakalářské práce

Analýza diskusních komentářů a jejich autorů na sociálních médiích

Autor
Martin Koucký
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Je možné, že na sociálních sítích existují shluky uživatelů nebo anomální uživatelé o kterých se neví. Tato práce tuto možnost prozkoumává tím, že analyzuje uživatele reprezentované jejich komentáři. Našli jsme vhodné zdroje dat na sociálních sítích a stáhli z nich data. Poté navrhujeme matematické reprezentace uživatelů vytvořené na základě jejich komentářů. Nakonec se snažíme vysvětlit shluky uživatelů a anomální uživatele za pomocí atributů na socílních sítích a manuální analýzou. Naše výsledky neprokázali existenci shluků nebo anomálií mezi uživateli sociálních sítí, protože jsme nenašli jasné oddělení normálních a anomálních uživatelů a uživatelů různých shluků. To mohlo být způsobeno nedostatečnými metodami reprezentace uživatelů nebo manuální analýzy. Mohlo by to ale také znamenat, že žádné shluky uživatelů nebo anomální uživatelé komentující podobným způsobem neexistují.

Unsupervised machine translation between Czech and German language

Autor
Ivana Kvapilíková
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Nedávný výzkum ukázal, že je možné navrhnout překladový systém, který se učí z čistě jednojazyčných textů. Ačkoli kvalita výsledného překladu stále zaostává za standardními systémy trénovanými pomocí textů předem přeložených člověkem, tyto výzkumné snahy otevírají nové možnosti pro datově chudé jazykové páry. Tato práce poskytuje přehled technik pro strojový překlad použitelných právě při nedostatku dat. Nejslibnější přístupy použijeme a porovnáváme jejich výsledky na česko-německém jazykovém páru. Jelikož použité metody závisí na vektorové reprezentaci slov ve vícejazyčném prostoru, zkoumáme tyto reprezentace, abychom ukázali, kolik nesou jazykově neutrální informace.

Analýza sentimentu recenzí v českém jazyce

Autor
Lukáš Langr
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Mgr. Petr Novák, Ph.D.
Anotace
Tato práce poskytuje bližší pohled na současně nejmodernější metody reprezentace dokumentů pro účely analýzy sentimentu. Přestože se mnoho nedávných článků soustředí buď na angličtinu nebo čínštinu, tato práce poskytuje unikátní hodnocení daných metod z pohledu českého jazyka. Převádíme české rezence do různých reprezentací a za pomocí modelů strojového učení na nich provádíme klasifikaci do několika tříd sentimentu. Dosažená přesnost předčila naše očekávání i podobné výzkumné články v českém prostředí používající stejný dataset. Věříme, že tato práce bude základem dalšího rozsáhlejšího výzkumu těchto reprezentací.

Analýza diskusních komentářů na českých zpravodajských serverech

Autor
Martin Vastl
Rok
2019
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Tato práce je zaměřena na možnosti využití metod pro zpracování přirozeného jazyka k analýze komentářů zpravodajského portálu. Hlavním cílem je srovnání modelů BERT, Doc2vec a Doc2vec s předtrénovanými reprezentacemi slov z BERT ke zkoumání relevance komentářů k obsahu článků z portálu. Dalším cílem je aplikace vektorových reprezentací textu k detekci anomálních příspěvků a anomálního chování uživatelů pomocí metody Local outlier factor. Provedenými experimenty bylo zjištěno, že nejvyšší úspěšnosti ke zkoumání relevance je dosaženo pomocí modelu BERT, a že předtrénované slovní reprezentace nemají pozitivní vliv na zachycení sémantické informace textu oproti metodě Doc2vec. Metoda Local outlier factor, která je použita pro detekci anomálií, je schopna detekovat anomální komentáře i uživatele při využití vektorů z modelu BERT. Na druhou stranu, Doc2vec je v případě detekce anomálií nevhodný a často vrací nesprávné výsledky.

Sledování a analýza článků v médiích

Autor
Peter Kanoš
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Mgr. Jan Starý, Ph.D.
Anotace
Práca sa zaoberá implementáciou aplikácie pre zbieranie článkov a ich verzií v čase z českých spravodajských serverov iDnes.cz a Aktuality.cz. Následne analýzou týchto článkov vykonanou nástrojom Doc2Vec. Analýza týchto článkov je zameraná najmä na zmeny článkov v čase a porovnávanie podobností medzi ich časťami. Zmeny sa týkali najmä titulkov, perexov článkov a textov daných článkov. Skúmané boli najmä závislosti rôznych faktorov ako sú napríklad čas vydania článku, problematika ktorou sa článok zaoberá a podobne. Výsledkom práce samotnej je aplikácia naprísaná v jazyku Python.

Webová demonstrace základních statistických výpočtů s využitím matematického software R a SAGE

Autor
Jana Ernekerová
Rok
2015
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Mgr. Rudolf Bohumil Blažek, Ph.D.
Anotace
Tato práce se zabývá možnostmi integrace volně dostupných matematických algebraických systémů R a Sage do webové aplikace. Napojení statistického softwaru R do webové aplikace bylo provedeno s využitím API poskytova- ného projektem OpenCPU, napojení matematického softwaru Sage za pomoci služby Sage Cell Server. Oba zvolené matematické systémy se podařilo úspěšně využít ve webové aplikaci postavené na jazyce PHP. Výsledkem je jednoduchá webová aplikace pro základní statistické výpočty. Hlavním přínosem práce je rozbor možností využití systémů R a Sage ve webové aplikaci a jejich porov- nání z hlediska jednoduchosti integrace, efektivity a praktické použitelnosti.

Webová aplikace pro číselné kódování textových proměnných v datech

Autor
Miroslav Duka
Rok
2014
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Daniel Dombek, Ph.D.
Anotace
Tato bakalářská práce se zabývá návrhem a implementací webové aplikace pro kódování odpovědí z dotazníků do číselné podoby. Ze specifikovaných požadavků je navrženo řešení aplikace, která je implementována v prostředí ASP.NET. Popis technologie ASP.NET, její frameworky, knihovny a používání je v práci také uvedeno.

Webová aplikace podporující tvorbu rozvrhu kombinovaných studentů

Autor
Jiří Hanuš
Rok
2013
Typ
Bakalářská práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.

Diplomové práce

Curriculum Learning of Neural Networks

Autor
Gary Fibiger
Rok
2020
Typ
Diplomová práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Magda Friedjungová
Anotace
Umělé neuronové sítě se běžně trénují na náhodně seřazených datech. V mnoha směrech je tento přístup podobný učení živých organismů, to však nebývá náhodné. Lidé používají učební plány, podle kterých se jejich učení řídí. V posledních letech bylo navrženo mnoho přístupů, které mají za cíl vylepšit trénování neuronových sítí učebními plány. Tato práce obsahuje přehled těchto přístupů. Některé přístupy byly implementovány a experimentálně vyhodnoceny. Výsledky ukazují, že úspěšnost různých učebních plánů je závislá na mnoha faktorech.

Hodnocení smluv zveřejňovaných v Registru smluv s ohledem na podezření z korupce

Autor
Jan Staněk
Rok
2018
Typ
Diplomová práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Marek Sušický
Anotace
Tato diplomová práce se zabývá návrhem metrik sloužících pro nalezení podezřelých smluv zveřejňovaných v registru smluv. Popsány jsou dostupné datové zdroje, kterými je možné data z registru smluv doplnit, integrace dat a výběr příznaků pro detekci anomálií. Vytvořené metriky usnadňují výběr smluv vhodných pro ruční kontrolu.

Učicí metody skrytých Markovových modelů se spojitým časem

Autor
Lukáš Lopatovský
Rok
2017
Typ
Diplomová práce
Vedoucí
Ing. Daniel Vašata, Ph.D.
Oponenti
Ing. Tomáš Šabata
Anotace
Skrytý Markovův proces se spojitým časem je slibným modelem s využitím nejen pro biomedicínský výzkum. Nedostatek efektivních algoritmů pro jeho učení v minulosti výrazne omezoval jeho použití. Nedávno však byly prezentovány nové efektivní metody založené na EM algoritmu. V této diplomové práci zkoumáme a srovnáváme současné moderní metody, které jsou schopné vycvičit modely obsahující až stovky skrytých stavů. Jako součást práce jsme vyvinuli univerzální knihovnu pro skrytý Markovův proces se spojitým a diskrétním časem, která efektivně implementuje nejslibnější učební metody. Knihovna je snadno použitelná a dostupná všem uživatelům pod licencí open-source.