Aktuální informace FIT ke koronaviru najdete zde.

Znalostní inženýrství

Závěrečné práce

Diplomové práce

Sekvenční bayesovská poissonovská regrese

Autor
Radomír Žemlička
Rok
2020
Typ
Diplomová práce
Vedoucí
Ing. Kamil Dedecius, Ph.D.
Anotace
Poissonovská regrese je populární zobecněný lineární model používaný k modelování diskrétních náhodných veličin, typicky počtů. Tato práce je zaměřena na problematiku jejího sekvenčního odhadování s regresními koeficienty potenciálně pomalu proměnnými v čase. Je použita vhodná aproximace normálním rozdělením, aby tak bylo možné učinit v Bayesovském kontextu. Rovněž je diskutována kalibrační technika pro zvýšení kvality odhadů. Na závěr je navržen případ použití představeného přístupu v doméně zpracování signálu, zejména jeho použití v difuzních sítích (diffusion networks) pro realizaci distribuovaného kolaborativního odhadování.

Detekce anomalií pomocí Extended Isolation Forest algoritmu

Autor
Adam Valenta
Rok
2020
Typ
Diplomová práce
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Práce se zabývá různými typy algoritmů pro detekci anomálií, podrobně pak algoritmem Extended Isolation Forest. Extended Isolation Forest rozšiřuje svého předchůdce Isolation Forest. Původní Isolation Forest přináší zcela nový přístup k detekci, ale trpí zaujetím (bias) plynoucím ze způsobu, jakým vytváří stromy. Rozšířená verze algoritmu se tohoto zaujetí zbavuje úpravou větvení a původní algoritmus je jeho speciálním případem. Extended Isolation Forest je v rámci práce implementován do H2O-3 Machine Learning open-source platformy pro strojové učení. Základním požadavkem implementace je schopnost jejího spuštění na systému s distribuovaným výpočtem pomocí Map/Reduce knihovny.

Neurální faktorizační modely pro doporučovací systémy

Autor
Radek Bartyzal
Rok
2019
Typ
Diplomová práce
Vedoucí
Ing. Tomáš Řehořek, Ph.D.
Oponenti
MSc. Juan Pablo Maldonado Lopez, Ph.D.
Anotace
Doporučovací systémy nám napomáhají objevit zajímavé produkty v široké nabídce. Jedním z typů algoritmů generujících doporučení jsou faktorizační modely. V této práci popisujeme moderní faktorizační modely založené na neuronových sítích. Čtyři z nich také implementujeme. Dále představujeme nový faktorizační model Hybrid cSDAE založený na neuronových sítích, který dokáže zpracovat, jak interakční informace, tak různé druhy atributů. Všechny implementované modely jsou porovnány na standardních datasetech za stejných podmínek.

Detekce materiálových vad na izolačních deskách z napěněného skla

Autor
Tomáš Duda
Rok
2018
Typ
Diplomová práce
Vedoucí
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Oponenti
doc. Ing. Ivan Šimeček, Ph.D.
Anotace
Tato diplomová práce se zabývá automatizovanou detekcí materiálových vad na deskách z pěnového skla prostřednictvím analýzy snímků materiálu. Popsán je proces výroby pěnového skla a současný způsob kontroly kvality pracovníkem výroby. Je vysvětlen princip fungování instalované techniky pro snímání desek. Součástí práce je rešerše systémů pro detekci materiálových vad a analýza metod pro popis textur. Dále je proveden konceptuální návrh detekčního systému. Je navržen proces předzpracování snímků a aplikace pro anotaci snímků desek. Metody uvedené v rešerši jsou otestovány na reálných datech a na základě výsledků je sestaven detekční algoritmus pokrývající jednotlivé typy vad. Navržený algoritmus je implementován, ověřen na reálných datech a výsledky měření jsou diskutovány. Práce nakonec navrhuje několik způsobů, kterými by šel systém dále rozvíjet v budoucnosti. Vyvinutá aplikace byla úspěšně nasazena do produkčního prostředí.

Metody pro přibližné vyhledávání vzorků v řídkých multidimensionálních polích pomocí metod strojového učení

Autor
Anna Kučerová
Rok
2017
Typ
Diplomová práce
Vedoucí
Ing. Luboš Krčál
Oponenti
prof. Ing. Jan Holub, Ph.D.
Anotace
Hlavním cílem této práce je navrhnout řešení přibližného vyhledávání vzorů, které používá některou z metod strojového učení. Toho je dosaženo využitím hashování a již existujících algoritmů. Hashování se používá k nalezení pozic potenciálních výsledků. Následné ověření bylo provedeno stejným způsobem jako u existujících řešení pro lepší porovnání. Předchozí výzkum byl zaměřen především na vyhledávání v prostorech s malým počtem dimenzí. Výstupem této práce je algoritmus, který je porovnán s již existujícími řešeními. Některé z porovnávaných algoritmů byly zatím pouze teoreticky navrženy a dosud neimplementovány. Algoritmy také používají binární formát používaný v komerčních databázích.

Predikce kriminality

Autor
Veronika Maurerová
Rok
2017
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Anotace
S důrazem na efektivitu práce a s vzrůstajícím zájmem o zpracování dat, strojové učení a umělou inteligenci, se prediktivní analýza stává součástí policejních aktivit, predevším v oblasti prevence kriminality. Například policejní hlídky jsou plánováné pomocí prediktivní analýzy nejvíce ohrožených oblastí ve městě. Tato práce se zabývá především využitím metod supervizovaného učení při dolování skrytých vzorců z historických kriminálních dat. Cílem je s určitou jistotou indikovat ohrožená místa pro budoucí spáchání trestného činu či přestupku s vyžitím metod založených na rozhodovacíh stromech a neuronových sítích.

Škálovatelnost prediktivních modelů

Autor
Tomáš Frýda
Rok
2017
Typ
Diplomová práce
Vedoucí
doc. Ing. Pavel Kordík, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Tato práce má dva hlavní cíle - (1) paralelizovat FAKE GAME integrací do open source frameworku H2O, zaměřeného na strojové učení, a (2) hodnocení anytime vlastností algoritmů strojového učení a vlivu optimalizace hyper-parametrů na tyto algoritmy. Tyto cíle jsem realizoval integrací FAKE GAME do H2O. Za účelem vyhodnocení anytime vlastností jsem implementoval nový nástroj nazvaný Benchmarker. Vyhodnocení anytime vlastností ukázalo, že pro některé problémy modely z FAKE GAME překonají modely z H2O, jak v přesnosti, tak i ve výkonu. Na druhou stranu vyhodnocení vlivu optimalizace hyper-parametrů ukázalo poměrně malý úspěch při optimalizaci algoritmů strojového učení z H2O. Domnívám se, že zanedbatelné zvýšení výkonnosti, a pro některé z optimalizovaných modelů dokonce i nižší výkon než u výchozí konfigurace, je způsobeno automatickým laděním některých hyper-parametrů, které se provádí ve výchozím nastavení H2O.

Neuronové sítě s pamětí

Autor
Ondřej Kužela
Rok
2016
Typ
Diplomová práce
Vedoucí
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Oponenti
Ing. Josef Pavlíček, Ph.D.
Anotace
Neuronové sítě s pamětí jsou rodinou neuronových sítí, které kromě klasické paměti ve formě vah, sloužících pro dlouhodobé závislosti, obsahují také jinou formu paměti. Ta slouží pro uchovávání střednědobých, občas také nazývaných dlouho-krátkodobých, závislostí. Taková paměť může být buď interní nebo externí. V rámci této práce poskytuji souhrnný náhled na rodinu neuronových sítí s pamětí. Na základě analýzy existujících modelů také navrhuji nový model, který nazývám Recurrent Neural Modules with External Memory. Tento model nabízí nový a inovativní přístup k použití externí paměti v rámci neuronových sítí, jelikož nasazuje externí paměť na úrovni částí sítě a tudíž obsahuje několik externích pamětí v rámci jedné sítě. Výkonnost nově navrženého modelu byla testována na Air Travel Information System (ATIS) datasetu.

Automatická sumarizace textu

Autor
Šimon Hlaváč
Rok
2015
Typ
Diplomová práce
Vedoucí
doc. RNDr. Ing. Marcel Jiřina, Ph.D.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
V této práci jsou představeny základní metody využívané v automatické sumarizaci textu a genetických algoritmech. Dále je zde navržen systém automatické sumarizace založený na grafových strukturách a Markovských řetězcích, který byl rovněž implementován a řádně otestován. Práce se dále zabývá učením správného nastavení vah důležitosti jednotlivých metod používaných v sumarizaci pomocí naivního přístupu a genetických algoritmů, které byly rovněž naimplementovány, včetně možnosti paralelního zpracovávání a využití cache pro zrychlení systému, a řádně otestovány.

Textové příznaky pro zlepšení relevance full-textového vyhledávání

Autor
Jan Hnízdil
Rok
2015
Typ
Diplomová práce
Vedoucí
Ing. Jan Šedivý, CSc.
Oponenti
doc. Ing. Pavel Kordík, Ph.D.
Anotace
Ačkoliv se vyhledávání informací na webu stalo standardem a často oblíbenym zdrojem pro hledání informací již před mnoha lety, úloha hledání relevance dokumentů k danému uživatelskému dotazu má stále mnoho slabych míst, které je zapotřebí zlepšit. Tato práce se snaží nalézt takové textové příznaky, které by zlepšily vysledky full-textového vyhledávání, a tím i spokojenost uživatelů, za využití datasetů od společnosti Seznam.cz. Za prvé jsou v rámci této diplomové práce analyzovány hlavní LTR algoritmy, evaluační míry a běžně používané textové signály známé z literatury. Za druhé byl navržen a naimplementován systém pro testování a evaluaci nově přidanych textovych signálů a nakonec byly tyto nově přidané signály porovnány s anonymizovanymi signály, které v současnosti používá Seznam.cz, prostřednictvím velké sady experimentů.