doc. Ing. Jan Janoušek, Ph.D.

Vedoucí Katedry teoretické informatiky

Projekty

Algoritmy pro zpracování stromových datových struktur a kompresi dat

Program
Studentská grantová soutěž ČVUT
Kód
SGS15/116/OHK3/1T/18
Období
2015
Popis
Pro ukládání, indexování a další zpracování velkého množství dat je zapotřebí využívat speciálních datových struktur. Pro hierarchickou organizaci dat je takovou typickou strukturou strom. Pro indexování, čtení a další zpracování dat v nich uložených je zapotřebí specializovaných algoritmů. Projekt si dále klade za cíl návrh a implementaci nových metod komprese dat a indexování ve dvou hlavních směrech: komprese DNA sekvencí pomocí slovníkových metod a přibližné vyhledávání v genomech.

Algoritmy pro zpracování stromových datových struktur, implementaci programovacích jazyků a kompresi dat

Program
Studentská grantová soutěž ČVUT
Kód
SGS17/209/OHK3/3T/18
Období
2017 - 2019
Popis
Pro ukládání, indexování a další zpracování velkého množství dat je zapotřebí využívat efektivních datových struktur a algoritmů. Pro hierarchickou organizaci dat je takovou typickou strukturou strom. Projekt si dále klade za cíl návrh a implementaci nových metod pro indexování kombinované s kompresí dat a metod pro různá přibližná vyhledávání nad těmito indexy. Aplikace takových indexů pak je při vyhledávání v DNA a RNA sekvencích. Dalším tématem výzkumu je oblast algoritmů pro implementace dynamických pragramovacích jazyků.

Algoritmy pro zpracování stromových struktur a kompresi dat

Program
Studentská grantová soutěž ČVUT
Kód
SGS14/101/OHK3/1T/18
Období
2014
Popis
Pro ukládání, indexování a další zpracování velkého množství dat je zapotřebí využívat speciálních datových struktur. Pro hierarchickou organizaci dat je takovou typickou strukturou strom. Pro indexování, čtení a další zpracování dat v nich uložených je zapotřebí specializovaných algoritmů. Cílem tohoto výzkumu je navrhnout efektivní a snadno pochopitelné algoritmy cílené na vyhledávání (přesné i přibližné) a indexování ve stromech, a poté poskytnout jejich implementaci. Projekt si dále klade za cíl návrh a implementaci nových metod komprese dat ve dvou hlavních směrech: komprese DNA sekvencí a rozdílová komprese souborů.

Generování uživatelského rozhraní automatickou inspekcí zdrojového kódu

Program
Studentská grantová soutěž ČVUT
Kód
SGS12/147/OHK3/2T/13
Období
2012 - 2013
Popis
Při vývoji softwarových aplikací je mnoho času věnováno vývoji uživatelského rozhraní (podle průzkumů až 50%). Výsledkem vývoje rozhraní je často složitý a nepřehledný kód. Příčinou je, že uživatelské rozhraní kombinuje různé aspekty (zájmy) jako je bezpečnost, grafická prezentace, rozložení prvků, validace či nápověda. Cílem tohoto projektu je minimalizace manuální práce při vytváření uživatelského rozhraní. Toho lze dosáhnout pomocí inspekce zdrojového kódu aplikace a následného generování uživatelského rozhraní, čímž lze oddělit prezentaci, validaci, konverzi a zabezpečení a spravovat je nezávisle. Jednotlivé aspekty pak mohou být kombinovány v rámci transformace do uživatelského rozhraní. Kromě optimalizace výstupního kódu rozhraní je výhodou i možnost tvorby rozhraní při běhu aplikace, což umožní integraci s kontextovým zabezpečením třetích stran či zrychlení načítání rozhraní aplikace. Použitá metoda je přenositelná i do oblastí jako je reverse-engineering nebo model-driven dev

Nástroje pro automatizaci Quality Assurance rozsáhlých Business Intelligence systémů a datových skladů

Program
ALFA: Program na podporu aplikovaného výzkumu a experimentálního vývoje
Poskytovatel
Technologická agentura České republiky
Kód
TA03010964
Období
2013 - 2016
Popis
Prostředí Business Intelligence systémů a datových skladů se skládá z tisícovek programových artefaktů. Automatizovaná správa velkého množství artefaktů vyžaduje vysoce výkonné nástroje, které na trhu chybí. S využitím posledních výsledků teoretického výzkumu a dlouhodobých praktických zkušeností se správou prostředí založených na standardech SQL a XML vytvoříme nástroje, které budou představovat revoluční změnu v oblasti současných nástrojů Quality Assurance, kam se investují velké finanční prostředky.

Nástroje pro governance dynamických aspektů Big Data prostředí

Program
EPSILON: Program na podporu aplikovaného výzkumu a experimentálního vývoje
Poskytovatel
Technologická agentura České republiky
Kód
TH02010287
Období
2017 - 2019
Popis
Klíčovým trendem posledních desetiletí při řízení společností je rozhodování založené na datech (tzv. data-driven). Kritický systém podniku, který tento typ rozhodování a řízení umožňuje, je datový sklad (DWH), resp. Business Intelligence (BI). Rychle se měnící (nejen) ekonomické podmínky nutí společnosti BI dynamicky rozvíjet a efektivita správy a rozvoje BI (tzv. Data Governance) je podmínkou pro úspěšnou práci s daty. Big Data revoluce však přináší do světa zpracování dat masivní změny a ukazuje se, že dosavadní Data Governance technologie a metody jsou ve světě velkých dat neefektivní. Cílem projektu je proto vytvořit nástroje, které zajistí efektivní Data Governance i v Big Data prostředí, a uchrání tak miliardy korun investovaných po celém světě do dosavadního rozvoje BI.

Vyhledávání a indexování stromových datových struktur

Program
Studentská grantová soutěž ČVUT
Kód
SGS12/092/OHK3/1T/18
Období
2012
Popis
Pro ukládání, indexování a další zpracování velkého množství dat je zapotřebí využívat speciálních datových struktur. Pro hierarchickou organizaci dat je takovou typickou strukturou strom. Pro indexování, čtení a další zpracování dat v nich uložených je zapotřebí specializovaných algoritmů. Příkladem aplikací stromů může být optimalizace abstraktních syntaktických stromů při kompilaci, přepisování termů, mechanické provádění důkazů, hledání v fylogenetických stromech, indexování sekundární struktury RNA, hledání v XML dokumentech a vyhodnocování zdrojového kódu funkcionálních jazyků. Proto jsme založili novou výzkumnou disciplínu, Arbologii, odnož Stringologie, která se zabývá stromovými strukturami. Používáme zásobníkového automatu jako výpočetního modelu, jelikož lineární zápisy stromů jsou generovány bezkontextovými gramatikami a tudíž jsou bezkontextovými jazyky. Cílem tohoto výzkumu je navrhnout efektivní a snadno pochopitelné algoritmy cílené na vyhledávání (přesné i přibližné) a

Vyhledávání ve stromech

Program
Studentská grantová soutěž ČVUT
Kód
SGS10/225/OHK3/2T/18
Období
2010 - 2011
Popis
Pro ukládání, indexování a další zpracování velkého množství dat je zapotřebí využívat speciálních datových struktur. Pro hierarchickou organizaci dat je takovou typickou strukturou strom. Pro indexování, čtení a další zpracování dat v nich uložených je zapotřebí specializovaných algoritmů. Příkladem aplikací stromů může být optimalizace abstraktních syntaktických stromů při kompilaci, přepisování termů, mechanické provádění důkazů, hledání v fylogenetických stromech, indexování sekundární struktury RNA, hledání v XML dokumentech a vyhodnocování zdrojového kódu funkcionálních jazyků. Proto jsme založili novou výzkumnou disciplínu, Arbologii, odnož Stringologie, která se zabývá stromovými strukturami. Používáme zásobníkového automatu jako výpočetního modelu, jelikož lineární zápisy stromů jsou generovány bezkontextovými gramatikami a tudíž jsou bezkontextovými jazyky. Cílem tohoto výzkumu je navrhnout efektivní a snadno pochopitelné algoritmy cílené na vyhledávání (přesné i přibližné) a

Zpracování stromových datových struktur a kompresi dat

Program
Studentská grantová soutěž ČVUT
Kód
SGS16/118/OHK3/1T/18
Období
2016
Popis
Pro ukládání, indexování a další zpracování velkého množství dat je zapotřebí využívat efektivních datových struktur a algoritmů. Pro hierarchickou organizaci dat je takovou typickou strukturou strom. Projekt si dále klade za cíl návrh a implementaci nových metod pro indexování kombinované s kompresí dat a metod pro různá přibližná vyhledávání nad těmito indexy. Aplikace takových indexů pak je při vyhledávání v DNA a RNA sekvencích.

Zpracování stromových struktur a komprese dat

Program
Studentská grantová soutěž ČVUT
Kód
SGS13/097/OHK3/1T/18
Období
2013
Popis
Pro ukládání, indexování a další zpracování velkého množství dat je zapotřebí využívat speciálních datových struktur. Pro hierarchickou organizaci dat je takovou typickou strukturou strom. Pro indexování, čtení a další zpracování dat v nich uložených je zapotřebí specializovaných algoritmů. Cílem tohoto výzkumu je navrhnout efektivní a snadno pochopitelné algoritmy cílené na vyhledávání (přesné i přibližné) a indexování ve stromech, a poté poskytnout jejich implementaci. Projekt si dále klade za cíl návrh a implementaci nových metod komprese dat ve dvou hlavních směrech: komprese notových zápisů a komprese textů přirozených jazyků.