Ing. Petr Procházka, Ph.D.

Projekty

Komprese formálních a přirozených jazyků

Program
Studentská grantová soutěž ČVUT
Kód
SGS10/306/OHK3/3T/18
Období
2010 - 2012
Popis
Projekt si klade za cíl návrh a implementaci nových metod komprese dat. Kontextové metody jsou součástí bezeztrátových kompresních metod, které umožňují získat z komprimovaných dat původní, identické informace. Tyto metody jsou založeny na podobnostech v kódovaných datech. Hlavní směr výzkumu je dnes zaměřen k slovním kontextovým metodám a s nimi spojeným transformacím. Slovní metody přinášejí rychlejší adaptivitu ke komprimovaným datům, při čemž využívají striktně definovaných struktur především přirozených či formálních jazyků, čímž dosahují lepší kompresní poměr ve srovnání s ostatními metodami. Cílem projektu je využít uvedených možností při návrhu nových metod pro kompresi přirozených jazyků, které budou disponovat kompresním poměrem lepším či srovnatelným s nejlepšími současnými metodami komprese dat. Zároveň se projekt chce zaměřit na návrh metod s vyváženým kompresním poměrem a časovou výpočetní náročností. Dalším cílem projektu je dokončení projektu knihovny ExCom (Extensib

Zpracování stromových struktur a komprese dat

Program
Studentská grantová soutěž ČVUT
Kód
SGS13/097/OHK3/1T/18
Období
2013
Popis
Pro ukládání, indexování a další zpracování velkého množství dat je zapotřebí využívat speciálních datových struktur. Pro hierarchickou organizaci dat je takovou typickou strukturou strom. Pro indexování, čtení a další zpracování dat v nich uložených je zapotřebí specializovaných algoritmů. Cílem tohoto výzkumu je navrhnout efektivní a snadno pochopitelné algoritmy cílené na vyhledávání (přesné i přibližné) a indexování ve stromech, a poté poskytnout jejich implementaci. Projekt si dále klade za cíl návrh a implementaci nových metod komprese dat ve dvou hlavních směrech: komprese notových zápisů a komprese textů přirozených jazyků.