Ing. Miroslav Balík, Ph.D.

Projekty

Komprese formálních a přirozených jazyků

Program
Studentská grantová soutěž ČVUT
Kód
SGS10/306/OHK3/3T/18
Období
2010 - 2012
Popis
Projekt si klade za cíl návrh a implementaci nových metod komprese dat. Kontextové metody jsou součástí bezeztrátových kompresních metod, které umožňují získat z komprimovaných dat původní, identické informace. Tyto metody jsou založeny na podobnostech v kódovaných datech. Hlavní směr výzkumu je dnes zaměřen k slovním kontextovým metodám a s nimi spojeným transformacím. Slovní metody přinášejí rychlejší adaptivitu ke komprimovaným datům, při čemž využívají striktně definovaných struktur především přirozených či formálních jazyků, čímž dosahují lepší kompresní poměr ve srovnání s ostatními metodami. Cílem projektu je využít uvedených možností při návrhu nových metod pro kompresi přirozených jazyků, které budou disponovat kompresním poměrem lepším či srovnatelným s nejlepšími současnými metodami komprese dat. Zároveň se projekt chce zaměřit na návrh metod s vyváženým kompresním poměrem a časovou výpočetní náročností. Dalším cílem projektu je dokončení projektu knihovny ExCom (Extensib