Pražský stringologický klub

Vyvíjíme algoritmy pro zpracování řetězců, posloupností a stromů a aplikujeme je v oblastech jako je bioinformatika a komprese dat.
 
Výzkumná skupina s téměř dvacetiletou tradicí začala s řešením klasických problémů vyhledávání. S rozvojem v dalších oblastech vědy se objevují větší a větší výzvy. Takové výzvy obsahují uložení a indexování velkých objemů podobných dat. Tyto úlohy přicházejí z oblasti bioinformatiky a souvisí s vývojem vysokoobjemových sekvenátorů.
 
http://www.stringology.org/
 

Vedoucí
Prof. Ing. Jan Holub, Ph.D., jan.holub@fit.cvut.cz, +420-22435-9814

Výzkumná témata vedoucího
stringologie, bioinformatika, komprese dat, indexování

Další členové

  • prof. Ing. Bořivoj Melichar, DrSc.
  • Ing. Miroslav Balík, Ph.D.
  • Ing. Ondřej Guth, Ph.D. (stromové algoritmy, algoritmy na vyhledávání pravidelností v řetězcích)
  • doc. Ing. Jan Janoušek, Ph.D. (stromové algoritmy, překladače)
  • Ing. Luboš Krčál, (komprese dat, deduplikace, similarity search)
  • Ing. Radomír Polách
  • Ing. Petr Procházka, Ph.D., (komprese přirozeného textu, selfindexes)
  • Ing. Jan Trávníček (stromové algoritmy)
  • Ing. Ladislav Vagner, Ph.D.
  • Ing. Jan Žďárek, Ph.D.

Výzkumná témata skupiny

  • Vyhledávání
  • Komprese dat
  • Bioinformatika
  • Stringologie
  • Indexování

Vyučované předměty - zkratky
BI-AAG, MI-EVY, MI-AVY, MI-KOD, BI-PJP, MI-SYP, MI-GEN

Oceněné závěrečné práce

  • Luboš Krčál, Inkrementální komprese založená na clusterování (absolvoval v červnu 2014)

Články

  • Procházka, P., Holub, J.: Compressing Similar Biological Sequences using FM-index. In A. Bilgin, M. W. Marcellin, J. Serra-Sagrista, J. A. Storer (eds.): Proceedings of Data Compression Conference 2014, IEEE Computer Society Press, pp. 312-321, 2014.
  • Lahoda, J., Žďárek, J.: Simple Tree Pattern Matching for Trees in the Prefix Bar Notation. Discrete Applied Mathematics, Vol. 163, Part 3, pp. 343–351, Jan 2014.
  • Procházka, P., Holub, J.: Compression of a Set of Files with Natural Language Content. The Computer Journal, 2014, available online.
  • Procházka, P., Holub, J.: ODC: Frame for Definition of Dense Codes. European Journal of Combinatorics, Elsevier, Vol. 34, No. 1, pp. 52-68, 2013.
  • Na, J. C., Park, H., Crochemore, M., Holub, J., Iliopoulos C. S., Mouchard, L., Park, K.: Suffix Tree of Alignment: An Efficient Index for Similar Data. Proceedings of the 24th Workshop on Combinatorial Algorithms (IWOCA 2013), Rouen, July 2013, LNCS 8288, Springer-Verlag, pp. 337-348, 2013.
  • Žďárek, J., Melichar, B.: Tree-Based 2D Indexing. In Domaratzki, M., Salomaa, K. (Eds.): International Journal of Foundations of Computer Science (IJFCS), Special Issue Implementation and Application of Automata (CIAA 2010), vol. 22, no. 8, World Scientific, pp. 1893–1907, Dec. 2011.
  • Holub, J.: The Finite Automata Approaches in Stringology. Kybernetika, Vol. 48 (3), pp. 386-401, 2012.
  • Melichar, B., Janoušek, J., Flouri, T.: Arbology: Trees and pushdown automata. Kybernetika, Vol. 48 (3), pp. 401-428, 2012.
  • Flouri, T., Holub, J., Iliopoulos, C.S., Pissis, S.P.: An algorithm for mapping short reads to a dynamically changing genomic sequence. Proceedings of IEEE International Conference on Bioinformatics and Biomedicine (BIBM 2010), IEEE Computer Society, pp. 133-136, 2010.
  • Holub, J.: Finite Automata in Pattern Matching. In M. Elloumi, A. Y. Zomaya (eds.): Algorithms in Computational Molecular Biology: Techniques, Approaches and Applications, Wiley, pp. 51-71, 2011.


Poslední změna: 18.2.2016, 15:41