BI-VWM – Vyhledávání na webu a v multimed. DB

Cíl předmětu

Studenti získají základní přehled o technikách vyhledávání v prostředí webu, na které je nahlíženo jako na rozsáhlá distribuovaná a heterogenní datová úložiště. Konkrétně studenti získají znalosti o technikách vyhledávání textových a hypertextových dokumentů (samotných webových stránek), dále se detailněji seznámí s technikami podobnostního vyhledávání v heterogenních multimediálních databázích (obecně v kolekcích nestrukturovaných dat). Zároveň se tak naučí technikám pro programování webových vyhledávačů pro uvedené typy dat.

Program přednášek

 1. Úvod. Infrastruktura webu, distribuce dat na webu, typy dokumentů na webu, modality vyhledávání na webu.
 2. Vyhledávání textu - Booleovské modely. Implementace.
 3. Vyhledávání textu - Vektorové modely. Implementace.
 4. Vyhledávání hypertextu. Hypertextový ranking.
 5. Optimalizace webových stránek pro vyhledávače.
 6. Sémantické weby. Implementace.
 7. Doporučující systémy. Kolaborativní filtrování.
 8. Multimediální databáze. Vyhledávání multimédií založené na textu.
 9. Podobnost jako model pro vyhledávání podle obsahu. Extrakce multimediálních deskriptorů.
 10. Podobnostní dotazy a jejich integrace do SQL.
 11. [2] Indexování metrické podobnosti pro rychlé vyhledávání v multimediálních databázích.
 12. Aproximativní podobnostní vyhledávání.
 13. Pokročilé modely - nemetrické podobnosti, dynamické podobnosti a dotazy apod.

Program cvičení

 1. Booleovský model.
 2. Vektorový model.
 3. Vyhledávání hypertextu.
 4. Doporučující systémy.
 5. Podobnostní dotazy.
 6. Indexování metrické podobnosti.
 7. Aproximativní vyhledávání.Poslední změna: 22.4.2009, 21:11