Na internetu každou sekundu přibyde 5 milionů nových stránek a tato rychlost se neustále zvyšuje. Tento seriál popíše metody, jak v informacích vyhledávat.
V této lekci popisu principu internetového vyhledávače pochopíme, jak vyhledávač získané výsledky třídí, popisuje a hodnotí.
Třídění výsledků
Představme si hotový barel, který je právě připravený na hledacím serveru. Od uživatele přijde náš první…
V dnešní lekci se budeme věnovat datovým barelům, jejich struktuře, StopSlovům a nakonec si popíšeme crawlery.
Datové barely
Jedná se o speciální datový typ, umístěný na více serverech současně ve více kopiích. Zpravidla se jedná o datově náročné…
V dnešní lekci se budeme věnovat indexaci a kanonizaci dokumentů na internetu.
Indexace
Proces indexace provádí komponenta zvaná indexér. Jedná se o speciálně navržený program, který ze stažených dat (ta data, která stáhl Crawler) udělá speciální…
Na internetu každou sekundu přibyde 5 milionů nových stránek a tato rychlost se neustále zvyšuje. Aby bylo možné tomuto obrovskému moři informací dát nějaký řád a něco v něm naleznout, tak existují vyhledávače. Následující práce má za cíl seznámit s…