A | B | C | D | E | F | G | H | CH | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
Webový vyhledávač je služba, která umožňuje na Internetu najít webové stránky, které obsahují požadované informace. Uživatel zadává do rozhraní vyhledávače klíčová slova, která charakterizují hledanou informaci, a vyhledávač obratem na základě své databáze vypisuje seznam odkazů na stránky, které hledané informace obsahují (text, obrázky nebo jiné typy multimediálních informací). Databáze je udržována převážně automaticky na rozdíl od internetových katalogů, které jsou udržovány převážně ručně.
Cílem vyhledávačů je poskytnout uživateli při odpovědi na dotaz co nejrelevantnější informace, a proto různými způsoby hodnotí důležitost obsažených informací na webových stránkách (např. pomocí PageRank) a stránky s vyšším hodnocením zobrazuje uživateli jako první.
Jak vyhledávač pracuje
Vyhledávač pracuje z větší části automaticky, k čemuž využívá desítky až statisíce počítačů. Kvalita vyhledávače je závislá na tom, jak kvalitní dává odpovědi, tj. jestli uživatel najde hledanou informaci na prvních místech odpovědi vyhledávače. Z tohoto důvodu je nutné měřit kvalitu stránek, které vyhledávač má ve své databázi (např. PageRank u Google, S-rank u Seznamu) a naopak majitelé stránek se snaží modifikací svých stránek dosáhnout na co nejvyšší pozice ve výstupu vyhledávače (SEO). Výsledkem je, že vyhledávač musí své metody neustále vylepšovat, aby vyhověl čím dál vyšším požadavkům svých návštěvníků.
Obecně většina internetových vyhledávačů pracuje ve čtyřech krocích:
- procházení webových stránek
- vytvoření databáze výskytu slov
- indexování
- poskytování odpovědí na dotazy
Procházení webových stránek
Pro procházení webových stránek má internetový vyhledávač automatický program, tzv. vyhledávací robot (bot nebo též spider – „pavouk“), který se pomocí hypertextových odkazů snaží navštívit všechny webové stránky na Internetu (celý World Wide Web, tj. WWW).
Robot pracuje tak, že dostane na začátku seznam atraktivních stránek (tj. vstupních míst, resp. seznam URL odkazů). Nejlépe je to seznam rozcestníků, jako je například katalog Seznamu[1], Yahoo! Directory[2] a podobně. Robot každou stránku stáhne na svůj pevný disk a poznamená si její URL adresu, aby ji nenavštěvoval opakovaně. V uložené stránce přečte všechny hypertextové odkazy na další webové stránky, čímž získá další místa, která stejným způsobem navštíví. Robot pracuje cyklicky, takže se po určitém čase na stránky vrací, aby zjistil jejich případné změny.
Databáze výskytu slov
Stránky, které robot uložil na pevný disk, je nutné zpracovat a vytvořit z nich databázi. V databázi jsou uvedena všechna nalezená slova a k nim adresy, na kterých se tato slova vyskytují. Databáze je tedy schopna poskytnout informaci, na kterých stránkách se hledané slovo nachází. Problémem je velikost databáze, protože její sekvenční prohledání by trvalo neúměrně dlouho. Proto následuje další krok, tzv. indexace.
Indexování
Indexování databáze urychluje vyhledání požadované informace. Zároveň je index vytvořen tak, aby poskytoval na prvních místech stránky s nejvyšší užitnou hodnotou (tzv. relevancí, mající nejvyšší hodnocení kvality, nejvyšší váhu). Pro výpočet relevance se používají nejrůznější algoritmy, které jsou založeny na nejrůznějších znacích stránek a různých úhlech analýzy jejich obsahu, například:
- Váha slov
- Stránka má vyšší hodnocení, když má hledané slovo na stránce vyšší váhu. Váha slov se zvyšuje, je-li slovo v titulku stránky, nadpisu nebo blíže k začátku stránky, případně se na stránce opakuje. Váhu slov lze zneužít vkládáním „zajímavých“ slov do obsahu stránky bez ohledu na její skutečný obsah nebo prostým opakováním slov. Vyhledávač se brání penalizací (snížením kvality) podezřelých stránek.
- Atraktivita stránky
- Stránka má vyšší hodnocení, když na ni odkazuje více jiných stránek, protože zřejmě obsahuje zajímavé informace. Atraktivitu lze zneužít vytvářením falešných stránek, které odkazují na stránku, která má získat vyšší hodnocení. Vyhledávač se brání sledováním podezřelého náhlého hromadění odkazů.
- Serióznost Webu
- Webové servery, které obsahují velké množství kvalitních stránek, jsou při výpočtu váhy zvýhodněny. Seznam se může udržovat i ručními zásahy.
- Sponzorované odkazy
- Váha odkazu se zvyšuje zaplacením poplatku. Seriózní vyhledávače se této praxi vyhýbají nebo zřetelně oddělují výsledky zobrazené na základě komerčního zvýhodnění. Tento způsob je jedním z možných zdrojů příjmů vyhledávače.
- Technická kvalita
- Váha odkazu se zvyšuje, pokud jsou stránky správně sestaveny a vyhovují webovým standardům.
Odpovědi na dotazy
Vyhledávač poskytuje svým uživatelům vstupní formulář, do kterého jsou zadávána hledaná slova (fráze atp.). Po odeslání dotazu jsou pomocí indexu získány z databáze odkazy na stránky, které hledané slovo obsahují. Podle kvality indexu jsou na prvních místech většinou odkazy na stránky, které jsou pro uživatele dostačující. Pro vyšší přehlednost se zobrazuje kromě odkazu ještě titulek stránky, okolí nalezených slov a případně i další informace (stáří informace, kvalita odkazu, …).
Aktuálnost databáze
Z principu práce vyhledávače vyplývá, že nikdy nemá úplně aktuální informace, ale prezentuje je se zpožděním. Robot navštěvuje zajímavé adresy co nejčastěji (např. zpravodajské servery) nebo se dokonce uzavírá smlouva o snadnějším zpřístupnění obsahu pro robota (místo pasivního čekání na návštěvu robota jsou nové informace robotovi přímo zaslány). Pro vyšší efektivitu se databáze aktualizuje po částech nebo průběžně nebo se co nejčastěji aktualizují alespoň nejzajímavější a nejčastěji hledané informace.
Nežádoucí aktivity robotů
Někdy je nežádoucí, aby robot indexoval některé stránky. Proto existuje možnost, jak roboty omezit pomocí souboru robots.txt, který se umisťuje do kořene webového serveru.
SEO
Technika, která dokáže stránky upravit tak, aby se co nejlépe umístily ve výsledcích vyhledávání, se nazývá SEO (anglicky Search Engine Optimization) a v poslední době je velmi žádanou službou. SEO techniky se rozlišují na „povolené“ a „zakázané“ (tzv. Black Hat SEO, které vyhledávače tvrdě postihují například vyřazením ze svého indexu), avšak z hlediska vyhledávačů je jakékoliv umělé zlepšování umístění ve výsledcích vyhledávání nežádoucí (snad kromě případů, kdy robot stránce z nějakého důvodu nerozumí).
Na podobném principu funguje i tzv. Google bomba, která umožňuje do výsledků vyhledávání zahrnout i stránky, které hledané slovo neobsahují.
Nejznámější vyhledávače
Ve světě
V Česku
- Seznam.cz
- Atlas.cz (využívá Google)
- Centrum.cz (využívá Google)
Historie
Historie internetových vyhledávačů se začala psát v roce 1990, kdy byl pro prohledávání FTP archivů vytvořen vyhledávač Archie. V roce 1998 byl představen vyhledávač Google, který pomocí unikátního řadícího algoritmu výrazně změnil pohled na vyhledávání v internetovém obsahu.
Reference
- ↑ http://odkazy.seznam.cz – katalog odkazů na Seznam.cz
- ↑ http://dir.yahoo.com Archivováno 20. 12. 2014 na Wayback Machine. – Yahoo! Directory (katalog odkazů)
Související články
Externí odkazy
- Obrázky, zvuky či videa k tématu internetový vyhledávač na Wikimedia Commons
- http://www.searchenginesindex.com/cs/ – Vyhledávače ve všech zemích na světě (česky)
- http://www.vyhledavace.net – katalog vyhledávačů a katalogů (česky)
- http://vyhledavace.tym.cz – hodnocení vyhledávačů a katalogů pro SEO (česky)
- https://web.archive.org/web/20100202050726/http://www.jantichy.cz/blog/podily-vyhledavacu - proč nelze věrohodně určit skutečné podíly vyhledávačů v ČR
- http://www.portiscio.net/historie-seo - vývoj vyhledávačů od roku 1994 do roku 2010
- Nejpoužívanější české Internetové vyhledávače a jejich ostatní služby (česky)
Text je dostupný za podmienok Creative Commons Attribution/Share-Alike License 3.0 Unported; prípadne za ďalších podmienok. Podrobnejšie informácie nájdete na stránke Podmienky použitia.
Antény
Chemické zdroje elektriny
Chladenie v elektrotechnike
Elektrická sústava automobilu
Elektrická trakcia
Elektrické prístroje
Elektrické súčiastky
Elektrické spotrebiče
Elektrické stroje
Čítanie (elektrotechnika)
Činný výkon
Štatistická dynamika
Živý vodič
Admitancia
Antiparalelné zapojenie
Asynchrónny motor
Blúdivý prúd
Bočník (elektrotechnika)
Diak (polovodičový prvok)
Displej s kvapalnými kryštálmi
Elektrická inštalácia
Elektrická rezonancia
Elektrická sila
Elektrická vodivosť
Elektrické zariadenie
Elektrický obvod
Elektrický zvonec
Elektroenergetika
Elektromer
Elektrometer
Elektromobil
Elektromotor
Elektromotorické napätie
Elektrotechnický náučný slovník
Elektrotechnika
Elektrotechnológia
Fázor
Faradayova klietka
Frekvencia (fyzika)
Graetzov mostík
Impedancia
Indukčnosť
Induktancia
Istič
Izolácia (elektrotechnika)
Izolant
Jadro vodiča
Jednobran
Jednosmerný prúd
Joulovo teplo
Katóda
Koaxiálny kábel
Kompenzácia účinníka
Konduktometria
Konektor (elektrotechnika)
Korónový výboj
Lanko (elektrotechnika)
Leptanie
Logické hradlo
Magnetická susceptibilita
Magnetizácia (veličina)
Merný elektrický odpor
Mobilné zariadenie
Napájací zdroj
Napäťový chránič
Napäťový násobič
Nortonova veta
Odpínač
Odpojovač
OLED
Olovený akumulátor
Paralelné zapojenie
Peltierov článok
Plošná hustota elektrického prúdu
Poistka (elektrotechnika)
Posuvný prúd
Prúdový chránič
Prenosové médium
Prieletový klystrón
Primárny elektrochemický článok
Reaktancia
Rekuperácia (dopravný prostriedok)
Relé
Reproduktorová výhybka
Rezistancia
Rozhranie (interface)
Sériové zapojenie
Seebeckov jav
Sekundárny elektrochemický článok
Settopbox
Skrat
Sonar
Spínač
Spínaný zdroj
Straty v mikropásikových vedeniach
Striedavý prúd
Stupeň ochrany krytom
Svetelná výbojka
Symetrizačný člen
Technická normalizácia
Tepelné relé
Tepelne vodivostný detektor
Termočlánok
Théveninova veta
Transformátor
Transformátor s fázovou reguláciou
Trojfázová sústava
Tuhá fáza (elektronika)
Tyratrón
Usmerňovač (elektrotechnika)
Uzemnenie
Uzol (vodiče)
Vírivý prúd
Výbojka
Varistor
Ventilátor
Vodič (elektrotechnika)
Voltov stĺp
Vstavaný systém
Zásuvka (elektrotechnika)
Zdroj (elektrotechnika)
Zisk antény
Text je dostupný za podmienok Creative
Commons Attribution/Share-Alike License 3.0 Unported; prípadne za ďalších
podmienok.
Podrobnejšie informácie nájdete na stránke Podmienky
použitia.
www.astronomia.sk | www.biologia.sk | www.botanika.sk | www.dejiny.sk | www.economy.sk | www.elektrotechnika.sk | www.estetika.sk | www.farmakologia.sk | www.filozofia.sk | Fyzika | www.futurologia.sk | www.genetika.sk | www.chemia.sk | www.lingvistika.sk | www.politologia.sk | www.psychologia.sk | www.sexuologia.sk | www.sociologia.sk | www.veda.sk I www.zoologia.sk