Hledání informací na webu

Jak vyhledávat na Internetu

 

Rozdíl mezi katalogem a vyhledávačem

a) Co je katalog

Katalogy jsou weby, které obsahují odkazy na jiné webové stránky a portály. Odkazy jsou tématicky setříděny, může se procházet jednotlivými sekcemi nebo i vyhledávat podle jednoduchých dotazů.

V Česku je katalog stránek na Seznamu, Atlasu a Centru. Jedním z nejstarších a nejznámějších katalogů ve světě je Yahoo! (vykřičník je součástí názvu).

b) Jak funguje vyhledávač

Jak již napovídá název tak jsou to programy, které vyhledávají v celém textu. Fulltextový vyhledávač si na rozdíl od katalogu stránku sám aktivně vyhledá. Vysílá neustále po Internetu několik speciálních programů (tzv. robota či pavouka) a ty stahují navštívené stránky do hlavní databáze vyhledávače (do tzv. indexu).

Index je databáze všech slov vyskytujících se na vyhledávaných stránkách. V současných vyhledávačích se používá tzv. invertovaný index, tj. abecedně seřazený seznam všech výrazů, které se na stránce vyskytují.

Nejznámějším světovým vyhledávačem je Google. Hlavní robot tohoto vyhledávače se nazýváGooglebot.

Jak funguje vyhledávání?

Vyhledávací roboti (Seznam, Google aj.) procházejí veškerý obsah na internetu formou hypertextových odkazů – crawling. Z takto navštívených stránek si roboti indexují důležité aspekty stránek do vlastní databáze, na základě které pak zobrazují výsledky v SERP.

Každý den pravděpodobně vyhledáváte na různorodých serverech, reprezentovaných internetovou stránkou (seznam.cz, gooogle.cz, centrum.cz aj.) a snažíte se ve výsledcích vyhledávání (SERP – Search engine result page) najít to, co Vás zajímá.

Pro představu Google index měl v roce 1998 26 miliónů stránek, v roce 2000 1 bilión a v roce 2008 1 trilión (to je již opravdu hodně nul). Je potřeba brát v potaz obrovský rozvoj sociálních sítí v posledních letech, indexace textu v obrázcích, zvuku ve video souborech, obsahu emailů atd. Dostáváme se tedy opět o velký skok dopředu.

Při zpracovávání dotazu je používáno mnoho technologií a postupů. Jedním ze základních principů je Lemmatizace.

Lemmatizace převede slovní spojení (klíčové slovo) na lemma (jeho základ) a určí jeho kontext, který je určován jako parametr pro zpracování. Kontext vychází ze statistiky výskytu daného slovního spojení. Pokud je tedy např. hledáno slovní spojení „nabídka kurzů“, bude se jako základ uvažovat „kurz“ ve spojení výuky, tedy nabídky vzdělávacích kurzů. Oproti tomu nebude brán zřetel např. na měnové kurzy.

Rozšířené vyhledávání

Přesná slova zadejte v uvozovkách: „krysí teriér“

Mezi všechna požadovaná slova vložte operátor OR:miniaturní OR standardní

Před slova, která nechcete, zadejte znaménko mínus:-hlodavec, -„Jack Russell“

Mezi čísla vložte 2 tečky a uveďte měrnou jednotku:10..35 kg, 300..500 Kč, 2010..2011

Rozšířené vyhledávání

Pomocí stránky Rozšířené vyhledávání můžete upřesnit výsledky v případě složitějšího vyhledávání. Můžete například najít webové stránky ve španělštině, které v názvu obsahují slovo „paella“ a byly aktualizovány během posledních 24 hodin. Nebo můžete najít černobílé obrázky New Yorku.

Přechod na stránku Rozšířené vyhledávání

  • Rozšířené vyhledávání webových stránek: Přejděte na www.google.cz/advanced_search nebo v pravém horním rohu stránky s výsledky vyhledávání klikněte na ikonu ozubeného kola > Rozšířené vyhledávání.
  • Rozšířené vyhledávání obrázků: Přejděte na www.google.cz/advanced_image_search nebo v pravém horním rohu stránky s výsledky vyhledávání obrázků klikněte na ikonu ozubeného kola > Rozšířené vyhledávání.

Jak rozšířené vyhledávání funguje

  1. Přejděte na stránku Rozšířené vyhledávání.
  2. V sekci „Kritéria vyhledávání stránek“ zadejte hledané výrazy.
  3. V sekci „Kritéria zúžení okruhu výsledků“ vyberte filtry, které chcete použít. Můžete použít jeden nebo více filtrů.
  4. Klikněte na tlačítko Rozšířené vyhledávání.

Tip: Mnoho z těchto filtrů můžete použít také ve vyhledávacím poli pomocí vyhledávacích operátorů.

 Interpunkce, symboly a operátory ve vyhledávání

Pomocí některých speciálních znaků a slov můžete získat konkrétnější výsledky vyhledávání. S výjimkou níže uvedených příkladů je většina interpunkce ignorována. Například vyhledávací dotaz psi! Google zpracuje jako psi.

Interpunkční znaménka a symboly, které ve Vyhledávání Google fungují

I když jsou níže uvedené symboly podporovány, ne vždy se po jejich přidání do vyhledávacího dotazu výsledky zlepší. Pokud podle nás interpunkce nepovede k lepším výsledkům, mohou se zobrazit doporučené výsledky pro daný vyhledávací dotaz bez interpunkce.

Poznámka: Když vyhledáváte pomocí symbolů, mezi symbol a slova vyhledávacího dotazu nepřidávejte mezery. Vyhledávací dotaz -psi bude fungovat, ale - psi fungovat nebude.

SymbolK čemu slouží
+Vyhledání stránek Google+ nebo krevních skupin Příklady: +Chrome a AB+
@Vyhledání štítků na sociálních sítích Příklad: @cuketka
$Vyhledání cen
Příklad: nikon $400
#Vyhledání populárních témat podle tzv. hashtagu Příklad: #volby2014
-Odstranění slovKdyž před slovem nebo webem použijete pomlčku, vyloučí se výsledky, které dané slovo nebo web obsahují. Hodí se to pro slova s více významy, například Jaguar (značka auta) a jaguár (zvíře).Příklady: jaguár rychlost -auto a panda -site:wikipedia.orgSpojení slovKdyž je pomlčka mezi slovy ve funkci spojovníku, Google pozná, že spolu slova úzce souvisejí.Příklad: Brno-venkov
_Spojení dvou slov, například quick_sort. Ve výsledcích vyhledávání se zobrazí všechna sousloví napsaná dohromady (quicksort) nebo spojená podtržítkem (quick_sort).
"Když dáte slovo nebo frázi do uvozovek, budou výsledky obsahovat jenom stránky se stejnými slovy ve stejném pořadí, jako je text v uvozovkách. Poznámka: Tuto možnost použijte pouze v případě, že hledáte přesné slovo nebo frázi, jinak zbytečně vyloučíte mnoho užitečných výsledků. Příklad: "prší prší jen se leje"
*Neznámé výrazy můžete ve vyhledávacím dotazu nahradit hvězdičkou. Tento operátor můžete použít s uvozovkami, abyste našli variace přesného sousloví nebo si připomněli slova uprostřed sousloví. Příklad:"lepší * v hrsti než * na střeše"
..Pokud čísla oddělíte dvěma tečkami bez mezer (..) zobrazí se výsledky, které obsahují čísla v daném rozmezí, například data, ceny nebo míry. Příklad: fotoaparát 2500..5000

Zpřesnění výsledků pomocí vyhledávacích operátorů

Vyhledávací operátory jsou slova, která můžete přidat k vyhledávání, abyste zpřesnili výsledky. Operátory se nemusíte učit nazpaměť – k vytvoření těchto vyhledávání můžete využít také stránku Rozšířené vyhledávání.

Poznámka: Když vyhledáváte pomocí operátorů, mezi operátor a slova vyhledávacího dotazu nepřidávejte mezery. Vyhledávání site:idnes.cz bude fungovat, ale site: idnes.cz fungovat nebude.

OperátorK čemu slouží
site:Získejte výsledky z konkrétních webů nebo domén. Můžete třeba najít všechny zmínky olympiády na webu České televize nebo na všech webech s příponou .cz. Příklady: olympiáda site:ceskatelevize.cz a olympiáda site:.cz
link:Najděte stránky, které odkazují na určitou stránku. Můžete například najít všechny stránky, které odkazují na google.cz. Příklad: link:google.cz
related:Najděte stránky podobné adrese URL, kterou již znáte. Pokud vyhledáte weby související s webem Aktuálně, najdete další zpravodajské weby, které by vás mohly zajímat. Příklad: related:aktualne.centrum.cz
ORPokud chcete vyhledávat stránky, které mohou obsahovat jen jedno z několika slov, použijte mezi slovy operátor OR (velkými písmeny). Bez operátoru OR se obvykle zobrazí stránky obsahující oba výrazy. Příklad: mistrovství světa ve fotbale 2014 OR 2018
info:Najděte informace o adrese URL, včetně archivované verze stránky, podobných stránek a stránek, které na daný web odkazují. Příklad: info:google.com
cache:Podívejte se, jak stránka vypadala, když ji Google naposledy procházel. Příklad: cache:cuni.cz

Filtry rozšířeného vyhledávání, které můžete použít

  • Jazyk
  • Oblast
  • Poslední aktualizace
  • Web nebo doména
  • Výskyt výrazů na stránce
  • Bezpečné vyhledávání
  • Úroveň čtení
  • Typ souboru
  • Práva k užití (najít stránky, které jste oprávněni používat)
  • Velikost
  • Poměr stran
  • Barva
  • Typ (obličej, animovaný apod.)
  • Web nebo doména
  • Typ souboru
  • Bezpečné vyhledávání
  • Práva k užití (najít obrázky, které jste oprávněni používat)

    Zadání úkolů I.

    Každý z nás potřebuje denně nalézt na internetu nějaké informace. Dnešní hodinu se podíváme, jak a kde tyto informace co nejrychleji a snadno vyhledat. Otevřete si textový dokument Word, který uložte jako Prijmeni_vyhledavani.doc na disk T:\. Do tohoto dokumentu si poznamenej všechny výsledky vyhledávání na dané otázky.

      • Chtěli bychom jet na exkurzi do Kutné Hory. Najdi, jakým spojem a v kolik hodin se můžeme dostat z Vlašimi do Kutné Hory, dále vyhledej nějakou turistickou zajímavost v tomto městě, turistickou a leteckou mapu města.
      • O víkendu bychom chtěli jít do kina. Vyhledej nejbližší kino v tvém okolí a najdi v programu kina, jaké filmy promítají tento víkend. Vyber film, na který by ses chtěl jít podívat a do připraveného dokumentu si poznamenej začátek promítání tohoto vybraného filmu.
      • Tatínek opravuje byt a potřebuje tvoji pomoc. Je potřebné vyhledat kontakt na zámečníka, topenáře a malíře v blízkosti tvého okolí. A mamince se rozbil vysavač, potřebovala by zakoupit nový. Pomoz jí vyhledat, na jaké internetové adrese je možné vysavač objednat. Typ vysavače: bezsáčkový, ruční, cena do 2000,-Kč.
      • V létě pojedete s rodiči na dovolenou do zahraničí letecky. Zkus vyhledat internetovou stránku, kde je možné zarezervovat si letenku. Na této stránce poté vyhledej odlety letadel ve směru Praha-New York a časové údaje odletů napiš do svého dokumentu.
      • Přeložte slovo dopis do anglického, německého, španělského a francouzského jazyku.
      • Pomocí serveru www.google.com vyhledej alespoň tři obrázky psa. Obrázek musí být barevný a pes na obrázku je hlavním motivem. Musí se jednat o fotografii psa, nesmí to být kresba, koláž ani 3D efekty.

    Zadání úkolů II.

      • Vyhledej nejrychlejší cestu automobilem Písek-Kutná hora. Vyhledej jaká je délka trasy mezi městy Olomouc a Zlín. Vyhledej přibližnou vzdálenost města Vrchlabí od Špindlerova Mlýna. Údaje poznamenej do dokumentu Prijmeni_spojeni.doc a ulož do své složky.
      • Vyhledej spojení z Prahy do Českých Budějovic ve všední den v dopoledních hodinách a to vlakem Českých drah a autobusem Student-agency. Dále zjisti cenu pro dospělého člověka a porovnej mezi sebou dobu jízdy. Údaje poznamenej do dokumentu Prijmeni_spojeni.doc a ulož do své složky.
      • Naplánuj jednodenní výlet z místa školy pro 10 žáků a 1 učitele, zjisti způsob dopravy, čas odjezdu, čas příjezdu (autobusem, vlakem) a ceny jízdenek (zjisti cenu za jednotlivé, skupinové jízdné a dále cenu za jednosměrnou a zpáteční jízdenku. Všechny údaje poznamenej do dokumentu Prijmeni_vylet.doc a ulož do své složky.
      • Vyhledej program do divadla ve Vašem okolí. Uveď odkaz internetové stránky na toto divadlo a zkopíruj program divadla na celý tento týden do dokumentu Vyhledavani_programy.doc. Dále v tomto programu zjisti jaké představení (název a  žánr – opera, balet, muzikál, atd.) se hraje tento víkend. Všechny tyto informace poznamenej do dokumentu (Prijmeni_programy.doc.)
      • Vytvoř si svůj vlastní slovníček, který bude obsahovat nejméně 10 slov, vztahující se k tématu „Vánoce“. Slovníček bude vytvořen do přehledné tabulky a všechna slova budou přeložena do anglického, německého, italského, ruského a španělského jazyka. Pod vytvořený slovníček vlož alespoň 3 obrázky, (formát .png), hodící se k tomuto tématu. Slovníček ulož do své složky v textovém dokumentu pod názvem Prijmeni_slovnicek.doc
    • Vytvoř si textový dokument, který si ulož do své složky pod názvem Prijmeni_obrazky.doc. Do stejné složky vyhledej, stáhni a ulož tři obrázky na téma Vánoce, tři obrázky na téma Halloween, tři na Velikonoce. Vždy tak, že každý ze tří obrázků bude v jiném formátu, např. Vanoce.jpg, Vanoce.gif, Vanoce.png. (použij formát JPG, GIF, PNG, velikost obrázků bude nastavena na Vysoká. V textovém dokumentu vytvoř tabulku, která bude obsahovat položku s názvem obrázku, formát, velikost obrázku. Obrázky v tabulce seřaď podle velikosti od největšího po nejmenší.