10 rad pro vytvoření nejlepší URL

Jakým způsobem volit tvar URL jednotlivých stránek s ohledem na použitelnost a SEO.
Nálepky:
Článek původně vyšel na autorově webu Je čas.
Každá webová stránka má zpravidla:
- název/titulek (značka
<title>
), - hlavní nadpis (
<h1>
), - obsah
A všechny tyto věci se nacházejí na nějaké adrese – URL (Uniform Resource Locator – český překlad „jednotná adresa zdroje“). Tvar adresy může být různý:
example.com/super-clanek example.com/clanky/super-clanek example.com/super-clanek.html example.com/Super_článek example.com/?id=5
Plus různé variace výše uvedeného.
Tvar URL chce promyslet
Zatímco přepsat název článku nebo změnit jeho obsah není výraznější problém, změna adresy je značně komplikovanější.
Na obsah nacházející se na dané URL už mohou vést odkazy či stránku již zaindexovaly vyhledávače. V takovém případě změna URL přináší komplikace.
Ideální je adresy neměnit.
Jaké by měly být dobré adresy, aby zaručily dobrou dohledatelnost informací? Přináším přehled třech hlavních vlastností. URL adresy by měly být
- trvalé,
- trvalé
- a trvalé
Když už se adresy změní, je nutné alespoň zajistit přesměrování, což bývá práce navíc, takže je lepší skutečně adresy neměnit.
Navíc seznam přesměrování zanáší lehký nepořádek do webu, na který se při redesignu stránek snadno zapomene.
Na určení tvaru URL je tedy mimořádně důležité si dát záležet a i například při publikaci obsahu pořádně zkontrolovat, že neobsahuje překlep.
Srozumitelnost a stručnost adresy
URL stránky se zobrazuje na řadě míst.
V adresním řádku prohlížeče:
Ve stavovém řádku po najetí myší na odkaz:
Dále se adresy zobrazují ve výsledcích vyhledávání. Vyhledávače v nich i zvýrazňují hledaná slova. Zobrazení na Seznamu:
Zobrazení URL v SERPu Googlu:
Jen tak vložená URL bez úpravy textu odkazu se může objevit v diskusních fórech nebo komentářích, kde se samotná URL stane textem odkazu.
Je tedy dobré, když adresa dobře vystihuje obsah, který lze na dané URL očekávat. Z toho vyplývá, že by adresa neměla mít podobu typu:
example.com/?id=5
To člověku většinou příliš nepomůže.
Délka adresy
Vzhledem k omezenému prostoru je dále lepší, aby adresa byla kratší než delší. Hodně dlouhá URL se stejně zpravidla celá nezobrazí.
Krátká URL se dá dobře nadiktovat (tj. je použitelná v offline světě), lze zapamatovat nebo se zobrazí celá při sdílení na Twitteru:
Opravdu hodně dlouhé adresy mohou být rozbity různými redakčními systémy, které dlouhá slova rozdělují a neumějí rozlišit slovo od URL. Uživatelé tak musí používat zkracovače adres.
Klíčová slova v URL a SEO
Z pohledu vyhledávačů se zdá být rozumné uvádět v URL nejdůležitější klíčová slova.
- Klíčová slova v URL jsou zvýrazněna ve výsledcích hledání. To může být další signál pro návštěvníka, že má právě kliknout na daný odkaz.
- Pro vyhledávač je adresa stránky další informace, podle které určovat téma stránky.
Nějaký zázračný SEO efekt klíčovým slovům v adrese ale přisuzovat nelze. Adresa není pro návštěvníky tak důležitá jako obsah, aby vyhledávač stránky kvůli špatným adresám výrazně upozaďoval.
Složky/kategorie
Někdy bývají k vidění adresy znázorňující stromovou strukturu.
example.com/sekce/kategorie/clanek
Vytvářet hlubokou strukturu v adresách je značně risikové z toho důvodu, že se rozvržení stránky málokdy podaří navrhnout rovnou finálně.
Problém logicky vyvstane, když bude potřeba strukturu změnit. To bude znamenat:
- buď změnu URL,
- nebo vytvoření nekonsistence mezi tvarem adres a skutečnou strukturou.
Celé situaci se tak jde vyhnout jednou jedinou úrovní pro veškerý obsah. Tento systém používá například Wikipedie.
cs.wikipedia.org/wiki/HyperText_Markup_Language
Zbytečná slova
V ideálním případě by v URL nemělo být nic, co nenese hodnotnou informaci. Tedy se vyhnout různým identifikátorům, které do URL přidávají redakční systémy.
Pro web o pěti podstránkách je zbytečné mít adresy ve tvaru:
example.com/stranka/kontakt
Postačí prosté:
example.com/kontakt
Vycpávání klíčovými slovy
Vycpávání klíčovými slovy (anglicky Keyword stuffing) je nekalá SEO praktika, kdy se do adresy klíčové slovní spojení vloží hned několikrát.
example.com/klicove-slovo/klicove-slovo.html
Lze předpokládat, že rozumné vyhledávače nebudou mít důvod kvůli zopakování klíčových slov stránku upřednostnit. Naopak taková adresa může působit podezřele na lidské návštěvníky a vést tak nižší míře prokliku.
Česká diakritika v URL
Wikipedie dokazuje, že adresa stránky diakritiku (a dokonce i další netradiční znaky) obsahovat může. Mohou s tím ale být problémy, za které se lepší srozumitelnost a menší počet kolisí (např. koš vs. kos) adresy nemusí vyplatit – některé přísnější skripty ověřující URL s tím mohou mít problémy.
Automatický převodník textu na klikací odkaz tak může vzít znak s háčkem nebo čárkou jako konec URL a odkaz tím rozbít.
Osvědčené je používat pouze znaky a–z, 0–9 a pro oddělení slov spojovník -
. Jde k tomu použít následující funkci, které dokáže takovou podobu URL automaticky vytvořit podle názvu stránky:
- PHP triky: Vytvoření přátelského URL – hotové funkce v PHP a JavaScriptu
Předložky a slovní vata
Skripty zajišťující automatický převod názvu stránky na URL (řetězec adresy se někdy označuje jako slug) mohou obsahovat funkci pro odstraňování předložek, spojek a dalšího obsahu, co není klíčovým slovem. V angličtině potom ještě členů.
V češtině to kvůli skloňování značně snižuje čitelnost. Například z titulku:
Hledám fotografa s objektivem pro interier – Praha Palmovka
Může vzniknou slug ve tvaru:
hledam-fotografa-objektivem-interier-praha
Ideální je tedy tvořit URL ručně. U webů, kde obsah tvoří nepoučení lidé, jako třeba diskusní fórum, je ale takový postup značně komplikovaný. Nakonec může méně škody napáchat automatický převod než vložení důvěry do rukou návštěvníků.
Duplicitní adresy
Nikdy by nemělo být možné získat stejný obsah na více různých adresách. V případě, že na něco takového vyhledávač narazí, musí si jednu z adres vybrat a tu preferovat. Nešikovné je, když si vybere tu podobu, která nebyla zamýšlena.
U adres obsahující číselný identifikátor následovaný textovou omáčkou pro uživatele, může dojít ke komickým situacím, kdy je možné změnit text URL bez následného přesměrování.
Stránka example.com/5-kontakt
tak může být dostupná na URL example.com/5-jsme-hlupaci
. Řešením je používat přesměrování hlavičkou 301 na preferovaný tvar.
URL složené z číselných ID
V některých případech je prakticky nevyhnutelné mít v adresách identifikátory číselné či složené z písmen. Týká se to stránek s velkým množstvím obsahu – zpravidla tvořeným lidmi, po kterých lze těžko požadovat navrhnutí rozumných URL.
Příkladem je třeba YouTube s tvarem URL:
youtube.com/watch?v=-ecdH-HdLjA
Nebo Facebook:
facebook.com/jecas.cz/posts/896912130370504
Číselné identifikátory navíc řeší ještě jednu věc – případné kolise stejných tvarů URL vytvořené z nadpisů, které tak není vůbec třeba řešit.
Při nízkém počtu stránek se některým návštěvníkům může líbit, že se číselná adresa typu „example.com/1312
“ snadno zapamatuje. Domnívám se ale, že stručná slovní adresa typu „example.com/css
“ na tom bude ještě lépe.
Česky, nebo anglicky?
Google doporučuje, aby jazyk URL odpovídal jazyku, kterým je napsán obsah stránky.
U vícejazyčného webu to tedy znamená mít například pro stánku Kontakt adresy typu:
example.com/cs/kontakt
example.com/en/contact
U hloupějších redakčních systému to ale může být problém.
Jakmile narazím na patvary (byť gramaticky správné) typu „kolise“, dělá se mi šoufl. Co to má autor za úchylku? Už mockrát to tady lidi kritizovali, takže musí vědět, jak moc to čtenářům vadí…
Mně se zase dělá šoufl z lidí, co pod odborný článek nablejou to, co ty, i když je vše pravopisně naprosto správně. Stěžuj si na ÚJČ AV, ne tady.
Zdá se, že „Můžeme o tom vést spory, můžeme s tím nesouhlasit…“ ;)
Lidi maji tendenci si stezovat na blbosti, nechapu v cem je problem…
Kolise je nějaký patvar z angličtiny, ve slovníku spisovné češtiny ho nenajdete. Vzhledem k tomu, že máme v češtině výraz „kolize“, není třeba si vymýšlet nová slova jako „kolise“. Chápu že to čtenářům vadí a zásah korektora by neuškodil.
Upřesním. Kolise není nové, ale naopak staré slovo. V pravidlech spisovné češtiny ho najdeme, ale jen v těch staršího data vydání. Chápu, že mladší generace může být překvapena, když tu vidí něco „nového“ (ve skutečnosti starého), jelikož autor používá starší verzi spisovné češtiny, ale zrovna u technického zaměření v tom nevidím problém. Možná je to poprvé, ale rozhodně ne naposled, kdy se v technických oborech se starší češtinou setkáte.
Martine, setkáme se tu někdy i s fysikálním engine v javascriptu?
To vážně nevím, tohle není soutěž. 8-)
Nenajdeme jen v Pravidlech staršího vydání, ale i v těch nových. Pravidla vydaná v roce 1993 sice připouštěla pouze variantu se -z-, nicméně Dodatek vzápětí znovu povolil i variantu se -s- s tím, že taková varianta je považována za stylově příznakovou (a používá se například v odborných textech). Takže to slovo je správně i podle současných pravidel českého pravopisu.
Díky za doplnění. Současná pravidla jsou ale z 2000, ne?
Jinak, proč je to dle mě v pořádku jsme probrali kdysi, tak jen odkážu http://www.zdrojak.cz/clanky/jak-pridat-komentare-na-web/?show=comments#comment-27287
Pravidla se od roku 1993 neměnila, pouze se někdy přidávají další hesla do slovníkové části. Podrobně je to popsáno na stránce Informace o příručce Pravidla českého pravopisu: Za aktuální či platná PČP lze tedy považovat kterákoli Pravidla vydaná po r. 1993.
Proč se většina komentářů pod články točí jen kolem pravopisu? Základem každého jazyka je podat sdělení. Rád ťukám na komentáře pod články v na zahraničních webech. V komentářích se řeší obsah článku nebo upřesňuje obsah článku. Proč v ČR je na technických webech převážně diskuze o pravidlech pravopisu?
Protoze asi nemaji k tematu co dodat – clanek popisuje obecne prijimane pravdy, takze neni o cem moc diskutovat.