Ve světě, kde jsou informace na internetu publikovány technologiemi Sémantického Webu, nemusíte např. hledat pomocí různých vyhledávačů webové stránky svého zubaře, abyste zjistili otvírací dobu, ale váš inteligentní kalendář zjistí, u kterého zubaře jste registrováni, porovná otvírací dobu jeho ordinace s vaším rozvrhem času, zajistí ideální dopravní spojení, a předloží vám možné varianty. Tohle je samozřejmě velmi idealistická vize, avšak možná.
V dalším textu se úmyslně vyhýbám obecně užívanému výrazu „sémantický web“ a používám raději „Sémantický Web“ coby termín, který označuje využití RDF jako hlavního modelu reprezentace informací. – pozn.aut.
Sémantický Web je označení pro skupinu technologií, které umožňují informace na internetu formulovat tak, aby byly srozumitelné nejen pro lidí, ale i pro stroje, tedy hlavně software na nich běžící. U zrodu nestál nikdo jiný než Tim Berners-Lee a konsorcium W3C, které je dodnes hlavním tahounem vývoje v této oblasti. Sémantický Web není konkurencí současného webu, nýbrž jeho doplňkem, zlepšujícím využití potenciálu, který sítě typu internetu mají. HTML popisuje dokumenty a vztahy mezi nimi, účelem technologií Sémantického Webu je popis jakýchkoliv věcí (lidé, věci, služby, události, role…) a vztahů mezi nimi. Takováhle síť se nazývá Sémantický Web, Web of Data, Giant Global Graph, nebo i Web 3.0.
Základní technologie Sémantického Webu jsou: RDF, RDFS, OWL a SPARQL.
RDF, RDFS, SPARQL a další
RDF (Turtle verze) definuje model vyjadřování informací, které jsou formulovány trojicí „podmět přísudek objekt“, kde přísudek určuje vztah mezi podmětem a objektem. Identifikátory, neboli „slova“ tvořící tyto „věty“, jsou URI. Množina trojic tvoří RDF graf. RDF samotné je pouze model, který pro textovou reprezentaci má mnoho serializací – jako nejstarší RDF/XML, potom máme RDFa pro integraci RDF v HTML, dobře čitelnou Turtle, primitivní N-Triples, a další…
Abychom RDF mohli smysluplně využít, tak potřebujeme nějak přiřadit našim „slovům“ význam. Právě k tomu jsou ontologie, RDF slovníky, neboli RDF schémata, např. FOAF (specifikace), SIOC (specifikace), GoodRelations (specifikace)… Ty jsou definovány pomocí RDFS a složitější OWL, které samotné jsou ontologiemi.
SPARQL je jazyk, vycházející z SQL, určený k manipulaci (primárně dotazování) s RDF databázemi (tzv triplestore).
Mikroformáty jsou příbuzné technologiím Sémantického Webu a dají se z nich lehce extrahovat data do RDF pomocí GRDDL, avšak nejsou natolik flexibilní jako RDFa.
Linked data je název pro několika principů, které se snaží zajistit určitou úroveň užitečnosti informací (tvoří podmnožinu Sémantického Webu). Komunitní projekt Linking Open Data publikuje otevřené databáze jako Linked Data, jako nejlepší příklad je DBpedia obsahující data, extrahovaná z Wikipedie.
Ekosystém Linked Data – obrázek pochází z http://www4.wiwiss.fu-berlin.de/…9-03-05.html
Mezi některými oblastmi průmyslu jako například medicína a těžařství jsou tyto technologie rozšířené kvůli potřebě sdílení informací jasné definovanými termíny a automatické dedukce dalších informací.
Implicitní decentralizovanost technologií Sémantického Webu se používá k bourání zdi mezi sociálními sítěmi jako Facebook, Myspace etc., pomoci RDF dat používajících ontologii FOAF, kdy může každý server fungovat jako hosting FOAF profilů, tvořící jednu velkou, otevřenou, decentralizovanou sociální síť.
Protože ne všechny informace jsou určené pro širokou veřejnost, vznikl systém WebAccessControl, který využívá autentizační protokol FOAF+SSL. Tento protokol je rychlejší a jednodušší než OpenID, a ve většině případů i uživatelsky přívětivější (nepotřebujete si pamatovat jméno/id ani heslo, stačí jen mít svůj certifikát).
Jak to vypadá v praxi?
Yahoo a Google využívají RDF data ke zlepšení výsledků vyhledávání. (Viz Yahoo embraces the semantic web, Google introducing rich snippets)
Existují projekty sémantického desktopu na linuxu ze stáje KDE (Nepomuk Social Semantic Desktop) i Gnome (Semantic Desktop).
Drupal 7 bude v RDF publikovat svá interní data.
Sémantický Web mezi lidmi nikdy širokého povědomí nedosáhne. Ani by neměl, protože se jedná o vnitřní reprezentaci informací. RDF vzniklo jako odpověď na poptávku po jednotném modelu pro výměnu informací v decentralizované heterogenní sítí systémů. Pokud vyvíjíte aplikaci a chcete umožnit, aby informace byly sdíleny a využívány jinými aplikacemi, publikujte tyto informace v RDF.
Historie a budoucnost
Vývoj Sémantického Webu má tři hlavní odvětví:
- Vývoj technologií
- Publikování informací pomocí těchto technologií
- Vývoj aplikaci a automatických agentů pracující s těmito informacemi
První fáze, kdy se vývoj soustředil především na první odvětví, pominula, teď je třeba rozvíjet druhé odvětví, protože bez něj je nemyslitelný rozkvět odvětví třetího, a přitom právě ono je naším cílem, protože přináší zjednodušení našeho každodenního života.
Pokud máte zájem o další články z této oblasti, například práci s RDF a FOAF prakticky, vyjádřete se v diskusi.
Přehled komentářů