Ugrás a tartalomhoz

Semantic Web

A Wikiszótárból, a nyitott szótárból
(semantic web szócikkből átirányítva)


Főnév

Semantic Web (tsz. Semantic Webs)

  1. (informatika) A Semantic Web (Szemantikus Web) a World Wide Web Konzorcium (W3C) kezdeményezése, amely célja, hogy az interneten található információk ne csak emberek, hanem gépek (szoftverek, algoritmusok) számára is értelmezhetőek legyenek. A Semantic Web tehát nem egy különálló web, hanem a jelenlegi web egy továbbfejlesztett változata, amely strukturált adatokon és formális szemantikán (jelentésen) alapszik. Alapgondolata, hogy az adatok közötti kapcsolatok explicit módon leírhatók legyenek, lehetővé téve a gépi értelmezést, integrációt és automatizált következtetést.



Alapelvek és célok

A jelenlegi web főleg HTML-dokumentumokból áll, melyeket emberek olvasnak. A Semantic Web célja, hogy ezt kiegészítse gépek által feldolgozható metaadatokkal, amik leírják, hogy mely fogalmak, entitások és kapcsolatok szerepelnek az adott dokumentumban. Ezt RDF-ben (Resource Description Framework) lehet megtenni.

A Semantic Web fő céljai:

  • Interoperabilitás: különböző rendszerek összehangolása.
  • Adatintegráció: heterogén források összekapcsolása.
  • Automatikus következtetés: új tudás levezetése meglévő adatokból.
  • Adatújrafelhasználás: adatok ismételt és kombinált felhasználása új környezetekben.



Technológiák és szabványok

A Szemantikus Webet egy sor W3C-szabvány alkotja, amelyek hierarchikus rétegekbe sorolhatók, Tim Berners-Lee híres “Semantic Web Stack” (piramis) ábráján:

1. URI (Uniform Resource Identifier)

  • Egyértelműen azonosítja az entitásokat (pl. embereket, városokat, fogalmakat).

2. XML és XML Schema

  • Formátum az adatok strukturálásához (de nem szemantikus).

3. RDF (Resource Description Framework)

  • Az alapvető adatmodell: az információt tripletek (alany–állítmány–tárgy) formájában írja le.
  • Példa: <Paris> <isCapitalOf> <France> ahol mindegyik elem egy URI lehet.

4. RDFS (RDF Schema)

  • Lehetővé teszi osztályok és tulajdonságok meghatározását.
  • Leírható például, hogy „minden ország egy földrajzi entitás”.

5. OWL (Web Ontology Language)

  • Fejlettebb szemantikai viszonyokat enged: ekvivalencia, részhalmaz, diszjunktság.
  • Lehetővé teszi ontológiák definiálását.

6. SPARQL (SPARQL Protocol and RDF Query Language)

  • Az RDF-adatok lekérdezésére szolgáló nyelv, hasonlóan az SQL-hez.

7. Rules (pl. SWRL, RIF)

  • Logikai szabályok, amelyek segítségével következtetéseket lehet levonni.

8. Proof és Trust réteg

  • A következtetések bizonyítása, források megbízhatóságának kezelése.



Ontológiák

A Semantic Web központi eleme az ontológia, amely egy adott domén fogalmainak és azok viszonyainak formális leírása. Egy ontológia tartalmazhat:

  • Osztályokat (pl. „Ember”),
  • Tulajdonságokat (pl. „születési hely”),
  • Egyedeket (pl. „Albert Einstein”).

Széles körben használt példák:

  • FOAF (Friend of a Friend) – emberek és kapcsolataik leírására.
  • Dublin Core – dokumentumok metaadataihoz.
  • Schema.org – webes tartalom strukturálásához.



Használati esetek

  1. Keresés fejlesztése: A keresőmotorok (pl. Google, Bing) a strukturált adatok (Schema.org) segítségével pontosabb válaszokat tudnak adni.
  2. Tudásgrafok: A Wikipedia és más források adataiból épített tudásgráfok (pl. Google Knowledge Graph).
  3. Élettudományok: gyógyszerkölcsönhatások, génfehérje kapcsolatok ábrázolása.
  4. Digitális archívumok: könyvtárak, múzeumok összekapcsolása (pl. Europeana, DBpedia).
  5. Okosvárosok és IoT: érzékelők adatait szemantikusan leírva automatizálható döntéshozatal.



Előnyök

  • Gépi feldolgozhatóság: nem csak adatok, hanem jelentés is továbbítható.
  • Skálázható tudásmegosztás: különböző források integrálhatók.
  • Automatikus következtetés: új információ nyerhető ki.
  • Kereshetőség és újrafelhasználás javul.



Kihívások

  • Ontológiafejlesztés nehézsége: időigényes, szakterület-specifikus.
  • Szabványosítás: sokféle adatmodell és elnevezés miatt nehéz egységesíteni.
  • Teljesítmény: SPARQL lekérdezések nagy tudásbázisokon lassúak lehetnek.
  • Adatminőség és forrásmegbízhatóság.



Kapcsolódó fogalmak

  • Linked Data: nyílt, egymáshoz kapcsolt RDF-adatok publikálása (Tim Berners-Lee 4 szabálya alapján).
  • Knowledge Graph: csomópontokból és élekből álló grafikus modell, ahol a kapcsolatok szemantikusan értelmezettek.
  • LOD cloud: a Linked Open Data hálózat vizualizációja, amely több ezer nyílt adatbázist kapcsol össze.



Jövője

A Semantic Web az utóbbi években háttérbe szorult a gépi tanulás és NLP mellett, de ma is használják például a tudásgráfok, adatközpontú webszolgáltatások és szakterületi ontológiák világában. A jövőben várható, hogy a szemantikus technológiák a mesterséges intelligenciával együttműködve kulcsszerepet játszanak a gépi tudásreprezentáció és automatikus következtetési rendszerek fejlődésében.