Semantic Web
Főnév
Semantic Web (tsz. Semantic Webs)
- (informatika) A Semantic Web (Szemantikus Web) a World Wide Web Konzorcium (W3C) kezdeményezése, amely célja, hogy az interneten található információk ne csak emberek, hanem gépek (szoftverek, algoritmusok) számára is értelmezhetőek legyenek. A Semantic Web tehát nem egy különálló web, hanem a jelenlegi web egy továbbfejlesztett változata, amely strukturált adatokon és formális szemantikán (jelentésen) alapszik. Alapgondolata, hogy az adatok közötti kapcsolatok explicit módon leírhatók legyenek, lehetővé téve a gépi értelmezést, integrációt és automatizált következtetést.
Alapelvek és célok
A jelenlegi web főleg HTML-dokumentumokból áll, melyeket emberek olvasnak. A Semantic Web célja, hogy ezt kiegészítse gépek által feldolgozható metaadatokkal, amik leírják, hogy mely fogalmak, entitások és kapcsolatok szerepelnek az adott dokumentumban. Ezt RDF-ben (Resource Description Framework) lehet megtenni.
A Semantic Web fő céljai:
- Interoperabilitás: különböző rendszerek összehangolása.
- Adatintegráció: heterogén források összekapcsolása.
- Automatikus következtetés: új tudás levezetése meglévő adatokból.
- Adatújrafelhasználás: adatok ismételt és kombinált felhasználása új környezetekben.
Technológiák és szabványok
A Szemantikus Webet egy sor W3C-szabvány alkotja, amelyek hierarchikus rétegekbe sorolhatók, Tim Berners-Lee híres “Semantic Web Stack” (piramis) ábráján:
1. URI (Uniform Resource Identifier)
- Egyértelműen azonosítja az entitásokat (pl. embereket, városokat, fogalmakat).
2. XML és XML Schema
- Formátum az adatok strukturálásához (de nem szemantikus).
3. RDF (Resource Description Framework)
- Az alapvető adatmodell: az információt tripletek (alany–állítmány–tárgy) formájában írja le.
- Példa:
<Paris> <isCapitalOf> <France>ahol mindegyik elem egy URI lehet.
4. RDFS (RDF Schema)
- Lehetővé teszi osztályok és tulajdonságok meghatározását.
- Leírható például, hogy „minden ország egy földrajzi entitás”.
5. OWL (Web Ontology Language)
- Fejlettebb szemantikai viszonyokat enged: ekvivalencia, részhalmaz, diszjunktság.
- Lehetővé teszi ontológiák definiálását.
6. SPARQL (SPARQL Protocol and RDF Query Language)
- Az RDF-adatok lekérdezésére szolgáló nyelv, hasonlóan az SQL-hez.
7. Rules (pl. SWRL, RIF)
- Logikai szabályok, amelyek segítségével következtetéseket lehet levonni.
8. Proof és Trust réteg
- A következtetések bizonyítása, források megbízhatóságának kezelése.
Ontológiák
A Semantic Web központi eleme az ontológia, amely egy adott domén fogalmainak és azok viszonyainak formális leírása. Egy ontológia tartalmazhat:
- Osztályokat (pl. „Ember”),
- Tulajdonságokat (pl. „születési hely”),
- Egyedeket (pl. „Albert Einstein”).
Széles körben használt példák:
- FOAF (Friend of a Friend) – emberek és kapcsolataik leírására.
- Dublin Core – dokumentumok metaadataihoz.
- Schema.org – webes tartalom strukturálásához.
Használati esetek
- Keresés fejlesztése: A keresőmotorok (pl. Google, Bing) a strukturált adatok (Schema.org) segítségével pontosabb válaszokat tudnak adni.
- Tudásgrafok: A Wikipedia és más források adataiból épített tudásgráfok (pl. Google Knowledge Graph).
- Élettudományok: gyógyszerkölcsönhatások, génfehérje kapcsolatok ábrázolása.
- Digitális archívumok: könyvtárak, múzeumok összekapcsolása (pl. Europeana, DBpedia).
- Okosvárosok és IoT: érzékelők adatait szemantikusan leírva automatizálható döntéshozatal.
Előnyök
- Gépi feldolgozhatóság: nem csak adatok, hanem jelentés is továbbítható.
- Skálázható tudásmegosztás: különböző források integrálhatók.
- Automatikus következtetés: új információ nyerhető ki.
- Kereshetőség és újrafelhasználás javul.
Kihívások
- Ontológiafejlesztés nehézsége: időigényes, szakterület-specifikus.
- Szabványosítás: sokféle adatmodell és elnevezés miatt nehéz egységesíteni.
- Teljesítmény: SPARQL lekérdezések nagy tudásbázisokon lassúak lehetnek.
- Adatminőség és forrásmegbízhatóság.
Kapcsolódó fogalmak
- Linked Data: nyílt, egymáshoz kapcsolt RDF-adatok publikálása (Tim Berners-Lee 4 szabálya alapján).
- Knowledge Graph: csomópontokból és élekből álló grafikus modell, ahol a kapcsolatok szemantikusan értelmezettek.
- LOD cloud: a Linked Open Data hálózat vizualizációja, amely több ezer nyílt adatbázist kapcsol össze.
Jövője
A Semantic Web az utóbbi években háttérbe szorult a gépi tanulás és NLP mellett, de ma is használják például a tudásgráfok, adatközpontú webszolgáltatások és szakterületi ontológiák világában. A jövőben várható, hogy a szemantikus technológiák a mesterséges intelligenciával együttműködve kulcsszerepet játszanak a gépi tudásreprezentáció és automatikus következtetési rendszerek fejlődésében.
- Semantic Web - Szótár.net (en-hu)
- Semantic Web - Sztaki (en-hu)
- Semantic Web - Merriam–Webster
- Semantic Web - Cambridge
- Semantic Web - WordNet
- Semantic Web - Яндекс (en-ru)
- Semantic Web - Google (en-hu)
- Semantic Web - Wikidata
- Semantic Web - Wikipédia (angol)