Inhalt

Home » Digitalks Events, Digitalks Videos, Was ist Semantic Web

Rückblick & Video Digitalks #13 Semantic Web

Beim ersten Digitalks für „Semantic Web“ haben wir uns auf zwei Themenbereiche konzentriert, um EinsteigerInnen in das Thema besser einzuführen, und ihnen ein paar praktische Werkzeuge in die Hand zu geben, mit denen Sie gleich loslegen können. Ich danke AustriaPro für die Kooperation beim Event.

Vortrag Andreas Blumauer „Auf der Suche nach der besseren Suche: Wie semantische Suche und Semantic Web unsere Arbeitsweisen verändert“

Zum State-of-the-Art in der unternehmensweiten Suche (Enterprise Search) zählen heute bereits Verfahren wie facettierte Suche, die automatische Erkennung von Strukturen in Dokumenten oder das Offenlegen von verborgenen Zusammenhängen zwischen Texten (ähnliche Dokumente).

Suchverfahren wie diese werden sukzessive um innovative Suchtechnologien aus dem Semantic Web erweitert. Damit lassen sich neue Möglichkeiten entwickeln, Prozesse effizienter zu gestalten und neue Kommunikationswege zu erschließen.

Wie sieht die Zukunft der Suche aus? Werden Maschinen je die Bedeutung von Texten interpretieren können? Wie sieht Wissensarbeit im Semantic Web aus?

Der Vortrag gibt einen Überblick über folgende Themen und demonstriert diese anhand zahlreicher Beispiele:

* Moderierte Suche & Suchassistenten (ecoi.net & as-search.at & evri.com)
* Finden von Relationen und Ähnlichkeiten (rel.finder.dbpedia.org & zemanta.com & textwise.com)
* Frage & Antwort-Maschinen (wolframalpha.com & sig.ma)

Vortrag Markus Linder „Semantic-Web-basierte e-commerce und Praxisanwendungen“

Einleitung
Aktuell entsteht nach jahrelanger Forschung, parallel zum heutigen „World Wide Web“, das so genannte „Semantic Web“ bzw. „Web of Data“, das vielfach auch als „Web 3.0“ bezeichnet wird. Dieses Web der nächsten Generation ermöglicht es Anbietern von Produkten und Dienstleistungen Informationen einmalig in einer Form aufzubereiten, die nicht nur wie im heutigen WWW für Menschen verständlich ist, sondern die es auch Computern ermöglicht, zu interpretieren, um welche Angebote es sich handelt und welche Eigenschaften diese Angebote haben. Diese strukturierte und maschineninterpretierbare Bereitstellung von Angebotsinformationen ermöglich eine Fülle von neuen Services und Diensten, die es Interessenten letztendlich erleichtert, jene Angebote zu finden, die ihren Anforderungen am besten entsprechen.

Veränderung durch Semantic Web
Die Grenzen des konventionellen Webs sind spätestens dann erreicht, wenn man in einer führenden Suchmaschine wie etwa Google oder selbst auf einem führenden Reiseportal z.B. nach einem Familienurlaub in Österreich von 25. bis 30. Dezember, in einer Pension sucht, im Rahmen dessen am Urlaubsort im selben Zeitraum etwa auch klassische Konzerte angeboten werden und ein Yoga-Kurs besucht werden kann. Google liefert auf derartige Suchanfragen zwar tausende Links, aber kein einziges Ergebnis, das den Wünschen des Suchenden entsprechen würde. Ähnlich verhält es sich, wenn ein Benutzer in einer Suchmaschine oder selbst auf einem spezialisierten Shopping-Portal nach einem leichten Business-Notebook von Sony oder Asus mit Webcam sucht, mit einer maximalen Bilddiagonale von 12 Zoll. Auch in diesem Fall erhalten Nutzer eine Vielzahl von Links, aber keine ihren Wünschen entsprechend geordnetes Ranking ihrer Angebote.
Der Grund für die Unzulänglichkeiten des konventionellen Webs ist offensichtlich: Konventionelle Suchmaschinen und Anwendungen verbleiben auf der syntaktischen Ebene, sie erkennen – vereinfacht ausgedrückt – lediglich ob eine Kette von aneinander gereihten Zeichen auf einer Website vorkommt. Sie „verstehen“ jedoch beispielsweise nicht, dass ein „Gästehaus“ oder eine „Herberge“ als Synonym zu „Pension“ genauso in Frage kämen. Genauso wenig kann eine konventionelle Suchmaschine unterscheiden, ob in der Suchanfrage oder der Website, auf der das Stichwort vorkommt, mit „Pension“ eine Altersvorsorge oder eine Unterkunft gemeint ist. Spätestens wenn ein Ergebnis nicht nur auf einer Webseite gefunden werden kann, sondern wie beim Urlaubs-Beispiel passende Ergebnisse nur durch die Kombination verschiedener Angebote gebildet werden können, wird klar, dass im heutigen World-Wide-Web beschriebene Informationen lediglich vom Menschen intelligent in einen Kontext gesetzt werden können.

Semantic Web – Technische Grundlagen
Das Semantic Web stellt eine Erweiterung des World Wide Web dar und beruht auf einem Konzept von Sir Tim Berners-Lee, dem Erfinder des WWW. Diese Erweiterung ermöglicht es, dass Informationen im Internet auch durch Maschinen interpretiert und automatisch weiterverarbeitet werden können. Informationen z.B. über Anbieter, Produkte und Dienstleistungen können so von Maschinen ähnlich wie durch eine Abfrage einer „globalen Datenbank“ intelligent miteinander in Beziehung gesetzt werden. Daher spricht man in diesem Zusammenhang häufig auch von „Linked Data“.

Um Informationen maschinen-interpretierbar zu machen, müssen diese mit Meta-Daten annotiert werden. Das XML-Format ist dafür jedoch nicht ausreichend, da XML letztendlich erst wieder auf einer rein syntaktischen Ebene bleibt und die Daten noch nicht um maschinen-interpretierbare Zusammenhänge anreichert. Daher wird als Auszeichnungssprache RDF (Resource Description Framework) verwendet. Auf Basis von RDF kann etwa beschrieben werden, dass ein Notebook-Modell eine gewisse Bildschirmauflösung aufweist und in bestimmten Farben verfügbar ist. OWL (Web Ontology Language) wiederum ermöglicht die Erstellung von Beschreibungen von Objekten bzw. Konzepten und Beziehungen – so genannter Ontologien. In einer Ontologie kann etwa definiert sein, dass ein Notebook im Allgemeinen eine besondere Form eines Computers ist und diese wiederum Produkte sind. Zusätzlich wird so festgelegt, dass Notebooks im Allgemeinen eine Bildschirmdiagonale besitzen, die in Zoll gemessen wird. Ein wesentliches Element des Semantic Web ist auch die Tatsache, dass jedes Objekt (z.B. Produkt oder Anbieter) in der Regel über eine eindeutige Webadresse referenziert werden muss. So muss etwa ein Versender, der eine Digitalkamera X verkauft, das Modell mit seinen Eigenschaften nicht erneut beschreiben, sondern verweist mit einem entsprechenden Link zu einer diesbezüglichen semantischen Produktbeschreibung, die sich etwa auf der Herstellerseite befinden kann. Eine Anwendung, die sich für die Eigenschaften des Produkts interessiert, kann die Informationen automatisch von dort übernehmen. Die Abfragesprache für das Semantic Web ist SPARQL (Protocol and RDF Query Language). Sie ermöglicht es, ganz gezielte Abfragen an das „Web of Data“ zu stellen. Zum Beispiel: „finde alle Orte in Österreich, an denen zu einem bestimmten Zeitpunkt sowohl eine Unterkunft mit bestimmten Eigenschaften verfügbar ist, als auch gewünschte Freizeitaktivitäten angeboten werden“ oder „finde alle Notebooks vom Hersteller Sony oder Asus mit bestimmten Business-Features und Webcam, mit einer Bilddiagonale von kleiner gleich 12 Zoll“.

Beispiele von Anbietern und Angeboten im Semantic Web
Anbieter, wie etwa der führende Consumer Electronics Händler Best Buy, hinterlegen auf deren Websites bzw. Online-Shops bereits heute Links zu RDF-Dateien, in denen zu den eigenen Stores und Angeboten maschinen-interpretierbare Metadaten ausgewiesen werden. Damit können auf Semantic-Web-Technologien aufbauende Anwendungen etwa vollautomatisch „verstehen“, dass Best Buy ein Geschäft in Richfield betreibt, das täglich von 10 bis 19 Uhr geöffnet hat, in dem man z.B. mit Visa und Mastercard bezahlen kann, usw. Zu konkreten Angeboten, wie etwa einem Notebook, sind nicht nur Hersteller oder Preis maschinen-interpretierbar hinterlegt, sondern auch Angebotsmerkmale wie die Tatsache, dass das Produkt sowohl im Geschäft abgeholt werden kann, als auch versendet werden kann und Attribute wie der EAN-Code, Beschreibungstexte und Links zu Produktbildern.

Externe Nutzungsmöglichkeiten für Online-Shops, Herstellerportale und Preisvergleichsportale
Anbieter, die Informationen über sich und ihre Angebote Semantic-Web-tauglich aufbereiten, profitieren dadurch bereits heute in Suchmaschinen wie Yahoo (Search Monkey) oder Google (Rich Snippets). Denn diese stellen Suchergebnisse von Anbietern, die Meta-Daten in dieser Form ausweisen, bereits heute im Suchergebnis besser dar, indem z.B. bei einem Produktangebot direkt im Suchergebnis ein Foto des Produkts gezeigt werden kann und Informationen wie Hersteller, Produktbeschreibung, Produktbewertungen und Preis tabellarisch ausgewiesen werden.

Doch diese strukturierten Angebotsinformationen können genauso von Preisvergleichsportalen genutzt werden, um vollautomatisch zu erkennen, welche Produkte ein bestimmter Händler zu welchen Konditionen anbietet. Das heute noch erforderliche semi-automatische bzw. teilweise sogar manuelle Matching entfällt dabei, da die Portale aufgrund der auf die Produktbeschreibung referenzierenden Webadresse Produkte eindeutig erkennen können.

Semantic-Mashups ermöglichen es, Angebote wesentlich einfacher und zielgruppengerechter aufzubereiten. So kann etwa ein Portal, das user-generierte Fahrrad-Routen beschreibt, das Semantic Web vollautomatisch nach Restaurants entlang der Strecke durchsuchen, die zur Zielgruppe der Radfahrer passen. Somit können Restaurants, deren Eigenschaften einmal im RDF-Format im Semantic Web beschrieben wurden und die eine Terasse aufweisen und eine leichte Küche bieten, vollautomatisch entlang von Fahrrad-Routen dargestellt werden, ohne dass diese Daten manuell auf dem Portal eingegeben und gepflegt werden müssen. Ebenso kann ein Sportportal das Semantic Web automatisch nach kleinen, leichten Mobiltelefonen durchsuchen, die jeweils stoßfest sind und diese Mobiltelefone gemeinsam mit dazugehörigen Angeboten darstellen und der Community auch noch zusätzlich eine Bewertungsmöglichkeit bieten.

Semantic-Web-Daten zu Produkten, Dienstleistungen und Angeboten bieten aber nicht nur Vorteile im externen Austausch von Content und in der einfacheren zielgruppenorientierteren Integration der eigenen Angebote auf externen Portalen und Suchmaschinen, sondern bieten auch für die On-Site-Dienste und Services einen entscheidenden Mehrwert.

So müssen etwa Produktbeschreibungen künftig nicht mehr manuell oder semi-automatisch in Webshops übertragen werden, sondern Webshop- und Content-Management-Systeme können diese Informationen vollautomatisch vom Hersteller oder Anbieter übernehmen und entsprechend der eigenen Anforderungen und im eigenen Design darstellen.

Völlig neue Chancen bieten sich insbesondere auch für die Themen On-Site-Search und Produktberatung für Online-Shops, Herstellerportale und Preisvergleichsportale. So gelangen etwa Nutzer des Preisvergleichsportals billiger.de künftig nachdem Sie einen Suchbegriff wie z.B. „Panasonic Digicam leicht, mind. 12 Megapixel für Landschaftsaufnahmen“ in die On-Site-Suche eingegeben haben, direkt in einen vom Online-Produktberatungsspezialisten Smart Information Systems entwickelten Produktberater, der jene Produkte reiht, die diesen Anforderungen am besten entsprechen. Die hier eingesetzten Semantic-Web-Technologien ermöglichen es, die Benutzerbedürfnisse zu interpretieren und für den Fall, dass nur wenige Produkte zu 100 % den Wünschen entsprechen, auch jene Angebote anzuzeigen, die den Wünschen möglichst nahe kommen. Zusätzlich haben User in Folge die Möglichkeit weitere Anforderungen in einem interaktiven Beratungsprozess zu definieren und so das Ergebnis zu verfeinern.

Teaser Photo courtesy of Richard Cyganiak „About the Linking Open Data dataset cloud

1 Kommentar »