April 2008
Semantic Web! Semantic What?
Fortsetzung, Teil 3
The End of the Web as we know it
Standardfragen brauchen Standardantworten … und dafür brauchen wir Standards
Schaut man genauer hin, fallen die ersten Probleme auf. Natürlich muss eine Maschine auch die einzelnen Konzepte verstehen: Was ist ein Medikament, was ist eine Apotheke, was bedeutet Standort oder Öffnungszeit? Hier wird es für Maschinen zunehmend schwierig, "intelligent" zu handeln. Über standardisierte Begriffsstrukturen (z.B. so genannte Ontologien) werden solche Konzepte miteinander in Bezug gesetzt – aber wie bei fast allen Standards gibt es konkurrierende Systeme, Ausnahmen, fehlende Detailspezifikation etc. Zudem ist die Welt in sich nicht fehlerfrei, d.h. von Menschen gemachte Aussagen mögen falsch sein (beispielsweise Tippfehler bei den Öffnungszeiten), widersprüchlich (zwei voneinander abweichende Angaben für die Öffnungszeiten) oder falsch annotiert sein (hier hat dann jemand z.B. die Bank zum Sitzen mit der Bank für das Geld verwechselt).
"Wie vielen Menschen macht es wohl Spaß, bereits eingetippte Daten mit zusätzlichen Informationen für einen Computer zu versehen?"
Das macht es nicht nur für Maschinen, sondern auch für den Menschen schwierig. Sollen Informationen annotiert werden, müssen nicht nur die richtigen Begriffskategorien in einem halbwegs verbreiteten Standard vorgefunden werden, damit Maschinen diese erkennen und nutzen können. Zudem muss man sie auch noch verstehen – und Strukturen für komplexe Themen sind selten leicht zu verstehen – und richtig zuordnen können. Bleibt zu fragen: Wie vielen Menschen macht es wohl Spaß, bereits eingetippte Daten mit zusätzlichen Informationen für einen Computer zu versehen? Fans des Semantic Web weisen nun darauf hin, dass viele Informationen bereits in Datenbanken vorliegen und somit automatisiert ausgezeichnet werden können. Das ist aber nur die halbe Wahrheit. Denn man muss ja noch den richtigen Auszeichnungsstandard finden, auf seine Datenbank übertragen, die "Automatisierung" bauen etc. Und wenn dann noch Konzepte in verschiedenen Sprachen und Kulturkreisen ausgedrückt werden sollen, ist man ziemlich nah an dem Zustand, der zum Einsturz des Turms in Babylon geführt hat: Chaos und Sprachverwirrung.
Inzwischen findet sich RDF zwar schon in manchen Programmen (z.B. einigen Content-Management-Systemen und einer Vielzahl wissenschaftlicher Prototypen), aber der Spaßfaktor des Word Wide Web stellt sich hierbei einfach nicht ein. Und was keinen Spaß macht, wird von der Masse der User auch nicht benutzt, weshalb das bisherige Angebot an echten Semantic-Web-Applikationen entsprechend mau ist. Da aber die Evolution immer einen Weg findet, hat sich die breite Öffentlichkeit andere Mittel gesucht, um ihre Ziele zu erreichen – und das bringt uns zum…
Web 2.0
Ups, da haben wir es. Ja, das Web 2.0 ist gegenwärtig in aller Munde. Das soziale Web. Das Web der Gemeinschaften. Das Web-der-Hypes-die-mindestens-so-toll-sind-wie-die-Hypes-um-2001. Nicht, dass wir uns falsch verstehen: Auch ich mag das Web 2.0. Ich arbeite täglich mit Web-2.0-Anwendungen und diese bereichern eindeutig mein Leben. Aber was ist denn das Web 2.0 eigentlich? So einfach lässt sich das gar nicht sagen – sein Erfinder (oder zumindest der Erfinder des Begriffes) Tim O’Reilly, Inhaber des gleichnamigen Verlages – fasst seine Auffassung des Web 2.0 in einigen markanten Thesen zusammen:
• Das Internet ist die Plattform für Web-2.0-Anwendungen – es gibt keine Clientprogramme im eigentlichen Sinn. Alles läuft im Browser
• Das Web 2.0 lebt von kollektiver Intelligenz – Informationen werden durch Tags beschrieben, Mehrwerte entstehen, in dem sich Gleichgesinnte zu Gruppen versammeln, ihr Wissen zusammenwerfen und dadurch mehr als nur die Summe der einzelnen Teile entsteht, sei es in Form der Wikipedia, den Amazon-Empfehlungen oder kollektiv bewerteter Nachrichten
• Das Web 2.0 pulsiert und lebt: Blogs führen zu einer neuen Form der vernetzten Kommunikation, spontane Gemeinschaften werden gebildet, um sich auszutauschen.
• Daten sind alles – das Web 2.0 "blüht" aufgrund der Masse an Daten, die von ebensolchen Massen von Personen gepflegt werden. Beispiele hierfür sind wieder Wikipedia aber auch Linksammlungen oder Google Earth.
• Software "verflüssigt" sich – sie wird ständig weiterentwickelt, zugrunde liegende Technologien sind so leichtgewichtig wie möglich und vernetzter Austausch ist ein zentrales Paradigma.
• Anwendungen werden wieder benutzbar – die Zeit der simplen HTML-Formulare ist vorbei, heute regieren AJAX & Co.
Bei Betrachtung dieser Punkte fällt auf, dass es neben einer neuen "Lebensphilosophie" auch eine pragmatische Variante des Semantic Web gibt: Informationen werden mit Tags versehen, um sie zu charakterisieren, was wiederum mittels statistischer Verfahren von Maschinen genutzt werden kann, um Rückschlüsse auf Interessen, Personenprofile und Ähnliches zu ziehen. Im Grunde eine Reduzierung auf "Information, handelt-von, Tag"-Tripeln – so einfach zu pflegen und es funktioniert. Millionen von Internet-Usern "taggen" ihre Blogs, Links, bevorzugte Hobbies und vieles mehr. Und wieder andere (Menschen und Maschinen) nutzen diese Informationen, um jenes abstrakte und nebulöse Ding namens "Mehrwert" zu erzeugen. Könnte es sein, dass das Semantic Web doch nie wirklich "geboren" wurde – oder erst jetzt in Form des nebulösen Web 2.0 seine Reinkarnation erfährt? Vielleicht, aber wo würde das hinführen?
Alternative 1: Das Spezialweb
Bereits heute gibt es eine Reihe von Anwendungsfeldern, in denen RDF sehr erfolgreich ist und das Semantic Web des Tim Berners-Lee eine exzellente Nischenexistenz führt. Dies ist beispielsweise in verschiedenen wissenschaftlichen und forschungsnahen Tätigkeitsbereichen der Fall: im Gesundheitswesen, bei rechtlichen Fragestellungen oder im klassischen Wissensmanagement. Damit bewegt sich das Semantic Web aber lediglich in eine Richtung, die dem Leser in ähnlicher Form bereits aus den 80er und 90er Jahren bekannt vorkommen könnte – denn eigentlich geht es hier um Expertensysteme.
"Falls das Semantic Web jemals ein Wachstum erlebt, das mit dem des World Wide Web vergleichbar ist, droht ein Informationskollaps."
Neu am Semantic-Web-Ansatz ist die eher föderierte Natur der Informationen. Diese werden nicht über ein zentrales System gepflegt, sondern aus einem lose vernetzten Informationsstand aggregiert. Hierin liegen zugleich Stärken als auch Schwächen dieses neuen Ansatzes: Einerseits wird die Menge an verfügbaren Fakten schneller wachsen als in klassischen Expertensystemen, da die Integration neuer Fakten vergleichsweise einfach ist. Andererseits werden aber auch die Schwächen von Expertensystemen zu einer neuen Herausforderung: Kann man mangels hinreichender Informationen gewisse andere Fakten nicht herleiten, dann müssen "Semantic-Web-Expertensysteme" auch noch mit widersprüchlichen und falschen Aussagen umgehen und diese geeignet bewerten können, um überhaupt zu sinnvollen Ergebnissen zu kommen. Hier droht auch das größte Risiko: Falls das Semantic Web jemals ein Wachstum erlebt, das mit dem des World Wide Web vergleichbar ist, droht ein Informationskollaps.
Falsche und widersprüchliche Informationen über "n" Stufen eines Schlussfolgerungsprozesses können bestenfalls höchst fragwürdige Ergebnisse erzeugen. Doch selbst wenn alle Daten richtig wären, stellt sich immer noch die Frage, ob ein derartiges, dynamisch gewachsenes System auch das Vertrauen der Anwender finden kann. Oder würden Sie einem Diagnosesystem glauben schenken, das auf Basis von Daten ganz unterschiedlicher und nicht immer kompetenter "Experten" läuft? Bleibt also der Verdacht, dass Semantic-Web-Expertensysteme entweder doch nur relativ einfache Anfragen zu unkritischen Themen beantworten oder aber nur praxisferne Elfenbeintürmen entwickelt werden. Ersteres geht heute besser über spezialisierte Suchsysteme, Letzteres ähnelt dann doch wieder sehr stark den klassischen Expertensystemen mit all ihren Vor- und Nachteilen.
Es stellt sich die Frage, ob nicht eine visionärere Form des Semantic Web (gegebenenfalls auf anderer formaler Basis) möglich wäre, die zugleich auch praktikabler ist. Und: Wohin könnte uns diese dann führen?

























