Beiträge

Web 3.0: Internetdaten verknüpfen

Web-Erfinder Tim Berners-Lee will das Internet von einer Publikationsplattform zu einem Ort entwickeln, an dem strukturierte Daten geteilt und vor allem verknüpft werden. Seine Vision vom "Linked Data Web" ist eine Vorstufe zum sinnverstehenden "semantischen Netz".

Das Internet wie es heute existiert, ist weitestgehend eine Ansammlung von Websites, gefüllt mit Informationen. Während der Mensch mit diesen Informationen etwas anfangen kann, erschließt sich dem Computer der Sinn der Zahlen und Wörter auf diesen Websites nicht. Die Idee hinter dem semantischen Web ist es, dem Computer die Bedeutung (Semantik) von Informationen "beizubringen".

Dass die Bedeutung eines Begriffs von einer Maschine tatsächlich verstanden wird, ist irreführend. "Verstehen" heißt in der Informatik, dass alle konzeptionellen Dinge von Menschen mit einer Bedeutung versehen werden, die von Computern verarbeitet werden kann.

"Webisierung" von Daten

Ähnlich einer Inventur des gesamten Internets, müssen alle Begriffe mit einem Etikett in Form eines "RDF-Tripels" versehen werden.
RDF (Resource Description Framework) ist ein System zur Zuweisung von Metadaten, das so wie Sätze aus Subjekt, Prädikat und Objekt besteht. Das Wort, mit dem man Metadaten verbinden will, ist das Subjekt. Prädikat und Objekt geben dem Subjekt eine Bedeutung. Zum Beispiel: "<Österreich> <liegt> <in Europa>". Werden nun andere Länder Europas ebenfalls mittels solcher Tripels kategorisiert, entstehen durch Verknüpfung dieser Metadaten semantische Netze. Berners-Lee nennt das in einem Artikel für die Royal Society die "Webisierung" von Daten.

Im Internet der Zukunft, wie es ihm vorschwebt, soll nicht nur jede Homepage eine Adresse, sondern jeder Mensch, jeder Ort, jedes Produkt, einen eigenen URI (Universal Resource Identifier) haben. Mit Hilfe dieses URIs können nicht nur Websites miteinander verlinkt werden, sondern Dinge an sich. Berners-Lees Vision ist ein riesiges Netzwerk von verknüpften Daten, die aufgrund ihrer zugewiesenen Bedeutung in Beziehungen zueinander stehen - das "Linked Data Web". Dieses neuartige Internet würde dem Benutzer erlauben, aufgrund der unzähligen Verknüpfungen große Mengen an Daten über zusammenhängende Dinge oder verwandte Konzepte mit nur einer Suchanfrage zu erhalten.
32 Milliarden "Etiketten"

Das Projekt DBpedia ist der erste große Versuch, solche verknüpften Datennetze auf Basis von Wikipedia-Einträgen zu erstellen. Firmen-, Regierungs- oder andere öffentliche Datensätze finden sukzessive auch ihren Weg in semantische Netze. Von 2007 bis 2011 wuchs das "Linked Data Web" insgesamt auf eine Größe von etwa 32 Milliarden RDF-Tripels an. Bei Online-Werbung oder auf der Homepage der BBC kommt die Technologie zum Teil schon zum Einsatz, von einer Umsetzung in großem Maßstab ist man allerdings noch entfernt.

Bei einem Vortrag auf einer TED-Konferenz (Technology, Entertainment and Design), sprach Berners-Lee davon, nicht nur sachliche Daten großflächig zu verbinden, sondern ebenso soziale Daten. Die Suche nach einer Person "X" ließe so alle Verbindungspunkte im Leben und Schaffen dieser Person aufleuchten: vom Geburtsort bis hin zu Teilnahmen an Veranstaltungen. Wo Datenschützer einen weiteren Schritt zum gläsernen Menschen sehen, kommt Berners-Lee fast ins Schwärmen.

In dem Artikel für die Royal Society kritisiert er soziale Netzwerke als riesige Datensilos, die geöffnet werden müssten. Statt in abgeschlossenen Gemeinschaften sollten persönliche Daten plattform-übergreifend verfügbar sein - dass allerdings die Kontrolle über die Daten beim Nutzer selbst verbleiben sollte, erwähnt er nur am Rande.

WATERKANT - driven by German engineering