Daten­wis­sen­schaft­liches Suchbild

Für ein Projekt experimentiere ich gerade mit HTML5 Canvassen. Dabei ist unter anderem die folgende “Animation” entstanden. Hier werden zufällig bunte Punkte in ein Canvas gemalt, nur ein Wort wird ausgespart. Das Wort wird dabei zufällig aus allen Wörtern der aktuellen Seite gezogen. Um zu erfahren, wo welches Wort gerade im Canvas versteckt muss man der Animation erst einmal eine ganze Weile zusehen..

Die Animation läuft nur mit aktiviertem JavaScript.

Während ihr der Animation zuschaut macht ihr quasi Data Science! Ihr beobachtet Datenpunkte und versucht davon abstrahierend ein Muster zu finden :)

Zugegeben, ein bisschen anders funktioniert das mit den Datenwissenschaften schon. Aber in beiden Fällen transportieren einzelne Datenpunkte nur relativ wenige Informationen. Manchmal sind die Informationen auch noch irreführend oder lenken ab: In der Animation oben hat die Farbe der Punkte bspw. gar keine Bedeutung, sieht nur hübsch aus… Wenn aber viele Datenpunkte zusammen gekommen sind ergibt sich ein Muster und man kann zunächst erahnen, wo sich das Wort im Bild befindet, und mit weiteren Daten auch schon Teile oder später das gesamte Wort erkennen. Es wird auch deutlich, dass die Fläche gar nicht komplett bemalt sein muss – das Wort ist schon viel früher klar zu erkennen.

Daten sind das Öl des 21. Jahrhunderts sagen sie alle…
Auch wenn ich den Vergleich ein bisschen … nicht so passend finde, ist die Idee dahinter natürlich nicht ganz falsch. Daten spielen eine zunehmend große Rolle in unserem Leben, fragt mal Google! Wenn ihr ein Video bei YouTube guckt, weiß Google nur ein kleines bisschen über euch. Wenn ihr das öfter macht, weiß Google ein bisschen mehr. Wenn ihr Google für jede online Suche benutzt, eure Emails über Google-Mail verwaltet, und einfach ohne Blocker im Internet surft, kann Google euch in Kürze besser einschätzen als ihr es je selbst könntet… Das Gleiche gilt natürlich für all die anderen kleinen und großen Player wie Facebook oder Amazon, die uns auf Schritt und Tritt tracken wollen. Daher plädiere ich regelmäßig für Datensparsamkeit: Geht nicht so achtlos mit eurer Privatsphäre um!

Aus “urheberrechtlichen” Gründen gibt es keinen Download-Knopf für das automatisch generierte Bild. Ihr könnt es also nicht mitnehmen, sondern müsst immer wieder kommen wenn ihr es nochmal sehen wollt – natürlich jedes mal mit anderen Datenpunkten! Es lohnt sich also hier ab und zu mal reinzuschauen ;-)

Den Code zur Animation gibt es mittelmäßg kommentiert auf diesem Webserver.