re:publica 17: Was wird? Meinungen sind wie Daten.
Die re:publica 17 ist lange vorbei. Was kommt jetzt? Auf jeden Fall viel Aufregung über das Datensammeln. Die Versuche, die Freiheit zu erhalten. Das Überwachen oder das Überwachtwerden einzuschränken. Zu wenig Aufmerksamkeit für das Daten manipulieren. Und Meinungen sind Daten!
Eigentlich sind das nur Gedanken, die mir nach der re:publica einfielen. Alles Gehörte hat lose Enden ergeben. Ich habe das Lose zusammengeschrieben, mußte wo stehen, für später.
Vielleicht dann beim Aufschreiben, ist manchmal die Stringenz verloren gegangen. Aber im Anschauen und Vorüberlesen kann jede/r die Enden wieder verbinden. Und als Fortsetzung von re:publica 17: Was bleibt? kann jede/r diese Enden auch dort überall anknüpfen.
Erst sammeln
Nach der Zeit und all dem auf der re:publica 17 Gehörtem fiel mir lange kein Anfang ein. Alles ist klar, liegt alles ausgebreitet in meinem Kopf. Ich möchte darüber schreiben, daß das Daten sammeln heute zum Status Quo geworden ist. Das Daten sammeln ist nicht nur kein physisches und verstecktes Ereignis wie die Überwachung oder das Abhören früher, es ist offen kommuniziertes Geschäftsmodell der Firmen, die uns all die schönen Dienste (kostenlos) zu Verfügung stellen. Und selbst das Wissen über die Überwachung durch die großen Dienste wie die NSA haben wir in unseren Alltag integriert und kümmern uns nicht weiter darum.
Daten werden gesammelt, sobald wir das Internet betreten. Jede/r muß Daten sammeln, jedes Unternehmen, daß gerade anfängt, etwas im und mit dem Internet aufzubauen, muß heute als integralen Bestandteil unsere Daten sammeln, sobald wir sein virtuelles Produkt nutzen. Um sein Business auszuwerten oder unsere Daten für sein Business auszuwerten. Und alle die, die schon länger dabei sind, tun gut daran, so schnell wie möglich mitzumachen. BTW: Während Du dies hier liest, wirst Du übrigens von Piwik getrackt. Welchen Browser Du verwendest, von wo Du gekommen bist. Wie lange Du auf dieser Seite bist. Wie groß Dein Bildschirm ist. Wahrscheinlich kann ich anhand der IP Adresse herausfinden, in welcher Stadt Du wohnst. Eine ganze Menge. Und mich interessiert eigentlich nur, wenn dann mal mehr als 2 Leute pro Monat vorbeikommen, woher sie kamen und was sie sich so nacheinander auf der Seite angeschaut haben.
Natürlich genauso in der analogen Welt, unsere Daten werden gesammelt. Und wurden gesammelt, auch früher. Schon, als wir noch klein waren. Eine Zahl ist bei mir im Kopf: Im Westen in den 80ern soll jedes zweite Auslandsgespräch von irgendeinem Geheimdienst abgehört worden sein. Und im Osten natürlich die Stasi. Nur da war immer noch ein Mensch involviert, der überwacht hat. Was diese alte Form der analogen Überwachung fast schon kuschelig erscheinen läßt. Waren wir Überwachten wenigstens nicht allein. Anders als heute, wo wir nur noch eine Date im Elektronenmeer sind, kühl und still. Und in der Zwischenzeit eben mal die Möglichkeiten der digitalen Werkzeuge so performant geworden sind, das z.B. auch Gesichtserkennung in großen Gruppen von Menschen in Echtzeit möglich ist. Echtzeitsammeln und -auswerten. Oder wie auch auf der re:publica gehört, werden Möglichkeiten getestet, Bewegungsprofile durch das Scannen und Überwachen von Autonummernschildern zu erstellen. Dafür gibt es dann leider keinen Aus-Knopf wie am Smartphone.
Genau, das war das Einstiegsthema. Ein alter Hut. Daten überall. Und Sammler. Darüber wollte ich dann später zum eigentlich Thema – dem Daten manipulieren – kommen.
Daten erkennen
Die Phase des Sammelns von Daten war gestern. Gestern war das neu, fing das an. Aufpassen, was jede/r in Formulare eingibt. Facebook - ja oder nein? Google - sind die böse oder die Guten? Was machen die eigentlich? Meine Daten sind doch nicht wichtig. Der schönste Satz: Ich hab doch nichts zu verbergen.
Viel und oft gesagt wurde das. Interessiert, was dahinter, hinter dem ganzen Datensammeln steckt, hat es niemanden so richtig und es betraf ja auch größtenteils immer nur die Anderen. Ideen und Potentiale, gedachte, realistische Zukünfte waren gefühlt in der Diskussion sehr wenig zu erkennen. Entweder die Version 1984 und wir werden bis in jede kleinste, dunkelste Ecke überwacht oder sie sammeln doch einfach nur meine unwichtigen Daten. Letzteres stellte sich psychisch als bequemer und erfolgreicher heraus, weshalb wir dabei blieben.
Bis heute. Wir alle machen mit. Wird schon nicht so schlimm sein und die Apps sind auch wirklich toll. Ja, tolle Apps, ok, aber können wir sagen ob und wie schlimm das alles ist mit diesen Daten? Können wir das? Schwierige Frage gefunden, denke ich. Wir haben keinen Vergleich, keine Erfahrungswerte. Wir hatten jedoch ein bißchen Zeit, uns damit zu beschäftigen. Nur hat uns die Beschäftigung mit der Frage, wer warum unsere Daten sammelt, wo sie doch für sich genommen so unwichtig sind, die ganze Zeit gekostet. Selbst als dann Themen wie Big Data aufkamen, wurde es noch nicht klarer. Zumindest waren wir jetzt beruhigt: Aha, dazu brauchen sie unsere Daten. Gewürzt mit ganz viel: siehst Du, kommt ja was Gutes für uns alle bei raus. Meine App weiß durch uns alle, wo der nächste Stau ist.
Dazwischen ein kurzer Blick in die Vergangenheit: Die Ausstellung Hufelandstraße mit Fotos von Harf Zimmermann. Zu sehen: Eine graue, gleichgeschaltete Realität – in den Fassaden wie den Gesichtern. Selbst die Kinder sehen schon gleichgeschaltet aus. Meine Feststellung: Wenn jede/r sich eine lange Zeit (meine lange Zeit: 18 Jahre) in einem Kontinuum bewegt, in ihm aufwächst, nimmt jede/r jede Realität als gegeben hin. Und das haben wir als Realität akzeptiert. Es gab keinen Vergleich, keine Daten als Maßstab. Auf den Bildern sehen die Häuser aus, als wären gerade erst die Panzer der Sowjetarmee abgezogen, nachdem sie Berlin ‘45 eingenommen hatten. So sah es im 1989 Prenzlauer Berg immernoch aus. Soviel aus der Erinnerung und nur als Bild, daß man das Hintergrundrauschen der Realität immer nicht als solches wahrnimmt. Und so auch jetzt das Rauschen der Datenströme wieder in die Geräusche der Realität eingewoben ist und unsere Sinne den Reiz des Unterschieds schon längst adaptiert haben.
Und mitgerissen von diesem Strom sind wir längst in die Phase der Datenmanipulation eingetreten. Und erst langsam wird das zum Thema. Das wird in den nächsten Jahren der neue Hype werden. Daten zu sammeln ist heutzutage Grundvoraussetzung jeder digitalen Unternehmung.
Aber das Sammeln von Daten ist ja noch nie der reine Zweck von Überwachung gewesen. Ein schöner, einfacher Gedanke: Da ist eine Kamera und hinter dem Monitor, der die Kamerabilder anzeigt, sitzt ein Mensch und schaut sich das an und paßt auf, das mir da niemand auf den Kopf haut oder ich niemandem heimlich ein Bein stelle. Diese Vorstellung ist leider naiv und gefährlich aus mehreren Gründen. Als erstes: wenn wir das Beispiel skalieren, kann da natürlich nicht an jedem Bildschirm eine/r sitzen, der sich das 24/7 anschaut. Was dazu führt, das die Bilder maschinell ausgewertet werden. Was dazu führt, das Algorithmen für verschiedene Überwachungsanforderungen, wie beispielsweise Gesichtserkennung oder Bewegungstracking, geschaffen werden. Und die Anforderungen an die Algorithmen werden von ein paar wenigen Menschen unkontrolliert aufgrund heutiger Erfahrungen aufgestellt und den Algorithmen werden nur bestimmte ausgewählte Datensätze zum Lernen gegeben. Auch unkontrolliert. Und bei der Masse an Informationen und der Komplexität menschlicher Beziehungen kennen wir wahrscheinlich einige Anforderungen an die Algorithmen und zu sammelnden Daten erst in der Zukunft, weshalb wir die Daten speichern müssen, um sie dann später auswerten zu können. Dabei werden dann aus den Daten Profile erstellt. Und damit bin ich wieder beim Anfang, das das Sammeln der Daten nicht der Zweck von Überwachung ist.
Das erinnert mich an das Tun der Stasi in der DDR, deren IMs mit akribischer Sammelarbeit Daten über die Bürger der DDR gesammelt haben. Im großen und ganzen nicht, um das kleine Fehlverhalten demjenigen sofort unter die Nase zu halten und ihn zu bestrafen. Nein, die Daten wurden gesammelt und ein Profil erstellt, um es dann im dem Moment hervorzuholen, wenn es gebraucht wurde, um jemanden direkt zu erpressen oder jemand anderen indirekt zu manipulieren, um zu drohen und Angst zu erzeugen.
An dem Punkt sind wir heute. Die Profile sind erstellt! Sich gegen das Daten sammeln zu wehren, ist gut, aber es wird nicht mehr änderbar sein. Sich für eine Algorithmen-Ethik einzusetzen ist das, was wir jetzt tun müssen. Heute müssen wir bestimmen, welche Art von Algorithmen wir haben wollen. Welche Art von Profilen wir brauchen und wer diese erstellen darf. Wir stehen irgendwann in nicht allzu ferner Zukunft vor der Frage, welche Gesetze und Algorithmen für Roboter gelten. Wohl dem, der dann seinen Asimov gelesen und verstanden hat.
Google baut heute Prozessoren, die mittels maschinellem Lernen (Machine Learning) alle die Datenströme auswerten, die es einsammelt. Um Muster zu erkennen, die wir Menschen mit unseren eingeschränkten Mustererkennungsverfahren in unseren Köpfen, welche sehr stark von dem Bias unserer vergangenen Erfahrungen bestimmt werden und so stark von der Subjektivität dieser Erfahrungen abhängen, nicht in der Lage sind zu erkennen, geschweige denn zu interpretieren.
Die Zukunft ist gemustert
Während des Suchens stolperte ich auf meiner uralten Web-Seite über das gute alte McLuhan-Zitat, in dem er das global village erwähnt. Und da macht McLuhan eine Bemerkung, die ihm damals im Betrachtung der elektronischen Umwälzungen im täglichen Leben wichtig war und die mir heute wichtiger den je erscheint. Und die so unglaublich gut zum Thema paßt, obwohl sie vor 50 Jahren gesagt wurde. Wir sollten endlich anfangen, diesen Satz ernst zu nehmen: das wir heute von einem Verhalten der reinen Einordnung der Daten in einen Modus der Mustererkennung übergehen müssen. Aus dem Grund, daß wir zu wenig Zeit für ersteres haben. Das das wahrscheinlich auf jedes Zeitalter zutrifft, dieses radikale Umlernen müssen, nicht nur eine neue Sichtweise auf die Welt und ihre Nachrichten einnehmen, sondern eine neue Qualität entwickeln in der Art und Weise, sie zu betrachten, denke ich dann. Nur haben wir nicht so viel Zeit, wie es bräuchte, so einen Modus zu lernen.
Hier der ganze Text, den Marshall McLuhan vor 50 Jahren aufschrieb:
Ours is a brand-new world of allatonceness. “Time” has ceased, “space” has vanished. We now live in a global village… a simultaneous happening. We are back in acoustic space. We have begun again to structure the primordial feeling, the tribal emotions from which a few centuries of literacy divorced us.
We have had to shift our stress of attention from action to reaction. We must now know in advance the consequences of any policy or action, since the results are experienced without delay. Because of electric speed, we can no longer wait and see. George Washington once remarked, “We haven’t heard from Benjamin Franklin in Paris this year. We should write him a letter.”
At the high speeds of electric communication, purely visual means of apprehending the world are no longer possible; they are just too slow to be relevant or effective.
Unhappily, we confront this new situation with an enormous backlog of outdated mental and psychological responses. We have been left d-a-n-g-l-i-n-g. Our most impressive words and thoughts betray us — they refer us only to the past, not to the present.
Electric circuitry profoundly involves men with one another. Information pours upon us, instantaneously and continuously. As soon as information is acquired, it is very rapidly replaced by still newer information. Our electrically-configured world has forced us to move from the habit of data classification to the mode of pattern recognition. We can no longer build serially, block-by-block, step-by-step, because instant communication insures that all factors of the environment and of experience co-exist in a state of active interplay.
— Marshall McLuhan (The medium is the message, 1967)
Was ich mich dabei frage: Wer hat eigentlich in der Zeit vor 50 Jahren verstanden, was McLuhan damit meinte? Damals ging es um die Kommunikation in Form von Radio und Fernsehen im Zusammenspiel mit Telefon und später dann dem Telefax, das zu der Zeit seit dem 2. Weltkrieg Einzug in die Lebenswelten der Familien der industrialisierten Welt, größtenteils auf der Nordhalbkugel, gehalten hatte. Nur auf die Verbreitung von Nachrichten bezogen, war hier in den Köpfen die Stufe von der Nachrichtenverbreitung über Zeitungen - Reporter, die lange und aufwendig an die Orte der Nachrichten reisen und dann die Geschichten erst wieder zurück bringen mußten - hin zur Verbreitung über Radio und Fernsehen zu gehen, bei denen die Berichterstattung teilweise Live vor Ort stattfand und in Echtzeit in die Wohnzimmer übertragen wurde. Sofortige Verfügbarkeit. Da waren keine Filter und kein langes Geschichtenschreiben mehr, bevor Texte in den Zeitungen veröffentlicht wurden. Die ganze Welt war in Echtzeit visuell und akustisch erfahrbar. Die magischen Kanäle konnte jede/r anzapfen. Einzig zu wählen war das Label, das auf dem Kanal stand. Die Zeitpunkte der Interaktion mit den Kanälen war stark begrenzt und jedesmal ging dem eine bewußte Entscheidung voran: schalte ich jetzt den Fernseher oder das Radio ein, rufe ich jemanden per Telefon an, benutze ich meine Kreditkarte. Nur dann konnten Daten gesammelt werden. Überwachung und Beschattung lasse ich hierbei außer Acht.
Und die Stufe, die wir heute gehen? Ich bin mir nicht sicher, ob es eine qualitative oder nur quantitative Veränderung ist. Alles ist mehr geworden, was auf uns einwirkt. Das wäre nur quantitativ. Ja, wir sind ständig online (Wer schaltet schon nachts sein Mobiltelefon aus?) und produzieren die ganze Zeit Daten, die dann eingesammelt werden und ihre Geschichten über uns erzählen. Das fühlt sich zwar anders an, als den Fernseher einschalten und einen von fünf Sendern auswählen, aber es ist trotzdem nur mengenmäßig mehr.
Was einer neuen Qualität sehr nahe kommt, ist, daß wir bis hierher nur Empfänger waren. Wir haben über die Jahre immer mehr empfangen, aber eben nur empfangen. Heute sind wir alle oder können zumindest auch Sender sein, jede/r Einzelne von uns.
Und was einer neuen Qualität noch näher kommt, ist natürlich, das die Kanäle nicht mehr nur unidirektional Senden wie beim Fernsehen oder bidirektional Senden und Empfangen wie beim Telefon, sondern alles gleichzeitig und multidirektional in der Cloud passiert, die wir zum Meinungsaustausch und zur Informationsbeschaffung verwenden und so zu unserer sozialen Sphäre machen. So wie früher. Man traf sich auf dem Marktplatz und das “Gerede” dort bestimmte diese soziale Sphäre des Zusammenlebens in diesem Dorf. Das “Gerede” im nächsten Dorf bestimmte das Zusammenleben dort. Heute bewegen wir uns in unserer Filterblase, dem Strom zugelassener Freunde und zugelassener Meinungen auf Facebook oder Twitter, unserem Dorf. Und das “Gerede” in diesen Wolken bestimmt heute – genau wie früher – unsere soziale Sphäre.
Manipuliere, wer kann!
Die Daten werden gesammelt, um etwas in ihnen zu Suchen. Die Daten werden analysiert, durch selbstlernende Algorithmen geleitet. Sie werden verarbeitet, es wird nach Mustern gesucht. Mit den Ergebnissen werden in einer Art Feedback die Parameter der Algorithmen so verändert, daß sie die Muster, denen wir Bedeutung beimessen, in Zukunft leichter erkennen.
Und hier stehen wir vor einem Dilemma. Entweder wir haben die Algorithmen mit den Daten, die wir zum Lernen benutzt haben, so stark in eine unserem Verständnis entsprechende Richtung entwickelt, was bedeutet, daß der Bias sehr stark ist, daß das System zwar für uns gut interpretierbare, d.h. verstehbare Ergebnisse liefert, er jedoch darüber hinaus ziemlich unfrei ist. Oder wir lassen den Algorithmen mehr Freiheiten, erzeugen mit unseren Lerndaten einen weniger starken Bias, verstehen jedoch die Ergebnisse in dem Maße schlechter, können sie nicht so einfach interpretieren, da uns die Erfahrungen fehlen, die uns zu ähnlichen Ergebnissen führen könnten. Welchen der beiden Wege gehen wir?
Und so gibt es soviele einfache Ansatzpunkte, um Daten zu verändern, in bestimmte Richtungen zu lenken und und so unsere digitale Realität ein Stück neben die Wirklichkeit zu setzen. Die Daten können einmal direkt manipuliert werden, in dem vorhandene Datensätzen eingelesen, verändert und wieder eingegeben und weitergeleitet werden. Und die Mechanismen, die Daten erzeugen, die Algorithmen, können manipuliert werden, so daß sie in einem bestimmten Sinne rechnen. Oder handeln. Wahrscheinlich effektiver das Zweite, da hier nicht jede einzelne Date angeschaut, sondern nur einmal der Algorithmus erstellt werden muß. Wiederum: die Manipulation eines Algorithmus heißt wohl eher ‘Erstellung’. Dann die Manipulation der Manipulation. Ein Algorithmus wird erstellt, um Daten zu manipulieren und um die Daten in einem bestimmten Sinne zu manipulieren, manipuliere ich den Algorithmus. Entweder, indem die Berechnungsvorschriften so erstellt werden, daß sie einen bestimmten Weg gehen – was sie ja, wenn man es wertfrei betrachtet, immer tun – oder indem die Datensätze, die zum Lernen verwendet werden, so ausgewählt sind, daß sie nur einen gewollten Ausschnitt der Realität widerspiegeln. Und nur in diesem Ausschnitt der Realität kann dann der Algorithmus denken. Und handeln.
Und wir?
Unser System von Erfahrung und Bewertung unserer Realität funktioniert ja nicht anders. Unsere Meinungen beruhen auf unseren Erfahrungen. Die Erfahrungen sind in den Verknüpfungen der Nervenzellen unseres Gehirns als eine Art Muster von verstärkenden und dämpfenden Verbindungen abgespeichert. Diese Muster sind der Bias, durch den wir nachfolgende Erfahrungen filtern und formen und die dann wieder als neue Muster abgespeichert werden, indem die Verbindungen und ihre Wichtungen neu bewertet und angepaßt werden. In unseren Köpfen eine Art kleine, persönliche soziale Sphäre, wo sich gleichartige Eindrücke, Muster positiv verstärken. So könnten wir unsere Meinungen als Daten sehen, die unser Sphäre im Gehirn befüttern und wieder als Daten aus diesem System ausgegeben werden. Neue Meinungen, die wir dann wiedergeben, die wir als Posts und Kommentare in die soziale Sphäre einspeisen. Und die wir von anderen lesen.
Zum Informationsaustausch gehören Sender und Empfänger. Eigentlich ist das natürlich hier nicht anwendbar, aber die philosophische Spielerei bietet sich an: Nach Claude Shannon ist der Informationsgehalt einer Nachricht umgedreht proportional zu ihrer Wahrscheinlichkeit. Eine unwahrscheinlich Information hat einen hohen Informationsgehalt. Da durch die hohe Unwahrscheinlichkeit die enthaltene Information auch in dem Maß weniger wahrscheinlich vorhergesagt werden kann, kann der Inhalt weniger leicht manipuliert werden. Spezifische Information hingegen sind wahrscheinlicher und damit leichter vorhersehbar und können somit leichter manipuliert werden. Vielleicht ein Quergedanke, der weiterhilft.
Wenn wir uns in unserer gewohnten, bequemen sozialen Sphäre bewegen, schwimmen wir durch Wölkchen gleicher oder zumindest ähnlicher Meinungen. Vorhersagbare Meinungen, wenig Informationsgehalt. Es ist unwichtig, aus welcher Quelle die Meinungs-Daten kommen, Hauptsache sie stimmen mit unserer Meinung überein. Werden jetzt Daten, die aussehen wie echte Daten, in die uns umgebende soziale Sphäre eingespeist, um uns zu manipulieren, können wir ihre Echtheit nicht mehr feststellen, da die Daten-Meinungen zu unspezifisch sind, keinen Informationsgehalt mehr besitzen. Außer wir führen mit jeder Meinung einen Quellencheck durch und versuchen den Gehalt an Echtheit zu überprüfen.
In unserer Sphäre fühlen wir uns aufgehoben, sozial verbunden mit den vielen anderen und sicher in diesem wohligen Meinungsstrom, der sanft plätschernd dahin fließt. Wie beschrieben, sind nicht wir, sondern nur unsere Meinungen dort aufgehoben. Wir als Sender oder Empfänger sind allein. Jede/r sendet und empfängt für sich allein. Filtert für sich allein. Interpretiert für sich allein. Und in der Vereinzelung der Nachrichten, die auf unserer eigenen Vereinzelung beruht, wird jede/r einzelne manipulierbar. In den sicheren Meinungsstrom können leicht neue Meinungs-Daten geschüttet werden, denen wir dieselben Attribute zuschreiben, die wir für genauso sicher und glaubwürdig halten, wie die schon vorhandenen Meinungen.
Auch ganz viele Gedanken zusammen, die scheinbar dieselbe Meinung äußern, bedeuten gerade nicht nicht eine Gemeinschaft. Eine Sphäre von scheinbar gleichen Gedanken ist nur eine größere Anzahl des Gedankens, vielleicht ein Gedanke mit größerer Amplitude. Dies stellt nicht einen neuen Gedanken dar und die Gedanken können keine neue Idee hervorbringen in ihrer bestätigenden Selbstreferenz. Die soziale Sphäre bedeutet noch nicht mal, daß da viele Menschen das gleiche Denken, sichtbar sind nur ähnliche Meinungen zu einem Sachverhalt. Da es in einer Sphäre passiert, deuten wir es als Zustimmung zueinander. Vielleicht bedeutet es noch, daß die Menschen einen Sachverhalt auf sehr ähnliche Weise dekodieren. Aber wir wissen nichts darüber und es wird nicht durch die soziale Sphäre oder die Nachrichten vermittelt, ob die Menschen den Sachverhalt auch auf dieselbe Weise verstanden haben. Es ist also nur ein scheinbarer Zusammenhalt in der Sphäre, ein angenommener, nie bestätigter. Und das macht jede/n einzelne/n angreifbar und manipulierbar.
Geschichten erzählen
Doch wenn Informationen so nur zwischen Einzelnen ausgetauscht werden, gibt es auch nur eine Geschichte zwischen Sender und Empfänger und nicht zwischen den vielen in der sozialen Sphäre, die nur scheinbar dieselbe Geschichte hören.
Wir erzählen uns keine Geschichten mehr, sondern erzeugen nur ein beständiges wohliges weißes Rauschen gleichförmiger Signale. Wir sollten wieder eine gemeinsame Geschichte finden und sie uns erzählen, damit die Informationen darin und wir weniger manipulierbar sind.
Das war die Fortsetzung von re:publica 17: Was bleibt?. Die Karten für re:publica 18 liegen bereit. So wie die Frage: Was kommt?