AI und Homogenisierung des Verhaltens

von berries
7 min readJun 14, 2024

--

Spekulationen über maschinengenerierte Weltsimulatoren

zusammengestellt von GPT4 und Christian von Borries

„Standardisierung, Gleichschaltung, Vermassung“, Klaus Mann, 1942

ANALOG:
Der Begriff Verhaltenshomogenisierung beschreibt einen Prozess, bei dem sich verschiedene Kulturen oder Gesellschaften in Bezug auf Verhaltensweisen, Traditionen und Werte immer mehr angleichen. Dieses Konzept wird häufig im Zusammenhang mit der kulturellen Globalisierung diskutiert, bei der die Verbreitung bestimmter kultureller Elemente zu einer Verringerung kultureller Vielfalt führt.
Im weiteren Sinne steht er im Zusammenhang mit biokultureller Homogenisierung, d. h. der Verringerung biologischer und kultureller Vielfalt durch Verbreitung bestimmter Lebensstile und den Verlust einzigartiger kultureller und biologischer Merkmale. Dies kann erhebliche Auswirkungen sowohl auf die menschliche Gesellschaft als auch auf die Umwelt haben, denn es führt zum Verlust von traditionellem ökologischem Wissen und Praktiken, die für die Nachhaltigkeit von Sozial- und Ökosystemen unerlässlich sind. Es handelt sich um einen komplexen Aspekt des Kapitalismus, der das Zusammenspiel zivilisatorischer, wirtschaftlicher und politischer Kräfte auf globaler Ebene betrifft.

DIGITAL:
Digitale Technologien tragen erheblich zur Homogenisierung von Verhaltensweisen bei, insbesondere durch ihr Überwachungspotential.
Soziale Medienplattformen und Suchmaschinen fördern Inhalte oft auf Grundlage von Algorithmen, die der Dauer individuellen Engagements Vorrang einräumen. Dies kann dazu führen, dass der Zugang zu kulturellen Ausdrucksformen eingeschränkt wird und homogenisierte Verhaltensweisen und Werte verstärkt werden.
Die umfangreichen Datenerfassungsmöglichkeiten digitaler Technologien ermöglichen eine detaillierte Verfolgung und Erstellung von Profilen aller. Dies kann unser Verhalten beeinflussen, indem Konformität mit wahrgenommenen Normen gefördert wird. Menschen ändern ihr Verhalten, weil sie sich bewusst sind dass sie überwacht werden.
Diese Überwachungsmöglichkeiten digitaler Technologien können tiefgreifende Auswirkungen auf politische Systeme und das Individuum haben. „Es gibt Formen der Unterdrückung und Dominanz, die unsichtbar werden“ (Foucault)
Wirtschaftliche Effizienz bestimmt die Entwicklung digitaler Technologien und führen häufig dazu, dass der Schwerpunkt auf Standardisierung und Effizienz statt auf Vielfalt gelegt wird. Dies kann zu sozialem Druck führen, der eine homogenisierte globale Kultur gegenüber lokalen und indigenen Praktiken bevorzugt.
Die Idee anarchischer Strukturen (das schließt P2P — Netzwerke ein) als Lösung für technologische Herausforderungen ist faszinierend. Anarchische Strukturen beziehen sich in diesem Zusammenhang auf Systeme, die ohne zentralisierte Kontrolle funktionieren. Sie können zwar Freiheit und Gleichheit fördern, bergen aber auch die Gefahr, dass es ihnen an Verantwortungsvermögen mangelt und sie möglicherweise genau die Probleme verschärfen, die sie lösen sollen.

GENERATIV:
Erstmalig nutzt Film generative Technologien, um Modelle einer dystopischen, anarchischen Welt zu schaffen, die uns Auswege aus heutigen politischen Dilemmata zeigen könnten. Sie könnten sogar auf unser eigenes Unbewusstes verweisen. Maschinelles Lernen wird hier letztlich als Erweiterungs- und Korrekturinstrument für menschliches Versagen gesehen, die Übersetzung einer technischen Perfektibilität, also als Wille zur Perfektion anstelle von Nietzsches Willen zur Macht.

Vieles im Film wird heutzutage AI-generiert, Gedichte aus AI-generierten Büchern, aber auch andere von Chat-GPT/GPT4 generierte Texte, Stimmen, die Texte lesen, dann Musik, die wie verstörende Orchester-Soundtracks klingt — vor allem aber Videoclips, die mit Diffusionstransformatoren erzeugt werden.
Dabei geht es darum eine Kohärenz zwischen aufeinanderfolgenden Bildern zu erhalten. Diffusionstransformatoren sind prädestiniert, zeitliche Abhängigkeiten zu erfassen und dafür zu sorgen, dass aufeinanderfolgende Bilder reibungslos ineinander übergehen. Bei der Videogenerierung müssen wir das Modell von bestimmten Informationen abhängig machen (z. B. Textbeschreibungen, einzelne Stills). Diffusionstransformatoren sind ein „Aufmerksamkeitsmechanismen“, die für jedes Stück Eingabedaten — im Fall der Diffusion Bildrauschen — die Relevanz jedes anderen Inputs abwägen und daraus das Ausgabeergebnis generieren, also eine Schätzung des Bildrauschens. Sie sind entscheidend für das Verständnis von AI-generierten Videoinhalten.
Die Herausforderung besteht darin, diese generativen Technologien gegen ihre kapitalistischen Absichten einzusetzen und eher dystopische Welten zu zeigen, die durch die Homogenisierung des Verhaltens definiert sind, eine Eigenschaft, die einer auf statistischen Vorhersagen basierenden Technologie eigen ist. Es könnte sich dabei aber auch um eine Art von Einschüchterung durch das Generieren unüberprüfbarer Inhalte handeln, die es dann zu überwinden gilt.

Welche Eigenschaften haben AI-generierte Videos?
1) Indem sie so etwas wie einen verzerrten Spiegel der Realität zeigen, ähneln sie dem Unbewussten. Das Unbewusste bezieht sich auf menschliches Denken, Fühlen und Handeln, das nicht nur von bewussten Entscheidungen und Prozessen bestimmt wird, sondern auch von Impulsen, Strukturen oder Konflikten, die dem Bewusstsein verborgen sind und daher nicht von ihm kontrolliert werden können. Diese Videos können dies zum ersten Mal zeigen.
2) AI produziert eher Effekte als moralisierende Geschichten.
Die Autoren würde sie als postmoralisch bezeichnen: Es geht nie um das WIE, sondern um das WARUM, denn Moral ist abhängig von historischen und psychologischen Einflüssen, was eine politische Betrachtung der Gesellschaft erschwert. Marx stellte fest, dass Moral immer vom eigenen Interesse geleitet ist, und Nietzsche sagt, darauf aufbauend, dass sie zur Zersplitterung der Bevölkerung führte.
Wir können Zeuge einer Dekonstruktion von Sinn und Wahrheit werden, indem wir antimoralisch handeln (weder gut oder schlecht, noch gut gegen böse). Stattdessen zeigen diese generierten Clips eine vermeintlich subjektive, aber letztlich unempathische Inszenierung von Simulationen der Welt.
3) Indem sie eine unvollständige AMI (Advanced Machine Intelligence) simuliert, baut die Software schließlich Modelle der Welt und imitiert das Unzusammengesetzte und Unorganisierte als Darstellung von Welt. Die leichte Fremdheit, die von der Unvollkommenheit der Videos ausgeht, die derzeit erzeugt werden können, hat eine inhärent utopische Kraft, da sie die menschliche Vorstellungskraft übersteigt. Wir werden Zeuge einer simultanen, multiperspektivischen Wahrnehmungsform heterogener Stile jenseits des Dialogs — es scheint fast wie eine Selbstreflexion der Form, indem die Welt auf unbekannte Weise interpretiert wird -, die auf die simulierte Welt der digitalen Medien reagiert und schließlich Teil unserer Realität wird.
4) Er stellt die Funktion und Authentizität der/des AutorIn in Frage, indem sie postdramatisch und narrativistisch wird.

POSTDRAMATISCH:
Der postdramatische Film wendet sich von traditionellen, auf das Drama ausgerichteten Ansätzen ab. Stattdessen setzt er auf Jump Cuts. Er will beim Zuschauer eine Wirkung erzielen, anstatt sich strikt an eine Geschichte zu halten. Er kombiniert verschiedene Stile und stellt sich selbst als „nach“ oder „jenseits“ des Dialogs dar. Er stellt die Dominanz der erklärenden Rede in Frage. ProtagonistInnen werden nur für kurze widersprüchliche Momente zum Thema. Überforderung wird zum sinnvollen Mittel der Reflexion unserer Welt.

NARRATIVISTISCH:
Narrativistische Filme sind Werke, die absichtlich mit den Konventionen der Erzählung spielen, oft die lineare Erzählung in Frage stellen und die ZuschauerInnen auffordern, sich auf den Prozess der Konstruktion oder Gestaltung einer Erzählung einzulassen.
Sie durchbrechen häufig die vierte Wand (also die vermeintliche Unabhängigkeit der Handlung von der Kamera), indem sie ihren eigenen Status als fiktionales Konstrukt erkennen. Sie können Figuren zeigen, die sich ihrer Rolle in der Geschichte bewusst sind oder sich direkt an das Publikum wenden.
In diesen Filmen wird die chronologische Reihenfolge durchbrochen. Rückblenden, Vorblenden und elliptische Schnitte fordern die ZuschauerInnen heraus, das Puzzle der Erzählung zusammenzusetzen.
Narrativistische Filme erforschen verschiedene Standpunkte und betonen die Subjektivität. Sie können widersprüchliche Darstellungen ein und desselben Ereignisses präsentieren.
Narrativistische Arbeiten fügen verschiedene Elemente — Text, Bilder, Ton — zu einer Collage zusammen. Diese Fragmente wecken Emotionen und Ideen, ohne sich an eine lineare Handlung zu halten.
FilmemacherInnen verweisen in ihren Erzählungen auf andere Filme, Literatur oder kulturelle Artefakte. Diese intertextuellen Verbindungen widersetzen sich stringenten Auflösungen. Stattdessen bereichern sie aktiv das Seherlebnis.

MUSIKALISCH:
Sowohl in der Musik als auch bei AI geht es um das Erkennen von Mustern und um Elemente der Unerklärbarkeit. MusikerInnen erhalten bei Proben und Auftritten Rückmeldungen. Sie passen ihr Spiel auf der Grundlage ihrer eigenen Einschätzung und der Reaktionen des Publikums an. Auch AI-Modelle verbessern sich durch Feedback-Schleifen. Das Training umfasst iterative Anpassungen auf der Grundlage von Bewertungsmaßstäben. Reinforcement Learning (RL) in der AI ist mit Lernen durch Belohnungen und Bestrafungen vergleichbar. RL-Agenten (wie MusikerInnen) führen Aktionen aus, um kumulative Belohnungen zu maximieren. Sprachmodelle können ihren Ton und Stil je nach Kontext anpassen, ähnlich wie MusikerInnen ein Stück je nach Kontext einer Aufführung unterschiedlich interpretieren.

BLACK BOX:
Das Black-Box-Problem in der AI bezieht sich auf die Herausforderung, Gründe für die Vorhersagen oder Entscheidungen eines AI-Systems zu entschlüsseln. Im Wesentlichen geht es darum, dass wir nicht verstehen können, wie das System zu seinen Schlussfolgerungen kommt. Selbst wenn wir Zugang zu den Trainingsdaten haben können wir nicht vollständig verstehen, wie Entscheidungen zustandekommen.
Auch die Musik hat ihre eigenen irrationalen Aspekte. Bestimmte Musikstücke wecken starke Emotionen, aber wir können nicht genau sagen, warum. Oft ist es eine Mischung aus Erinnerungen, Emotionen, Kontext und natürlich der Art, wie das Stück modelliert wurde. Beiden Phänomenen ist also die Unfähigkeit einer Rationalisierung der Welt gemein.

WELTSIMULATOR:
Ein Weltsimulator ist ein AI-System, das interne Repräsentationen einer Umgebung konstruiert und diese verwendet, um zukünftige Ereignisse innerhalb dieser Umgebung zu simulieren. Diese Simulatoren können verschiedene Aspekte der Welt modellieren, z. B. Physik, Dynamiken und Interaktionen. Modelle zur Videogenerierung, die mit Raum-Zeit-Feldern von Video- und latenten Bildcodes arbeiten, können als vielversprechende Allzweck-Simulatoren der physischen Welt dienen und reale Phänomene vorhersagen.

„Nur wenn das Modell verändert wird, kann man aus der Geschichte lernen“ (Heiner Müller). Das heutige Modell ist ein Large Language Model (LLM), das mit dem gesamten Online-Wissen trainiert wurde und sich ständig selbst optimiert.
Per Definition erzeugt AI generische Inhalte. Könnte der kleinste gemeinsame Nenner nicht etwas von der Wahrheit dieser Welt zeigen? Andererseits: Führen nicht oben beschriebene Versuche der Standardisierung zu einem Faschismus, der nur noch Stimmungen hinterlässt?
Es gibt Anzeichen dafür, dass maschinelles Lernen bereits feministisch wird, denn es könnte selbst all die Vorurteile aufgedeckt haben, die von meist weißen, männlichen Programmierern geschaffen wurden.
Ein feministischer Technologieansatz geht über geschlechtsspezifische Ungleichheiten hinaus. Er umfasst soziale Ungleichheiten, einschließlich Rasse, Klasse, Behinderung. Feministische Perspektiven auf generative AI (GenAI) überdenken die Art und Weise, wie wir diese Technologie entwickeln und anwenden.

Wie Testvorführungen zeigen, ruft der mithilfe von AI generierte postdramatische, narrativistische Film sehr unterschiedliche Reaktionen hervor, je nach Kontext und vielleicht auch Herkunft der ZuschauerInnen.
In dieser Erweiterung der Genres und letztlich „leidenschaftslosen Dialektik“ (Heiner Müller) sehen die Autoren seine Stärke.

--

--