NaDiRa-Kurzstudie: Rassismus in Plenardebatten
Deep Learning zur Erkennung von Rassismus in Plenardebatten - eine Machbarkeitsstudie
Nationaler Diskriminierungs- und Rassismusmonitor
Projektteam:
Andreas Blätte
Laura Dinnebier
Simon Gelhar
Emilia Blank
Silvia Mommertz
- - -
Projektbeschreibung:
Die Studie befasst sich mit der Frage, was die methodischen, technischen und konzeptionellen Voraussetzungen sind, um rassistische Äußerungen und die diskursiven Grundlagen von Rassismus mit Textanalyse-Verfahren zu erfassen. Im Fokus steht die automatisierte Erkennung rassistischer Äußerungen in Plenardebatten. Die Studie erkundet so, ob automatisierte textanalytische Verfahren zur Weiterentwicklung der Rassismusforschung beitragen können.
Ergebnisse:
Ein wesentliches konzeptionelles Zwischenergebnis des Projekts ist ein Kategoriensystem. Es subsummiert Kernmerkmale einer Rassismus-Definition sowie rassistische Topoi aus der Literatur in drei Hauptkategorien, auf deren Grundlage wir potenziell rassistische Sätze erfasst haben: 1) Rassifizierung/Essenzialisierung/Naturalisierung; 2) Inferiorität; 3) Devianz und Bedrohlichkeit. Auf der Grundlage dieses Kategoriensystems generierten wir einen Trainingsdatensatz mit über 20.000 annotierten Textstellen, der insgesamt über 1.500 als rassistisch klassifizierte Textstellen umfasst.
Erste Einschätzungen der manuellen Kodierungen deuten darauf hin, dass insbesondere Abgeordnete, die rechtsextremen oder sogenannten rechtspopulistischen Fraktionen angehören, sich rassistisch äußern. Weiterhin lässt sich ein stetiger Anstieg rassistischer Äußerungen in den deutschen Landesparlamenten insbesondere nach 2015 beobachten.
Überraschende Einsichten:
Unser Ergebnis, dass sich vor allem rechtsextreme und rechtspopulistische Parlamentarier*innen rassistisch äußern, widerspricht der Annahme, rassistische Diskurse würden sich zunehmend normalisieren. Allerdings benötigten wir, um den Klassifikationsalgorithmus zu trainieren, der rassistische Aussagen automatisch erkennen soll, eine Vielzahl an Trainingsdaten, die rassistische und nicht-rassistische Äußerungen gleichermaßen enthalten. Aus diesem Grund basiert das Sampling auf word embeddings. Deshalb enthält es schwerpunktmäßig explizitere rassistische Aussagen und kaum subtilere Formen.
Bedeutung für die Praxis:
Das Projekt liefert die technische und methodische Expertise zur (Re-)Evaluierung von Rassismus über lange Zeiträume hinweg. Zudem stellen wir unsere Forschungsdaten (Programmcodes, manuelle Annotationen) über die im PolMine-Projekt erprobten Netzwerke und Disseminationskanäle (Open Science-Repositorium Zenodo, GitHub) anderen Forschenden zur Verfügung – im Rahmen bestehender lizenzrechtlicher Vereinbarungen. So haben wir den Workflow zur Ausgabe der Annotationsdaten in einem geeigneten Format als R-Paket (annotask) aufbereitet und machen ihn für andere Forschende zeitnah auf dem PolMine-GitHub zugänglich. Ebenfalls bereitgestellt wird der annotierte Trainingsdatensatz.
Um einen umfassenden Rassismusmonitor vorzubereiten, rief das DeZIM im Jahr 2020 Wissenschaftler*innen aus der DeZIM-Forschungsgemeinschaft dazu auf, innovative Studienideen zu entwickeln. Diese sollten bestehende Forschungsprojekte erweitern, neue und innovative Ansätze verfolgen oder eine Infrastruktur aufbauen, um Rassismus zu erforschen. Bis 2021 führten über 120 Wissenschaftler*innen an den sechs Standorten der DeZIM-Forschungsgemeinschaft insgesamt 34 Kurzstudien durch. Diese gliedern sich in sechs thematische Schwerpunkte:
- Gesundheitssystem
- Bildungssystem und Arbeitsmarkt
- Institutioneller Rassismus
- Umgang mit Rassismuserfahrungen
- Teilhabe und Medien
- Rassistische Ideologien und Einstellungen
Förderung: Bundesministerium für Familie, Senioren, Frauen und Jugend (Drittmittel)