Textressourcen für die Integrations- und Migrationsforschung (MigTex)

DeZIM-Forschungsgemeinschaft

Laufzeit November 2017 bis Februar 2020

Status Abgeschlossenes Projekt

Projektteam

Projektleitung: Prof. Dr. Andreas Blätte

Projektmitarbeiter*innen: Christoph Leonhardt (InZentIM), Merve Schmitz-Vardar (InZentIM), Florian Gilberg (InZentIM), Kevin Glock (SHK, InZentIM)

---

Projektbeschreibung:

Das Ziel des Projekts war es, für die Migrations- und Integrationsforschung relevante Textressourcen (Korpora, Diktionäre, Annotationen, Trainingsdaten) zu identifizieren, diese in nachhaltige Formate zu überführen und für die Forschung bereitzustellen. Methodisch war das Projekt im Bereich der eHumanities bzw. Computational Social Sciences angesiedelt. Es wurde in einer Kooperation zwischen der Universität Duisburg-Essen (Interdisziplinäres Zentrum für Integrations- und Migrationsforschung / InZentIM) und dem Wissenschaftszentrum Berlin (WZB) durchgeführt. „MigTex“ baute dabei auf der Infrastruktur, der Codebasis und den Zielsetzungen des PolMine-Projekts auf. Als Strukturprojekt trägt „MigTex“ zur Forschungsdateninfrastruktur des Deutschen Zentrums für Migrations- und Integrationsforschung (DeZIM) bei.

Ein zentrales Interesse des Projekts war die nachhaltige Bereitstellung von Textressourcen für die Migrations- und Integrationsforschung. Diese Textressourcen in nachhaltige Formate (eXtended Markup Language / XML) zu überführen, dient der Reproduzierbarkeit und führt somit zu mehr Transparenz in der Forschung. Aufwändige Doppelarbeiten können vermieden werden. Die Entwicklung einschlägiger Korpora, Diktionäre und Annotationen eröffnet Potenziale für neue Forschungsansätze und Forschungsvorhaben der Migrations- und Integrationsforschung. Hierzu ist es notwendig, sowohl neue Verfahren bei der nachhaltigen Aufbereitung der Textressourcen zu entwickeln als auch die „klassischen“ qualitativen und quantitativen Ansätze der Inhaltsanalyse um Verfahren der eHumanities bzw. Computational Social Sciences zu erweitern.

Der Arbeitsplan des Projekts sah vor, dass einschlägige Ressourcen identifiziert und Standardisierungen entwickelt werden. Zunächst wurden gemeinfreie Arbeitsmaterialien (Parlaments- und Regierungskommunikation) aufbereitet. Im Rahmen des Projekts bestand allerdings auch die Möglichkeit, lizenzrechtlich geschützte Materialien zu erschließen. Im Projekt stand somit die Verbesserung der Zugänglichkeit und die Dissemination der entwickelten Methoden und der aufbereiteten Daten im Vordergrund. Hierzu war die Bereitstellung einer Analyseumgebung auf Basis des bereits vorliegenden R-Pakets ‚polmineR’ ebenso zentral wie die Erstellung von Tutorials und Workshops (November 2018 und September 2019), die der Vermittlung der bereitstehenden Daten und Methoden diente.

Seit Abschluss des Projektes stehen die Daten wissenschaftlichen NutzerInnen in lizenzrechtlich geklärter Weise zur Verfügung. Eine Analyseumgebung kann genutzt werden, die quelloffen ist und durch adäquate Dokumentation, Tutorials und Schulungsmaterialen eine technisch niedrigschwellige Verwendung dieser Daten erlaubt. Diese Transparenz und Mechanismen des User-Feedbacks dienen der Qualitätssicherung des Projekts.

Beteiligte Verbundpartner: Interdisziplinäres Zentrum für Integrations- und Migrationsforschung (InZentIM), Wissenschaftszentrum Berlin für Sozialforschung (WZB)

Förderung: Bundesministerium für Bildung, Familie, Senioren, Frauen und Jugend (Drittmittel)

Textressourcen für die Integrations- und Migrationsforschung (MigTex)

Bleiben Sie mit uns in Kontakt

Abonnieren Sie unsere DeZIM.news