616 views
# Exposé Bachelorarbeit Mustermann Deutscher Titel: Automatische Umformulierung von Nebensätzen in Hauptsätze Englischer Titel: Automated Rephrasing of Subordinate Clauses Into Main Clauses Voraussichtlicher Beginn: Mitte März Gewünschte Gutachter:innen: * Erstgutachter: Prof. Mauve * Zweitgutachter: Jens Bendisposto ## Problembeschreibung Die am Lehrstuhl für Rechnernetze entwickelte Diskussions- und Argumentationsplattform D-BAS sammelt strukturiert Argumente in Form von Premise-Conclusion-Paaren, z. B. „Ich denke, dass mindestens ein Seminar verpflichtend sein soll, weil es wichtig ist, dass alle Studenten Präsentationstechniken erlernen.“ In diesem Satz ist „mindestens ein Seminar verpflichtend sein soll“ die Conclusion, „es wichtig ist, dass alle Studenten Präsentationstechniken erlernen“ die Premise. Auf die Premise eines bestehenden Arguments können andere Personen reagieren, z. B. „Ich stimme zu, dass es wichtig ist, dass alle Studenten Präsentationstechniken erlernen, weil dies eine wichtige Kompetenz für viele Berufe ist.“ Damit D-BAS automatisch Argumente zusammenbauen kann, ist die Satzstruktur in Webinterface vorgegeben. In der Datenbank sind die Nebensatzfragmente „mindestens ein Seminar verpflichtend sein soll“, „es wichtig ist, dass alle Studenten Präsentationstechniken erlernen“, „dies eine wichtige Kompetenz für viele Berufe ist“. In manchen Zusammenhängen wäre es aber praktisch, diese Fragmente als Hauptsatz (also insbesondere mit Verb in zweiter Satzgliedposition) zu haben, z. B. „Dies ist eine wichtige Kompetenz für viele Berufe“. Damit können Argumentbestandteile als eigenständiger Satz dargestellt werden oder zu einfacheren Sätzen (mit weniger Nebensätzen) wie „Mindestens ein Semminar soll verpflichtend sein, weil es wichtig ist, dass alle Studenten Präsentationstechniken erlernen.“ zusammengebaut werden. ## Ziele In dieser Bachelorarbeit soll eine Bibliothek entwickelt werden, die ein (kausales) Nebensatzfragment (z. B. „es wichtig ist, dass alle Studenten Präsentationstechniken erlernen“) als Eingabe erhält und es als Hauptsatzfragment („es ist wichtig, dass alle Studenten Präsentationstechniken erlernen“) zurückliefert. Die Qualität des entwickelten Verfahren soll anhand echter Daten aus D-BAS evaluiert werden. Für die Qualitätsbewertung ist ein Bewertungsmaßstab zu definieren. ## Minimalanforderungen * Recherche bestehender/verwandter Algorithmen und relevanter Bibliotheken * Erstellung eines Nebensatz-Datensatzes aus D-BAS-Daten (mit Train/Validate/Test-Split) * Definition eines Bewertungsmaßstabs * Implementierung eines Verfahrens * Evaluation des Verfahrens ## Mögliche Erweiterungen * Implementierung weiterer Verfahren, z. B. unter Nutzung von Machine Learning, und Vergleich dieser Verfahren * Erkennung von syntaktisch falschen Eingaben * Erkennung von wahrscheinlich falschen Ausgaben * Dockerisierte REST-API * Umformung von Haupt- in Nebensätze