TOPTEXT Projektantrag von Förderlinie "Terra Incognita" der Universität Stuttgart bewilligt

4. Juni 2025

Der von Herrn Dr. Dr. Timon Boehm und Prof. Dr. Claus Zittel vorgebrachte Projektantrag TOPTEXT wurde bewilligt

TOPTEXT. Ein algebraisch-topologisches Modell zur Erschließung von thematischen Gebieten in Texten

Das gängige Paradigma zur Textanalyse im Natural Language Processing ist die distributionelle Semantik. Die Bedeutung eines Wortes wird über die Häufigkeit von Kookurrenzen ermiꢀelt. Distributionelle Semantik wird auf unterschiedliche Weise in Modellen wie Word2Vec, LDA oder LLMs verwendet und ist dort erfolgreich dank enormer Rechenkapazitäten. Jedoch finden viele ausschlaggebende Operationen in einer Blackbox staꢀ und es besteht eine Tendenz zur Übergewichtung gewöhnlicher und alltäglicher edeutungen. 
Ein solcher Bias kann für Textarten, die von der ,natürlichen‘ Alltagssprache abweichen (z. B. literarische oder philosophische Texte) unbefriedigend sein.

Mehr Infos folgen in Kürze.

Zum Seitenanfang