Netzwerkanalyse
Grundlagen der digitalen Netzwerkanalyse
Wie die meisten anderen digitalen Analyseverfahren ist auch die digitale Netzwerkanalyse in den Philologien eine vergleichsweise ‚junge‘ Disziplin. Ursprünglich stammt der Ansatz, Daten in Form von Netzwerken zu verarbeiten aus der Mathematik. Das Teilgebiet der Mathematik, das sich mit Netzwerken (bzw. Graphen) beschäftigt, ist die Graphentheorie. Dort geht es darum, Graphen, die aus Knoten und Kanten bestehen. Knoten kann man sich wie ‚Datenpunkte‘ oder oft wie eine Form von Entitäten vorstellen. Die Kanten stellen dagegen die Verbindungen zwischen den Knoten dar.[1] Neben der Mathematik ist auch die Informatik eine Disziplin, die sich mit Graphen auseinandersetzt. Bekannte Beispiele der Verwendung von Graphen in der Informatik sind Routenplanung oder Suchmaschinen.[2] Weiterhin gibt es auch Graphendatenbanken[3] sowie Ansätze, künstliche Intelligenz auf Graphen aufzubauen.[4]
Netzwerkanalyse in der Literaturwissenschaft
In den Sozialwissenschaften fand die digitale Netzwerkanalyse bereits Ende des 20. Jahrhunderts intensiv Anwendung. In der Literaturwissenschaft entstand etwas später, ab ca., den 2000er Jahren, ein verstärktes Interesse für diese Analysemethode. Prädestiniert für die Arbeit mit der Netzwerkanalyse sind dabei Dramentexte. Die Figuren eines Dramas und deren Interaktionen lassen sich intuitiv mithilfe der Netzwerkanalyse abbilden und tiefergehend analysieren. Hierbei ist v.a. zwischen Kopräsenznetzwerken und Interaktionsnetzwerken zu unterscheiden. Kopräsenznetzwerke konzentrieren sich darauf, welche Figuren gemeinsam auf der Bühne auftreten. Interaktionsnetzwerke fokussieren dagegen, welche Figuren miteinander direkt interagieren. Dabei stehen meist Redebeiträge bzw. pragmatisch interpretiert Sprechakte im Vordergrund.[5]
Neben Dramentexten lassen sich aber auch andere Texte mithilfe der Netzwerkanalyse bearbeiten. Romane und deren Figuren können beispielsweise ebenfalls auf diese Weise untersucht werden. Andere Phänomene, die sich für die Arbeit mit Netzwerken anbieten, sind Korrespondenzbeziehungen oder auch Zitationen bzw. weiter gefasst auch Intertextualität. Neben der praktischen Anwendung der Netzwerkanalyse kann auch die Beschäftigung mit Texten und ihren Netzwerken auf einer epistemologischen Ebene aufschlussreich sein.[6]
Praktische Anwendung
In der Praxis stehen zahlreiche Software-Tools für die digitale Netzwerkanalyse zu Verfügung. Eines der bekanntesten und in der Literaturwissenschaft verbreitetsten dürfte Gephi sein.[7] Gephi erlaubt einerseits die Visualisierung von Netzwerken mithilfe verschiedener Layouts. Diese stellen in der Regel Transformationen mithilfe speziell für Netzwerke entwickelter Algorithmen dar. Ein Beispiel für einen solchen Algorithmus ist der Fruchterman-Reingold-Algorithmus.[8] Darüber hinaus erlaubt Gephi auch die mathematische Analyse der Netzwerkdaten. So können insbesondere verschiedene Zentralitätsmaße berechnet werden. Diese beschreiben, grosso modo, welche Knoten ‚zentral‘ im Netzwerk liegen. Dabei unterscheidet sich die Art der Zentralität, also was unter ‚zentral‘ konkret verstanden ist, je nach Zentralitätsmaß. So basiert die Gradzentralität oder Degree Centrality auf der Annahme, dass Knoten mit vielen Kanten ‚zentral‘ sind. Eher ‚topgraphisch‘ orientiert ist die Exzentrizität oder Eccentricity. Diese betrachtet die „Distanz eines Knotens zum am weitesten von diesem entfernten Knoten“.[9]
Textdaten für die Netzwerkanalyse
Gephi bietet zwar eine nützliche ‚Infrastruktur‘ für die Netzwerkanalyse an. Die zu untersuchenden Daten müssen jedoch von außen eingebracht werden. Im Falle von Gephi müssen hierzu die Knoten und Kanten in Form tabellarischer Daten (in der Regel CSV) hinterlegt werden. Dies kann entweder manuell in Gephi selbst oder über einen Import geschehen. Die Datentabellen wiederum müssen aus den Texten generiert werden. Das bedeutet, man muss entweder manuell oder (semi-)automatisiert die interessierenden Daten aus den Texten extrahieren. Oft bedeutet dies, dass die ursprünglichen Texte (meist manuell) annotiert werden, um z.B. Redebeiträge zu markieren und zu beschreiben. Danach kann mithilfe eines selbst geschriebenen Skripts (z.B. in Python) eine Extraktion der Daten und Transformation in ein für Gephi lesbares Format (z.B. CSV) erfolgen.[10]
Somit bedeutet die Netzwerkanalyse einen nicht zu unterschätzenden Arbeitsaufwand. Dies ist v.a. der Fall, wenn man komplexere Verbindungen in den Texten freilegen will. Auch eine Detailbetrachtung. z.B. bei der Erstellung von Interaktionsnetzwerken von Dramen, geht mit einer zeitintensiven Vorarbeit einher. Neben er komplett eigenständigen Verarbeitung des Textmaterials bietet sich der Rückgriff auf DraCor an.[11] DraCor ist ein umfangreiches Korpus von Dramentexten unterschiedlicher Sprachen. Auch für das Italienische stehen einige Texte zur Verfügung, insbesondere aus der Zeit vor 1900. Bei DraCor sind zum einen die Texte im TEI XML-Format hinterlegt, das für die weitere Annotation gut geeignet ist. Außerdem finden sich für viele Dramentexte bereits vorgefertigte Netzwerke. Diese sind zwar meist eher schlicht und sind in der Regel Kopräsenznetzwerke. Dennoch bieten sie einen guten Ausgangspunkt für weitere Analysen.
Literaturnachweise
- Vgl. u.a. DIESTEL, Reinhard 2017: Graph Theory. Berlin/Heidelberg. Vgl. außerdem STEGER, Angelika 2007: Diskrete Strukturen. Bd. 1: Kombinatorik, Graphentheorie, Algebra. Berlin/Heidelberg.[↩]
- Vgl. zur Informatik einführend u.a. TURAU, Volker 2009: Algorithmische Graphentheorie, München.[↩]
- Vgl. immer noch für die Grundlagen von Graphendatenbanken gültig ANGLES, Renzo/GUTIERREZ, Claudio 2008: „Survey of graph database models“, in: ACM Computing Surveys, 40, 1, S. 1–39, online unter: https://arxiv.org/abs/1704.08829.[↩]
- Vgl. als Übersicht v.a. WU, Lingfei/CUI, Peng/PEI, Jian/ZHAO, Liang (Hgg.) 2022: Graph Neural Networks: Foundations, Frontiers, and Applications, Singapore.[↩]
- Vgl. hierzu auch RESCH, Sascha 2024: „Mandragola und Clizia aus der Perspektive der digitalen Netzwerkanalyse“, in: Philologie im Netz, 97, S. 95–111, hier: v.a. 97–98, online unter: https://web.fu-berlin.de/phin/phin97/p97t7.pdf[↩]
- Vgl. u.a.TRILCKE, Peer/FISCHER, Frank 2018: „Literaturwissenschaft als Hackathon. Zur Praxeologie der Digital Literary Studies und ihren epistemischen Dingen“, in: Wie Digitalität die Geisteswissenschaften verändert. Neue Forschungsgegenstände und Methoden, hg. von Martin Huber, Sybille Krämer, o.S., online uner: https://zfdg.de/sonderband/3 bzw. https://zfdg.de/sb003_003. [↩]
- Vgl. BASTIAN, Mathieu/HEYMANN, Sébastien/JACOMY, Mathieu 2009: Gephi: an open source software for exploring and manipulating networks, online unter: https://gephi.org/.[↩]
- Vgl. für den Algorithmus FRUCHTERMAN, Thomas M. J./REINGOLD, Edward M. 1991: „Graph drawing by force-directed placement“, in: Software: Experience and Practice, 21, S. 1129–1164.[↩]
- RESCH, Sascha 2024: „Mandragola und Clizia aus der Perspektive der digitalen Netzwerkanalyse“, in: Philologie im Netz, 97, S. 95–111, hier: 99, online unter: https://web.fu-berlin.de/phin/phin97/p97t7.pdf[↩]
- Vgl. RESCH, Sascha 2024: „Mandragola und Clizia aus der Perspektive der digitalen Netzwerkanalyse“, in: Philologie im Netz, 97, S. 95–111, hier: v.a. 100–104, online unter: https://web.fu-berlin.de/phin/phin97/p97t7.pdf[↩]
- Vgl. FISCHER, Frank u.a. 2019: „Programmable Corpora: Introducing DraCor, an Infrastructure for the Research on European Drama“, in: Proceedings of DH2019: „Complexities“. Utrecht University, online unter: https://zenodo.org/records/4284002 bzw. https://dracor.org.[↩]