Technisches Konzept

Graphenmodell

Zusammenhänge zwischen Entitäten (Person, Ort, Zeit, Idee) werden im Cosmotool zukünftig in Form eines gewichteten Graphen modelliert. Entitäten werden dabei durch Knoten, Bezüge zwischen den Entitäten durch Kanten repräsentiert. Aufgrund der typischen Unsicherheit erkannter Bezüge – insbesondere im Fall der Identifizierung durch automatische Verfahren – wird eine errechnete Konfidenz in Form des Kantengewichts abgebildet.

Erste Arbeiten der Implementierung wurden hierzu bereits durchgeführt. Wissenschaftlich spannend ist hierbei insbesondere die Integration von Konfidenzwerten (Kantengewichte), sowie die Transparenz deren Herleitung. Am Lehrstuhl Medieninformatik1 ist hierzu eine Abschlussarbeit ausgeschrieben, um an dieser Stelle zusätzliche, fundierte Perspektiven zu generieren.

Qualitative Verfahren

Der Erfolg quantitativer Verfahren für die Erkennung und Einschätzung biographischer Ereignisse und insbesondere der Erkennung und Zuweisung von ideengeschichtlicher Aspekte ist insbesondere von der gezielten Steuerbarkeit durch qualifizierte Experten abhängig.

_images/qualitative_quantitative_interaktion.png

Obige Abbildung zeigt die drei im Cosmotool vorgesehenen Stellen der qualitativen Interaktion: Neben manueller Korrekturmöglichkeiten an biographischen Profilen soll insbesondere die Veränderung von Heuristiken und Modellen, also des in semi-automatischen Verfahren angewendeten Domänenwissens ermöglicht werden. Zudem erhalten Anwender des Systems Möglichkeiten die Zusammenstellung betrachteter Datenbasen zu verändern. Dies bedeutet die Eintragung, Veränderung oder Löschung von Einträgen in der dedizierten Collection Registry bzw. auch die Selektion relevanter Quellen zum Anfragezeitpunkt.

Wortfelder

Als erster weiterführender, methodischer Schritt zur Klassifikation und Beschreibung von Personengruppen wurde eine Möglichkeit zur Registrierung definitorischer Wortfelder implementiert. Als Wortfeld wird eine Menge von Begriffen verstanden, die in einem Bedeutungszusammenhang stehen. Für den Einsatz im Cosmotool ist vorgesehen, dass Domänenexperten global sichtbare, übrige Anwender individuell verwendbare Wortfelder definieren können, die eine Selektion und Klassifikation von Personen erlaubt. Um im Beispiel des qualitativ erarbeiteten Pietistennetzwerks durch quantitative Unterstützung weitere Personen zuweisen zu können, erarbeitet das IEG derzeit klassifizierende Wortfelder für religiöse Gruppen. Neben der manuellen, direkten Erfassung von Wortfeldern ist zudem die Errechnung solcher auf Basis definitorischer Texte vorgesehen.