Übung 3
Laden Sie sich folgende Beispieldatei im TEI-XML-Format herunter: [Link Datei].
Öffnen Sie diese mit einem passenden Programm. Am einfachsten ist es, einen zusammen mit Ihrem Betriebssystem installierten Editor zu verwenden. Wenn Sie eine Umgebung zum Programmieren wie Visual Studio Code installiert haben, öffnen Sie die Datei am besten damit, dadurch werden die XML-Elemente automatisch vom Text farblich abgesetzt. Sie können die Datei auch mit einem Webbrowser öffnen.
Schauen Sie sich die Datei an. Welche annotierten Entitäten können Sie erkennen? Welche Informationen werden durch die Annotation jeweils zusätzlich maschinenlesbar gespeichert? Wie unterscheiden sich die einzelnen Entitäten hinsichtlich ihres Informationsgehalts?
Literatur und Quellenangaben
Keraghel, Imed, Stanislas Morbieu, und Mohamed Nadif. 2024. „Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study“. arXiv. https://doi.org/10.48550/arXiv.2401.10825.
