BeNASch: Das Berner (früh-)Neuhochdeutsche Annotationsschema

Auf dieser Seite finden Sie das Berner (früh-)Neuhochdeutsche Annotationsschema. Es handelt sich dabei um Regeln zur Annotation von Texten, um gewisse Informationen wie Entitäten, z.B. Personen oder Organisationen, aber auch Ereignisse, auf systematische Weise zu vermerken.

Im Vordergrund stand die Motivation einen Standard zu etablieren, auf den Projekte, in welchen mit Texten in vormodernem Deutsch gearbeitet wird, zurückgreifen können und der eine weitgehende Kompatibilität zwischen den Projekten gewährleistet.

Das Schema wurde auch im Hinblick auf den grossen Nutzen, den Maschinelles Lernen bei der automatischen Annotation von textuellen Daten bringen kann, entwickelt.

Die Entwicklung von BeNASch ist ein Projekt von Mitgliedern der Digital Humanities der Universität Bern, die Mitsprache und Perspektiven von ausserhalb dieses Kreises sind aber äusserst erwünscht. Oben rechts findet sich ein Link zum Github-Repository des Projekts, darin können über das Issues oder das Discussions-Tab Änderungsvorschläge vorgebracht oder Diskussionen angestossen werden. Wer sich mit Git auskennt, darf z.B. Tippfehler, Umformulierungen oder Ergänzungen an Beispielen auch gerne per Pull-Request einreichen.

Neuigkeiten

BeNASch-Workshop im Januar 2025

Wir laden herzlich interessierte Forscher:innen zum ersten Workshop rund um das BeNASch-Schema ein, welcher am 23. und 24. Januar 2025 stattfinden wird. Der Workshop findet in Bern statt und ist kostenlos, alle weiteren Infos gibt es hier.

Regelmässige Meetings

Meetings zur Diskussion von Punkten aus dem Github-Forum finden alle zwei Wochen statt (siehe Forum). Bei Interesse bitte bei den Admins melden, wir freuen uns über jede zusätzliche Teilnehmer:in!

Änderungsprotokoll

Januar 2025

Überarbeitung des Schemas, insbesondere Namensgebung:

  • Stärkere Verwendung der deutschen Begrifflichkeiten (Kern statt Head).
  • Umbenennung von Attributen zu Appositionen.
  • Umbenennung von Deskriptoren zu Attributen.
  • Erwähnungs-Typen und Erwähnungspräzisionen wurden durch Kern-Klassen ersetzt.

November 2024

(für genaues Changelog siehe Github Repo)

  • Umbenennung von Beziehungen in Zustände, Beziehungen bezeichnen Zustände mit mehr als einer beteiligten Entität.
  • Entgliederung der Entitäten-Typologie aus der Entitäten-Annotation für bessere Übersichtlichkeit.
  • Einführung der Unterscheidung zwischen direkten und indirekten Koreferenzen.