Abstract: CRF-Classifier für automatische Annotation männlicher, weiblicher und neutraler Genderzuschreibungen in deutschsprachiger Literatur. Der Gender-Classifier kann mit dem Stanford Named Entity Recognizer zusammen genutzt werden. Das Modell wurde mit einem Trainingskorpus folgender Zusammensetzung trainiert: ca. 100.000 Tokens aus 25 Novellen des deutschen Novellenschatzes ca. 40.000 Tokens aus 10 Romanen des 18. Jahrhunderts ca. 40.000 Tokens aus 10 Romanen des 19. Jahrhunderts ca. 40.000 Tokens aus 10 Romanen des 20. Jahrhunderts ca. 40.000 Tok...
(read more)