Literarischer Fingerabdruck

Nicht nur statistische Wahrscheinlichkeit, auch der Stil des einzelnen Autors bestimmt, wie oft selten oder häufig gebrauchte Wörter in einem literarischen Text vorkommen
Umeå (Schweden)/Bad Honnef - Gelten, wenn es um die Häufigkeit von Worten geht, für literarische Texte die selben Regeln wie für Gebrauchstexte - etwa Zeitungsartikel oder Bedienungsanleitungen? Nein, sagt jetzt ein internationales Forscherteam. Es zeigte, dass es eine Art literarischen Fingerabdruck gibt, und widerlegte damit die bisherige Annahme aus den 1930er Jahren, das so genannte "Zipfsche Gesetz". Die aktuelle Analyse der Worthäufigkeiten im Text beschreiben die Forscher im "New Journal of Physics". In den Werken dreier bekannter Autoren - Thomas Hardy, Herman Melville und D.H. Lawrence - zeigte sich, dass zumindest seltenere Wörter bei jedem Autor auf eine charakteristische Art häufig oder selten sind.

Das "Zipfsche Gesetz" stammt von dem Sprachwissenschaftler George K. Zipf (1902-1950), der die Häufigkeit der Wörter und den Rang, den sie gemäß dieser Häufigkeit einnehmen, in Zusammenhang brachte: Werden die Wörter einer Textmenge nach ihrer Häufigkeit geordnet, dann nimmt das häufigste Wort, im Deutschen meist "der" oder "und", den ersten Rang ein, während ein Wort wie "Kerze" vielleicht auf Platz 128 der Häufigkeit erscheint. Die Wahrscheinlichkeit, dass ein Wort in einem Text auftritt - so sagt das Zipfsche Gesetz - ist umgekehrt proportional zur Position in der Reihenfolge: Das zweithäufigste Wort kommt also nur halb so oft vor wie das erste Wort, das dritthäufigste Wort kommt nur ein Drittel mal so oft vor, das vierthäufigste Wort kommt nur ein Viertel mal so häufig vor wie das erste und so weiter. In einem Diagramm ergibt sich durch diese Korrelation eine Gerade.

Das Team um Sebastian Bernhardsson hat nun anhand der Werke von Herman Melville (1819-1891), Thomas Hardy (1840-1928) und D.H. Lawrence (1885-1930) das Zipfsche Gesetz überprüft. Dabei zeigte sich unter anderem, dass die Häufigkeit neuer Wörter im Laufe eines Werks abnahm. Außerdem konnten die Wissenschaftler feststellen, dass die Rate des Fallenlassens einzelner seltener Wörter von Autor zu Autor unterschiedlich war. Mehr noch: Diese Rate blieb innerhalb des Werks eines einzelnen Autors konstant. "Diese Ergebnisse führen uns zu dem Konzept eines Meta-Buchs, nämlich des Schreibens eines Textes, das durch den Prozess beschrieben werden kann, in dem der Autor ein Textstück gewissermaßen aus einem großen 'Mutterbuch' (eben aus dem Meta-Buch) zieht und es zu Papier bringt", erklären die Forscher. "Dieses Meta-Buch ist ein vorgestelltes unendliches Buch, das eine Darstellung der Worthäufigkeitscharakteristiken von all dem gibt, was ein bestimmter Autor sich auch immer zu schreiben ausdenken könnte."

© Wissenschaft aktuell
Quelle: "The meta book and size-dependent properties of written languages", Sebastian Bernhardsson, Luis Enrique Correa da Rocha, Petter Minnhagen; New Journal of Physics, Vol 11 (2009), doi:10.1088/1367-2630/11/12/123015


 

Home | Über uns | Kontakt | AGB | Impressum | Datenschutzerklärung
© Wissenschaft aktuell & Scientec Internet Applications + Media GmbH, Hamburg