Literarischer Fingerabdruck
Das "Zipfsche Gesetz" stammt von dem Sprachwissenschaftler George K. Zipf (1902-1950), der die Häufigkeit der Wörter und den Rang, den sie gemäß dieser Häufigkeit einnehmen, in Zusammenhang brachte: Werden die Wörter einer Textmenge nach ihrer Häufigkeit geordnet, dann nimmt das häufigste Wort, im Deutschen meist "der" oder "und", den ersten Rang ein, während ein Wort wie "Kerze" vielleicht auf Platz 128 der Häufigkeit erscheint. Die Wahrscheinlichkeit, dass ein Wort in einem Text auftritt - so sagt das Zipfsche Gesetz - ist umgekehrt proportional zur Position in der Reihenfolge: Das zweithäufigste Wort kommt also nur halb so oft vor wie das erste Wort, das dritthäufigste Wort kommt nur ein Drittel mal so oft vor, das vierthäufigste Wort kommt nur ein Viertel mal so häufig vor wie das erste und so weiter. In einem Diagramm ergibt sich durch diese Korrelation eine Gerade.
Das Team um Sebastian Bernhardsson hat nun anhand der Werke von Herman Melville (1819-1891), Thomas Hardy (1840-1928) und D.H. Lawrence (1885-1930) das Zipfsche Gesetz überprüft. Dabei zeigte sich unter anderem, dass die Häufigkeit neuer Wörter im Laufe eines Werks abnahm. Außerdem konnten die Wissenschaftler feststellen, dass die Rate des Fallenlassens einzelner seltener Wörter von Autor zu Autor unterschiedlich war. Mehr noch: Diese Rate blieb innerhalb des Werks eines einzelnen Autors konstant. "Diese Ergebnisse führen uns zu dem Konzept eines Meta-Buchs, nämlich des Schreibens eines Textes, das durch den Prozess beschrieben werden kann, in dem der Autor ein Textstück gewissermaßen aus einem großen 'Mutterbuch' (eben aus dem Meta-Buch) zieht und es zu Papier bringt", erklären die Forscher. "Dieses Meta-Buch ist ein vorgestelltes unendliches Buch, das eine Darstellung der Worthäufigkeitscharakteristiken von all dem gibt, was ein bestimmter Autor sich auch immer zu schreiben ausdenken könnte."