„Wörter“
Der Text des Manuskripts enthält ca. 35.000 „Wörter“. Diese Wörter weisen phonotaktische Charakteristika ähnlich denen einer natürlichen Sprache auf, d. h.,
es lässt sich eine Teilmenge von Zeichen ausmachen, aus der ein oder mehrere Zeichen in jedem Wort erscheinen (analog den Vokalen), und
manche Kombinationen von Zeichen erscheinen nie.
Die statistische Analyse des Textes offenbart weitere Ähnlichkeiten mit natürlichen Sprachen:
die Worthäufigkeiten gehorchen dem Zipfschen Gesetz,
die Wortentropie gleicht mit ca. 10 Shannon/Wort der von Latein oder Englisch, und
manche Wörter erscheinen nur auf bestimmten Seiten oder in bestimmten Sektionen, andere erscheinen überall im Text. Insbesondere:
weisen die „Beschriftungen“ der Abbildungen nur sehr wenige Wiederholungen auf, und
in der „kräuterkundlichen“ Sektion erscheint das erste Wort jeder Seite nur auf dieser Seite (vielleicht der Name der betreffenden Pflanze).
Andere Eigentümlichkeiten des Voynich-Textes finden sich jedoch in europäischen Sprachen nirgends. Zum Beispiel gibt es kaum Wörter mit mehr als zehn, aber auch kaum welche mit weniger als drei Zeichen. Weiter scheint es initiale und finale Buchstabenformen zu geben, also Sonderformen von Zeichen am Wortanfang und -ende, wie sie in semitischen Sprachen gebräuchlich sind. Und schließlich erscheinen unmittelbare Wiederholungen des gleichen Wortes oder kleinere Varianten mit ungewöhnlicher Häufigkeit.