Un ELS est de l'arithmétique pure : depuis une position initiale, prendre une lettre toutes les d positions. Si le texte a une seule lettre en trop ou en moins avant votre séquence, toutes les positions se décalent et la découverte apparaît, disparaît ou change de place. C'est pourquoi, avant de chercher quoi que ce soit, il faut répondre avec une précision absolue : combien de lettres compte la Torah, et lesquelles ?
« Le » nombre n'existe pas — il existe des éditions
La question « combien de lettres compte la Torah ? » n'a pas une réponse unique, mais une réponse par tradition textuelle. Les manuscrits massorétiques les plus autorisés diffèrent entre eux d'une poignée de lettres — presque toutes des variantes d'écriture pleine ou défective (malé/ḥaser : la présence ou l'omission d'un ו ou d'un י comme mater lectionis), qui ne changent ni la lecture ni le sens, mais bien le comptage :
- Édition Koren / textus receptus — 304 805 lettres. Le texte des rouleaux standard et des éditions imprimées classiques. C'est le texte qu'ont utilisé Witztum, Rips et Rosenberg dans l'expérience publiée dans Statistical Science (1994), et celui qu'utilise pratiquement toute la recherche sur les codes depuis.
- Miqra According to the Masorah (MAM) — 304 801 lettres. Édition numérique fondée sur le Codex d'Alep (Ben Asher, Xe s.), le manuscrit massorétique le plus autorisé. Elle est développée ouvertement sur Wikisource hébreu sous licence CC-BY-SA.
- Codex de Léningrad — 304 850 lettres. Le plus ancien manuscrit complet, base de la Biblia Hebraica académique. Il diffère des précédents par des dizaines de lettres.
Quatre lettres entre Koren et MAM. Quarante-cinq entre Koren et Léningrad. Pour lire le texte, sans importance. Pour un saut fixe de milliers de positions, décisif.
Notre décision : Koren pour la Torah
Nous avons adopté l'édition Koren (304 805 lettres) comme texte canonique du moteur pour les cinq livres de la Torah, pour trois raisons :
- C'est le standard de la discipline. Toutes les découvertes publiées de la littérature ELS — de Weissmandl à WRR et à leurs critiques — ont été calculées sur ce texte. Pour reproduire une découverte avec son saut exact, il faut chercher dans le même texte.
- Il est stable. Le textus receptus est fixé depuis des siècles ; il n'a pas d'histoire éditoriale active. MAM, en revanche, est un projet vivant qui continue de recevoir des corrections — une vertu éditoriale, mais un risque pour la reproductibilité d'une recherche arithmétique.
- Il est vérifiable. Son comptage (304 805) est le nombre publiquement documenté contre lequel chacun peut auditer notre corpus.
Les 9 différences, documentées une par une
Notre corpus part de l'édition MAM (Wikisource hébreu, licence ouverte CC-BY-SA) et applique les 9 variantes documentées qui la séparent du texte Koren. Ce sont celles-ci — et seulement celles-ci :
| # | Verset | MAM (Alep) | Koren | Type |
|---|---|---|---|---|
| 1 | Genèse 4:13 | מנשא | מנשוא | +1 (pleine) |
| 2 | Genèse 7:11 | מעינת | מעינות | +1 (pleine) |
| 3 | Genèse 9:29 | ויהיו | ויהי | −1 |
| 4 | Exode 25:31 | תעשה | תיעשה | +1 (pleine) |
| 5 | Exode 28:26 | האפד | האפוד | +1 (pleine) |
| 6 | Nombres 1:17 | בשמת | בשמות | +1 (pleine) |
| 7 | Nombres 10:10 | חדשיכם | חדשכם | −1 (défective) |
| 8 | Nombres 22:5 | בער | בעור | +1 (pleine) |
| 9 | Deutéronome 23:2 | דכא | דכה | 0 (substitution) |
Bilan : +6 −2 = +4 lettres → 304 801 + 4 = 304 805. Il existe en outre une dixième différence qui ne change aucune lettre : dans Koren, les mots ויהי אחרי המגפה forment le verset Nombres 25:19 ; dans MAM ils sont le début de Nombres 26:1. Même Torah, numérotation différente — la Torah Koren compte 5 847 versets.
Comment nous le vérifions (et comment vous pouvez le vérifier vous-même)
- Collation lettre par lettre contre le texte de Rips. Nous avons comparé notre corpus complet — les 5 847 versets — au texte Koren distribué par le projet TorahBibleCodes (le même fichier dérivé du texte utilisé par Eliyahou Rips). Résultat : identité totale, 304 805 sur 304 805.
- Checksums figés. Le flux de lettres de chaque livre possède une empreinte SHA-256 enregistrée dans le dépôt. Chaque build du site re-vérifie les 39 livres du Tanakh contre ces empreintes ; si une seule lettre changeait, le site ne serait pas publié.
- Comptages canoniques comme invariant. Genèse 78 064 · Exode 63 529 · Lévitique 44 790 · Nombres 63 530 · Deutéronome 54 892. Tout écart arrête le build.
- Ketiv, non qeré. Là où la Massore ordonne d'écrire une chose et d'en lire une autre, le corpus contient exclusivement ce qui est écrit dans le rouleau — la convention de toute la recherche ELS.
Et le reste du Tanakh ?
Hors de la Torah, il n'existe pas de « texte Koren de référence » dans la littérature des codes (l'expérience WRR a été menée sur la Genèse). Pour les Nevi'im et les Ketouvim, nous utilisons l'édition MAM figée — même source ouverte, mêmes checksums, même garantie de reproductibilité. La table complète des comptages par livre se trouve dans notre article sur les nombres du Tanakh.
Le rouleau que vous voyez à l'écran
Le visualiseur du Sefer Torah (les amudim avec la stichographie traditionnelle) utilise les données de tikkun.io, dont le texte suit la tradition de Ben Asher. Notre index d'alignement parcourt les deux textes lettre par lettre et vérifie à chaque build qu'ils diffèrent exactement par les 9 variantes de la table — pas une de plus. En ces 9 points, le surlignage s'ancre à la lettre voisine du rouleau ; pour les 304 796 autres lettres, la correspondance est exacte.