Um ELS é aritmética pura: a partir de uma posição inicial, tomar uma letra a cada d posições. Se ao texto sobra ou falta uma única letra antes da sua sequência, todas as posições se deslocam e o achado aparece, desaparece ou muda de lugar. Por isso, antes de buscar qualquer coisa, é preciso responder com precisão absoluta: quantas letras tem a Torá, e quais são elas?

Não existe "o" número — existem as edições

A pergunta "quantas letras tem a Torá?" não tem uma única resposta, mas uma resposta por tradição textual. Os manuscritos massoréticos mais autorizados diferem entre si em um punhado de letras — quase todas variantes de escrita plena ou defectiva (malê/chaser: a presença ou omissão de um ו ou de um י como mater lectionis), que não mudam a leitura nem o significado, mas mudam a contagem:

  • Edição Koren / textus receptus — 304,805 letras. O texto dos rolos padrão e das edições impressas clássicas. É o texto que Witztum, Rips e Rosenberg usaram no experimento publicado na Statistical Science (1994), e o que usa praticamente toda a pesquisa de códigos desde então.
  • Miqra According to the Masorah (MAM) — 304,801 letras. Edição digital baseada no Códice de Alepo (Ben Asher, séc. X), o manuscrito massorético mais autorizado. Desenvolve-se abertamente no Wikisource hebraico com licença CC-BY-SA.
  • Códice de Leningrado — 304,850 letras. O manuscrito completo mais antigo, base da Biblia Hebraica acadêmica. Difere dos anteriores em dezenas de letras.

Quatro letras entre Koren e MAM. Quarenta e cinco entre Koren e Leningrado. Para ler o texto, irrelevante. Para um salto fixo de milhares de posições, decisivo.

Nossa decisão: Koren para a Torá

Adotamos a edição Koren (304,805 letras) como texto canônico do buscador para os cinco livros da Torá, por três razões:

  • É o padrão da disciplina. Todos os achados publicados da literatura ELS — de Weissmandl a WRR e seus críticos — foram calculados sobre este texto. Para reproduzir um achado com seu salto exato, é preciso buscar no mesmo texto.
  • É estável. O textus receptus está fixado há séculos; não tem história editorial ativa. O MAM, em contrapartida, é um projeto vivo que continua recebendo correções — virtude editorial, mas risco para a reprodutibilidade de uma busca aritmética.
  • É verificável. Sua contagem (304,805) é o número publicamente documentado contra o qual qualquer pessoa pode auditar nosso corpus.

As 9 diferenças, documentadas uma por uma

Nosso corpus parte da edição MAM (Wikisource hebraico, licença aberta CC-BY-SA) e aplica as 9 variantes documentadas que a separam do texto Koren. São estas — e somente estas:

#VersículoMAM (Alepo)KorenTipo
1Gênesis 4:13מנשאמנשוא+1 (plena)
2Gênesis 7:11מעינתמעינות+1 (plena)
3Gênesis 9:29ויהיוויהי−1
4Êxodo 25:31תעשהתיעשה+1 (plena)
5Êxodo 28:26האפדהאפוד+1 (plena)
6Números 1:17בשמתבשמות+1 (plena)
7Números 10:10חדשיכםחדשכם−1 (defectiva)
8Números 22:5בערבעור+1 (plena)
9Deuteronômio 23:2דכאדכה0 (substituição)

Balanço: +6 −2 = +4 letras → 304,801 + 4 = 304,805. Há ainda uma décima diferença que não muda nenhuma letra: na Koren, as palavras ויהי אחרי המגפה formam o versículo Números 25:19; no MAM são o começo de Números 26:1. Mesma Torá, numeração diferente — a Torá Koren tem 5,847 versículos.

Como verificamos (e como você mesmo pode verificar)

  • Cotejo letra por letra contra o texto de Rips. Comparamos nosso corpus completo — os 5,847 versículos — com o texto Koren distribuído pelo projeto TorahBibleCodes (o mesmo arquivo derivado do texto usado por Eliyahu Rips). Resultado: identidade total, 304,805 de 304,805.
  • Checksums congelados. O fluxo de letras de cada livro tem uma impressão digital SHA-256 registrada no repositório. Cada build do site re-verifica os 39 livros do Tanach contra essas impressões; se uma única letra mudasse, o site não seria publicado.
  • Contagens canônicas como invariante. Gênesis 78,064 · Êxodo 63,529 · Levítico 44,790 · Números 63,530 · Deuteronômio 54,892. Qualquer desvio interrompe o build.
  • Ketiv, não qerê. Onde a massorá manda escrever uma coisa e ler outra, o corpus contém exclusivamente o que está escrito no rolo — a convenção de toda a pesquisa ELS.

E o resto do Tanach?

Fora da Torá não existe um "texto Koren de referência" na literatura de códigos (o experimento WRR foi feito sobre o Gênesis). Para Nevi'im e Ketuvim usamos a edição MAM congelada — mesma fonte aberta, mesmos checksums, mesma garantia de reprodutibilidade. A tabela completa de contagens por livro está em nosso artigo sobre os números do Tanach.

O rolo que você vê na tela

O visualizador do Sefer Torá (os amudim com a esticografia tradicional) usa os dados do tikkun.io, cujo texto segue a tradição de Ben Asher. Nosso índice de alinhamento percorre ambos os textos letra por letra e verifica em cada build que eles diferem exatamente nas 9 variantes da tabela — nem uma a mais. Nesses 9 pontos, o destaque se ancora à letra vizinha do rolo; nas outras 304,796 letras, a correspondência é exata.