Todo estudo quantitativo do Tanach — e as sequências de letras equidistantes são exatamente isso — depende de uma pergunta prévia: exatamente qual texto você está medindo? Esta página responde a essa pergunta para o nosso buscador com precisão de uma letra: documentamos a cadeia completa da fonte, declaramos as regras de contagem, publicamos a tabela íntegra dos 39 livros e validamos o total contra o número que os soferim guardam há séculos.

A fonte, documentada elo por elo

Nosso buscador não usa "um texto hebraico da internet". Usa uma edição específica, com história editorial pública:

  • Edição: Miqra According to the Masorah (MAM, מקרא על פי המסורה) — edição digital do Tanach baseada no Códice de Alepo (כתר ארם צובא, o manuscrito massorético mais autorizado, vocalizado por Aharon ben Asher, séc. X) e em manuscritos relacionados para as partes faltantes. Cada decisão editorial do MAM está documentada publicamente.
  • Onde vive: o MAM é desenvolvido e mantido no Wikisource hebraico, com licença aberta CC-BY-SA.
  • Como chega até nós: a Sefaria distribui o MAM como sua versão hebraica padrão do Tanach. Isso não é suposição: a própria API da Sefaria o declara nos metadados (heVersionTitle: "Miqra according to the Masorah" e heVersionSource apontando para a página do projeto no Wikisource). Qualquer pessoa pode conferir a resposta crua da API.
  • Nosso buscador carrega esse texto, livro por livro, diretamente da API da Sefaria — a mesma cadeia de ponta a ponta.

Metodologia de contagem (as regras exatas)

Contagens do Tanach só são comparáveis quando as regras são declaradas. As nossas, aplicadas identicamente nesta tabela e no corpus do buscador:

  • Letra: todo caractere do alfabeto hebraico (Unicode U+05D0 a U+05EA: as 22 letras mais as 5 formas finais ך ם ן ף ץ). Sinais de vocalização (nikud) e cantilação (te'amim) não são letras e não são contados.
  • Texto escrito (ketiv), não lido (qerê): onde a Massorá registra uma palavra escrita de uma forma e lida de outra, contamos exclusivamente o ketiv — o que está fisicamente escrito no rolo. É a convenção da pesquisa ELS clássica.
  • Sem aparato editorial: as notas de rodapé do MAM (variantes de manuscritos), os marcadores de seção {פ}/{ס} e todo elemento de sinalização ficam fora: não são letras do Tanach.
  • Palavra: sequência de letras hebraicas delimitada por espaço ou maqaf (־). Ou seja, palavras unidas por maqaf contam separadamente.
  • Versículo: cada verso da divisão massorética padrão da edição.

A tabela completa

#LivroVersículosPalavrasLetras
1Gênesis בראשית1.53320.61278.063
2Êxodo שמות1.21016.71363.527
3Levítico ויקרא85911.95044.790
4Números במדבר1.28816.40863.529
5Deuteronômio דברים95614.29454.892
Torá — 5 livros5.84679.977304.801
6Josué יהושע65610.03139.730
7Juízes שופטים6189.88538.952
8I Samuel שמואל א81113.26151.357
9II Samuel שמואל ב69511.03342.179
10I Reis מלכים א81713.14050.625
11II Reis מלכים ב71912.27347.822
12Isaías ישעיהו1.29116.92566.874
13Jeremias ירמיהו1.36421.83184.899
14Ezequiel יחזקאל1.27318.73074.511
15Oseias הושע1972.3819.389
16Joel יואל739573.872
17Amós עמוס1462.0428.034
18Obadias עובדיה212911.119
19Jonas יונה486882.700
20Miqueias מיכה1051.3965.571
21Naum נחום475582.255
22Habacuque חבקוק566712.596
23Sofonias צפניה537672.995
24Ageu חגי386002.336
25Zacarias זכריה2113.12712.433
26Malaquias מלאכי558763.450
Neviʼim (Profetas) — 21 livros9.294141.463553.699
27Salmos תהלים2.52719.58378.822
28Provérbios משלי9156.91526.500
29איוב1.0708.34031.851
30Cântico dos Cânticos שיר השירים1171.2505.141
31Rute רות851.2944.949
32Lamentações איכה1541.5425.974
33Eclesiastes קהלת2222.98710.968
34Ester אסתר1673.04512.110
35Daniel דניאל3575.92324.280
36Esdras עזרא2803.75415.762
37Neemias נחמיה4055.31222.507
38I Crônicas דברי הימים א94310.74044.559
39II Crônicas דברי הימים ב82213.31554.917
Ketuvim (Escritos) — 13 livros8.06484.000338.340
TANACH COMPLETO — 39 livros23.204305.4401.196.840

A validação: por que estes números são confiáveis

Qualquer tabela se copia; uma tabela científica se valida. A tradição dos soferim — os escribas que copiam rolos letra por letra — guarda há séculos a contagem do Sêfer Torá: 304.805 letras. Nossa contagem computada da Torá dá 304.801. Uma diferença de exatamente 4 letras, ~0,0013%.

E aqui está o ponto decisivo: essa diferença não é um erro — é uma assinatura de autenticidade. O número 304.805 corresponde à ortografia dos rolos padrão atuais (tradição consolidada pelas edições impressas tardias), enquanto o Códice de Alepo de Ben Asher difere desses rolos em um punhado de casos documentados de escrita plena/defectiva (מלא/חסר). Um texto digital corrompido se desviaria por centenas ou milhares de letras; uma edição crítica fiel ao Códice de Alepo se desvia do rolo padrão exatamente nessa ordem de grandeza minúscula e explicável. As validações convergem:

  • Letras da Torá: 304.801 (MAM/Alepo) vs 304.805 (rolos padrão) — Δ de 4 letras, consistente com as diferenças plena/defectiva documentadas entre tradições.
  • Palavras da Torá: 79.977 — a contagem de referência citada é 79.976 (Δ = 1, atribuível a um caso-limite de divisão de palavra entre edições).
  • Versículos da Torá: 5.846 — exatamente a contagem das edições massoréticas modernas.
  • Versículos do Tanach: 23.204 — dentro da faixa massorética transmitida (~23.200).

Por que outros sites publicam números diferentes?

Compare tabelas de "letras da Bíblia" na internet e você verá variações. Quase sempre elas se explicam por quatro fatores raramente declarados: a edição de base (Alepo, Leningrado, Koren, edições impressas — diferem em escrita plena/defectiva), o tratamento do ketiv/qerê (contam o escrito, o lido, ou ambos?), a regra de palavra (o maqaf une ou separa?), e a contaminação silenciosa (notas editoriais, marcadores e caracteres de formatação contados como texto). Nossa tabela declara as quatro decisões — por isso cada número é defensável e reproduzível.

De fato, preparar este estudo nos levou a melhorar o próprio buscador: detectamos que as notas editoriais do MAM e o qerê duplicado estavam inflando o corpus em cerca de 5.600 letras (~0,5%), e corrigimos. O corpus atual é exatamente o texto escrito — os números desta tabela.

Reproduza você mesmo

Não acredite em nós: abra o buscador, carregue qualquer livro (ou o Tanach completo) e compare o total de letras do painel de informações com esta tabela. Eles coincidem porque são a mesma contagem sobre o mesmo texto. O procedimento completo — fonte, limpeza, regras — está descrito acima, e qualquer programador pode replicá-lo contra a API pública da Sefaria em uma tarde.

Nota: as contagens correspondem à edição MAM tal como distribuída pela API da Sefaria na data de publicação deste artigo. O MAM é uma edição viva, com correções editoriais documentadas; mudanças futuras seriam da ordem de letras individuais.