Todo estudo quantitativo do Tanach — e as sequências de letras equidistantes são exatamente isso — depende de uma pergunta prévia: exatamente qual texto você está medindo? Esta página responde a essa pergunta para o nosso buscador com precisão de uma letra: documentamos a cadeia completa da fonte, declaramos as regras de contagem, publicamos a tabela íntegra dos 39 livros e validamos o total contra o número que os soferim guardam há séculos.
A fonte, documentada elo por elo
Nosso buscador não usa "um texto hebraico da internet". Usa uma edição específica, com história editorial pública:
- Edição: Miqra According to the Masorah (MAM, מקרא על פי המסורה) — edição digital do Tanach baseada no Códice de Alepo (כתר ארם צובא, o manuscrito massorético mais autorizado, vocalizado por Aharon ben Asher, séc. X) e em manuscritos relacionados para as partes faltantes. Cada decisão editorial do MAM está documentada publicamente.
- Onde vive: o MAM é desenvolvido e mantido no Wikisource hebraico, com licença aberta CC-BY-SA.
- Como chega até nós: a Sefaria distribui o MAM como sua versão hebraica padrão do Tanach. Isso não é suposição: a própria API da Sefaria o declara nos metadados (
heVersionTitle: "Miqra according to the Masorah"eheVersionSourceapontando para a página do projeto no Wikisource). Qualquer pessoa pode conferir a resposta crua da API. - Nosso buscador carrega esse texto, livro por livro, diretamente da API da Sefaria — a mesma cadeia de ponta a ponta.
Metodologia de contagem (as regras exatas)
Contagens do Tanach só são comparáveis quando as regras são declaradas. As nossas, aplicadas identicamente nesta tabela e no corpus do buscador:
- Letra: todo caractere do alfabeto hebraico (Unicode U+05D0 a U+05EA: as 22 letras mais as 5 formas finais ך ם ן ף ץ). Sinais de vocalização (nikud) e cantilação (te'amim) não são letras e não são contados.
- Texto escrito (ketiv), não lido (qerê): onde a Massorá registra uma palavra escrita de uma forma e lida de outra, contamos exclusivamente o ketiv — o que está fisicamente escrito no rolo. É a convenção da pesquisa ELS clássica.
- Sem aparato editorial: as notas de rodapé do MAM (variantes de manuscritos), os marcadores de seção {פ}/{ס} e todo elemento de sinalização ficam fora: não são letras do Tanach.
- Palavra: sequência de letras hebraicas delimitada por espaço ou maqaf (־). Ou seja, palavras unidas por maqaf contam separadamente.
- Versículo: cada verso da divisão massorética padrão da edição.
A tabela completa
| # | Livro | Versículos | Palavras | Letras |
|---|---|---|---|---|
| 1 | Gênesis בראשית | 1.533 | 20.612 | 78.063 |
| 2 | Êxodo שמות | 1.210 | 16.713 | 63.527 |
| 3 | Levítico ויקרא | 859 | 11.950 | 44.790 |
| 4 | Números במדבר | 1.288 | 16.408 | 63.529 |
| 5 | Deuteronômio דברים | 956 | 14.294 | 54.892 |
| Torá — 5 livros | 5.846 | 79.977 | 304.801 | |
| 6 | Josué יהושע | 656 | 10.031 | 39.730 |
| 7 | Juízes שופטים | 618 | 9.885 | 38.952 |
| 8 | I Samuel שמואל א | 811 | 13.261 | 51.357 |
| 9 | II Samuel שמואל ב | 695 | 11.033 | 42.179 |
| 10 | I Reis מלכים א | 817 | 13.140 | 50.625 |
| 11 | II Reis מלכים ב | 719 | 12.273 | 47.822 |
| 12 | Isaías ישעיהו | 1.291 | 16.925 | 66.874 |
| 13 | Jeremias ירמיהו | 1.364 | 21.831 | 84.899 |
| 14 | Ezequiel יחזקאל | 1.273 | 18.730 | 74.511 |
| 15 | Oseias הושע | 197 | 2.381 | 9.389 |
| 16 | Joel יואל | 73 | 957 | 3.872 |
| 17 | Amós עמוס | 146 | 2.042 | 8.034 |
| 18 | Obadias עובדיה | 21 | 291 | 1.119 |
| 19 | Jonas יונה | 48 | 688 | 2.700 |
| 20 | Miqueias מיכה | 105 | 1.396 | 5.571 |
| 21 | Naum נחום | 47 | 558 | 2.255 |
| 22 | Habacuque חבקוק | 56 | 671 | 2.596 |
| 23 | Sofonias צפניה | 53 | 767 | 2.995 |
| 24 | Ageu חגי | 38 | 600 | 2.336 |
| 25 | Zacarias זכריה | 211 | 3.127 | 12.433 |
| 26 | Malaquias מלאכי | 55 | 876 | 3.450 |
| Neviʼim (Profetas) — 21 livros | 9.294 | 141.463 | 553.699 | |
| 27 | Salmos תהלים | 2.527 | 19.583 | 78.822 |
| 28 | Provérbios משלי | 915 | 6.915 | 26.500 |
| 29 | Jó איוב | 1.070 | 8.340 | 31.851 |
| 30 | Cântico dos Cânticos שיר השירים | 117 | 1.250 | 5.141 |
| 31 | Rute רות | 85 | 1.294 | 4.949 |
| 32 | Lamentações איכה | 154 | 1.542 | 5.974 |
| 33 | Eclesiastes קהלת | 222 | 2.987 | 10.968 |
| 34 | Ester אסתר | 167 | 3.045 | 12.110 |
| 35 | Daniel דניאל | 357 | 5.923 | 24.280 |
| 36 | Esdras עזרא | 280 | 3.754 | 15.762 |
| 37 | Neemias נחמיה | 405 | 5.312 | 22.507 |
| 38 | I Crônicas דברי הימים א | 943 | 10.740 | 44.559 |
| 39 | II Crônicas דברי הימים ב | 822 | 13.315 | 54.917 |
| Ketuvim (Escritos) — 13 livros | 8.064 | 84.000 | 338.340 | |
| TANACH COMPLETO — 39 livros | 23.204 | 305.440 | 1.196.840 |
A validação: por que estes números são confiáveis
Qualquer tabela se copia; uma tabela científica se valida. A tradição dos soferim — os escribas que copiam rolos letra por letra — guarda há séculos a contagem do Sêfer Torá: 304.805 letras. Nossa contagem computada da Torá dá 304.801. Uma diferença de exatamente 4 letras, ~0,0013%.
E aqui está o ponto decisivo: essa diferença não é um erro — é uma assinatura de autenticidade. O número 304.805 corresponde à ortografia dos rolos padrão atuais (tradição consolidada pelas edições impressas tardias), enquanto o Códice de Alepo de Ben Asher difere desses rolos em um punhado de casos documentados de escrita plena/defectiva (מלא/חסר). Um texto digital corrompido se desviaria por centenas ou milhares de letras; uma edição crítica fiel ao Códice de Alepo se desvia do rolo padrão exatamente nessa ordem de grandeza minúscula e explicável. As validações convergem:
- Letras da Torá: 304.801 (MAM/Alepo) vs 304.805 (rolos padrão) — Δ de 4 letras, consistente com as diferenças plena/defectiva documentadas entre tradições.
- Palavras da Torá: 79.977 — a contagem de referência citada é 79.976 (Δ = 1, atribuível a um caso-limite de divisão de palavra entre edições).
- Versículos da Torá: 5.846 — exatamente a contagem das edições massoréticas modernas.
- Versículos do Tanach: 23.204 — dentro da faixa massorética transmitida (~23.200).
Por que outros sites publicam números diferentes?
Compare tabelas de "letras da Bíblia" na internet e você verá variações. Quase sempre elas se explicam por quatro fatores raramente declarados: a edição de base (Alepo, Leningrado, Koren, edições impressas — diferem em escrita plena/defectiva), o tratamento do ketiv/qerê (contam o escrito, o lido, ou ambos?), a regra de palavra (o maqaf une ou separa?), e a contaminação silenciosa (notas editoriais, marcadores e caracteres de formatação contados como texto). Nossa tabela declara as quatro decisões — por isso cada número é defensável e reproduzível.
De fato, preparar este estudo nos levou a melhorar o próprio buscador: detectamos que as notas editoriais do MAM e o qerê duplicado estavam inflando o corpus em cerca de 5.600 letras (~0,5%), e corrigimos. O corpus atual é exatamente o texto escrito — os números desta tabela.
Reproduza você mesmo
Não acredite em nós: abra o buscador, carregue qualquer livro (ou o Tanach completo) e compare o total de letras do painel de informações com esta tabela. Eles coincidem porque são a mesma contagem sobre o mesmo texto. O procedimento completo — fonte, limpeza, regras — está descrito acima, e qualquer programador pode replicá-lo contra a API pública da Sefaria em uma tarde.
Nota: as contagens correspondem à edição MAM tal como distribuída pela API da Sefaria na data de publicação deste artigo. O MAM é uma edição viva, com correções editoriais documentadas; mudanças futuras seriam da ordem de letras individuais.