Quantas letras tem a Torá?

A Torá tem 304.805 letras na edição Koren (textus receptus) — a contagem que a tradição dos soferim guarda e o texto sobre o qual foi feita toda a pesquisa ELS publicada. É o texto do nosso buscador, contando exclusivamente o que está escrito no rolo (ketiv). A edição do Códice de Alepo (MAM) dá 304.801: as 9 variantes documentadas de escrita plena/defectiva entre as duas tradições somam uma diferença líquida de 4 letras.

Quantos versículos, palavras e letras tem o Tanach completo?

Segundo nossa contagem computada (Torá na edição Koren; Nevi'im e Ketuvim na edição MAM): 23.205 versículos, 305.440 palavras e 1.196.844 letras nos 39 livros, contando apenas o texto escrito (ketiv) e excluindo notas editoriais e marcadores.

De onde provém o texto hebraico do buscador?

A base digital é a Miqra According to the Masorah (MAM), uma edição do Tanach baseada no Códice de Alepo que se desenvolve abertamente no Wikisource hebraico com licença CC-BY-SA. Para a Torá, sobre essa base aplicam-se as 9 variantes massoréticas documentadas que produzem o texto da edição Koren (304.805 letras). Tudo fica congelado em um corpus estático próprio, verificado com checksums.

Por que as contagens de letras variam entre sites?

Quatro fatores: a edição de base (Alepo vs Leningrado vs edições impressas), o tratamento do ketiv/qerê (escrito vs lido), a regra de palavra (maqaf unindo ou separando) e a contaminação por notas ou marcadores contados como texto. Sem declarar essas regras, duas contagens não são comparáveis.

A contagem inclui as porções em aramaico?

Sim. As seções aramaicas de Daniel e Esdras (mais um versículo de Jeremias e duas palavras de Gênesis) estão escritas no mesmo alfabeto hebraico e fazem parte do texto canônico, então suas letras contam igualmente.

Os números do Tanach: versículos, palavras e letras dos 39 livros

Todo estudo quantitativo do Tanach — e as sequências de letras equidistantes são exatamente isso — depende de uma pergunta prévia: exatamente qual texto você está medindo? Esta página responde a essa pergunta para o nosso buscador com precisão de uma letra: documentamos a cadeia completa da fonte, declaramos as regras de contagem, publicamos a tabela íntegra dos 39 livros e validamos o total contra o número que os soferim guardam há séculos.

A fonte, documentada elo por elo

Nosso buscador não usa "um texto hebraico da internet". Usa uma edição específica, com história editorial pública:

Edição: Miqra According to the Masorah (MAM, מקרא על פי המסורה) — edição digital do Tanach baseada no Códice de Alepo (כתר ארם צובא, o manuscrito massorético mais autorizado, vocalizado por Aharon ben Asher, séc. X) e em manuscritos relacionados para as partes faltantes. Cada decisão editorial do MAM está documentada publicamente.
Onde vive: o MAM é desenvolvido e mantido no Wikisource hebraico, com licença aberta CC-BY-SA.
Nosso buscador parte desse texto, livro por livro, e o congela em um corpus estático próprio, verificado com impressões digitais SHA-256 a cada publicação do site.
Para a Torá, sobre essa base aplicam-se as 9 variantes massoréticas documentadas que produzem o texto da edição Koren (304.805 letras) — o padrão da pesquisa ELS. Aqui está a lista completa das 9 diferenças.

Metodologia de contagem (as regras exatas)

Contagens do Tanach só são comparáveis quando as regras são declaradas. As nossas, aplicadas identicamente nesta tabela e no corpus do buscador:

Letra: todo caractere do alfabeto hebraico (Unicode U+05D0 a U+05EA: as 22 letras mais as 5 formas finais ך ם ן ף ץ). Sinais de vocalização (nikud) e cantilação (te'amim) não são letras e não são contados.
Texto escrito (ketiv), não lido (qerê): onde a Massorá registra uma palavra escrita de uma forma e lida de outra, contamos exclusivamente o ketiv — o que está fisicamente escrito no rolo. É a convenção da pesquisa ELS clássica.
Sem aparato editorial: as notas de rodapé do MAM (variantes de manuscritos), os marcadores de seção {פ}/{ס} e todo elemento de sinalização ficam fora: não são letras do Tanach.
Palavra: sequência de letras hebraicas delimitada por espaço ou maqaf (־). Ou seja, palavras unidas por maqaf contam separadamente.
Versículo: cada verso da divisão massorética padrão da edição.

A tabela completa

#	Livro	Versículos	Palavras	Letras
1	Gênesis בראשית	1.533	20.612	78.064
2	Êxodo שמות	1.210	16.713	63.529
3	Levítico ויקרא	859	11.950	44.790
4	Números במדבר	1.289	16.408	63.530
5	Deuteronômio דברים	956	14.294	54.892
	Torá — 5 livros (Koren)	5.847	79.977	304.805
6	Josué יהושע	658	10.031	39.730
7	Juízes שופטים	618	9.885	38.952
8	I Samuel שמואל א	811	13.261	51.357
9	II Samuel שמואל ב	695	11.033	42.179
10	I Reis מלכים א	817	13.140	50.625
11	II Reis מלכים ב	719	12.273	47.822
12	Isaías ישעיהו	1.291	16.925	66.874
13	Jeremias ירמיהו	1.364	21.831	84.899
14	Ezequiel יחזקאל	1.273	18.730	74.511
15	Oseias הושע	197	2.381	9.389
16	Joel יואל	73	957	3.872
17	Amós עמוס	146	2.042	8.034
18	Obadias עובדיה	21	291	1.119
19	Jonas יונה	48	688	2.700
20	Miqueias מיכה	105	1.396	5.571
21	Naum נחום	47	558	2.255
22	Habacuque חבקוק	56	671	2.596
23	Sofonias צפניה	53	767	2.995
24	Ageu חגי	38	600	2.336
25	Zacarias זכריה	211	3.127	12.433
26	Malaquias מלאכי	55	876	3.450
	Neviʼim (Profetas) — 21 livros	9.296	141.463	553.699
27	Salmos תהלים	2.527	19.583	78.822
28	Provérbios משלי	915	6.915	26.500
29	Jó איוב	1.070	8.340	31.851
30	Cântico dos Cânticos שיר השירים	117	1.250	5.141
31	Rute רות	85	1.294	4.949
32	Lamentações איכה	154	1.542	5.974
33	Eclesiastes קהלת	222	2.987	10.968
34	Ester אסתר	167	3.045	12.110
35	Daniel דניאל	357	5.923	24.280
36	Esdras עזרא	280	3.754	15.762
37	Neemias נחמיה	405	5.312	22.507
38	I Crônicas דברי הימים א	943	10.740	44.559
39	II Crônicas דברי הימים ב	822	13.315	54.917
	Ketuvim (Escritos) — 13 livros	8.064	84.000	338.340
	TANACH COMPLETO — 39 livros	23.205	305.440	1.196.844

A validação: por que estes números são confiáveis

Qualquer tabela se copia; uma tabela científica se valida. A tradição dos soferim — os escribas que copiam rolos letra por letra — guarda há séculos a contagem do Sêfer Torá: 304.805 letras. Nossa contagem computada da Torá dá exatamente 304.805: desde que o buscador adotou a edição Koren como texto canônico da Torá (o texto da pesquisa ELS clássica), a contagem computada e a contagem dos soferim coincidem letra por letra.

O corpus é construído a partir da edição MAM (Códice de Alepo) aplicando as 9 variantes massoréticas documentadas que a separam do textus receptus — todas casos de escrita plena/defectiva (מלא/חסר) ou equivalentes — e é verificado contra o texto Koren de referência usado por Eliyahu Rips. O resultado está congelado com impressões digitais SHA-256: nenhuma letra pode mudar sem que o site detecte. As validações convergem:

Letras da Torá: 304.805 — coincidência exata com a contagem dos rolos padrão e com o texto da pesquisa ELS publicada.
Palavras da Torá: 79.977 — a contagem de referência citada é 79.976 (Δ = 1, atribuível a um caso-limite de divisão de palavra entre edições).
Versículos da Torá: 5.847 — a numeração Koren, que conta Números 25:19 como verso próprio.
Versículos do Tanach: 23.205 — dentro da faixa massorética transmitida (~23.200).

Por que outros sites publicam números diferentes?

Compare tabelas de "letras da Bíblia" na internet e você verá variações. Quase sempre elas se explicam por quatro fatores raramente declarados: a edição de base (Alepo, Leningrado, Koren, edições impressas — diferem em escrita plena/defectiva), o tratamento do ketiv/qerê (contam o escrito, o lido, ou ambos?), a regra de palavra (o maqaf une ou separa?), e a contaminação silenciosa (notas editoriais, marcadores e caracteres de formatação contados como texto). Nossa tabela declara as quatro decisões — por isso cada número é defensável e reproduzível.

De fato, preparar este estudo nos levou a melhorar o próprio buscador: detectamos que as notas editoriais do MAM e o qerê duplicado estavam inflando o corpus em cerca de 5.600 letras (~0,5%), e corrigimos. O corpus atual é exatamente o texto escrito — os números desta tabela.

Reproduza você mesmo

Não acredite em nós: abra o buscador, carregue qualquer livro (ou o Tanach completo) e compare o total de letras do painel de informações com esta tabela. Eles coincidem porque são a mesma contagem sobre o mesmo texto. O procedimento completo — fonte, limpeza, regras — está descrito acima, e qualquer programador pode replicá-lo em uma tarde a partir da edição MAM publicada no Wikisource hebraico.

Nota: a Torá corresponde à edição Koren (ver o artigo sobre nossa fonte textual); Nevi'im e Ketuvim, à edição MAM congelada em nosso corpus e verificada por checksums a cada publicação do site. Os números desta tabela não podem mudar silenciosamente.