Todo estudio cuantitativo del Tanaj — y los Equidistant Letter Sequences lo son — se sostiene o se cae con una pregunta previa: ¿exactamente qué texto estás midiendo? Esta página responde esa pregunta para nuestro buscador con precisión de una letra: documentamos la cadena completa de la fuente, declaramos las reglas de conteo, publicamos la tabla íntegra de los 39 libros y validamos el total contra el número que los soferim custodian desde hace siglos.

La fuente, documentada eslabón por eslabón

Nuestro buscador no usa "un texto hebreo de internet". Usa una edición específica, con historia editorial pública:

  • Edición: Miqra According to the Masorah (MAM, מקרא על פי המסורה) — edición digital del Tanaj basada en el Códice de Alepo (כתר ארם צובא, el manuscrito masorético más autorizado, vocalizado por Aharón ben Asher, s. X) y manuscritos relacionados para las partes faltantes. Cada decisión editorial de MAM está documentada públicamente.
  • Dónde vive: MAM se desarrolla y mantiene en Hebrew Wikisource, con licencia abierta CC-BY-SA.
  • Cómo llega a nosotros: Sefaria distribuye MAM como su versión hebrea estándar del Tanaj. Esto no es una suposición: la propia API de Sefaria lo declara en sus metadatos (heVersionTitle: "Miqra according to the Masorah" y heVersionSource apuntando a la página del proyecto en Wikisource). Cualquiera puede comprobarlo en la respuesta cruda de la API.
  • Nuestro buscador carga ese texto, libro por libro, directamente de la API de Sefaria — la misma cadena de extremo a extremo.

Metodología de conteo (las reglas exactas)

Los conteos del Tanaj solo son comparables si se declaran las reglas. Las nuestras, aplicadas por igual en esta tabla y en el corpus del buscador:

  • Letra: todo carácter del alfabeto hebreo (Unicode U+05D0 a U+05EA: las 22 letras más las 5 formas finales ך ם ן ף ץ). Los signos de vocalización (nikud) y cantilación (teamim) no son letras y no se cuentan.
  • Texto escrito (ketiv), no leído (qere): donde la masorá registra una palabra escrita de una forma y leída de otra, contamos exclusivamente el ketiv — lo que está físicamente escrito en el rollo. Es la convención de los estudios ELS clásicos.
  • Sin aparato editorial: las notas al pie de MAM (variantes de manuscritos), los marcadores de sección {פ}/{ס} y todo elemento de señalización quedan fuera: no son letras del Tanaj.
  • Palabra: secuencia de letras hebreas delimitada por espacio o por maqaf (־). Es decir, las palabras unidas por maqaf cuentan por separado.
  • Versículo: cada verso de la división masorética estándar de la edición.

La tabla completa

#LibroVersículosPalabrasLetras
1Génesis בראשית1,53320,61278,063
2Éxodo שמות1,21016,71363,527
3Levítico ויקרא85911,95044,790
4Números במדבר1,28816,40863,529
5Deuteronomio דברים95614,29454,892
Torá — 5 libros5,84679,977304,801
6Josué יהושע65610,03139,730
7Jueces שופטים6189,88538,952
8Samuel I שמואל א81113,26151,357
9Samuel II שמואל ב69511,03342,179
10Reyes I מלכים א81713,14050,625
11Reyes II מלכים ב71912,27347,822
12Isaías ישעיהו1,29116,92566,874
13Jeremías ירמיהו1,36421,83184,899
14Ezequiel יחזקאל1,27318,73074,511
15Oseas הושע1972,3819,389
16Joel יואל739573,872
17Amós עמוס1462,0428,034
18Abdías עובדיה212911,119
19Jonás יונה486882,700
20Miqueas מיכה1051,3965,571
21Najum נחום475582,255
22Habacuc חבקוק566712,596
23Sofonías צפניה537672,995
24Ageo חגי386002,336
25Zacarías זכריה2113,12712,433
26Malaquías מלאכי558763,450
Neviʼim (Profetas) — 21 libros9,294141,463553,699
27Salmos תהלים2,52719,58378,822
28Proverbios משלי9156,91526,500
29Job איוב1,0708,34031,851
30Cantar de los Cantares שיר השירים1171,2505,141
31Rut רות851,2944,949
32Lamentaciones איכה1541,5425,974
33Eclesiastés קהלת2222,98710,968
34Ester אסתר1673,04512,110
35Daniel דניאל3575,92324,280
36Esdras עזרא2803,75415,762
37Nehemías נחמיה4055,31222,507
38Crónicas I דברי הימים א94310,74044,559
39Crónicas II דברי הימים ב82213,31554,917
Ketuvim (Escritos) — 13 libros8,06484,000338,340
TANAJ COMPLETO — 39 libros23,204305,4401,196,840

La validación: por qué estos números son confiables

Una tabla cualquiera se copia; una tabla científica se valida. La tradición soferit — los escribas que copian rollos letra por letra — custodia desde hace siglos el conteo del Sefer Torá: 304,805 letras. Nuestro conteo computado de la Torá da 304,801. Una diferencia de exactamente 4 letras, ~0.0013%.

Y aquí está el punto decisivo: esa diferencia no es un error — es una firma de autenticidad. El número 304,805 corresponde a la ortografía de los rollos estándar actuales (tradición que consolidaron las ediciones impresas tardías), mientras que el Códice de Alepo de Ben Asher difiere de esos rollos en un puñado de casos documentados de escritura llena/defectiva (מלא/חסר). Un texto digital corrupto o descuidado se desviaría por cientos o miles de letras; una edición crítica fiel al Códice de Alepo se desvía del rollo estándar exactamente en ese orden de magnitud minúsculo y explicable. Las validaciones convergen:

  • Letras de la Torá: 304,801 (MAM/Alepo) vs 304,805 (rollos estándar) — Δ de 4 letras, consistente con las diferencias málé/jaser documentadas entre tradiciones.
  • Palabras de la Torá: 79,977 — el conteo de referencia citado es 79,976 (Δ = 1, atribuible a un caso límite de división de palabra entre ediciones).
  • Versículos de la Torá: 5,846 — exactamente el conteo de las ediciones masoréticas modernas.
  • Versículos del Tanaj: 23,204 — dentro del rango masorético transmitido (~23,200).

¿Por qué otros sitios publican números distintos?

Si comparas tablas de "letras de la Biblia" en internet verás variaciones. Casi siempre se explican por cuatro factores que rara vez se declaran: la edición de base (Alepo, Leningrado, Koren, ediciones impresas — difieren en escritura llena/defectiva), el tratamiento del ketiv/qere (¿cuentan lo escrito, lo leído, o ambos?), la regla de palabra (¿maqaf une o separa?), y la contaminación silenciosa (notas editoriales, marcadores y caracteres de formato contados como texto). Nuestra tabla declara las cuatro decisiones — por eso cada número es defendible y reproducible.

De hecho, preparar este estudio nos llevó a mejorar el propio buscador: detectamos que las notas editoriales de MAM y el qere duplicado estaban inflando el corpus en unas 5,600 letras (~0.5%), y lo corregimos. El corpus actual del buscador es exactamente el texto escrito — las cifras de esta tabla.

Reprodúcelo tú mismo

No nos creas: abre el buscador, carga cualquier libro (o el Tanaj completo) y compara el total de letras que reporta el panel de información con esta tabla. Coinciden porque son el mismo conteo sobre el mismo texto. El procedimiento completo — fuente, limpieza, reglas — está descrito arriba y cualquier programador puede replicarlo contra la API pública de Sefaria en una tarde.

Nota: los conteos corresponden a la edición MAM tal como la distribuye la API de Sefaria a la fecha de publicación de este artículo. MAM es una edición viva con correcciones editoriales documentadas; cambios futuros serían del orden de letras individuales.