Todo estudio cuantitativo del Tanaj — y los Equidistant Letter Sequences lo son — se sostiene o se cae con una pregunta previa: ¿exactamente qué texto estás midiendo? Esta página responde esa pregunta para nuestro buscador con precisión de una letra: documentamos la cadena completa de la fuente, declaramos las reglas de conteo, publicamos la tabla íntegra de los 39 libros y validamos el total contra el número que los soferim custodian desde hace siglos.
La fuente, documentada eslabón por eslabón
Nuestro buscador no usa "un texto hebreo de internet". Usa una edición específica, con historia editorial pública:
- Edición: Miqra According to the Masorah (MAM, מקרא על פי המסורה) — edición digital del Tanaj basada en el Códice de Alepo (כתר ארם צובא, el manuscrito masorético más autorizado, vocalizado por Aharón ben Asher, s. X) y manuscritos relacionados para las partes faltantes. Cada decisión editorial de MAM está documentada públicamente.
- Dónde vive: MAM se desarrolla y mantiene en Hebrew Wikisource, con licencia abierta CC-BY-SA.
- Cómo llega a nosotros: Sefaria distribuye MAM como su versión hebrea estándar del Tanaj. Esto no es una suposición: la propia API de Sefaria lo declara en sus metadatos (
heVersionTitle: "Miqra according to the Masorah"yheVersionSourceapuntando a la página del proyecto en Wikisource). Cualquiera puede comprobarlo en la respuesta cruda de la API. - Nuestro buscador carga ese texto, libro por libro, directamente de la API de Sefaria — la misma cadena de extremo a extremo.
Metodología de conteo (las reglas exactas)
Los conteos del Tanaj solo son comparables si se declaran las reglas. Las nuestras, aplicadas por igual en esta tabla y en el corpus del buscador:
- Letra: todo carácter del alfabeto hebreo (Unicode U+05D0 a U+05EA: las 22 letras más las 5 formas finales ך ם ן ף ץ). Los signos de vocalización (nikud) y cantilación (teamim) no son letras y no se cuentan.
- Texto escrito (ketiv), no leído (qere): donde la masorá registra una palabra escrita de una forma y leída de otra, contamos exclusivamente el ketiv — lo que está físicamente escrito en el rollo. Es la convención de los estudios ELS clásicos.
- Sin aparato editorial: las notas al pie de MAM (variantes de manuscritos), los marcadores de sección {פ}/{ס} y todo elemento de señalización quedan fuera: no son letras del Tanaj.
- Palabra: secuencia de letras hebreas delimitada por espacio o por maqaf (־). Es decir, las palabras unidas por maqaf cuentan por separado.
- Versículo: cada verso de la división masorética estándar de la edición.
La tabla completa
| # | Libro | Versículos | Palabras | Letras |
|---|---|---|---|---|
| 1 | Génesis בראשית | 1,533 | 20,612 | 78,063 |
| 2 | Éxodo שמות | 1,210 | 16,713 | 63,527 |
| 3 | Levítico ויקרא | 859 | 11,950 | 44,790 |
| 4 | Números במדבר | 1,288 | 16,408 | 63,529 |
| 5 | Deuteronomio דברים | 956 | 14,294 | 54,892 |
| Torá — 5 libros | 5,846 | 79,977 | 304,801 | |
| 6 | Josué יהושע | 656 | 10,031 | 39,730 |
| 7 | Jueces שופטים | 618 | 9,885 | 38,952 |
| 8 | Samuel I שמואל א | 811 | 13,261 | 51,357 |
| 9 | Samuel II שמואל ב | 695 | 11,033 | 42,179 |
| 10 | Reyes I מלכים א | 817 | 13,140 | 50,625 |
| 11 | Reyes II מלכים ב | 719 | 12,273 | 47,822 |
| 12 | Isaías ישעיהו | 1,291 | 16,925 | 66,874 |
| 13 | Jeremías ירמיהו | 1,364 | 21,831 | 84,899 |
| 14 | Ezequiel יחזקאל | 1,273 | 18,730 | 74,511 |
| 15 | Oseas הושע | 197 | 2,381 | 9,389 |
| 16 | Joel יואל | 73 | 957 | 3,872 |
| 17 | Amós עמוס | 146 | 2,042 | 8,034 |
| 18 | Abdías עובדיה | 21 | 291 | 1,119 |
| 19 | Jonás יונה | 48 | 688 | 2,700 |
| 20 | Miqueas מיכה | 105 | 1,396 | 5,571 |
| 21 | Najum נחום | 47 | 558 | 2,255 |
| 22 | Habacuc חבקוק | 56 | 671 | 2,596 |
| 23 | Sofonías צפניה | 53 | 767 | 2,995 |
| 24 | Ageo חגי | 38 | 600 | 2,336 |
| 25 | Zacarías זכריה | 211 | 3,127 | 12,433 |
| 26 | Malaquías מלאכי | 55 | 876 | 3,450 |
| Neviʼim (Profetas) — 21 libros | 9,294 | 141,463 | 553,699 | |
| 27 | Salmos תהלים | 2,527 | 19,583 | 78,822 |
| 28 | Proverbios משלי | 915 | 6,915 | 26,500 |
| 29 | Job איוב | 1,070 | 8,340 | 31,851 |
| 30 | Cantar de los Cantares שיר השירים | 117 | 1,250 | 5,141 |
| 31 | Rut רות | 85 | 1,294 | 4,949 |
| 32 | Lamentaciones איכה | 154 | 1,542 | 5,974 |
| 33 | Eclesiastés קהלת | 222 | 2,987 | 10,968 |
| 34 | Ester אסתר | 167 | 3,045 | 12,110 |
| 35 | Daniel דניאל | 357 | 5,923 | 24,280 |
| 36 | Esdras עזרא | 280 | 3,754 | 15,762 |
| 37 | Nehemías נחמיה | 405 | 5,312 | 22,507 |
| 38 | Crónicas I דברי הימים א | 943 | 10,740 | 44,559 |
| 39 | Crónicas II דברי הימים ב | 822 | 13,315 | 54,917 |
| Ketuvim (Escritos) — 13 libros | 8,064 | 84,000 | 338,340 | |
| TANAJ COMPLETO — 39 libros | 23,204 | 305,440 | 1,196,840 |
La validación: por qué estos números son confiables
Una tabla cualquiera se copia; una tabla científica se valida. La tradición soferit — los escribas que copian rollos letra por letra — custodia desde hace siglos el conteo del Sefer Torá: 304,805 letras. Nuestro conteo computado de la Torá da 304,801. Una diferencia de exactamente 4 letras, ~0.0013%.
Y aquí está el punto decisivo: esa diferencia no es un error — es una firma de autenticidad. El número 304,805 corresponde a la ortografía de los rollos estándar actuales (tradición que consolidaron las ediciones impresas tardías), mientras que el Códice de Alepo de Ben Asher difiere de esos rollos en un puñado de casos documentados de escritura llena/defectiva (מלא/חסר). Un texto digital corrupto o descuidado se desviaría por cientos o miles de letras; una edición crítica fiel al Códice de Alepo se desvía del rollo estándar exactamente en ese orden de magnitud minúsculo y explicable. Las validaciones convergen:
- Letras de la Torá: 304,801 (MAM/Alepo) vs 304,805 (rollos estándar) — Δ de 4 letras, consistente con las diferencias málé/jaser documentadas entre tradiciones.
- Palabras de la Torá: 79,977 — el conteo de referencia citado es 79,976 (Δ = 1, atribuible a un caso límite de división de palabra entre ediciones).
- Versículos de la Torá: 5,846 — exactamente el conteo de las ediciones masoréticas modernas.
- Versículos del Tanaj: 23,204 — dentro del rango masorético transmitido (~23,200).
¿Por qué otros sitios publican números distintos?
Si comparas tablas de "letras de la Biblia" en internet verás variaciones. Casi siempre se explican por cuatro factores que rara vez se declaran: la edición de base (Alepo, Leningrado, Koren, ediciones impresas — difieren en escritura llena/defectiva), el tratamiento del ketiv/qere (¿cuentan lo escrito, lo leído, o ambos?), la regla de palabra (¿maqaf une o separa?), y la contaminación silenciosa (notas editoriales, marcadores y caracteres de formato contados como texto). Nuestra tabla declara las cuatro decisiones — por eso cada número es defendible y reproducible.
De hecho, preparar este estudio nos llevó a mejorar el propio buscador: detectamos que las notas editoriales de MAM y el qere duplicado estaban inflando el corpus en unas 5,600 letras (~0.5%), y lo corregimos. El corpus actual del buscador es exactamente el texto escrito — las cifras de esta tabla.
Reprodúcelo tú mismo
No nos creas: abre el buscador, carga cualquier libro (o el Tanaj completo) y compara el total de letras que reporta el panel de información con esta tabla. Coinciden porque son el mismo conteo sobre el mismo texto. El procedimiento completo — fuente, limpieza, reglas — está descrito arriba y cualquier programador puede replicarlo contra la API pública de Sefaria en una tarde.
Nota: los conteos corresponden a la edición MAM tal como la distribuye la API de Sefaria a la fecha de publicación de este artículo. MAM es una edición viva con correcciones editoriales documentadas; cambios futuros serían del orden de letras individuales.