דילוג (ELS) הוא אריתמטיקה טהורה: מנקודת התחלה, לוקחים אות אחת בכל d עמדות. אם לטקסט יש אות אחת בלבד עודפת או חסרה לפני הרצף שלכם, כל העמדות זזות והממצא מופיע, נעלם או משנה מקום. לכן, לפני שמחפשים דבר, חייבים לענות בדיוק מוחלט: כמה אותיות יש בתורה, ומהן?
אין "המספר" — יש מהדורות
לשאלה "כמה אותיות יש בתורה?" אין תשובה אחת ויחידה, אלא תשובה לפי מסורת טקסטואלית. כתבי היד המסורתיים הסמכותיים ביותר נבדלים זה מזה בקומץ אותיות — כמעט כולן חילופי כתיב מלא וחסר (נוכחותה או היעדרה של ו או י כאם קריאה), שאינם משנים את הקריאה ולא את המשמעות, אך בהחלט משנים את הספירה:
- מהדורת קורן / הנוסח המקובל — 304,805 אותיות. הטקסט של ספרי התורה הסטנדרטיים ושל הדפוסים הקלאסיים. זה הטקסט שבו השתמשו ויצטום, ריפס ורוזנברג בניסוי שפורסם ב־Statistical Science (1994), והוא הטקסט של כמעט כל מחקר הצפנים מאז.
- מקרא על פי המסורה (MAM) — 304,801 אותיות. מהדורה דיגיטלית המבוססת על כתר ארם צובא (בן אשר, המאה הע׳), כתב היד המסורתי הסמכותי ביותר. היא מפותחת בגלוי בוויקיטקסט העברי ברישיון פתוח CC-BY-SA.
- כתב יד לנינגרד — 304,850 אותיות. כתב היד השלם העתיק ביותר, הבסיס לביבליה הבראיקה האקדמית. נבדל מהקודמים בעשרות אותיות.
ארבע אותיות בין קורן ל־MAM. ארבעים וחמש בין קורן ללנינגרד. לקריאת הטקסט — חסר משמעות. לדילוג קבוע על פני אלפי עמדות — מכריע.
ההחלטה שלנו: קורן לתורה
אימצנו את מהדורת קורן (304,805 אותיות) כטקסט הקנוני של מנוע החיפוש לחמשת חומשי התורה, משלוש סיבות:
- זהו הסטנדרט של התחום. כל הממצאים שפורסמו בספרות ה־ELS — מווייסמנדל ועד WRR ומבקריהם — חושבו על הטקסט הזה. כדי לשחזר ממצא עם הדילוג המדויק שלו, חייבים לחפש באותו טקסט.
- הוא יציב. הנוסח המקובל קבוע זה מאות שנים; אין לו היסטוריה עריכתית פעילה. MAM, לעומתו, הוא מפעל חי שממשיך לקבל תיקונים — מעלה עריכתית, אך סיכון ליכולת השחזור של חיפוש אריתמטי.
- הוא ניתן לאימות. הספירה שלו (304,805) היא המספר המתועד בפומבי שמולו כל אחד יכול לבקר את הקורפוס שלנו.
9 ההבדלים, מתועדים אחד אחד
הקורפוס שלנו יוצא ממהדורת MAM (ויקיטקסט העברי, רישיון פתוח CC-BY-SA) ומיישם את 9 החילופים המתועדים המפרידים בינה לבין טקסט קורן. אלה הם — ואלה בלבד:
| # | פסוק | MAM (ארם צובא) | קורן | סוג |
|---|---|---|---|---|
| 1 | בראשית 4:13 | מנשא | מנשוא | +1 (מלא) |
| 2 | בראשית 7:11 | מעינת | מעינות | +1 (מלא) |
| 3 | בראשית 9:29 | ויהיו | ויהי | −1 |
| 4 | שמות 25:31 | תעשה | תיעשה | +1 (מלא) |
| 5 | שמות 28:26 | האפד | האפוד | +1 (מלא) |
| 6 | במדבר 1:17 | בשמת | בשמות | +1 (מלא) |
| 7 | במדבר 10:10 | חדשיכם | חדשכם | −1 (חסר) |
| 8 | במדבר 22:5 | בער | בעור | +1 (מלא) |
| 9 | דברים 23:2 | דכא | דכה | 0 (החלפה) |
מאזן: +6 −2 = +4 אותיות ← 304,801 + 4 = 304,805. קיים גם הבדל עשירי שאינו משנה אף אות: בקורן, המילים ויהי אחרי המגפה מהוות את הפסוק במדבר 25:19; ב־MAM הן פתיחת במדבר 26:1. אותה תורה, מספור שונה — בתורת קורן יש 5,847 פסוקים.
איך אנחנו מאמתים (ואיך תוכלו לאמת בעצמכם)
- הצלבה אות אחר אות מול הטקסט של ריפס. השווינו את הקורפוס המלא שלנו — כל 5,847 הפסוקים — מול טקסט קורן שמפיץ פרויקט TorahBibleCodes (אותו קובץ הנגזר מהטקסט ששימש את אליהו ריפס). התוצאה: זהות מלאה, 304,805 מתוך 304,805.
- סכומי ביקורת מקובעים. לזרם האותיות של כל ספר יש טביעת אצבע SHA-256 הרשומה במאגר הקוד. כל בנייה של האתר מאמתת מחדש את 39 ספרי התנ״ך מול הטביעות האלה; אילו השתנתה אות אחת בלבד, האתר לא היה מתפרסם.
- ספירות קנוניות כאינווריאנט. בראשית 78,064 · שמות 63,529 · ויקרא 44,790 · במדבר 63,530 · דברים 54,892. כל סטייה עוצרת את הבנייה.
- כתיב, לא קרי. במקומות שבהם המסורה מורה לכתוב דבר אחד ולקרוא אחר, הקורפוס מכיל אך ורק את הכתוב בספר — המוסכמה של כל מחקר ה־ELS.
ומה עם שאר התנ״ך?
מחוץ לתורה לא קיים "טקסט קורן של התייחסות" בספרות הצפנים (ניסוי WRR נערך על ספר בראשית). לנביאים ולכתובים אנו משתמשים במהדורת MAM מקובעת — אותו מקור פתוח, אותם סכומי ביקורת, אותה ערובה ליכולת שחזור. הטבלה המלאה של הספירות לפי ספר נמצאת במאמר שלנו על מספרי התנ״ך.
הספר שאתם רואים על המסך
מציג ספר התורה (העמודים בסידור השורות המסורתי) משתמש בנתוני tikkun.io, שהטקסט שלו הולך בעקבות מסורת בן אשר. אינדקס היישור שלנו עובר על שני הטקסטים אות אחר אות ומאמת בכל בנייה שהם נבדלים בדיוק ב־9 החילופים שבטבלה — ולא באחד נוסף. ב־9 הנקודות האלה, הסימון נצמד לאות השכנה בספר; ביתר 304,796 האותיות, ההתאמה מדויקת.