Digitization in Jewish Studies and its Contribution to Identifying Tiny Manuscript Fragments (He)
Dr. Menachem Katz, The Open University of Israel, The Friedberg Genizah Project
"דומה כי היחידים הטורחים היום לבדוק כל קטע וקטע המתגלה בגניזת אירופה הם חוקרי ספרות חז"ל" (דברי פרופ' שמחה עמנואל, בספרו החדש, מגנזי אירופה א, עמוד 55), והדבר נכון במידה רבה גם לגבי הגניזה הקהירית: חוקרי ספרות התלמודית הם אלה שמתעניינים בכל קטע חדש, קטן ככל שיהיה. בהרצאה זו אעסוק בתרומתם של אמצעי הדיגיטציה החדשים לזיהוי של קרעים קטנים ביותר לטובת המחקר במדעי היהדות בפרט ובמדעי הרוח בכלל, לאור הנסיון שהצטבר במחקר התלמודי עד כה.
[1] בגניזה הקהירית, ולא רק בה, אנו נתקלים בלא מעט קרעים קטנים או זעירים. לחוקרים הנתקלים בקטעים כאלו אין הרבה מה לעשות איתם: קשה מאוד לזהות את הכתוב בהם, הזיהוי של סוג הקטע או מיקומו אינו טריוויאלי. וגם במקרה שהקטע מזוהה, לרוב קשה להפיק ממנו תועלת מחמת קוטנו. במילים אחרות, המאמץ הצפוי נראה גדול מדי ואילו התועלת והתרומה למחקר נראות קטנות מדי, לכל היותר.
עם זאת, כאשר ניתן לצרף את הקטעים הקטנים לקטעים אחרים, הרי שתרומתם יכולה להתגלות כמשמעותית. הצירוף לקטעים אחרים מועיל, ראשית כול, לעצם הזיהוי של הקטע. התרומה השנייה מן הצירוף היא הגדלת היקפו של הטקסט שהכרנו לפני כן: טקסט של שורות בודדות יכול להכפיל את הטווח שלו ואף יותר מכך, על ידי צירוף קרעים קטנים אליו. בנוסף, ככל שהקטע רחב יותר, החוקר יכול לאפיין אותו טוב יותר ולדעת עליו יותר: להכיר את מסורת הנוסח שלו, צורת ההעתקה והדף, תיאור קודיקולוגי של כתב היד, וכן הלאה. צירופים שכאלו מאפשרים לצאת מזיהוי וטיפול של יחידות בודדות של קטעי גניזה לאשכולות – קטעים מעותקים שלמים של כתבי יד, שיכולים לתרום הן למחקר התלמודי הן למחקר הקודיקולוגי.
בקטלוג המקורי צורפו ארבעה קרעים לכדי שריד דף אחד. בעבודתנו על התמונות מרובות הקרעים הצלחנו להוסיף עוד שמונה קרעים.
בתמונה זו אנו רואים את T-S NS 258.minutes – כלומר, קרעים שנותרו בקופסת T-S NS 258. הקרעים הללו מצטרפים לשני קרעים מאותה קופסה שכבר נרשמו בקטלוג המקורי (258.162, 258.184), וכולם ביחד מצטרפים לעוד קרעים שנמצאו בקופסאות אחרות (T-S NS 329.973, T-S AS 96.236 שנרשמו בקטלוג המקורי, ועליהם נוספו T-S AS 96.146, ועוד קרע מתמונה מרובת קטעים: T-S AS 140.113)
כאן ניתן לראות כיצד הקרעים מצטרפים, שלב אחרי שלב. הצירוף נראה כאן בעשרה מהלכים, אף כי למעשה לא פחות מ-12 קרעים מרכיבים את התמונה שהתקבלה בסופו של דבר.
דרגות קושי בטיפול של קטעים קטנים [מיון סכימתי בלבד]:
קטע קטן (ניתן לקרוא מספר מילים) – אך יש לו מספר מדף עצמאי, תמונה לחוד [ראו דוגמה במצגת - 4].
קטע קטן (ניתן לקרוא מספר מילים) – כשמספר קטעים בודדים צולמו יחד וקיבלו מספר מדף אחד. [JTS] [ראו דוגמה במצגת - 5]
קטע קטן (ניתן לקרוא מספר מילים) – כשהקטע הוא חלק מתוך "תמונות מרובות קטעים", multifragments. [ראו דוגמה במצגת - 6]
קטע זעיר (לא ניתן לקרוא מספר מילים. רק אותיות בודדות) – בדרך כלל מדובר על קטע מתוך "תמונות מרובות קטעים", multifragments. [ראו דוגמה באותה מצגת - 6]
קטע זעיר (כנ"ל) – כשקטעים אלו צולמו ותועדו בצורה פחות מסודרת, כפי שנפרט בהמשך.
במחקר נעשה מאמץ לנסות לאתר גם קטעים קטנים. לדוגמה, במבוא לקטלוג מודגש:
ב"אוצר" נמצאים החל מכתב-היד המקיף ביותר (מינכן 95), המכיל שישה סדרי משנה, ארבעת סדרי הבבלי... – ועד קטעים קטנטנים, כגון... [מספר מדף] T-S AS 96.193, שאינו אלא שריד זעיר של משנה פסחים וכו'.
[ראו במצגת – 7 Cambridge, CUL: T-S AS 96.193, Fragment 1r, FGP No.: C120637].
על פי המיון שלי הדוגמה המוזכרת כאן שייכת לדרגה א, כלומר, קטע קטן (ניתן לקרוא מספר מילים) – אך יש לו מספר מדף עצמאי, תמונה לחוד.
בקטלוג יש גם דוגמאות לדרגה ב, כלומר, קטע קטן (ניתן לקרוא מספר מילים) – כשמספר קטעים בודדים צולמו יחד וקיבלו מספר מדף אחד. דוגמאות מובהקות לקטעים אלו הם מספרית בית המדרש לרבנים באמריקה, JTS, בגלל שיטת המיון והצילום של אוספי בגניזה בספריה זו והודות לעבודת הזיהוי המפורטת של פרופ' נחמן דנציג, כפי שניתן לראות בקטלוג שהוא הכין.
במחקר נעשה מאמץ לנסות לאתר גם קטעים קטנים. לדוגמה, במבוא לקטלוג שערך פרופ' זוסמן מודגש:
ב"אוצר" [כלומר, בקטלוג] נמצאים החל מכתב-היד המקיף ביותר (מינכן 95), המכיל שישה סדרי משנה, ארבעת סדרי הבבלי... – ועד קטעים קטנטנים, כגון... [מספר מדף] T-S AS 96.193, שאינו אלא שריד זעיר של משנה פסחים.
על פי המיון שלי הדוגמה המוזכרת כאן שייכת לדרגה א, כלומר, קטע קטן (ניתן לקרוא מספר מילים) – אך יש לו מספר מדף עצמאי, תמונה לחוד.
בקטלוג יש גם דוגמאות לדרגה ב, כלומר, קטע קטן (ניתן לקרוא מספר מילים) – כשמספר קטעים בודדים צולמו יחד וקיבלו מספר מדף אחד. דוגמאות מובהקות לקטעים אלו הם מספרית בית המדרש לרבנים באמריקה, JTS, בגלל שיטת המיון והצילום של אוספי בגניזה בספריה זו והודות לעבודת הזיהוי המפורטת של פרופ' דנציג, כפי שניתן לראות בקטלוג שהוא הכין.
[4] כאמור, עד כה כמעט שלא נעשה במחקר שימוש בקרעים קטנים וזעירים אלו, וזאת משום שקשה מאוד לזהות את תוכנם ואת זהותם של אותם קטעים. כך הם היו מונחים בקרן זווית ואין מי שיגאל אותם. כוונתי לכל חמשת הקבוצות שתיארתי קודם. וזאת למרות שמשני הקבוצות הראשונות נעשה שימוש מזדמן במחקר. במבוא לקטלוג מובאת דוגמה לקטע קטנטן, עיול 5769, מספר מדף T-S AS 96.193, המצטרף לעיול 3572, מספר מדף T-S NS 329.357 (אוצר כתבי היד התלמודיים, מבואות ומפתחות, עמ' 1).
[5] הטיפול בקטעים הקטנים מציב אם כן אתגר לא קטן, ובתוכו נוסף אתגר מיוחד: בין התמונות באתר הגניזה הקהירית נמצאות עשרות רבות הכוללות בתוכן אוסף של קטעים קטנטנים, מסודרים בשורות או בלא סדר, רובם בספריית קמברידג'. לתמונות אלה נקרא "תמונות מרובות קטעים", או בלעז: multifragments.
תמונות אלה מאגדות פעמים רבות קרעים קטנים שנפלו מתוך הקטעים הגדולים שבקופסאות שבהן נמצאו. כך לדוגמה, סדרת מספרי המדף T-S AS 85, המאגדת את הקטעים הנמצאים בקופסה זו מתוך סדרת Additional Series שבקמברידג', כוללת את מספר המדף T-S AS 85.minute fragments, שבו צולמו כל אותם קרעים זעירים [התמונה התחתונה בשקף; ניתן ללחוץ להגדלה].
[6] במסגרת פרויקט "הכי גרסינן", עליו שמענו כעת, בהרצאה הקודמת, ביקשנו לאתר כמה שיותר עדי נוסח של התלמוד הבבלי, ולצורך כך עברנו על כל קטעי הגניזה, ובכללם גם הקרעים הקטנים הנמצאים בתמונות מרובות הקטעים. הצלחנו לזהות בדרך זו כשלש מאות קטעי תלמוד חדשים, מהם המצטרפים לקטעים קיימים ומשלימים אותם ומהם העומדים בפני עצמם.
חשוב לי לציין שכבר לפני כעשור, עדיין לפני שהצטרפתי לפרויקט הגניזה, החליט פרופ' שויקה שלכל תמונה יהיה מספר עצמאי, מספר FGP. החלטה זו היתה תשתית חשובה לכל טיפול מדויק של כל קטע בגניזה, והכרחית בטיפול של קטעים קטנים וזעירים בהם אני עוסק בהרצאתי.
[7] [מצגת - 14] דוגמה מעניינת נמצאת במספר מדף T-S NS 329, מדף המכיל למעלה מאלף קטעים. מספר מדף זה, T-S NS 329, נוצר בקיץ של שנת 1970 מערמות קטעים שהניח פרופ' יעקב זוסמן בצד בעת שעבר על קטעי גניזה מסדרת New Series שנודע עליה אז. בסופם של הקטעים הללו צולמו שמונה מערכים-מגשים של קרעים קטנים (329.m.I וכן הלאה). – חלקם כה קטנטנים שאין ספק שלא נאספו בכוונה כלשהי. העובדה שהם נמצאים בתוך מספר המדף הזה בכל זאת – כאמור, מספר מדף שנוצר מקטעים שנאספו במכוון על ידי פרופ' זוסמן – מעלה את האפשרות שהם התפוררו מן הקטעים הקיימים לאחר אסיפתם אל תוך הקופסה המיועדת, כלומר לכל המוקדם בסתיו 1970, לפני 45 שנה.
אפשרות זו חשובה משום שהיא מחזקת את ההנחה שלכל אחד מן הקרעים הקטנים ניתן פוטנציאלית "לשדך-לצרף" קטע גדול יותר מאותו מספר מדף, ובדיקת הקרעים הללו אחד אחד בצורה יסודית אינה בגדר "ירייה באפלה". ואכן, מבדיקת תמונות אלו הצלחנו למצוא לעת עתה ארבעה קרעים תלמודיים – כולם מצטרפים לקטעים הנמצאים באותו מספר מדף (329).
[8] יש להדגיש כי סביר להניח שרובם הגדול של הקרעים הנמצאים בתמונות הללו מצטרפים לקרעים אחרים ולקטעים גדולים יותר, מאחר שלא נראה שלגניזה בקהיר הושלכו קרעים קטנטנים כאלה בפני עצמם. האתגר לחבר אותם לקטעים קיימים, אם כן, משמעותי ובהחלט אפשרי. כאמור לעיל, הדבר נכון בפרט כאשר נראה שרוב הקטעים הם קרעים שנפלו מתוך הדפים שאוגדו בקופסה מסוימת בגניזה. לאחרונה שמתי לב שלא מעט קטעים שאינם מצטרפים לקטעים באותו מדף, מצטרפים לקטעים ממדף שנוצר על ידי פרופ' זוסמן בשנת 1970, מדף מספר T-S NS 329. נראה לי שנתונים האלו מלמדים שככל הנראה פרופ' זוסמן שלף את הקטע שמצא והעבירו, אך באותו מדף נשארו קרעים זעירים מקטעים הללו.
[9] מה עשינו במסגרת הפרויקט שלנו?
כל תמונה המכילה קטעים מרובים נבחנה בשיטתיות: בוצעה בדיקה על כל קטע קטן, זוהו המילים וחלקי המילים הכתובות בו, ונערך חיפוש במאגרים של ספרות תלמודית וספרות משיקה, ובכלל זה כתבי יד תלמודיים. לאחר שזוהו המילים כשייכות למקור תלמודי, נערכה בדיקה מול הקטעים המוכרים לנו מאותו מקור, וכך פעמים רבות ניתן היה לצרף את הקטעים החדשים לקטעים המוכרים כבר. במקרים רבים תרם המידע שבקטעים החדשים הללו לאיפיון מדויק ונכון יותר של הקטעים הקיימים. לדוגמה, קטע שזוהה כתלמוד, בעקבות הצירוף התברר שאינו תלמוד אלא הלכות הרי"ף או הלכות גדולות.
[10] להלן נפרט על כמה מן האתגרים שנתקלנו בהם במהלך עבודתנו:
טיפול בתמונות מרובות קטעים (multifragments)
אחת הבעיות שנתקלנו בה, היא הצורך לקבוע מספר מזהה (עיול) מדויק לכל קטע, כדי להפנות את המעיין לקטע המדויק מתוך תמונה המכילה קטעים רבים. הבעיות:
מספר מדף כולל הרבה קטעים, לפעמים מאה קטעים ויותר. [מצגת - 17]
מספר מדף כזה מצולם לפעמים בסדרה של מגשים. כך שבמקרים האלו לא מדובר בזוג תמונות אחד (recto, verso) אלא בכמה זוגות של תמונות.
ולפעמים לא מדובר בסדרה של תמונות, כשכל זוג מכיל קטעים אחרים, אלא בתמונות שנפרסו בצורה פנורמית וצולמו בחלקים, כזוג של תמונות, פעמים רבות עם חפיפה ביניהם. [מה שהצריך איחוד מיספור התמונות בשום שכל לפני בואנו למספר את הקטעים].
טיפול בתמונות מרובות קטעים (multifragments)
אחת הבעיות שנתקלנו בה, היא הצורך לקבוע מספר מזהה (עיול) מדויק לכל קטע, כדי להפנות את המעיין לקטע המדויק מתוך תמונה המכילה קטעים רבים. הבעיות:
מספר מדף כולל הרבה קטעים, לפעמים מאה קטעים ויותר. [מצגת - 17]
מספר מדף כזה מצולם לפעמים בסדרה של מגשים. כך שבמקרים האלו לא מדובר בזוג תמונות אחד (recto, verso) אלא בכמה זוגות של תמונות.
טיפול בתמונות מרובות קטעים (multifragments)
אחת הבעיות שנתקלנו בה, היא הצורך לקבוע מספר מזהה (עיול) מדויק לכל קטע, כדי להפנות את המעיין לקטע המדויק מתוך תמונה המכילה קטעים רבים. הבעיות:
מספר מדף כולל הרבה קטעים, לפעמים מאה קטעים ויותר. [מצגת - 17]
מספר מדף כזה מצולם לפעמים בסדרה של מגשים. כך שבמקרים האלו לא מדובר בזוג תמונות אחד (recto, verso) אלא בכמה זוגות של תמונות.
[11] כיון שלא היה לנו תקדים שיכולנו להיסמך עליו בשיטת המספור, היינו צריכים לחדש שיטה. בתחילה נקטנו שיטה המסמנת את מיקום הקטע לפי טור ושורה (לפי ה-recto). כך לדוגמה קטע הנמצא בטור מס' 5, שורה מס' 8, יקבל את הזיהוי [5/8]. לאחר מכן החלטנו כי השיטה הזו אינה מתאימה דיה לצרכינו, ועברנו לשיטת מספור רציף, משמאל למעלה עד ימין למטה, בהתקדמות טור אחר טור. כך לדוגמה הקטע הימני בשורה הראשונה בתמונה בת 11 טורים, שקיבל בתחילה את המספר [1/11] יכול לקבל את המספר 11, והקטע השמאלי בשורה השנייה ([2/1] בשיטה הישנה) קיבל את המספר 12.
לצורך כך פיתחנו תוכנה שאפשרה לנו לסמן ולמספר (ידנית) על גבי התמונות כל קרע וקרע בפני עצמו, וכך המחשב יודע כבר לזהות כל קטע עם עיול מסוים, ואותו בלבד.
[12] מאפייני הקטעים שזוהו [מצגת - 24]
בסך הכול זוהו כשלוש מאות קרעים קטנים מן התמונות מרובות הקטעים; מתוכם: 54% בבלי, 42% משנה, 4% רי"ף (קטעי רי"ף נרשמים בקטלוג אך לא נעשה חיפוש אקטיבי שלהם כיון שהמוקד של הפרויקט הוא תלמודי. אלו שנמצאו הם רק כאלו שהייתה אפשרות שהם בבלי).
מבחינת חומר הקטעים, רובם נייר (60%) מיעוטם קלף (20%), וכל השאר (20%) לא זוהה. הדבר מתאים לאופיו של הנייר, הנוטה יותר להתפורר.
[13] כבר כעת ניתן לומר שבזכות המפעל הנוכחי של פרויקט פרידברג, פרויקט שמטרתו להציג לראשונה מסורת הנוסח המלאה של כל התלמוד הבבלי, לכל עדיו ונוסחאותיו, הוליד תרומה נוספת. הגניזה, במיוחד זו שבספריית קיימברידג', גדלה בשלוש שנים האחרונות בזכות הפרויקט. ליתר דיוק, לגניזה עצמה לא נוספו קטעים חדשים בשנים האחרונות, אך המידע שאנו נחשפים אליו גדל במידה רבה.
אני מרשה לעצמי להשוות את הצעדים האלו לאבני דרך משמעותיים בחשיפה וגילוי הגניזה בעשרות השנים האחרונות. עד שנות החמישים של המאה הקודמת התמקדו באוסף הגניזה בקיימברידג' במה שמכונה באופן לא רשמי "הסדרה הישנה", Old Series. בשנת 1955 נוסדה הסדרה החדשה, New Series, בשנת 1974 נוסדה הסדרה הנוספת, Additional Series. ולפני שלש שנים גם הקטעים הזעירים למיניהם, ובמיוחד הקטעים הזעירים ש"תמונות מרובות קטעים" multifragments.
[14] הדיגיטציה של כתבי היד התלמודיים תרמה באופן מכריע להליך זה, העוזר לזיהוי מלא יותר של קטעים ולגילוי של נוסחים שעד כה נעלמו מאתנו: הצילום האיכותי של הקרעים, והיכולת לחפש מילים בכתבי יד של התלמוד, מאפשרים הליך זיהוי נוח יותר מאי פעם.
עם זאת, בין השאר מחמת קוטנם של הקרעים, זיהוי ממוחשב של קטעים דומים על בסיס של מאפייני כתב יד אינו יעיל עדיין.
[15] נראה לנו לאור העולה מניסיוננו בתחום התלמודי, כי החלת הליך זה על כלל הקטעים הקטנטנים, הזעירים, ובמיוחד "תמונות מרובות קטעים" (multifragments) מן הגניזה הקהירית ולא רק על הקטעים התלמודיים, תרים תרומה של ממש גם לתחומים נוספים המועשרים מממצאי הגניזה: המקרא, המדרש, הפיוט והליטורגיה, ההלכה והמנהג, המאגיה, ההיסטוריה ועוד.
קטעים זעירים כאלו קיימים לא רק באוספי הגניזה הקהירית אלא גם באוספים נוספים (גם אם הם לא נסרקו עדיין), אם כי במידה מועטה יותר. הניסיון מהטיפול בקטעים אלו יכול לתרום לדרכי העבודה גם באוספים אלו.