״אני מתאמץ להפסיק מנושא זה, כי אם אכתוב על כך לא תספיק הדיו בשבילי ואצטרך לגמור בדמעות-דם. אומר די לצרותינו! כשאזכה בקרוב לעלות ארצה אז אספר לכם הכול בפרוטרוט. תשמרו את המכתב והתמונות שאני שולח לכם. את ה'אוריגינל' של תמונת אחי מנעוריו שמרתי בכל ימי היותי בגטו ובמחנות, בכל הביקורים והחיפושים. רק זה נשאר לי מכל תמונותיי, ממשפחתי״.
יוסף ויסמן נולד בשנת 1920 בפולין, במחוז לובלין שבמזרח המדינה. יוסף היה תלמיד תורה שהצטיין בלימודיו. עם פרוץ מלחמת העולם השניה ברח יוסף לווילנה, שם התאחד עם אחיו יעקב ואחותו בתיה. בשנת 1941 פלשו הגרמנים לווילנה וריכזו את יהודי העיר בגיטו. תוך כחצי שנה נרצחו מעל 40,000 יהודים.
בשנת 1943 נערכו אקציות גירוש למחנות ריכוז והגטו חוסל. אלפי ילדים, נשים וזקנים נשלחו למחנה ההשמדה בסוביבור, שם נטבחו באכזריות. יוסף נשלח למחנות עבודה בכפייה שם עבר עינויים קשים. בסוף המלחמה הוא נמצא על ידי כוחות אמריקאים שוכב בערמת גופות קרות כשהוא במצב של אפיסת כוחות. הוא הובא לבית חולים, ולאחר מספר חודשים התאושש.
בשנת 1946 גילה יוסף את האמת המרה – הוריו, אחיו ואחותו נרצחו על ידי הנאצים והוא היחיד ששרד מבני משפחתו. באותה שנה עלה יוסף על אוניית המעפילים ״כ"ג יורדי הסירה״, אך לאחר שהבריטים גילו אותה בדרכה לארץ ישראל גורשו כ-800 המעפילים שעליה לקפריסין. לבסוף, בשנת 1947 התגשם חלומו של יוסף והוא זכה לעלות לארץ ולאחר זמן קצר התיישב בכפר עציון שם נקלט בחברה ובעבודה, במשק ובבניין, ובשעות הפנאי עסק בלימוד תורה. בכפר עציון הכיר יוסף את חברתו, רחל הילר, שעימה תכנן לבנות בית במקום.
בסוף אותה שנה החל הכפר לעמוד במוקד התקפות בלתי פוסקות של הערבים. יוסף הצטרף לכוחות המגינים, השתתף באימונים, בעבודת ביצורים ובשמירה, וכחבר פלוגת משמר של המשק התגלה כאחד מטובי הלוחמים. בינואר 1948 כתב יוסף: ״מעשי חשמונאים היו כאן, ולא עוד, אלא שגם אני זכיתי להיות בין אלה ולקחת חלק במעשי הגבורה האלה. בעיני ראיתים, חייתי והייתי בהם: המונים-המונים הקיפו והתקיפו אותנו ורצו להשמיד, להרוג ולאבד את הכול… אבל אחת ידענו וזכרנו: בתפילת שחרית אמרנו 'אל נקמות הופיע' – וכך היה״.
בשל חשיבות גוש עציון במערכה ושליטתו על הכביש המחבר בין חברון וירושלים פתח הצבא הירדני במתקפה עזה עליו עוד קודם לסיום המנדט וצאת הבריטים מהארץ.
בששת חודשי המערכה היה גוש עציון נתון במצור מרבית הזמן, אי בודד של התיישבות יהודית מוקפת ערבים. כל אנשי הגוש, ויוסף ביניהם, שירתו במחוז ירושלים של ה״הגנה״. ההתקפה האחרונה והגדולה מכולן על גוש עציון נערכה במאי 1948. חיילי הלגיון הירדני השתלטו על כמה משלטים הסמוכים לכפר עציון, והצליחו לבתר את הגוש לשניים. הם פרצו את ביצורי הכפר כשהם חמושים במשוריינים ובארטילריה, ומלווים בכוח מקומי רב מכפרי הסביבה.
למעלה ממאה מגיני הכפר נפלו באותו יום, רבים נרצחו לאחר שנכנעו. גם יוסף וחברתו רחל היו בין הנופלים. בן 28 היה במותו.
הספיד את יוסף חברו: ״מופלא היה הבחור היקר הזה: מצניע לכת היה, אך מלא גאווה לאומית. תמיד אמר שיש לשכוח את העבר הנורא ולהתמסר בכל הכוח לבניין העתיד, ורק עתיד אחד היה קיים בשבילו – עם חופשי במולדתו, אבל בלבו שמר את היגון הכבד והנורא על אובדן כל משפחתו, בתופת המלחמה. הוא חזה את המדינה, ידע שהיא מוכרחה לבוא, נלחם ונפל למענה, אך לא זכה לראות בהתגשמות חזונו, ואף לא לדעת בשעת נפילתו, שאת המדינה שירת, ולמענה נפל״.
יוסף ויסמן היה ״נצר אחרון״ – אחד מניצולי השואה שנותרו שריד אחרון ממשפחתם הגרעינית, שחוו על בשרם את אֵימַת השואה בגטאות ו/או במחנות הריכוז וההשמדה ו/או במנוסה ובמסתור בשטחים שנכבשו ע"י הנאצים ו/או בלחימה לצד אנשי המחתרות או הפרטיזנים בשטחי הכיבוש הנאצי שעלו לארץ, בשנות מלחמת העולם השנייה או אחריה, לבשו מדים ונפלו במערכות ישראל.
במלחמת העצמאות נפלו למעלה מ-4,500 חיילים. פחות משליש מהם היו ילידי הארץ והיתר עולים מהתפוצות, כאשר רובם המכריע הגיעו ממדינות אירופה. מעל אלף מהנופלים במלחמה היו ניצולי שואה שהגיעו ארצה לאחר ששרדו את זוועות המלחמה, לחמו להקמת המדינה ונפלו למענה. 139 מתוכם היו ״נצר אחרון״, שעם נפילתם לא נשאר כל זכר למשפחתם.
יום השואה, יום הזיכרון לחללי מערכות ישראל ויום העצמאות מצויינים בסמוך זה לזה. ניצולי השואה שלחמו בשנות הקמת המדינה מהווים גשר בין שואת העם היהודי חסר המולדת שנועדה להכחידו, לבין מלחמת העצמאות והקמת המדינה לעם היהודי בישראל. חלקם של ניצולי השואה בהקמת המדינה הינו משמעותי ביותר, והם היוו חלק נכבד מקרב הכוחות הלוחמים במלחמת העצמאות. ייתכן אף כי בלעדיהם לא יכול היה הצבא הצעיר לעמוד מול צבאות ערב. רבים מהניצולים ראו בהשתתפותם במלחמת העצמאות זכות גודלה – זכות ל'נקמת התקומה' – נקמת כבוד היהודי האחרון.
הנתונים המוצגים בפוסט זה מבוססים על מידע שאספתי מאתר ההנצחה לחללי מערכות ישראל.באתר מוצגים פרטי החללים והם כוללים את סיפור חייהם.
האתגר המרכזי היה לחלץ מתוך סיפורי החיים (הכתובים כטקסט חופשי ולא מובנה) את המידע הבא:
- ארץ הלידה של כל אחד מחללי מלחמת העצמאות
- שנת העליה לארץ (עבור ילידי התפוצות)
- האם החלל היה ניצול שואה
על מנת לחלץ את הנתונים האלה השתמשתי באלגוריתמים שונים לעיבוד שפה טבעית, למידת מכונה ולמידה עמוקה. בשלב הראשון, ניתחו האלגוריתמים את הטקסט החופשי על מנת להבין באיזה ארץ נולד כל חלל ואם ומתי הוא עלה לארץ. השלב השני, שהיה מורכב יותר, עסק בהבנה אם החלל היה ניצול שואה.
לשם כך בניתי רשת למידה עמוקה המסיקה באופן אוטומטי מתוך הטקסט מה הסבירות שהחלל היה ניצול שואה. אימון הרשת התבצע על שתי תת-קבוצות של חללים: הקבוצה הראשונה הכילה חללים שבוודאות לא היו ניצולי שואה ואילו הקבוצה השניה הכילה את אלה שבוודאות היו ניצולי שואה.
באופן מעשי, הקבוצה הראשונה הכילה את החללים שנולדו בארץ (עפ״י ארץ הלידה שהסיק האלגוריתם בשלב הראשון) ואת החללים שעלו לארץ לפני מלחמת העולם השניה (עפ״י שנת העליה שהסיק האלגוריתם בשלב הראשון). ואילו הקבוצה השניה הכילה את חללי ״נצר אחרון״ (נתון זה מצויין בסיפור חייהם).
רשת הלמידה העמוקה ניתחה את סיפורי החיים של כל אחת מהקבוצות ומתוכם היא למדה את המאפיינים הטקסטואלים היחודיים לכל קבוצה. לאחר בניית המודל נבחנו כל יתר סיפורי הנופלים אל מול המודל וכך חישבה הרשת עבור כל אחד את הסבירות שהחלל ניצול שואה – כלומר, בעל מאפיינים הדומים יותר לסיפורי ניצולי השואה מהקבוצה השניה במודל מאשר לאלה שלא (הקבוצה הראשונה במודל).
מדהים גיל.
שאלת תם:
אני לא מבין כלום בלמידת מכונה וכל זה, אז השאלה שלי היא איך יודעים אם התוצאות של האלגוריתם הן באמת נכונות?
השווית אותם לאיזה מחקרים אחרים שעשו את הפילוח הזה, או שאתה בכלל הראשון שעושה אותו?
תודה רבה מיקי
בעיקרון ראיתי כמה מחקרים ספורים בנושא אבל התוצאות שאני הגעתי אליהן היו קצת שונות.
אני לא יודע על סמך מה הם הגיעו למספרים שלהם אבל בוודאות הם לא תואמים למה שמופיע באתר יזכור.
כדי לוודא שהאלגוריתם אכן צודק אני עובר ידנית על חלק מהתוצאות שלו -מכיוון שהוא נותן גם את סיפור הדרך, כלומר מה גרם לו להגיע להחלטה, אז קל לראות את זה הגיוני או טעות.
באופן הזה אני גם מתייג ידנית חלק מהמידע וכך אני יכול להעריך איך שינויים באלגוריתם משפרים את התוצאות
גיל שלום וברכה
נעים להכיר אנשים שעוסקים בתחומי ההתעניינות שלך . אני מודה שנושא זה הוא לא מרכזי , אבל מצוי במחקר אקדמי שאני עורך
אני מודע שאני לא מכיר את צורת הניתוח שלך שמן הסתם יש בה הגיון מסוים , אבל על בסיס ספירה פרטנית ומגושמת , הנתונים אינם נראים מדויקים. אני מבין שבסיס הנתונים שלך הוא אתר "יזכור" . באתר יזכור ברשימה שהיא ללא ספק דינמית אבל היא המעודכנת ביותר, רשומים 153 חללי נצר אחרון. למיטב זיכרוני כשעברתי על השמות אחוז יוצאי הונגריה היה גדול יותר (בפולנים אתה די מדייק) , וזו כבר שאלה לא פשוטה: מהי הונגריה ערב מלחמת העולם ? אני לא בטוח שהשיטה שלך מסוגלת לבדוק שאלה כזו .
בכל הקשור לרשימה הגדולה של ניצולים שנפלו במלחמת הקוממיות, אכן לא נערכה, למיטב ידיעתי , ספירה של כל נופל ונופל. אבל ללא ספק מדובר במשימה הכרחית ולו בגלל הצורך להגדיר ניצול שואה , שזו שאלה מורכבת מאוד . .
חס ושלום לא רוצה להתנצח , אבל אני סבור שאין תחליף לספירה שדורשת המון סבלנות. מי שיעשה זאת , כשכל הידע ההסטורי מוכר לו – צריך להצדיע לו .
אני די חלש בבלוגים אבל אשמח להתכתב איתך
שוקי שריר
הי שוקי
תודה רבה על הערותיך.
אני בטוח שניתוח ידני של כל אחד מ-4700 סיפורי הנופלים יניב תוצאות מדויקות יותר.
מצד שני כמות הזמן הנדרשת לשם כך תהיה גדולה מאד.
צריך לזכור שגם בניתוח ידני יש אי דיוקים ולפעמים צריך מספר מעברים על הסיפורים של אנשים שונים.
היתרון בשימוש באלגוריתמים הוא שניתן לקבל תוצאות די מהר וזה מאפשר לי להציג דברים ולהעלות למודעות נושאים רבים יותר ממה שניתן לעשות ידנית.
בנוסף לפעמים דווקא האלגוריתמים צודקים במקום שאנשים טועים כי הם לוקחים בחשבון תיוגים קודמים ולומדים מנסיון העבר.
באופן כללי אני חושב שהטעות בתיוג קיימת באחוז קטן מהמקרים וזה אכן לא מושלם אבל אני לא חושב שיש תיוגים מושלמים כי בהרבה מקרים הנושא נתון לפרשנות.
לשם הדוגמא עד היום לא הבנתי אם הכפר של סבתא שלי היה בזמן השואה בהונגריה או ברומניה כי הגבולות היו נזילים ואפילו ניתוחי ידני לא היה מצליח לענות על השאלה.
ספציפית לגבי נצר אחרון, באתר יזכור יש אכן מעל 150 כאלה אבל מתוכם 139 נפלו במלחמת העצמאות והיתר לאחר מכן
אתה עושה ניתוחים מעניינים מאוד, אשמח לעזור לך לעשות הדמיות ברורות ויעילות יותר שיציגו תובנות מעניינות נוספות שכרגע הולכות לאיבוד.
תודה רבה
היי גיל,
מעניין לקרוא.
אתחיל בכך שאשמח לראות את הקוד 🙂 (github)
לגבי התוצאות, אתה מזכיר השתמשת ברשת עמוקה, אך זה נראה שיש לך יחסית מעט data, איך התמודדת עם זה?
בנוסף, לגבי ניצולי שואה, למה לא ניסיתי לקחת טקסטים מיד ושם? זה יכל להקל.
אני חושב שגם יכל להיות מעניין לראות clusters של סיפורים דומים. אני לא יודע כרגע איך ניתן לעשות את זה, אבל זה יכול לתת לך"מחלקות" סיפורים וזה נשמע כמו משהו שיכול להיות מעניין.
הי ברק
תודה רבה
אני מתכנן להעלות את הקוד לכל הפוסטים מתישהו שיהיה לי זמן לארגן את הכל.
לגבי הלמידה, למעשה האימון מתבצע על n-grams של מילים מתוך מתוך הסיפורים ולא על כל הסיפור כמקשה אחת.
באופן הזה יש גם יותר data לאימון וגם אני משתמש בזה לתהליך נוסף של ווידוא התוצאות.
נשמע מעניין מה שהצעת, הבעיה היחידה שיכולה להיות היא שהשפה בה מסופרים סיפורי הנופלים באתר יזכור היא בעלת אלמנטים מסויימים שבאופן כללי הם די עקביים.
לעומת זאת יכול להיות שאם אכניס סיפורים מ״שפה״ אחרת (כלומר דרך אחרת לספר את הסיפורים) אז הרשת תלמד לזהות את השפה ולא את הסיפור.
בכל מקרה נשמע כיוון מעניין לחקור אותו – תודה רבה 🙂