האם ChatGPT יודע לקרוא כתב יד עברי? ניסוי, תובנות וטיפים

BlogNavon
האם ChatGPT יודע לקרוא כתב יד עברי? ניסוי, תובנות וטיפים

במסגרת ניסוי קטן שערכתי, רציתי לבדוק עד כמה ChatGPT מסוגל לזהות ולתמלל טקסט מכתב יד בעברית. מדובר ביכולת שיכולה להיות שימושית מאוד – מסטודנטים שרושמים סיכומים במחברת ועד יוצרים וכותבים שמתעדים רעיונות על דף.

הניסוי

צילמתי טקסט קצר, 4 שורות מתוך שיר שכתבתי בכתב יד ברור יחסית:

המפתחות עוד בכיס

וכבר הרגל על הברקס

שותק רק לא להכעיס

מחזיק חזק לא להתפרק

שלחתי את התמונה ל-ChatGPT וביקשתי לתמלל את הטקסט. התוצאה? רחוקה מהמקור:

המפתחות עזב כנס

עבר הדרך אל הברק

שנמצא רק לו לכנס

צריך לדעת לא להיפרד

כפי שניתן לראות, מדובר בניחוש פיוטי – אבל שגוי לגמרי. השורות לא משקפות את מה שכתוב בפועל, ונדמה שחלק מהמילים הומצאו או הושלמו "בהשראת" האות הראשונה שהוא קלט, תוך ניסיון לשמור על משקל וחריזה.

למה זה קורה?

היכולת של ChatGPT לקרוא כתב יד מבוססת על OCR – זיהוי תווים אופטי – ולא על "קריאה" כמו עין אנושית. יש הבדל משמעותי בין זיהוי כתב יד באנגלית לעומת עברית:

באנגלית:

  • קיימות מיליוני דוגמאות של כתיבה ידנית שהוזנו למודלים במהלך האימון.

  • כתב יד לטיני הוא סטנדרטי יחסית, עם פחות וריאציות צורניות.

  • הטכנולוגיות המובילות מותאמות טוב יותר לאותיות לטיניות.

בעברית:

  • פחות דוגמאות כתיבה ידנית זמינות לאימון.

  • כתב יד בעברית משתנה מאוד בין אדם לאדם.

  • צורות האותיות שונות בתכלית בין כתב דפוס לכתב רהוט.

  • חיבורים בין אותיות, שימוש באותיות סופיות ובלי ניקוד – כל אלו מקשים על זיהוי.

אז מה עושים?

אם אתה בכל זאת רוצה לנסות לתמלל כתב יד בעברית בעזרת AI, הנה כמה טיפים לשיפור הדיוק:

  • כתוב בדפוס ברור – לא בכתב מחובר.

  • שמור על רווחים גדולים בין מילים.

  • צלם בזווית ישרה עם תאורה טובה.

  • השתמש בעט כהה על דף בהיר.

  • העדף סריקה על פני צילום.

  • פצל טקסט ארוך למקטעים קצרים.

רוצה תוצאה טובה באמת? התאמה אישית

למי שכותב הרבה ביד ורוצה תמלול אוטומטי מדויק, קיימת גם אפשרות לאמן מודל OCR מותאם אישית, למשל בעזרת Tesseract OCR או Google Vision AI. זה דורש השקעה ראשונית – אבל יכול לשנות את חוקי המשחק.

לסיכום

ChatGPT מסוגל להתמודד עם תמונות טקסט, אך נכון להיום, תמלול כתב יד בעברית הוא אתגר שהוא עדיין לא מצליח לפצח באופן עקבי. עם זאת, יש לא מעט דרכים לשפר את התוצאה – ואם אתה טכנולוג בנשמה, גם אפשרות לאמן מערכת משלך.

רוצה לנסות בעצמך? כתוב כמה שורות, צלם ושלח. מעניין לראות איך המודל יתמודד עם כתב היד שלך.

תגובות

יש להתחבר כדי להגיב

מערכת התגובות מאתחלת, אנא המתן...

בודק חיבור לשרת...

    האם ChatGPT יודע לקרוא כתב יד עברי? ניסוי, תובנות וטיפים