על הבנות בסיסיות בנוגע להקראת תוכן עם תוכנות קוראות מסך

קיימת בקרב העוסקים בהתאמות נגישות דיגיטליות, אי בהירות בקשר ליכולות ההקראה של מנועי דיבור ותוכנות קוראות מסך. ארגונים גדולים לרבות פעילים בתחום ההדרכות, פונים אלי בשאלות תם – שעל חלק מהם אנסה לענות בפוסט זה.

תוכנות קוראות מסך -עולם שלם של יכולות והתאמות

תוכנות קוראות מסך המשמשות אנשים עם לקויות ראייה מתקדמות, אנשים עם עיוורון וכן, גם אנשים עם לקות למידה המתקשים מאוד בקריאת טקסט, הן תוכנות מורכבות, הכוללות מגוון רחב מאוד של תכונות והגדרות, הניתנות לשינוי ו/או להתאמה אישית. בשל מורכבותן, צריך להכירן היטב ו/או את המדריך למשתמש המגיע עם כל תוכנה קוראת מסך הנפוצה לשימוש כיום.

מנועי דיבור ופלט קול

  • מנוע דיבור המכונה גם דרייבר: הוא הרכיב המאפשר שימוש בקולות שונים, אשר פועלים עם אותו מנוע הדיבור.
  • קול: המכונה לעיתים גם פלט קול, הוא למעשה הקול ששומעים בעבודה עם תוכנה קוראת מסך

הדוגמה של Vocalizer Expressive

  • מנוע הדיבור Vocalizer Expressive
  • קרוב ל 50 קולות בשפות השונות כגון כרמית לשפה העברית, AVA לשפה האנגלית וכד'
  • בשפות כגון אנגלית וערבית, קיימים גם קולות לתת השפות השונות כגון אנגלית ארצות הברית, אנגלית בריטניה, אנגלית אוסטרליה ועוד
  • קולות יכולים להיות במגדר זכר ובמגדר נקבה, בקולות של ילדים, מתבגרים, מבוגרים, רשמיים יותר או פחות ועוד

בשפה העברית אין הקראה תקנית במאה אחוזים

  • בכל חבילות מנועי הדיבור והקולות, על אף יכולות ההקראה המתקדמות, לעולם יהיו טעויות בהקראת טקסט – במיוחד בשפה העברית.
  • מורכבותה של השפה העברית, נכון לעת כתיבת פרסום זה, אינה מאפשרת הגעה ל 100 אחוז דיוק. חשוב לציין כי לאורך השנים הושקעו ואולי עדיין מושקעים לא מעט משאבים בניסיון לשפר את יכולות ההקראה של השפה העברית.
  • בנוסף לכך, לעיתים תוכנה קוראת מסך, תקריא באופן שונה את אותה המילה, שכתובה באותן האותיות, באופן שונה במשפטים שונים. הדבר ניכר דווקא במסמכי PDF שבהם הטקסט מוקרא תקין בשפה העברית, אבל ניתן לראות עיוותים בקריאת מילים. כך לדוגמה, המילה 'דיגיטליים' מוקראת כך 'דיגיטליי-מם סופית'. במקרים רבים האות האחרונה במילה שבמשפט או פסקה תוקרא במנותק מהמילה כולה – כמו במקרה של האות מם סופית של המילה דיגיטליים שמוצגת בסוף שורה
  • במסמכים דיגיטליים מסוימים בהם אין קידוד תקין של השפה העברית, הטקסט בשפה העברית יהיה מוקרא בצורה מאוד משובשת

ניתן להציג עוד מקרים רבים המתארים את הקושי של מנועי דיבור בשפה העברית בהקראת טקסט בשפה העברית

על מנגנון הפרדת קולות

  • כאמור תוכנה קוראת מסך יודעת להקריא טקסטים בשפות השונות
  • תפקידו של מנגנון הפרדת קולות הוא להפריד בין קולות בשפות השונות, ולהפעיל את הקול באותה השפה
  • בדרך כלל מנגנון הפרדת קולות קיים במנועי דיבור
  • ישנם מנועי דיבור, אשר יודעים לבצע את המעבר רק כאשר יש תיוג של השפה ברמת הקוד
  • ויש מנועי דיבור כמו Vocalizer Expressive שיודעים לבצע את הפרדת הקולות ברוב המקרים, גם אם אין הגדרה בקוד של השפה הראשית.
  • במקרה זה, מנוע הדיבור "עובר" על כל תו ותו, יודע לזהות לאיזו שפה הוא משויך, ולהפעיל את הקול המתאים
  • ההשפעות של מנגנוני הפרדת קולות על יכולת הקראת טקסט בשפה העברית או בשילובים של שפות שונות, מתבטאת במיוחד ובעיקר בדפי אינטרנט שבאתרי אינטרנט.
  • ולכן יש חשיבות רבה להגדרת שפה ראשית ושפה בחלקים השונים של הדף – כאשר יש יותר משפה אחת במשפט או פסקה
  • כאשר דף אינטרנט שמוגדר בשפה הראשית כ"עברית" ובו משולבים מילים בשפות אחרות, כל מילה בשפה אחרת, משפט או פסקה, צריכים להיות מוגדרים בתגית השפה המתאימה עבור אותו חלק –  כמו  למשל לעטוף את המילים, המשפטים או הפסקאות ב span ולהגדיר להם את ה lang המתאים.

הדוגמה של דף תוצאות החיפוש עם טקסט בעברית של Google

  • ככל הנראה דף האינטרנט של תוצאות החיפוש של Google אינו כולל הגדרה של השפה הראשית, או שההגדרה לא מוכרת לחלק מתוכנות קוראות המסך השונות
  • לכן, מנועי דיבור כגון One Core Voices של מיקרוסופט, עם מנוע הדיבור Asaf לא יוכל לקרוא את הטקסט בעמוד תוצאות החיפוש של גוגל, כאשר יש טקסט בשפה העברית
  • לעומת זאת, מנוע הדיבור Vocalizer Expressive, יודע לנתח תו אחר תו ולשייך אותו בצורה מוצלחת מאוד לשפה, ולהפעיל את הקול המתאים בשפות השונות. וכך, כאשר גולשים בעמוד תוצאות החיפוש של גוגל, הכולל טקסט בשפה העברית, ניתן לשמוע את הטקסטים השונים בשפות השונות, גם אם לא מוגדר בקוד הגדרת שפה ראשית, או שהיא מוגדרת בדרך שלא מוכרת לחלק מתוכנות קוראות המסך

חשוב לציין כי בישראל, רוב רובם של משתמשי תוכנות קוראות המסך JAWS ו NVDA למחשבים שולחנים ו VoiceOver במערכת ההפעלה IOS ומק, עובדים עם מנוע הדיבור Vocalizer Expressive  – שכן זהו מנוע הדיבור הטוב ביותר שקיים כיום ושמספק את הפלט הקולי המוצלח ביותר. למשתמשי תוכנות קוראות מסך אשר עושים שימוש  יומיומי, קבוע וממושך בתוכנה קוראת מסך, זהו הפתרון הטוב ביותר כיום עבור שילובי השפות עברית, ערבית, אנגלית, צרפתית, רוסית  – שהן השפות המדוברות ביותר בישראל.

תשובות לשאלות נפוצות

למרבית התשובות לשאלות אלו ניתן למצוא כאמור במסמכי התיעוד, ההדרכה ובהגדרות של תוכנות קוראות המסך. ניתן גם להשאיר שאלות בתגובות או בטופס צור קשר.

  • כן, בהחלט עד לרמה הגבוהה ביותר, המאפשרת למתכנתים עם עיוורון מוחלט לתכנת, מה שמצריך גישה להרבה מאוד סימנים
  • כברירת מחדל, מרבית תוכנות קוראות המסך מוגדרות לרמה בינונית של הקראת סימני פיסוק

באמצעות כמה מקשי קיצור, ניתן בהחלט לשנות את רמת פירוט המלל ואף להגדיר אלו סימנים יוקראו או לא יוקראו בכל רמה. כך לדוגמה, ברמת פירוט מלל "ללא" שבה אין הקראת סימנים כלל, ניתן להגדיר שנקודה, פסיק, נקודתיים וסימנים נבחרים כן יוקראו

  • כן, בהחלט
  • אנשים רואים, כשהם קוראים טקסט, הם קוראים את המילים, ולא חושבים בכל רגע, אה, הפסקה הזו, היא בגודל גופן 12 נקודות, הגופן הוא גופן אריאל, הטקסט לא מודגש ועוד
  • מסיבה מובנת זו, גם הגדרות ברירת המחדל של תוכנות קוראות מסך, אינן מוגדרות להקראת מאפייני עיצוב

בכל מקרה, ניתן להיכנס להגדרות של תוכנה קוראת מסך ולבחור אילו מאפייני עיצוב יוקראו

  • כן, בהחלט
  • כאשר מגדירים רשימת מספור או תבליטים אוטומטיים, תוכנה קוראת מסך יודעת לזהות שמדובר ברשימה עם X פריטים, ולהקריא את המספר והתבליט, וגם להודיע למשתמש כאשר הרשימה מסתיימת – Out of list

כאשר ממשק המשתמש של תוכנה קוראת מסך הוא באנגלית, האלמנטים של ממשק המשתמש יוקראו באנגלית. וכך, כאשר תוכנה קוראת מסך תפגוש כותרת היררכית היא תכריז את שם הכותרת כפי שמופיעה בטקסט ואת המילה Heading level 1 לדוגמה.

כאן התשובה מורכבת ותלויה מאוד בממשק. להלן כמה דוגמאות:

  • באתרי אינטרנט, כאשר תמונה מוגדרת עם טקסט חלופי ריק, פירוש הדבר שתוכנה קוראת מסך לא תגיע לתמונה. באופן דומה, יש אלמנטים עיצוביים נוספים שמוגדרים באופן שתוכנה קוראת מסך לא תגיע אליהם ולפיכך לא תספק עבורם פלט קול. לעיתים הדבר הכרחי בכדי לא ליצור "עומס קוגניטיבי" על משתמשי תוכנות קוראות המסך, ולעיתים, כאשר האלמנטים נחוצים להבנת התוכן, חשוב להגדיר אותם בהתאם
  • במסמכים דיגיטליים, ישנם אלמנטים כגון צורות ותיבות טקסט שחלק מתוכנות קוראות המסך יודעות לקרוא וחלק לא. קשה מאוד עד בלתי אפשרי לבדוק כל צורה וצורה, ולכן צריך להפעיל שיקול דעת בכל מה שנוגע להנגשת מסמכים דיגיטליים, שבהם כמות אי תאימות בין תוכנות קוראות מסך ליישומים להקראת מסמכי PDF היא הגבוהה ביותר והבעייתית ביותר
  • הוספתי תיאור לטבלה ב Word בתיבת טקסט חלופי, ובקובץ ה PDF הוא לא מוקרא: גם  כאן, מדובר בסוגיית תאימות  שאנו מקווים כי ההתפתחות הטכנולוגית תשפר

גם במקרה זה, מדובר בהעדר תאימות טכנולוגית, ככל הנראה של אפליקציית Adobe הרשמית להצגת מסמכים דיגיטליים, שאינה מותאמת לשפה העברית.

כתיבה מגדרית אשר כוללת לוכסנים ונקודות בין מילים, יוצרת בעבור מרבית משתמשי תוכנות קוראות המסך בלבול רב. במקרים שבהם קורא המסך מוגדר להקריא חלק מסימני הפיסוק, הם יוקראו בתוך המילה כמילה נוספת. לדוגמה "א נקודה נשים". במקרים שבהם לא הוגדרו כלל הקראת סימני פיסוק, אזי המילים יוקראו בצורה משובשת מאוד. זו הסיבה  שיש להימנע מכתיבה מגדרית באופן זה. מידע נוסף בנושא שפה מגדרית בלתי שוויונית

השאר תגובה

%d בלוגרים אהבו את זה: