תוכנה מתמללת

הטכנולוגיה של האינטליגנציה המלאכותית (AI) משתפרת והולכת ונכנסת ליותר ויותר תחומים בחיינו. עם ההיכרות הגוברת שלנו עם היכולות ועם המגבלות של האינטליגנציה המלאכותית אנו לומדים להכיר בכך שטכנולוגיות המבוססות על אינטליגנציה מלאכותית לא יחליפו את האדם, אלא יהוו כלי עזר. דוגמא מוכרת מחיי היומיום היא שאוטו-קורקט והשלמה אוטומטית יכולים לעזור מאד לקצר זמן הקלדה ולחסוך טעויות כתיב, אבל בחיים לא הייתם נותנים לאוטוקורקט לכתוב את ההודעה במקומכם.

כך בדיוק גם לגבי זיהוי קול ותמלול. טכנולוגיית זיהוי הדיבור התקדמה מאד ומאפשרת כיום זיהוי לא רע של מילים באנגלית (כאשר הדובר יודע שהוא מדבר על מכונה והוגה את המילים בצורה ברורה במכוון), זיהוי חלקי של מילים מתוך שיחה, ועוד. זיהוי מילים באנגלית מאפשר מתן פקודות קוליות וחיפוש קולי (כגון אוקיי-גוגל וסירי). זיהוי חלקי של מילים מתוך שיחה מאפשר לזהות באופן כללי נושאים שהוזכרו בשיחה מוקלטת, אך לא את תוכן כל השיחה.

אנשים רבים מחפשים תוכנה מתמללת או תוכנה לתמלול, אך לא מודעים לכך שהטכנולוגיה כיום עוד רחוקה מאד מזיהוי דיבור שמאפשר תמלול מלא של הקלטות. ישנן כיום תוכנות המסוגלות לזהות חלק מהמילים בשיחה, ובכך עוזרות למתמלל אנושי ומקצרות את זמן התמלול. עם זאת, לא קיימות תוכנות תמלול המחליפות את המתמלל האנושי. השאלה הנשאלת כאן היא האם התוכנה מצליחה לזהות מספיק מילים כדי שתצליח באמת לעזור מספיק למתמלל האנושי בכדי לקצר את זמן התמלול, או שמא ה"טעויות" של התוכנה כה רבות עד כי היא לא מהווה עזר של ממש ולמתמלל עדיף לתמלל את ההקלטה ישירות ללא היעזרות בתוכנה.

בשפה האנגלית המצב כיום הוא שישנן תוכנות שמסוגלות לזהות חלק גדול מהמילים, כך שבהנחה שהדוברים בהקלטה מדברים בצורה ברורה, איטית, ולא נכנסים זה לדברי זה, התוכנה מסוגלת לזהות מספיק מילים בכדי שמספר התיקונים וההשלמות שהמתמלל יצטרך לערוך יהיה קטן מספיק כדי שהשימוש בתוכנה ישתלם מבחינת סך הזמן המושקע בתמלול. עם זאת, בשפה העברית אין כיום תוכנה המצליחה לעבור את הרמה הקריטית הזאת של שיעור הדיוק: תוכנות מתמללות בעברית מזהות נכונה רק שיעור קטן מהמילים, והתיקונים וההשלמות שעל המתמלל לערוך כה רבים, עד כי משתלם יותר לתמלל ללא עזרת התוכנה כלל.

 

למה בעברית עדיין אין תוכנה מתמללת?

הסיבה לכך תוכנות התמלול בעברית מתקדמות פחות מתוכנות התמלול באנגלית נעוצה בדרך הלמידה של מערכות הבינה המלאכותית. כדי שהתוכנה "תלמד" שפה, היא צריכה להיחשף לכמות גדולה של הקלטות אשר כבר תומללו בצורה מדוייקת. על ידי ההשוואה בין ההקלטה לתמליל, התוכנה משפרת את האלגוריתם באופן שמגדיל את הדיוק. באנגלית קיימות יותר הקלטות אשר יש להן תמליל שדיוקו ידוע, ולכן לתוכנות הזיהוי יש מצע רחב בהרבה "ללמוד" ולשפר את הדיוק. לעומת זאת בעברית מצאי הקלטות אשר יש להן תמליל שדיוקו ידוע קטן יותר, ולכן התוכנות עדיין לא הגיעו לרמת דיוק מספקת.

חשוב לציין שהאמור מתייחס להקלטות שבהן הדוברים מדברים לאט, ברור, ולא נכנסים זה לדברי זה. בהקלטות רגילות בהן הדוברים מדברים באופן חופשי וספונטני כגון פגישות, ראיונות וכדומה, הדיבור מהיר וישנה "בליעה" של מילים, ולכן לא קיימת כלל תוכנה המסוגלת לזהות מילים בשיעור מספיק בכדי להוות כלי עזר למתמלל.

כיוון שאנשים רבים מחפשים תוכנות תמלול או תוכנה מתמללת, ישנן חברות תמלול המציעות תמלול באמצעות תוכנה. ייתכן שהמתמללים באותן חברות אכן נעזרים בתוכנה כלשהי, אך אם התמלול היה באמת ממוחשב, היינו מצפים למחיר הרבה יותר נמוך לדקת הקלטה. עם זאת, השוואה של המחירים המוצעים על ידי החברות הללו למחירים המוצעים על ידי חברות המצהירות שהתמלול נעשה על ידי מתמללים בשר ודם מעלה כי דווקא החברות המציעות תמלול על ידי מתמללים אנושיים נמוך יותר. לכן, גם אם החברות שמציעות תמלול באמצעות תוכנה אכן עושות שימוש בתוכנה כלשהי, הרי שמדובר בעיקר בגימיק שכן הוא לא מוזיל את מחיר התמלול. מסיבה זו, לכל צורך מעשי, עדיין מומלץ להשתמש כיום בשירותי תמלול מקצועיים שנעשים על ידי מתמללים אנושיים המקדישים תשומת לב לדוברים בהקלטה.

לקבלת הצעת מחיר לתמלול מלאו את הטופס ואנו נחזור אליכם:


העלה קובץ (עד 10MB)*
*ההקלטה שלך גדולה מ-10MB? צור קשר באמצעות הטופס ללא שליחת ההקלטה, ונשלח לך במייל קישור מיוחד להעלאת קבצים גדולים

 

שלחו לחברים: