תארו לכם את התרחיש הבא:

אתם יושבים במשרד, באמצע יום עבודה עמוס, כשלפתע מנהל החברה מצלצל אליכם. הוא מבקש מכם להעביר לו, בדחיפות, מאה אלף שקל עבור עסקה חשובה שהחברה שלכם עומדת לבצע. אתם, בתור עובדים נאמנים לחברה, ממהרים לבצע את הבקשה שלו. שעתיים מאוחר יותר, אתם מקבלים הודעה מהמשטרה: שודד אלמוני גנב מהחברה שלכם מאה אלף שקל….. באמצעות התחזות קולית למנהל שלכם.

נשמע כמו תרחיש דמיוני?

תחשבו שוב:

מקרה דומה אירע לפני שנתיים- בתחילת שנת 2020- בבנק בהונג קונג: שם, אחד מעובדי הבנק קיבל שיחת טלפון ממנהל הבנק לאשר תשלום בסך 35 מיליון דולר עבור רכישה שהבנק עומד לבצע. לאחר מכן התברר, שהשיחה לא באמת הגיעה מהמנהל, אלא מגנב אלמוני שעשה את הרווח של חייו.

הונאה קולית- איך היא מתבצעת?

הונאות קוליות מהסוג הזה אינן מתבצעות על ידי חקיין אנושי מוכשר במיוחד, אלא משתייכות למשפחת ה-deepfake: מדובר בתוצרים מזוייפים (סרטונים, תמונות, קטעי קול ואפילו טקסטים), הנוצרים באמצעות שימוש בטכניקת בינה מלאכותית בשם deep learning (בעברית- למידה עמוקה). בפשטות, הונאה קולית מבוססת deepfake (שמכונה audio deepfake) נוצרת באמצעות דגימת קול של האדם אותו מחקים, אותה משנים ומרחיבים, לפי הצורך, באמצעות שימוש בלמידת מכונה, שיודעת לזהות ולחקות את הדפוסים שבדגימת הקול (אינטונציה, אוצר מילים, פאוזות בדיבור ועוד). כבר בשנת 2016, חברת אדובי הציגה אב טיפוס לתוכנה המסוגלת ליצור קטעי קול מזוייפים. בפרק הזמן שחלף מאז, התפתחה הטכנולוגיה באופן משמעותי במיוחד. רק לשם ההמחשה: בעוד שהתוכנה של אדובי הזדקקה לדגימת קול ארוכה, באורך 20 דקות, על מנת להפיק קטעי קול חדשים, הרי שכבר בסוף שנת 2017, חברת באידו מסין הציגה תוכנה לשיבוט קול אנושי, שזקוקה לדגימת קול אנושית אותנטית בת שניות אחדות בלבד.

דוגמה ליכולות הקיימות היום תוכלו למצוא בסרטון הבא, כשתשמעו את דונלד טראמפ מדבר כמו קומוניסט מושבע:

כיצד ניתן להתמודד עם התופעה?

כפי שהבנתם מהסיפור שהוצג בהתחלה, הקורבנות הראשיים של ההונאות הקוליות המתוחכמות הללו הם עסקים, שסכומי כסף עצומים עלולים להיגנב מהם באמצעות שימוש בהוראות תשלום מזוייפות. הדרך הטובה ביותר עבור עסקים כדי להתגונן ממצבים כאלו הוא קביעת מנגנון אישור נוסף, לביצוע מהלכים משמעותיים בחברה: למשל, העברות כספים גדולות לא יאושרו רק על סמך שיחת טלפון מהמנהל, אלא גם על בסיס הוראה דומה ממנהל החשבונות בחברה, או על בסיס הוראה כתובה המגיעה מהמנהל.

בנוסף, מומלץ גם ללמד את העובדים שיטות להתמודדות עם שיחות עסקיות, שנראות להם חשודות: כדאי, למשל, שהעובד ישאל את הצד השני שאלות מתקילות ובלתי צפויות- כאלו שרק בן אדם יכול לענות עליהן (רצוי שהשאלות הללו לא יהיו קשורות ישירות לבקשה של המתקשר).

בד בבד, ישנם כאלו שגם עובדים על פתרונות טכנולוגיים לבעיה: בדצמבר האחרון הוצג מחקרם של שני חוקרים מאוניברסיטת רוהר שבגרמניה, שנועד לפתח דרכי זיהוי של קטעי קול מזוייפים. במסגרת המחקר, אספו החוקרים 118,000 קטעי קול שהופקו באופן מלאכותי (באורך כולל של 196 שעות) והישוו אותם לקטעי קול אנושיים. בזכות ההשוואה הזו, מצאו החוקרים הבדלים עדינים בין קטעי קול אנושיים למלאכותיים- הבדלים אותם ניתן יהיה לנצל בעתיד כדי לעלות על קטעי קול מזוייפים, הנוצרים למטרות זדוניות.