טכנולוגיית קריאת שפתיים חדשה תגרום לאנשים "לכסות את פיותיהם" כשהם משוחחים ביניהם ברחוב - כך אמר הרגולטור הבריטי לפרטיות, טוני פורטר. הוא הביע חשש לגבי תוכנות לקריאת שפתיים שיכולות לפענח מה שאנשים אומרים ממרחק, או טכנולוגיות שיכולות לזהות אנשים לפי צורת הליכתם.
"ליכולת של הטכנולוגיה לקריאת שפתיים לקבוע מה אנשים אומרים תהיה השפעה מדכאת. היא תשנה את האופי של החברה שלנו", אמר פורטר ל"איבנינג סטנדרד". לדבריו, "אנשים ירגישו שאינם יכולים לנהל שיחה בחוץ. אנו רואים את מנהלי קבוצות הכדורגל מכסים את פיותיהם כשהם מנחים את השחקנים כדי שלא יקראו את שפתותיהם. הכפילו זאת במיליוני בני אדם".
אמירותיו של פורטר באו בעקבות השקה של חקירה רשמית לגבי השימוש בטכנולוגיית זיהוי פנים על ידי משטרת מטרופוליטן, על ידי הנציבה למידע אליזבת דנהם, שאמרה כי המשרד שלה "מודאג מאוד" מהתוכנה. ארגון זכויות האזרח ביג ברדר ווץ' הזהיר באוגוסט כי חשף "מגפה" של שימוש בטכנולוגיות זיהוי פנים במרכזי קניות, מוזיאונים ואולמות כנסים בבריטניה.
עם זאת, פורטר אמר כי הטכנולוגיות האלה יכולות ליהפך לכלי חשוב של רשויות החוק. הוא הוסיף כי "חשוב להגן על חברה פתוחה וחופשית, מאחר שכיום אנו בסכנה של ויתור על החופש שלנו לטובת הטכנולוגיה. ג'ורג' אורוול הוציא לאור את '1984' לפני 70 שנה, ועדיין רלוונטי לומר שאנו חייבים להקשיב לאזהרות ולהתעקש על כך שאיננו רוצים חברה כזאת".
מדענים באוניברסיטת איסט אנגליה בנוריץ' עובדים כיום על השלב הבא של טכנולוגיית קריאת שפתיים אוטומטית, שתוכל לתרגם דיבור מסרטוני מעקב ממצלמות במעגל סגור. טכנולוגיית זיהוי הדיבור הוויזואלי - שנוצרה על ידי ד"ר הלן בר ופרופסור ריצ'רד הארווי מבית הספר למדעי המחשב של איחוד האמירויות - יכולה לשמש ב"כל מקום שבו הקול אינו ברור דיו כדי לקבוע מה אנשים אומרים", אמרה בר.
הטכנולוגיה משתמשת ברשתות נוירולוגיות עמוקות ש"לומדות" את הדרך שבה אנשים מזיזים את השפתיים שלהם, הסביר הארווי. החוקרים מאמנים את המערכת באמצעות שימוש בתנועות שפתיים של אדם כלשהו, ואז בוחנים אותה על תנועות שפתיים של אדם אחר. ניתן יהיה להשתמש בטכנולוגיה גם כאשר איכות הקול טובה אך יש רעשי סביבה שמקשים על השמיעה.
עוד ב-TheMarker
הפלישה הגדולה: צבא של אלפי רובוטים צפוי לחדור לאוניברסיטאות בארה"ב
חשבון הטוויטר של מייסד החברה נפרץ והחל לפרסם ציוצים גזעניים
לצוות יש מאגר נתונים של 12 אנשים כרגע, והם משתמשים בקובץ המכיל כ-1,000 מלים. זה מייצר שיעור הצלחה של 80% במקרה של דובר אחד, ו-60% במקרה של שני דוברים. מאפיין במודל השפה גם מסייע לאמן את המחשב לזהות את התוכן של המלים.