Ένα νέο πρόγραμμα τεχνητής νοημοσύνης ‘διαβάζει’ τα χείλη των ανθρώπων με εξαιρετική ακρίβεια

14:53 1/8/2018 - Πηγή: ΕΡΤ

Ένα νέο πρόγραμμα τεχνητής νοημοσύνης που ‘διαβάζει’ τα χείλη των ανθρώπων εξ αποστάσεως με μεγαλύτερη ακρίβεια ακόμη και από επαγγελματίες που έχουν εξειδικευτεί στη νοηματική γλώσσα, ανέπτυξαν ερευνητές της Google και της βρετανικής θυγατρικής της Deep Mind. Επικεφαλής της ερευνητικής ομάδας της Deep Mind, ο ελληνικής καταγωγής Γιάννη Ασσαέλ, ειδικός στην πληροφορική.

Οι επιστήμονες χρησιμοποίησαν τη μηχανική εκμάθηση και τροφοδότησαν το σύστημα με 140.000 ώρες βίντεο από το YouTube

με ομιλούντα άτομα. Στη συνέχεια, σχεδίασαν ένα πρόγραμμα που δημιούργησε κλιπ μερικών δευτερολέπτων για κάθε φώνημα που ακούγεται στα βίντεο. Το πρόγραμμα φιλτράρισε ομιλίες που δεν ήταν στα αγγλικά, πρόσωπα που δε μιλούσαν και βίντεο χαμηλής ποιότητας. Αυτό απέδωσε περίπου 4000 ώρες βίντεο, συμπεριλαμβανομένων περισσότερων από 127.000 αγγλικών λέξεων.

Το νέο «έξυπνο» σύστημα εμφανίζει μέσο ποσοστό λαθών 41% στην ορθή κατανόηση των λέξεων που σχηματίζουν τα χείλη. Μπορεί να φαίνεται υψηλό αυτό το ποσοστό, αλλά η καλύτερη μέχρι σήμερα υπολογιστική μέθοδος είχε ποσοστό αποτυχίας 77%, συνεπώς το νέο πρόγραμμα έχει περιορίσει σχεδόν στο μισό τα λάθη.

Οι ερευνητές, με επικεφαλής τον Ασσαέλ και τον Μπρένταν Σίλινγκφορντ, οι οποίοι έκαναν τη σχετική προδημοσίευση στο arXiv, σύμφωνα με το «Science», δημιούργησαν αλγόριθμους καλύτερους από κάθε άλλους στο παρελθόν, που τα καταφέρνουν αποτελεσματικότερα και από επαγγελματίες αναγνώστες χειλιών. Αν το νέο σύστημα τελειοποιηθεί και ενσωματωθεί σε ηλεκτρονικές συσκευές, όπως τα «έξυπνα» κινητά τηλέφωνα, μπορεί μελλοντικά να προσφέρει τη δυνατότητα ανάγνωσης των χειλιών στον καθένα.

ΠΗΓΗ: AMNA, Science

www.ert.gr

Keywords
Τυχαία Θέματα