Πως αλλάζουν την κινητή τηλεφωνία τα AI chips;

Ο ενθουσιασμός για την τεχνητή νοημοσύνη θεμελιώνεται πάνω σε υπερβολικές υποσχέσεις του marketing ή πάνω σε μια καινοτόμο τάση που θα αλλάξει τη σχέση των χρηστών με την πλέον αγαπημένη τους συσκευή, το smartphone;

Ο όρος τεχνητή νοημοσύνη (Artificial Intelligence ή ΑΙ) έχει κατά καιρούς… «κατακρεουργηθεί» από τους «γκουρού» του marketing προκειμένου να υπογραμμίσουν τις εύχρηστες και πολύτιμες λειτουργίες κάποιου τεχνολογικού προϊόντος. Τη χρονιά που διανύουμε η συζήτηση για την τεχνητή νοημοσύνη επανήλθε δυναμικά στο προσκήνιο, τόσο λόγω των προβληματισμών που εξέφρασαν δημοσίως

επιστήμονες και CEO κολοσσών (όπως ο Elon Musk της Tesla) για την εξέλιξή της σε συνάρτηση με την ανάπτυξη του ανθρώπινου είδους, όσο και εξαιτίας της ενσωμάτωσης των πρώτων dedicated mobile neural network processing units (εν συντομία NPU) στα chipsets κορυφαίων smartphones όπως το Huawei Mate 10 Pro. Αφήνοντας την… επιστημονική φαντασία στην άκρη, ο σύγχρονος καταναλωτής αναρωτιέται πως μπορεί ένα τέτοιο chip να επηρεάσει την καθημερινότητά του.

Προσγειωνόμαστε, λοιπόν, στην σκληρή πραγματικότητα του σήμερα και μελετάμε τον γνήσιο εκπρόσωπο της γενιάς ολοκληρωμένων κυκλωμάτων SoC (System on Chip) που έρχεται, τον Kirin 970. Πρόκειται για το chipset που δίνει ζωή στη νέα σειρά Mate 10 της Huawei και όπως προείπαμε περιλαμβάνει στη σύνθεσή του μια μονάδα επεξεργασίας τεχνητών νευρωνικών δικτύων. Με μέγεθος που δεν ξεπερνά το ένα τετραγωνικό εκατοστό, η NPU του 970, διαθέτει 5.5 δισ. transistors που του προσφέρουν υπολογιστική ισχύ 1,92 teraflops. Για να το μεταφράσει κανείς αυτό στην πράξη, αρκεί να λάβει υπόψη του πως η υπολογιστική ισχύς της πρώτης έκδοσης της GPU του PlayStation 4 είναι 1,84 teraflops!

Παράλληλα, η αρχιτεκτονική μιας NPU ευνοεί την αυτόματη αναπροσαρμογή των αποφάσεων μιας μηχανής, αξιολογώντας αναρίθμητα εισερχόμενα δεδομένα βάσει αποτελέσματος και όχι απαραιτήτως βάσει κάποιου προσχεδιασμένου αλγορίθμου. Εκλαϊκεύοντας την παραπάνω φιλοσοφία, όσες περισσότερες φωτογραφίες σκύλων «βλέπει» μια NPU, τόσο πιο εύκολα θα μάθει να τους εντοπίζει σε μια νέα, άγνωστη φωτογραφία, αρκεί βέβαια προηγουμένως κάποιος να της έχει υποδείξει πότε κάνει λάθος. Έτσι, ενισχύει τα κριτήρια εκείνα που την οδηγούν σε σωστές επιλογές και δίνει λιγότερο βάρος στα κριτήρια που την παρασύρουν σε λάθη. Όταν η παραπάνω διαδικασία βασίζεται σε εκατοντάδες χιλιάδες ή και εκατομμύρια εξωτερικά ερεθίσματα, τότε νομοτελειακά το σύστημα «πλάθει» εμπειρία και δύσκολα μπορεί να ξεγελαστεί. Κάπως έτσι μαθαίνει και ο άνθρωπος άλλωστε, γι’ αυτό και η συγκεκριμένη τεχνολογία προσπαθεί να μιμηθεί τα δαιδαλώδη νευρωνικά δίκτυα του ανθρώπινου εγκεφάλου.

Αυτό που κάνουν συνεπώς καλύτερα οι NPU είναι να μαθαίνουν από τα λάθη τους, γεγονός που χρησιμεύει σε οποιαδήποτε προσπάθεια αλληλεπίδρασης μιας μηχανής με έναν άνθρωπο, καθώς η αντίδραση του ανθρώπου «διορθώνει» την αντίληψη της μηχανής.

Ως εκ τούτου, τεχνολογίες όπως η αναγνώριση φωνής, χειρόγραφου κειμένου ή ακόμα και αντικειμένων στο χώρο, μπορούν να βελτιωθούν με… εκθετικούς ρυθμούς, καθώς ο χρήστης συνεχώς τροφοδοτεί με δεδομένα τη μηχανή και συνεχώς διορθώνει τα τυχόν λάθη της.

Φυσικά, εκτός από τα οφέλη που μπορεί να έχει η «εκπαίδευση» μιας NPU κατά τη διάρκεια της «συμβίωσής» της με το χρήστη, υπάρχει πάντα η δυνατότητα της εκμετάλλευσης της σε συνδυασμό με την «υποδύναμη» των CPU και GPU πάνω σε έτοιμα μοντέλα εκπαίδευσης που έχουν βασιστεί σε τεράστιες τράπεζες δεδομένων (πχ image banks εκατοντάδων χιλιάδων φωτογραφιών για την εκπαίδευση αναγνώρισης αντικειμένων).

Παράδειγμα για αυτό αποτελεί η ικανότητα του Huawei Mate 10 Pro να «διαβάζει» αστραπιαία τις συνθήκες κάθε πλάνου, να προβλέπει την κίνηση των αντικειμένων και το σημαντικότερο, να καταλάβει τί αντικείμενα φωτογραφίζει. Η αντίληψη των αντικειμένων κάθε σκηνής γίνεται αφοπλιστικά άμεσα, γεγονός που επιδρά σε κάθε πτυχή μιας λήψης, από το στιγμιαίο auto focus μέχρι στο καλύτερο bokeh effect στα πορτραίτα. Η συντονισμένη χρήση CPU, GPU και NPU μπορεί να επιτρέψει την αναγνώριση 2.005 φωτογραφιών ανά λεπτό!

Ταυτόχρονα, καλύτερη μπορεί να γίνει και η αναγνώριση κειμένου. Χαρακτηριστικό είναι το παράδειγμα του «Microsoft Translator», το οποίο πλέον μπορεί να αναγνωρίσει με μεγαλύτερη ακρίβεια το κείμενο που βλέπει η κάμερα της συσκευής και να το μεταφράσει αυτοστιγμεί. Αρκετές ακόμα εταιρείες προσαρμόζουν στην Mobile AI εποχή τις δικές τους εφαρμογές, οι οποίες μέχρι σήμερα στηρίζονταν αποκλειστικά στην Cloud AI, στην τεχνητή νοημοσύνη δηλαδή που υλοποιείται σε απομακρυσμένους «θηριώδεις» servers αλλά ως εκ τούτου υπόκειται σε όλες τις διαδικτυακές καθυστερήσεις και κολλήματα. Η NPU του Kirin 970 υποστηρίζει τα open-source frameworks TensorFlow και Caffe2, με αποτέλεσμα ήδη η κοινότητα των developers να διερευνά νέους ορίζοντες πάνω στην εκμετάλλευσή της. Η αναγνώριση φωνής που δεν θα μπερδεύεται από τις ιδιαιτερότητες στο συντακτικό και στην έκφραση κάθε χρήστη, είναι το επόμενο μεγάλο στοίχημα…

Keywords
Τυχαία Θέματα