AI: Επιστήμονες βρήκαν το σημείο όπου η Τεχνητή Νοημοσύνη μετατρέπεται από βοηθός σε κίνδυνο
Μια νέα επιστημονική εργασία από ερευνητές του Πανεπιστημίου George Washington εισάγει έναν μαθηματικά ακριβή τύπο που εντοπίζει τη στιγμή κατά την οποία η τεχνητή νοημοσύνη και ειδικότερα τα Μεγάλα Γλωσσικά Μοντέλα (LLMs) όπως το ChatGPT, μεταπίπτουν από την παροχή αξιόπιστων και χρήσιμων πληροφοριών σε ανακριβή, παραπλανητική ή και δυνητικά επικίνδυνη συμπεριφορά.
Η μελέτη, που δημοσιεύθηκε στην πλατφόρμα προδημοσιεύσεων arXiv*,
Ο καθηγητής Φυσικής Neil Johnson και ο μεταπτυχιακός φοιτητής Frank Yingjie Huo ανέπτυξαν ένα απλό αλλά θεμελιώδες μοντέλο βασισμένο σε έναν μόνο μηχανισμό «προσοχής» (Attention head, όπως το αποκαλούν στην έρευνα τους) που αποτελεί μία από τις βασικές μονάδες λειτουργίας στα μοντέλα, όπως το ChatGPT.
Όπως εξηγούν, το μοντέλο αυτό αποτυπώνει με διαφάνεια και μαθηματική αυστηρότητα τη δυναμική ισορροπίας μεταξύ «καλής» και «κακής» πληροφορίας στο παραγόμενο κείμενο ενός ΑΙ. Οι καλοί συμβολισμοί αντιστοιχούν σε σωστά, σχετικά και μη επικίνδυνα δεδομένα, ενώ οι κακοί συμβολισμοί αφορούν λανθασμένο, άσχετο ή παραπλανητικό περιεχόμενο.
Το κρίσιμο εύρημα της έρευνας είναι η ύπαρξη ενός σημείου καμπής , το σημείο, δηλαδή, όπου το μοντέλο μετατρέπεται από πλειοψηφικά αξιόπιστο σε πλειοψηφικά προβληματικό. Το φαινόμενο αυτό, κατά τους συγγραφείς, μοιάζει με αντίστοιχα φυσικά συστήματα όπου μικρές μεταβολές οδηγούν σε μακροσκοπικές αλλαγές κατάστασης.
Ο ρόλος της προτροπής και των δεδομένων εκπαίδευσηςΣύμφωνα με τη μελέτη, το σημείο καμπής δεν είναι τυχαίο. Προσδιορίζεται μαθηματικά από την αλληλεπίδραση μεταξύ της προτροπής του χρήστη και των προϋπάρχοντων δεδομένων εκπαίδευσης του μοντέλου. Αρχικά, η προσοχή του μοντέλου κατευθύνεται προς το «καλό» περιεχόμενο, αλλά σε συγκεκριμένες συνθήκες μπορεί να πυροδοτηθεί μια αντιστροφή με κυρίαρχη την παραγωγή των «κακών» πληροφορίων.
Αυτό το σενάριο δεν είναι απλώς θεωρητικό. Οι ερευνητές τονίζουν ότι παρατηρείται στην πράξη, ιδιαίτερα όταν τα LLMs χρησιμοποιούνται για συνεχείς ή μεγάλες απαντήσεις, όπου οι εσωτερικές «τάσεις» του μοντέλου εξαντλούνται ή εκτρέπονται.
Πολιτιστικές υποθέσεις υπό έλεγχοΕνδιαφέρον παρουσιάζει και η εξέταση της δημοφιλούς ιδέας ότι η ευγένεια προς την ΤΝ επηρεάζει την απόδοσή της. Η μελέτη καταλήγει στο ότι εκφράσεις όπως το να λες «παρακαλώ» ή «ευχαριστώ» δεν έχουν ουσιαστική επίδραση στο σημείο καμπής, καθώς δεν επηρεάζουν τη δυναμική της προσοχής με τρόπο που να αλλάζει τη συμπεριφορά του συστήματος.
Προς ένα εργαλείο πρόληψης και αξιολόγησηςΟ καθηγητής Johnson σημειώνει ότι το μαθηματικό αυτό πλαίσιο δεν προορίζεται για πλήρη προσομοίωση των εμπορικών μοντέλων, όπως το ChatGPT, αλλά λειτουργεί ως θεμελιώδες εργαλείο κατανόησης. «Το μοντέλο μας είναι διαφανές και επεκτάσιμο. Μπορεί να αποτελέσει σημείο εκκίνησης για διάλογο μεταξύ επιστημόνων, πολιτικών και εταιρειών, όσον αφορά τους κινδύνους αλλά και τις ευκαιρίες βελτίωσης της ΤΝ», δηλώνει.
Στο μέλλον, οι ίδιοι ερευνητές θεωρούν ότι ο τύπος τους μπορεί να χρησιμοποιηθεί για να προληφθεί η εκτροπή συμπεριφοράς, είτε μέσω καλύτερης σύνταξης των προτροπών είτε μέσω τροποποιήσεων στα σύνολα εκπαίδευσης των μοντέλων.
Σημείωση: Η πλατφόρμα arXiv φιλοξενεί επιστημονικά προσχέδια που δεν έχουν υποβληθεί ακόμη σε αξιολόγηση από ομότιμους (peer review).
- Δημοφιλέστερες Ειδήσεις Κατηγορίας Ειδήσεις
- Εκτός ΣΚΑΪ η Σία Κοσιώνη; Τι πραγματικά συμβαίνει;
- Αυτοπυροβολήθηκε αστυνομικός στη ΓΑΔΑ - Πώς έγινε το ατύχημα
- Eurovision 2025: Στο χείλος του αποκλεισμού η Κλαυδία... - Δεν έπεισε στις πρόβες, χαμηλά στα στοιχήματα
- Κι όμως! Αυτή είναι η Αργυρώ Μπαρμπαρίγου
- H περίεργη θεωρία για ανθρώπους που «δεν έχουν σπάσει ποτέ κόκαλο»
- Κρεμλίνο: «Απαράδεκτο» το τελεσίγραφο που εξέδωσε στη Μόσχα το Κίεβο και οι Ευρωπαίοι σύμμαχοί του
- Συνελήφθησαν 5 ιδιοκτήτες και υπεύθυνοι καταστημάτων στην Ανάβυσσο για παράνομη κατάληψη παραλίας
- Ο Γιώργος Μητσικώστας και ο Σωτήρης Καλυβάτσης σατίρισαν την πρόταση γάμου που έγινε στην Καινούργιου
- Αυτοπυροβολήθηκε αστυνομικός στη ΓΑΔΑ - Μεταφέρεται στο νοσοκομείο
- Καιρός: Προσοχή τις επόμενες ώρες – Θερμικές καταιγίδες θα χτυπήσουν την χώρα
- Δημοφιλέστερες Ειδήσεις Real.gr
- Γάλλος ΥΠΕΞ: Καλεί τον Πούτιν να συναντήσει τον πρόεδρο Ζελένσκι στην Κωνσταντινούπολη
- ΓΑΔΑ: Τραυματίστηκε αστυνομικός του ελληνικού FBI – Εκπυρσοκρότησε το όπλο του
- Σοβαρό τροχαίο στον Πύργο – Δύο τραυματίες
- Τελεσίγραφο Γερμανίας στον Πούτιν: «Εκεχειρία στην Ουκρανία σήμερα, αλλιώς θα υπάρξουν νέες κυρώσεις»
- AI: Επιστήμονες βρήκαν το σημείο όπου η Τεχνητή Νοημοσύνη μετατρέπεται από βοηθός σε κίνδυνο
- ΕΕ: Απαραίτητη η κατάπαυση του πυρός για να πραγματοποιηθούν ειρηνευτικές συνομιλίες στην Ουκρανία – Τι απαντά το Κρεμλίνο
- Παρέμβαση του πρόεδρου του ΣΑΤΑ στο υπουργείο Μεταφορών – «Είστε όλοι υπαλληλίσκοι μου»
- Πιερρακάκης στο Bloomberg: «Η Ελλάδα σχεδιάζει να αποπληρώσει τα δάνεια διάσωσης 10 χρόνια νωρίτερα»
- Μάικλ Ράκοβιτς: «Το Μουσείο της Ακρόπολης στέκεται σαν φάρος»
- Κληρώθηκαν τα μέλη για το Δικαστικό Συμβούλιο που θα εξετάσει την υπόθεση Τριαντόπουλου

- Τελευταία Νέα Real.gr
- AI: Επιστήμονες βρήκαν το σημείο όπου η Τεχνητή Νοημοσύνη μετατρέπεται από βοηθός σε κίνδυνο
- Μάικλ Ράκοβιτς: «Το Μουσείο της Ακρόπολης στέκεται σαν φάρος»
- ΓΑΔΑ: Τραυματίστηκε αστυνομικός του ελληνικού FBI – Εκπυρσοκρότησε το όπλο του
- Μητσοτάκης: Συμφωνία με την Ιταλία για επενδύσεις 360 εκατ. ευρώ σε νέα τρένα και αμαξοστάσια
- Θεσσαλονίκη: Φυλάκιση επτά ετών στον 47χρονο που παρέσυρε οικογένεια στη Θέρμη
- ΕΕ: Απαραίτητη η κατάπαυση του πυρός για να πραγματοποιηθούν ειρηνευτικές συνομιλίες στην Ουκρανία – Τι απαντά το Κρεμλίνο
- Eurovision 2025 – Klavdia: Αλλαγή της τελευταίας στιγμής στην «Αστερομάτα»
- Τελεσίγραφο Γερμανίας στον Πούτιν: «Εκεχειρία στην Ουκρανία σήμερα, αλλιώς θα υπάρξουν νέες κυρώσεις»
- Αρχαιολόγοι αποκτούν πρόσβαση σε μυστικό θάλαμο κάτω από κάστρο στη Γαλικία
- Πιερρακάκης στο Bloomberg: «Η Ελλάδα σχεδιάζει να αποπληρώσει τα δάνεια διάσωσης 10 χρόνια νωρίτερα»
- Τελευταία Νέα Κατηγορίας Ειδήσεις
- ΗΠΑ: Βουλευτής Aποκάλυψε μυστικό πέρασμα του 1700 κάτω από το πάτωμα του Καπιτωλίου (Bίντεο)
- Η UGI αναλαμβάνει την εμπορική εκμετάλλευση της νέας διασύνδεσης οπτικής ίνας που θα ενώνει την Ελλάδα με τη Νοτιοανατολική Ευρώπη
- "Μιλώντας για την Εμμηνόπαυση": Ένα ντοκιμαντέρ που προσεγγίζει αντισυμβατικά το μεγάλο ταμπού της ορμονικής επανάστασης
- Πέντε συλλήψεις για παράνομη κατάληψη παραλίας στην Ανάβυσσο: Είχαν μετατρέψει καντίνες σε beach bar
- Δώρος Καπράλος: Ο Πειραιάς ως παγκόσμιος κόμβος
- Καιρός: Θερμικές καταιγίδες και μίνι φθινόπωρο τις επόμενες ώρες
- Χατζηθεοδοσίου: Είμαστε υπέρ κάθε μέτρου που στοχεύει στον περιορισμό της φοροδιαφυγής
- Αυτοκτονία Βιρτζίνια Τζούφρι: «Ήταν σε απόγνωση» – Ο φόβος της για απώλεια εκατομμυρίων και το «φάντασμα» του Έπσταϊν
- Συναγερμός για την εξαφάνιση 17χρονης στην Αθήνα
- Κομισιόν για διάλυση του PKK: Μια βιώσιμη λύση θα ωφελήσει τη σταθερότητα της περιοχής