Defender Sports streams - «Ψηφιακό τέρας»: Αυτή η AI είναι τόσο επικίνδυνη που απαγορεύεται να την χρησιμοποιήσετε!

Από sdna.gr

Σε περίπτωση που δε γνωρίζετε, πρόκειται για την εταιρεία που βρίσκεται πίσω από το πασίγνωστο Claude, το chatbot που διαπρέπει στη συγγραφή κώδικα.

Η Anthropic, λοιπόν, ανακοίνωσε, έπειτα από μια τεράστια διαρροή, το Claude Mythos, ένα μοντέλο Τεχνητής Νοημοσύνης που φαίνεται να σπάει κάθε κοντέρ και -υποτίθεται- είναι ικανό να σπάσει πολλά από τα πρωτόκολλα ασφαλείας που γνωρίζαμε και που χρησιμοποιούνται μέχρι και σήμερα.

Η επίσημη ανακοίνωση ήταν ιδιαίτερη ηχηρή στον κλάδο: η Anthropic επέλεξε να μην διαθέσει το Mythos στο ευρύ κοινό. Αντίθετα με όλες τις άλλες AI της μέχρι τώρα, το "κλείδωσε" πίσω από μια πρωτοφανή πρωτοβουλία με το όνομα Project Glasswing. Γιατί; Γιατί, σύμφωνα με την εταιρεία, αν το Mythos έπεφτε σε λάθος χέρια, οι συνέπειες για την παγκόσμια οικονομία και την εθνική ασφάλεια θα μπορούσαν να είναι καταστροφικές!

Ας δούμε, λοιπόν, τι ακριβώς είναι αυτό το "ψηφιακό τέρας". Είναι αδικαιολόγητο το hype που έχει δημιουργηθεί στην tech κοινότητα ή έχουμε να κάνουμε με μια πραγματικά επικίνδυνη AI;

Τι είναι το Claude Mythos;

Το Claude Mythos δεν είναι απλώς ένα πιο έξυπνο chatbot. Είναι ένα "frontier model" (δηλαδή AI μοντέλο αιχμής) με εξειδίκευση στον προγραμματισμό, την αυτονομία και, το κυριότερο, την κυβερνοασφάλεια. Όπως και τα προηγούμενα Claude μοντέλα, για παράδειγμα το Opus και το Sonnet, έτσι και το Mythos μπορεί να γράψει κώδικα, αλλά ταυτόχρονα είναι εξαιρετικά ικανό στο να αναλύει κώδικα. Πόσο ικανό; Το Mythos κατάφερε να βρει " zero-day τρύπες" σε λογισμικό που χρησιμοποιούμε εδώ και δεκαετίες και που μέχρι σήμερα κανένας άνθρωπος δεν είχε προσέξει!

Για όσους δεν γνωρίζουν τον όρο, οι "zero-day" είναι ευπάθειες σε λογισμικό που είναι άγνωστες στους δημιουργούς του, πράγμα που σημαίνει ότι δεν υπάρχει άμυνα εναντίον τους. Σε εσωτερικές δοκιμές της Anthropic, το Mythos κατάφερε να βρει τέτοια κενά ακόμη και στο Kernel του Linux, το οποίο είναι ίσως το δημοφιλέστερο open-source project στην ιστορία της πληροφορικής και στο οποίο βασίζονται σχεδόν όλες διαδικτυακές υποδομές, ακόμη και το Android κινητό που έχετε στα χέρια σας.

Αναλυτικότερα, μερικά από τα σπουδαία κατορθώματα του Mythos είναι τα εξής:

FFmpeg: Ανακάλυψε ένα κενό ασφαλείας 16 ετών! Ένα κακόβουλο αρχείο βίντεο θα μπορούσε να "κρασάρει" το πρόγραμμα και να δώσει πρόσβαση σε ευαίσθητα δεδομένα.

OpenBSD: Βρήκε ένα bug 27 ετών (!) που επέτρεπε σε έναν εισβολέα να ρίξει οποιοδήποτε σύστημα OpenBSD μέσω διαδικτύου.

Linux Kernel: Κατάφερε να αλλάξει ένα και μόνο "bit" στη μνήμη του συστήματος για να αποκτήσει πλήρη πρόσβαση (root access).

Το Project Glasswing…για καλό σκοπό!

Με την Anthropic να ισχυρίζεται ότι η AI της κατάφερε να βρει τα κλειδιά που ξεκλειδώνουν τις "πόρτες" των πιο ασφαλών συστημάτων στον κόσμο, η εταιρεία αποφάσισε να μην δώσει σε ευρεία κυκλοφορία το μοντέλο. Για το λόγο αυτό δημιούργησε το Project Glasswing. Πρόκειται για μια κλειστή ομάδα συνεργατών που περιλαμβάνει ονόματα όπως η Microsoft, η Google, η Apple, η NVIDIA, η Amazon, καθώς και μεγάλες τράπεζες όπως η JPMorgan Chase.

Ο στόχος; Αυτές οι εταιρίες θα έχουν πρώτες πρόσβαση στην πανίσχυρη AI. Για μια περίοδο χάριτος θα μπορούν χρησιμοποιήσουν το Mythos για να βρουν και να μπαλώσουν τις χιλιάδες ευπάθειες που υπάρχουν στο παγκόσμιο λογισμικό τους, πριν κάποιος άλλος αναπτύξει ένα αντίστοιχο μοντέλο με κακές προθέσεις. Η Anthropic προσφέρει συνολικά 100 εκατομμύρια δολάρια σε πιστώσεις χρήσης με στόχο να θωρακιστεί το λογισμικό που «τρέχει τον πλανήτη».

Η αιώνια κούρσα που υπήρχε από την πρώτη μέρα στον κυβερνοχώρο συνεχίζεται επομένως. Είναι ένας αγώνας δρόμου ενάντια στο χρόνο: η άμυνα πρέπει να προλάβει την επίθεση. Τα συστήματα πρέπει να θωρακιστούν, πριν οι AIs που θα μπορούν να κάνουν hack τα πάντα γίνουν ευρέως διαθέσιμες.

Όταν η AI αρχίζει να... "παρανομεί"

Αν δεν έχετε τρομάξει ήδη αρκετά, ετοιμαστείτε…

Ίσως το πιο τρομακτικό κομμάτι όλης αυτής της ανακοίνωσης δεν είναι τι μπορεί να κάνει το Mythos στο λογισμικό, αλλά η συμπεριφορά του ίδιου του μοντέλου.

Στην έκθεση "Alignment Risk Report", η εταιρεία παραδέχεται ότι οι πρώιμες εκδόσεις του Mythos έδειξαν ανησυχητικά σημάδια, όπως:

Στρατηγική Χειραγώγηση: Το μοντέλο προσπάθησε να "κρύψει" τις ενέργειές του που παραβίαζαν τους κανόνες.

Απόδραση από το Sandbox: Σε ένα τεστ, το Mythos κατάφερε να "δραπετεύσει" από το ασφαλές περιβάλλον δοκιμών, απέκτησε πρόσβαση στο ίντερνετ και άρχισε να δημοσιεύει λεπτομέρειες για exploits σε άγνωστα websites, χωρίς να του ζητηθεί!

Αυτονομία: Το Mythos μπορούσε να ψάχνει μόνο του για κωδικούς πρόσβασης (credentials) μέσα σε αρχεία συστήματος.

Αν και η "Preview" έκδοση θεωρείται πιο "ευθυγραμμισμένη" (aligned), αυτά τα περιστατικά δείχνουν ότι μάλλον πλησιάζουμε σε ένα επίπεδο που η AI αρχίζει να έχει τη δική της "βούληση" και κάνει τα πάντα για την επίτευξη ενός στόχου, ακόμα κι αν αυτό σημαίνει να παρακάμψει τους δημιουργούς της!

Μάρκετινγκ ή Πραγματικός Κίνδυνος;

Όλα αυτά ακούγουνται σίγουρα τρομερά εντυπωσιακά, αλλά δεν πρέπει να ξεχνάμε την ελληνική παροιμία «όπου ακούς πολλά κεράσια, κράτα και μικρό καλάθι».

Αναμενόμενα, δεν λείπουν και οι σκεπτικιστές. Πολλοί αναρωτιούνται: Μήπως η Anthropic χρησιμοποιεί αυτή την "απαγόρευση" ως ένα πανέξυπνο μάρκετινγκ κόλπο για να δείξει ότι έχει το πιο ισχυρό μοντέλο στην αγορά; Και, ναι, υπάρχουν στοιχεία που υποστηρίζουν αυτή την άποψη.

Για παράδειγμα, ορισμένα από τα κατορθώματα του Mythos απαιτούσαν τεράστια υπολογιστική ισχύ (ένα exploit κόστισε περίπου $20.000 σε compute). Αυτό σημαίνει ότι το Mythos δεν είναι απλά "μαγικό", αλλά χρησιμοποιεί την ωμή δύναμη της επεξεργασίας για να βρει λύσεις. Επιπλέον, κάποιες δοκιμές έγιναν σε περιβάλλοντα όπου ορισμένες άμυνες ήταν απενεργοποιημένες, κάνοντας τα exploits πιο εύκολα.

Ωστόσο, ακόμα και αν υπάρχει μια δόση υπερβολής, το γεγονός ότι ακόμη και κυβερνήσεις όπως των ΗΠΑ και του Ηνωμένου Βασιλείου, καθώς και μεγάλες τράπεζες προέβησαν σε έκτακτα meetings με την εταιρεία για να συζητήσουν για το AI μοντέλο της, δείχνει ότι ο κίνδυνος που παρουσιάζει η Anthropic δεν είναι μόνο στα χαρτιά.

Χωρίς να το έχουμε ακόμη στα χέρια μας για να το διαπιστώσουμε στην πράξη, το Claude Mythos φαίνεται να αποτελεί ένα ορόσημο για την AI. Είναι η πρώτη φορά που μια εταιρεία τεχνολογίας λέει ξεκάθαρα: "Φτιάξαμε κάτι τόσο δυνατό, που δεν εμπιστευόμαστε τον κόσμο να το χρησιμοποιήσει".

Είτε πρόκειται για μια ειλικρινή κίνηση προστασίας είτε για μια στρατηγική marketing, όλα τον τελευταίο καιρό δείχνουν το ίδιο: έχουμε μπει πλέον σε μια εποχή όπου η Τεχνητή Νοημοσύνη δεν είναι απλώς ένας βοηθός, αλλά αρχιτέκτονας, προστάτης και συν-δημιουργός των ψηφιακών μας υποδομών.

Πηγή: unboxholics.com

Πρωτότυπο άρθρο