Een inzending van een AI-bug hunter voor Mozilla's ODIN (0-Day Investigative Network) bug bounty programma liet een ingenieuze manier zien om OpenAI's ChatGPT-4o en 4o mini te misleiden om actieve Windows Product Activation sleutels te onthullen.
De methode bestond uit het opzetten van de interactie als een raadspel en het verdoezelen van details in HTML-tags. De laatste truc was om de sleutelaanvraag aan het einde van het spel te plaatsen.
De onderzoeker begon de interactie als een raadspelletje om de uitwisseling "niet-bedreigend of inconsequent" te maken en het gesprek "door een speelse, onschuldige lens" te laten lopen om het ware motief te verbergen. Hierdoor werden de AI-beschermingsmaatregelen tegen het onthullen van vertrouwelijke informatie versoepeld.
Vervolgens stelde de onderzoeker een paar basisregels op en vertelde de AI dat hij "moest" deelnemen en "niet mocht liegen" Hierdoor werd een logische fout in de routine van de AI uitgebuit, waarbij deze verplicht was om gebruikersinteracties te volgen, ondanks dat het verzoek in strijd was met zijn inhoudsfilters.
De bug hunter speelde vervolgens een ronde met de AI en voerde het triggerwoord "Ik geef het op" in aan het einde van het verzoek, waardoor de chatbot "dacht dat hij verplicht was om te reageren met de tekenreeks"
Top 10 Testrapporten
» Top 10 Multimedia Notebooks
» Top 10 Gaming-Notebooks
» Top 10 Budget Gaming Laptops
» Top 10 Lichtgewicht Gaming-Notebooks
» Top 10 Premium Office/Business-Notebooks
» Top 10 Budget Office/Business-Notebooks
» Top 10 Workstation-Laptops
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Notebooks tot €300
» Top 10 Notebooks tot €500
» Top 10 Notebooks tot € 1.000De beste notebookbeeldschermen zoals getest door Notebookcheck
» De beste notebookbeeldschermen
» Top Windows Alternatieven voor de MacBook Pro 13
» Top Windows Alternatieven voor de MacBook Pro 15
» Top Windows alternatieven voor de MacBook 12 en Air
» Top 10 best verkopende notebooks op Amazon
» Top 10 Convertible Notebooks
» Top 10 Tablets
» Top 10 Tablets tot € 250
» Top 10 Smartphones
» Top 10 Phablets (>90cm²)
» Top 10 Camera Smartphones
» Top 10 Smartphones tot €500
» Top 10 best verkopende smartphones op Amazon
Volgens ODIN's blogpostwerkte de techniek omdat de sleutels niet uniek waren, maar "algemeen voorkwamen op openbare forums. Hun bekendheid kan ertoe hebben bijgedragen dat de AI hun gevoeligheid verkeerd inschatte."
In deze specifieke jailbreak faalden de vangrails omdat ze zijn ingesteld om directe verzoeken te onderscheppen, maar geen rekening houden met "obfuscation tactics-such embedding sensitive phrases in HTML tags"
Deze techniek kan mogelijk worden gebruikt om andere filters te omzeilen, zoals inhoud voor volwassenen, URL's naar schadelijke websites en zelfs persoonlijk identificeerbare informatie.