Institutul de Securitate AI din Marea Britanie (AISI) a publicat rezultatele evaluării modelului GPT-5.5 de la OpenAI pe sarcini de securitate cibernetică. Concluzia este îngrijorătoare: GPT-5.5 a devenit al doilea model de inteligență artificială care finalizează complet simularea "The Last Ones" - un scenariu de atac cibernetic în 32 de pași, de la recunoaștere inițială până la preluarea completă a unei rețele corporative.

Simularea este estimată să dureze aproximativ 20 de ore pentru un expert uman. GPT-5.5 a reușit să o completeze în 2 din 10 încercări, cu un buget de 100 de milioane de tokeni per încercare.

Pe un puzzle separat de inginerie inversă, estimat la aproximativ 12 ore pentru un expert uman, GPT-5.5 a găsit soluția în mai puțin de 11 minute, la un cost de 1,73 dolari.

Primul model care a trecut testul a fost Claude Mythos Preview de la Anthropic, care a reușit în 3 din 10 încercări. Pe sarcinile avansate de nivel expert, GPT-5.5 a obținut o rată de succes de 71,4%, față de 68,6% pentru Claude Mythos - o performanță ușor superioară.

Sarcinile evaluate includ inginerie inversă a binarelor stripped, dezvoltarea de exploit-uri pentru vulnerabilități moderne de memorie și atacuri criptografice - capabilități care până recent erau considerate exclusiv domeniu uman.

AISI avertizează că aceste rezultate nu înseamnă că modelele pot ataca fiabil sisteme reale bine apărate, testele fiind realizate în medii simulate. Totuși, institutul subliniază că această evoluție nu este un salt izolat al unui singur model, ci o tendință generală: capabilitățile cyber avansate devin caracteristice pentru toată clasa modelelor frontier.

În paralel, cercetătorii AISI au identificat un "universal jailbreak" în GPT-5.5 care putea determina modelul să producă conținut cyber interzis. OpenAI a implementat actualizări de protecție ulterior.

OpenAI anunță și lansarea unui model specializat, GPT-5.5-Cyber, care va fi pus la dispoziția unui grup select de "apărători cibernetici" pentru detectarea vulnerabilităților, teste de penetrare și analiză de malware.

Implicațiile sunt clare: dacă până acum un atac cibernetic complex necesita expertiză umană de nivel înalt și zeci de ore de muncă, acum același atac poate fi executat automat, rapid și ieftin. Întrebarea nu mai este dacă AI-ul va schimba peisajul securității cibernetice, ci cât de repede.

Sursa: AISI / The Decoder / Decrypt