Un model de inteligență artificială, GPT-4.5, dezvoltat de OpenAI, a trecut recent testul Turing într-o versiune mai exigentă. Această realizare ridică întrebări legate de capacitatea tehnologiei de a imita interacțiunile umane.
Testul Turing, propus inițial de informaticianul Alan Turing în 1950, a fost utilizat pentru a evalua inteligența conversațională a mașinilor. În mod clasic, un interogator uman comunică în scris cu două entități, dintre care una este o mașină, fără să știe care este care.
Mașina trece testul dacă interogatorul nu poate să o deosebească de om după conversație.
Cercetătorii de la Universitatea din San Diego au propus o variantă modificată a testului, incluzând trei participanți: un interogator, un om și un AI, care participă simultan la o conversație de trei minute, având apoi cinci minute pentru a demonstra natura lor umană.
În studiul detaliat pe platforma Arxiv, GPT-4.5 a reușit să convingă în 73% din cazuri că este uman, în timp ce un alt model, Llama-3.1, a făcut același lucru în 56% din situații.
Aceasta depășește estimările inițiale ale lui Turing, care prevedea că un interogator ar putea identifica corect un om doar în 70% din cazuri.
Aceste rezultate nu sunt întâmplătoare, deoarece modelele AI au fost instruite să adopte personalități specifice, cum ar fi un tânăr introvertit familiarizat cu cultura internetului, pentru a le face mai credibile în conversații.
Cercetătorii spun că fără o astfel de contextualizare, modelele ar fi mai puțin convingătoare. Atmosfera creată de AI, și nu precizia răspunsurilor, a fost cheia succesului în aceste teste.
GPT-4.5 a demonstrat că poate simula comportamentul uman mai eficient decât un om, ducând la îndeplinirea viziunii lui Turing. Însă, această avansare tehnologică ridică și îngrijorări.
Capacitatea AI de a imita oamenii cu o asemenea acuratețe poate duce la riscuri sociale, cum ar fi manipularea emoțională sau dezinformarea.
Cercetătorii subliniază importanța transparenței în interacțiunile cu AI, sugerând că ar trebui ca AI-urile să fie clar identificate în conversații, mai ales în domenii sensibile precum sănătatea, educația și politica, unde impactul ar putea fi considerabil.






