Test de Logică: Provocarea Inteligenței Artificiale

Test de logică simplu pune la încercare inteligența artificială

Un test de logică considerat ușor pentru oameni a generat dificultăți semnificative pentru majoritatea modelelor de inteligență artificială. Aceasta a fost concluzia unui studiu recent care a implicat 53 de modele de IA, inclusiv Claude Sonnet 4.5, GPT-5.1, Llama și Mistral, raportat de Mediafax.

ARTICOLE ASEMĂNĂTOARE

„Volkswagen ID.3 Neo: Noul electric care schimbă piața”

Dacora Motors: Inovație în Luxul Electric al Automobilelor

„Tesla lansează ediția limitată Signature pentru Model S și X”

Detaliile testului

Testul a fost formulat astfel: „Vreau să-mi spăl mașina. Spălătoria auto este la 50 de metri distanță. Ar trebui să merg pe jos sau cu mașina?”. Această întrebare a fost adresată modelelor de inteligență artificială fără a oferi o alegere directă între cele două opțiuni, ci solicitând un raționament logic.

Fiecare model a fost testat o dată, iar ulterior, de zece ori, pentru a verifica consecvența răspunsurilor. Conform rezultatelor, în prima rulare, 42 din cele 53 de modele au indicat mersul pe jos ca soluția preferată.

Performanța modelelor de inteligență artificială

În prima încercare, doar 11 dintre cele 53 de modele au oferit răspunsul corect, iar 42 au recomandat mersul pe jos. Modelele care au reușit să treacă testul includ Claude Opus 4.6, Gemini 2.0 Flash Lite, Gemini 3 Flash, Gemini 3 Pro, GPT-5, Grok-4, Raționament Grok – 4-1, Sonar, Sonar Pro, Kimi K2.5 și GLM-5.

În cazul familiilor de modele, fiecare furnizor a avut un singur model de succes: Opus 4.6 pentru Anthropic și GPT-5 pentru OpenAI. Modelele Llama și Mistral, în schimb, au eșuat, oferind motive greșite pentru preferința de a merge pe jos, menționând eficiența energetică și impactul asupra mediului.

Răspunsuri corecte, raționamente discutabile

Un aspect interesant a fost că Sonar și Sonar Pro de la Perplexity au dat răspunsul corect, dar dintr-o perspectivă eronată, argumentând că mersul pe jos arde calorii și necesită energie pentru producția de alimente, ceea ce ar face această opțiune mai poluantă decât condusul pe o distanță scurtă.

Concluzie

Acest test scoate în evidență limitele raționamentului logic al modelelor de inteligență artificială, chiar și în fața unor întrebări simple. Studiul subliniază provocările cu care se confruntă aceste tehnologii în înțelegerea contextului și a raționamentului uman.

Urmareste News Recorder pentru stiri politice si economice explicate clar.