Inteligența Artificială, dezamăgitoare la matematică avansată: ChatGPT și Gemini eșuează în 98% din teste

Joi, 14 Noiembrie 2024, ora 19:01
4739 citiri
Inteligența Artificială, dezamăgitoare la matematică avansată: ChatGPT și Gemini eșuează în 98% din teste
FOTO: GSMArena

Deși Inteligența Artificială pare să transforme tehnologia din jurul nostru, se confruntă cu mari limite în înțelegerea și rezolvarea problemelor avansate de matematică. Conform unui studiu realizat de Epoch AI, modelele ChatGPT și Gemini, lideri în domeniul AI, nu reușesc să rezolve mai mult de 2% din problemele incluse în benchmark-ul FrontierMath, un test conceput pentru a evalua capacitățile de raționare matematică la nivel de cercetare.

Benchmark-ul FrontierMath și limitele modelelor AI

FrontierMath este un test complex care conține sute de probleme avansate, dezvoltate de un grup de peste 60 de matematicieni de renume. Testul solicită abilități superioare de raționare și creativitate, domenii în care modelele lingvistice actuale se dovedesc a fi extrem de slabe. În acest context, versiunile avansate ale ChatGPT și Gemini, cum ar fi ChatGPT-4 și Gemini 1.5 Pro, au înregistrat o rată de eșec de 98%, oferind răspunsuri inexacte.

Spre deosebire de alte domenii, unde Inteligența Artificială poate genera răspunsuri prin predicția cuvintelor următoare, problemele de matematică avansată necesită o structură logică clară și menținerea unei evidențe riguroase a datelor numerice. Modelele lingvistice sunt cunoscute pentru tendința lor de a „ghici” răspunsuri atunci când informațiile lipsesc, iar în testele FrontierMath, acest lucru a dus la rezultate profund eronate.

Problemele din FrontierMath sunt complet noi și nepublicate, eliminând astfel posibilitatea ca modelele să se antreneze cu date rezolvate anterior. Aceste provocări necesită nu doar calcule, ci și cunoștințe interdisciplinare avansate, la nivel de expert în matematică. Profesorul Terence Tao de la Universitatea din California subliniază că și studenții absolvenți pot întâmpina dificultăți în fața unor astfel de probleme, ceea ce ridică întrebări serioase despre capacitatea AI-ului de a ajunge la acest nivel de complexitate.

Roboții preiau controlul într-o țară aflată în criză demografică: 10% din forța de muncă, înlocuită cu roboți!
Roboții preiau controlul într-o țară aflată în criză demografică: 10% din forța de muncă, înlocuită cu roboți!
Coreea de Sud a stabilit un nou standard global în utilizarea tehnologiei, devenind prima țară care a înlocuit 10% din forța de muncă cu roboți. Această măsură inovatoare vine ca răspuns...
Google reinventează creativitatea vizuală: Veo, modelul AI care transformă imaginile în videoclipuri uimitoare
Google reinventează creativitatea vizuală: Veo, modelul AI care transformă imaginile în videoclipuri uimitoare
Google a anunțat oficial Veo, un model generativ AI care duce creativitatea la un nou nivel. Această tehnologie permite transformarea imaginilor statice, fie fotografii, fie desene simple, în...
#inteligenta artificiala, #matematica , #inteligenta artificiala
  1. Cu cât este scoasă la vânzare o bijuterie istorică în inima Clujului, un palat renascentist cu 48 de camere. Are peste 500 de ani FOTO
  2. O țară de un miliard de locuitori, prietenă cu Rusia, îi face pe plac lui Trump. Putin încasează o lovitură în plin
  3. SUA lovesc interesele a 2 țări NATO: Putin le ajută să scape de mutarea dură a Americii
  4. Prelungește performanța SUV-ului tău! Șapte sfaturi esențiale
  5. „Stare de urgență în economie”, declarată în Transnistria. Reacția liderilor transnistreni după anunțul întreruperii furnizării gazului rusesc
  6. Leul se menține stabil, o oră după anularea alegerilor parlamentare. La ce curs se tranzacționează moneda națională
  7. Lovitură pentru Blue Air. Compania a pierdut definitiv procesul deschis în urma amenzii de 2 milioane de euro, pentru cursele anulate
  8. Christine Lagarde a pus ochii pe economiile europenilor. Șefa BCE propune un standard european de economisire
  9. Economia României dă semne de îmbolnăvire. INS a revizuit în scădere evoluția PIB. Producția a scăzut pentru a doua oară în acest an
  10. România ar putea pierde Dacia. Mașinile produse la Mioveni s-ar scumpi cu minim 2.000 de euro dacă nu am mai fi în UE. Producția s-ar putea muta în Maroc ANALIZĂ