Google a anunțat oficial Veo, un model generativ AI care duce creativitatea la un nou nivel. Această tehnologie permite transformarea imaginilor statice, fie fotografii, fie desene simple, în videoclipuri captivante și dinamice, folosind descrieri text pentru a genera stiluri și scenarii complexe.
Veo vine la scurt timp după lansarea Sora de către OpenAI, un model capabil să creeze videoclipuri fotorealiste bazate pe scene complexe. Spre deosebire de alte tehnologii, Google a conceput Veo ca un instrument intuitiv, destinat atât companiilor, cât și antreprenorilor, pentru a fi integrat cu ușurință în procesele creative.
Utilizatorii pot începe cu o imagine simplă sau chiar un desen de bază. Printr-o descriere text, aceștia pot indica stilul dorit, locația sau atmosfera scenei. De exemplu, un utilizator poate genera un videoclip care să recreeze o pădure tropicală animată pornind de la o simplă schiță, oferind detalii precum „stil de film animat, răsărit de soare în junglă”. Veo procesează aceste informații și generează un videoclip de înaltă calitate la rezoluție 1080p.
În versiunile anterioare ale modelului experimental, videoclipurile generate aveau o lungime de „peste un minut”. În versiunea Preview, Google nu a menționat limite de lungime, deschizând astfel posibilitatea unor proiecte mai elaborate.
Exemplele furnizate de Google demonstrează capabilitățile impresionante ale Veo, fiind dificil să diferențiezi videoclipurile generate de cele reale. Cu toate acestea, această tehnologie ridică și întrebări legate de utilizarea sa pentru scopuri rău intenționate, cum ar fi generarea de falsuri și dezinformare.
Pentru a preveni astfel de probleme, Google a implementat protecții, inclusiv un watermark digital invizibil, denumit SynthID, care poate fi utilizat pentru a marca toate videoclipurile create cu Veo. Acest sistem este similar cu Adobe Content Credentials, menit să combată dezinformarea și să asigure o atribuire corectă.
Google a extins disponibilitatea lui Imagen 3, cea mai recentă versiune a serviciului său text-to-image. Acum, clienții Google Cloud vor putea folosi Imagen 3 prin platforma Vertex, cu funcționalități adiționale precum editarea fotografiilor bazată pe prompt și personalizarea conținutului cu logo-uri, stiluri și caracteristici unice.
Lansarea Veo și Imagen 3 subliniază direcția ambițioasă a Google în domeniul inteligenței artificiale generative. Aceste tehnologii deschid oportunități extraordinare pentru industrii precum marketing, producția video și entertainment, dar necesită și o gestionare atentă pentru a evita utilizarea abuzivă.
Cu funcționalități care oferă un control creativ mai mare, Veo și Imagen 3 sunt pași importanți spre un viitor în care inteligența artificială redefinește modul în care creăm și consumăm conținut vizual și video.