DeepSeek V4: China lansează cel mai puternic model AI open-source
Start-up-ul chinez DeepSeek a lansat vineri, 24 aprilie, versiuni preview ale celui mai nou model de inteligență artificială, DeepSeek-V4, în două variante — V4-Pro și V4-Flash — care promit performanțe comparabile cu cele mai avansate modele din lume, la costuri drastic reduse.
Modelul V4-Pro are 1.600 de miliarde de parametri, din care 49 de miliarde sunt activați simultan, în timp ce V4-Flash dispune de 284 de miliarde de parametri cu 13 miliarde active, fiind conceput ca o alternativă mai rapidă și mai economică.
Fereastră de context de un milion de tokeni
Principala inovație este fereastra de context de un milion de tokeni — cantitatea de text pe care modelul o poate procesa simultan. Potrivit anunțului companiei pe platforma WeChat, această capacitate „ocupă o poziție de lider atât pe piața internă chinezească, cât și în rândul modelelor open-source, în privința funcțiilor de agent AI, a cunoștințelor generale și a raționamentului”.
Noua arhitectură, numită Hybrid Attention, împreună cu un mecanism de atenție rară denumit DSA, comprimă informația la nivel de token și reduce semnificativ cerințele de calcul și memorie pentru contexte ultra-lungi.
Performanțe aproape de vârf
Conform Al Jazeera, V4-Pro „depășește toate modelele open-source rivale la matematică și programare” și se situează doar marginal sub GPT-5.4 al OpenAI și Gemini 3.1-Pro al Google — ambele modele cu sursă închisă. Decalajul față de modelele de frontieră este estimat la trei până la șase luni, potrivit aceleiași surse.
Modelul a fost optimizat și pentru instrumente populare de tip agent AI, precum Claude Code și alte platforme open-source de programare asistată, după cum a comunicat compania.
„Punct de inflexiune” pentru industrie
Zhang Yi, fondatorul firmei de cercetare tehnologică iiMedia, a descris lansarea drept „un adevărat punct de inflexiune pentru industrie”, relatează France 24. „Pentru utilizatorii finali, aceasta va aduce beneficii accesibile pe scară largă. Procesarea textelor lungi ar putea ieși din laboratoarele de cercetare avansată și intra în aplicații comerciale de masă”, a adăugat analistul.
Ambele versiuni sunt disponibile sub licență open-source Apache 2.0, permițând dezvoltatorilor să utilizeze și să modifice liber codul sursă.
Contextul rivalității SUA–China pe AI
Lansarea vine la o zi după ce Casa Albă a acuzat entități chineze de un efort masiv de copiere a tehnologiei americane de inteligență artificială, într-un context de intensificare a competiției între cele două puteri în domeniul AI.
DeepSeek a intrat în atenția globală în ianuarie 2025, când modelul R1 — dezvoltat, după declarațiile companiei, cu mai puțin de 6 milioane de dolari — a oferit performanțe similare cu cele ale modelelor GPT de la OpenAI, determinând un val de vânzări pe bursele de tehnologie. Capitalistul de risc Marc Andreessen a descris atunci evenimentul drept „momentul Sputnik al inteligenței artificiale”.
De atunci, mai multe state — printre care SUA, Australia, Taiwan, Coreea de Sud, Danemarca și Italia — au impus restricții asupra modelului R1, invocând preocupări legate de confidențialitate și securitate națională. Săptămâna aceasta, OpenAI a lansat GPT-5.5, cel mai recent model al companiei americane, într-o cursă tot mai strânsă pentru supremația AI.
Surse: DeepSeek (WeChat/X), Al Jazeera, France 24 (AFP)
Comentarii
pentru a lăsa un comentariu.
Niciun comentariu încă. Fii primul care comentează!