Update articol:

Start-up-ul tehnologic chinez DeepSeek neliniștește SUA cu un model de inteligență artificială cu costuri reduse, similar cu o1 al OpenAI – Global Times

  • DeepSeek a lansat recent R1, un model de raționament care a depășit cel mai recent model o1 al OpenAI

Start-up-ul tehnologic chinezesc DeepSeek zguduie sectorul american al inteligenței artificiale cu abordarea sa open-source și modelele sale low-cost, scrie presa din China, “stârnind curiozitate și o acoperire semnificativă din partea mass-mediei și a forumurilor americane de inteligență artificială cu privire la modul în care această companie chinezească  a produs sisteme competitive de inteligență artificială comparabile cu cele dezvoltate de giganții tehnologici americani, navigând în același timp prin restricțiile stricte privind semiconductorii impuse de guvernul american Chinei”.

Publicația chineză Global Times a discutat sâmbătă cu compania și cu mai mulți observatori din industria IA pentru a ilustra fenomenul din spate.

„Modelul ieftin și deschis de inteligență artificială al Chinei, DeepSeek, entuziasmează oamenii de știință”, a scris Nature la trei zile după ce un model lingvistic de mari dimensiuni (LLM) numit DeepSeek-R1 a fost lansat de compania chineză pe 20 ianuarie. Performanțele sale în anumite sarcini din chimie, matematică și codare sunt la același nivel cu cele ale modelului o1 al OpenAI, se arată în raportul Nature.

„How China’s new AI model DeepSeek is threatening US dominance” (Cum noul model chinez de inteligență artificială DeepSeek amenință dominația SUA), un articol CNBC de vineri, a subliniat preocupările legate de impactul DeepSeek asupra dominației SUA în domeniul IA. Potrivit acestuia, „un laborator de inteligență artificială puțin cunoscut din China a stârnit panică în Silicon Valley după ce a lansat modele de inteligență artificială care le pot depăși pe cele mai bune din America, în ciuda faptului că sunt construite mai ieftin și cu cipuri mai puțin puternice”.

Potrivit CNBC, DeepSeek, a prezentat un model gratuit, open-source, pentru modele lingvistice mari (LLM), despre care spune că a fost nevoie de doar două luni și de mai puțin de 6 milioane de dolari pentru a-l construi, folosind cipuri de capacitate redusă de la Nvidia, numite H800s.

CNBC scrie că noile evoluții trag un semnal de alarmă cu privire la faptul că avansul global al Americii în domeniul inteligenței artificiale este în scădere și pun sub semnul întrebării cheltuielile masive ale marilor companii tehnologice pentru construirea de modele de inteligență artificială și centre de date.

Într-un set de teste de referință efectuate de terți, modelul DeepSeek a depășit Meta Llama 3.1, OpenAI  GPT-4o și Anthropic Claude Sonnet 3.5 în ceea ce privește acuratețea, de la rezolvarea de probleme complexe la matematică și codare.

Oficialii Microsoft sunt foarte impresionați de realizările DeepSeek. „Referitor la noul model DeepSeek, este super impresionant atât în ceea ce privește modul în care au realizat în mod eficient un model open-source care face acest calcul în timp de inferență și este super eficient din punct de vedere al calculului”, a declarat CEO-ul Satya Nadella la 22 ianuarie la Forumul Economic Mondial, potrivit unui raport CNBC. „Ar trebui să luăm foarte, foarte în serios evoluțiile din China”.

DeepSeek a trebuit, de asemenea, să treacă prin restricțiile stricte privind semiconductorii pe care guvernul SUA le-a impus Chinei, împiedicând țara să aibă acces la cele mai puternice cipuri, precum H100 de la Nvidia. Cele mai recente progrese sugerează că DeepSeek fie a găsit o modalitate de a ocoli regulile, fie că controalele la export nu au fost eficiente, așa cum intenționa Washingtonul, mai scrie CNBC.

O știre New York Times, intitulată „Cum concurează DeepSeek, un start-up chinez în domeniul IA, cu giganții din Silicon Valley”, a scris: „Compania a construit un chatbot mai ieftin și competitiv cu mai puține cipuri de calculator high-end decât giganții americani precum Google și OpenAI, arătând limitele controlului exporturilor de cipuri”.

Atenția asupra start-up-ului cu sediul în Hangzhou a început în luna decembrie a anului trecut, în urma lansării modelului său de IA la scară largă, „DeepSeek-V3”. Acest nou model a câștigat rapid tracțiune în rândul entuziaștilor AI, stârnind discuții care au depășit granițele și au ajuns pe platformele internaționale de social media și pe forumurile de tehnologie.

Global Times spune că echipa DeepSeek este văzută pe scară largă ca „o echipă misterioasă” care vorbește rar cu mass-media. CNBC scrie că se știu puține lucruri despre laborator și despre fondatorul său, Liang WenFeng. DeepSeek a fost creat de un fond de hedging chinez numit High-Flyer Quant, care gestionează active în valoare de aproximativ 8 miliarde de dolari, conform rapoartelor media.

Când i s-a cerut să comenteze sâmbătă atenția externă din jurul dezvoltării programului, DeepSeek a informat Global Times că nu poate furniza informații suplimentare în acest moment. Ei au recomandat consultarea raportului tehnic pentru o mai bună înțelegere a modelului său.

Potrivit unei notificări publicate de DeepSeek într-un grup de comunicare deschisă, compania a declarat că „nu se angajează în cooperarea externă a proiectelor și nici nu furnizează servicii de implementare externă și servicii de asistență conexe”. În plus, DeepSeek a subliniat că se va concentra pe cercetare și dezvoltare pentru a lansa modele mai avansate, încurajând pe toată lumea: „vă rugăm să așteptați cu nerăbdare”.

„Abordarea tehnologică a DeepSeek sfidează dominația și monopolul SUA în tehnologia IA, dovedind că restricțiile privind cipurile din SUA au fost ineficiente”, a declarat sâmbătă Li Baiyang, profesor asociat de studii de informații la Universitatea Nanjing, pentru Global Times, explicând de ce DeepSeek a atras o atenție largă nu numai din partea Chinei, ci și a Silicon Valley din SUA.

În prezent, SUA încearcă să își mențină dominația în domeniul inteligenței artificiale prin diverse politici și reglementări administrative, cu accent pe protejarea avantajului său în ceea ce privește capacitățile de calcul și algoritmice, a declarat expertul.

Tian Feng, fost decan al Intelligence Industry Research Institute din cadrul gigantului chinez de software pentru inteligență artificială SenseTime, a descris capacitatea DeepSeek de a obține rezultate generative impresionante cu costuri de formare mai mici, împreună cu abordarea sa complet open-source în ceea ce privește tehnologia și modelele fundamentale, ca o mișcare care ar putea „redefini regulile de dezvoltare pentru inteligența artificială”.

Acesta demonstrează avantaje comparabile cu modelul o1 al OpenAI, împreună cu un cost de formare de numai aproximativ 6 milioane de dolari pentru modelul său V3 – aproximativ o zecime din ceea ce Meta investește în modele comparabile de AI, a declarat Tian sâmbătă pentru Global Times.

Jim Fan, Senior Research Manager la NVIDIA, a declarat pe X: „Trăim într-un moment în care o companie din afara SUA menține în viață misiunea inițială a OpenAI – o cercetare de frontieră cu adevărat deschisă, care dă putere tuturor”.

Potrivit unei postări anonime de pe Teamblind, un forum pentru angajații Big Tech verificați, departamentul AI al Meta simte presiunea, potrivit unui raport al publicației media The Decoder. Postarea a scris că Meta este „în modul panică. Inginerii se mișcă frenetic pentru a diseca DeepSeek și a copia orice și tot ce putem de la el”.

Mark Zuckerberg de la Meta a vorbit recent pe Facebook pentru a sublinia răspunsul companiei sale, spunând că în 2025, Meta își propune să dezvolte un asistent AI care să poată servi mai mult de un miliard de oameni. „Acesta va fi un an definitoriu pentru AI”, a scris Zuckerberg, conform raportului The Decoder.

Abordarea adoptată de start-up-ul tehnologic chinez a pus o presiune fără precedent asupra companiilor americane de inteligență artificială, deoarece este probabil să atragă mai mulți utilizatori și dezvoltatori la nivel global pentru a participa la dezvoltarea inteligenței artificiale high-end, ceea ce poate slăbi cota de piață și influența companiilor americane de inteligență artificială, potrivit lui Tian.

Președintele american Donald Trump a anunțat recent o investiție de 500 de miliarde de dolari în infrastructura IA din SUA. Trei firme de tehnologie de top vor crea o nouă companie, denumită Stargate, pentru a dezvolta infrastructura inteligenței artificiale în SUA, potrivit CNN.