Buja e madhe për një aplikacion të inteligjencës artificiale (IA), të krijuar nga kompania teknologjike kineze DeepSeek, tronditi tregjet e aksioneve në Shtetet e Bashkuara të Amerikës, të hënën, dhe nxiti debate për konkurrencën ekonomike dhe gjeopolitike ndërmjet SHBA-së dhe Kinës në zhvillimin e teknologjisë së IA-së.
Asistenti me IA i DeepSeek-ut u bë aplikacioni pa pagesë më i shkarkuar në dyqanin e aplikacioneve të Apple-it, AppStore, i nxitur nga kurioziteti për konkurrentin e ChatGPT-së.
Pjesë e asaj që po brengos disa njohës të industrisë teknologjike amerikane është ideja se kompania kineze ka zënë hapin me kompanitë amerikane, që udhëheqin në fushën e IA-së gjenerative, me shpenzime dukshëm më të vogla.
Kjo, nëse konfirmohet, vë në pikëpyetje shumat e majme të parave që kompanitë teknologjike amerikane thonë se planifikojnë t’i shpenzojnë për qendra të dhënash dhe për çipa kompjuterikë që nevojiten për t’i fuqizuar avancimet e mëtejme në fushën e IA-së, raporton agjencia amerikane e lajmeve, Associated Press.
Por, buja dhe paragjykimet për përparimet teknologjike të DeepSeek-ut shkaktuan edhe huti.
“Modelet që ata kanë ndërtuar janë fantastike, por s’janë mrekulli”, ka thënë Stacy Ragson, që hulumton industrinë e gjysmëpërçuesve për kompaninë Bernstein, dhe e cila ishte një prej disa analistëve të aksioneve që e përshkruan si të ekzagjeruar reagimin e Wall Street-it.
“Ata nuk po përdorin kurrfarë novacionesh të panjohura, apo të fshehta, apo diçka të ngjashme”, ka thënë Ragson. “Këto janë gjëra me të cilat po eksperimentojnë të gjithë”.
Çfarë është DeepSeek?
Kompania DeepSeek u themelua më 2023, në Hangzhou, Kinë, dhe nxori modelin e vet të parë të madh gjuhësor të IA-së më vonë atë vit.
Shefi i saj ekzekutiv, Liang Wenfeng, më herët kishte bashkëthemeluar njërin nga fondet më të mëdha të investimeve në Kinë, High-Flyer, i cili fokusohet në tregtim kuantitativ të nxitur nga IA-ja.
Fondi, deri më 2022, kishte siguruar 10.000 prej procesorëve A100 me performancë të lartë të kompanisë Nvidia, me bazë në Kaliforni, të cilat përdoren për të krijuar dhe funksionalizuar sisteme të IA-së, sipas një postimi të bërë atë verë në platformën sociale kineze, WeChat. SHBA-ja, më vonë, kufizoi shitjen e këtyre çipave në Kinë.
DeepSeek ka thënë se modelet e tij të fundit janë ndërtuar me çipat H800 të Nvidia-s, që kanë performancë më të ulët dhe nuk janë të ndaluar në Kinë, duke çuar një mesazh se hardueri më i avancuar mund të mos jetë i nevojshëm për përparim të madh në IA.
DeepSeek nisi të tërheqë më shumë vëmendje në industrinë e IA-së muajin e kaluar, kur nxori një model të ri të IA-së, që kompania tha se ishte po aq i fuqishëm sa modelet e ngjashme të kompanive amerikane, si ChatGPT nga OpenAI, dhe ishte më kursimtar në përdorimin e çipave të shtrenjtë të Nvidia-s për trajnimin e sistemit me grumbujt e mëdhenj të të dhënave. Aplikacioni u bë më gjerësisht i qasshëm kur u shfaq në dyqanet e aplikacioneve të Apple-it dhe të Google-it.
Por, ishte një hulumtim i publikuar javën e kaluar, po në ditën kur Donald Trump u inaugurua si president i SHBA-së, që i dha hov panikut që pasoi. Ai hulumtim kishte të bënte me një tjetër model të IA-së nga DeepSeek, të quajtur R1, i cili kishte shfaqur aftësi të avancuara “të arsyetimit” – si aftësinë për të rimenduar qasjen e tij ndaj një problemi matematikor – dhe që ishte dukshëm më i lirë se një model i ngjashëm i nxjerrë në treg nga OpenAI, i quajtur o1.
“Si i kanë punët ekonomikisht, s’ia kam idenë”, ka thënë Ragson. “Por, mendoj se kostot i kanë tmerruar njerëzit”.
Historia e Sputnik-ut
Prapa dramës për kapacitetet teknike të DeepSeek-ut është një debat brenda SHBA-së se si të garohet më së miri me Kinën në fushën e IA-së.
“Deepseek R1 është moment Sputnik-u në IA”, ka thënë investitori amerikan, Marc Andreessen, në një postim në platformën sociale X, duke iu referuar lëshimit të satelitit më 1957, që nxiti një garë për eksplorimin e hapësirës ndërmjet Bashkimit Sovjetik dhe SHBA-së, gjatë Luftës së Ftohtë.
Andreessen, i cili e ka këshilluar Trumpin për politikat teknologjike, ka paralajmëruar se mbirregullimi i industrisë së IA-së nga qeveria amerikane do t’i pengojë kompanitë amerikane dhe do t’i mundësojë Kinës t’ua kalojë atyre.
Por, vëmendja mbi DeepSeek-un rrezikon, po ashtu, të minojë një strategji kyç të politikës së jashtme të SHBA-së në vitet e fundit, për kufizimin e shitjes së gjysmëpërçuesve amerikanë të IA-së në Kinë. Disa ekspertë të marrëdhënieve SHBA-Kinë nuk mendojnë se e gjitha është rastësi.
“Novacioni teknologjik është real, por koha e shfaqjes së tij është politike prej natyre”, ka thënë Gregory Allen, drejtor i Qendrës Wadhwani AI në Qendrën për Studime Strategjike dhe Ndërkombëtare. Allen ka krahasuar risinë e javës së kaluar nga DeepSeek me nxjerrjen e një telefoni të ri në treg nga kompania kineze Huawei, nën sanksione nga SHBA-ja, gjatë diskutimeve diplomatike për kontrollin e eksporteve nga administrata e presidentit Joe Biden, më 2023.
“Përpjekja për të treguar se kontrollet e eksporteve janë të kota apo kundërproduktive, është një objektiv vërtet i rëndësishëm i politikës së jashtme kineze aktualisht”, ka thënë Allen.
Të hënën, Trump i ka quajtur lajmet për DeepSeek-un si “pozitive”, nëse janë të vërteta, sepse ato tregojnë se “nuk ke nevojë të shpenzosh aq shumë për të siguruar rezultatin e njëjtë”.
Presidenti amerikan i ka quajtur zhvillimet si “alarm zgjimi për industritë tona, që ne duhet të jemi shumë të përqendruar në garën për të fituar”.
Trump ka nënshkruar një urdhër ekzekutiv në ditën e tij të parë në detyrë, javën e kaluar, sipas të cilit, administrata e tij do t’i “identifikojë dhe eliminojë boshllëqet në kontrollet ekzistuese të eksporteve”, duke sinjalizuar se ai me gjasë do të vazhdojë dhe do të ashpërsojë qasjen e Bidenit.
Përparimi i DeepSeek-ut në fushën e IA-së, pa shpenzuar aq shumë sa konkurrentët amerikanë, mund të minojë investimin e mundshëm prej 500 miliardë dollarësh për IA-në nga OpenAI, Oracle dhe SoftBank, të cilin Trump e paralajmëroi në Shtëpinë e Bardhë.
Vlera e Nvidia-s në treg ra për 17 për qind të hënën, por kompania tha, nëpërmjet një komunikate, se përshëndeste punën e DeepSeek-ut si “përparim i shkëlqyeshëm në fushën e IA-së”, i cili shfrytëzoi “modelet që janë gjerësisht në dispozicion dhe çipat që janë plotësisht në përputhje me kontrollet e eksporteve”.