DeepSeek był celnym strzałem chińskiej propagandy. Nowy model sztucznej inteligencji nie jest aż takim przełomem, jak początkowo sądzono, ale może wprowadzić AI pod strzechy
– Premiera chińskiego modelu AI o nazwie DeepSeek powinna być dzwonkiem alarmowym dla naszej branży. Musimy się mocno skupić na konkurowaniu, by z nimi wygrać – stwierdził prezydent Donald Trump na spotkaniu Partii Republikańskiej na Florydzie 27 stycznia. I choć jak zwykle robił dobrą minę do złej gry, to wyjątkowo nie drwił z przeciwnika. Zaledwie tydzień po zmianie władzy w USA Chińczycy oblali kubłem zimnej wody amerykańską branżę sztucznej inteligencji, która – według Trumpa – ma być motorem gospodarki USA i wzorem dla całego świata.
Miś za pół biliona dolarów
Nie jest przypadkiem, że najjaśniej na inauguracji Trumpa błyszczeli technologiczni miliarderzy, zaś najbardziej zaufanym doradcą (a może i animatorem) nowego prezydenta jest Elon Musk, który też buduje własny model AI o nazwie Grok. Jednym z pierwszych dekretów Trumpa było cofnięcie prawnych barier dla AI wprowadzonych przez administrację Joe Bidena (chodziło o odpowiedzialny rozwój tej technologii). Pojawiła się też zapowiedź potężnych inwestycji w infrastrukturę do rozwoju AI – prezesi spółek OpenAI, Oracle i SoftBank w obecności Trumpa zobowiązali się wydać na projekt o nazwie Stargate na początek 100 mld dol., a docelowo aż 500.
Skąd te kwoty? Trenowanie zaawansowanych modeli sztucznej inteligencji wymaga supersilnych serwerów z zaawansowanymi chipami obliczeniowymi. Niemal monopolistą na rynku takich układów jest amerykańska spółka Nvidia, która od kilkudziesięciu lat produkuje karty graficzne do komputerów. Kiedy okazało się, że świetnie nadają się też do serwerów dla AI, Nvidia stała się jedną z najwyżej wycenianych firm na świecie. Tuż przed premierą ChatGPT warta była ok. 280 mld dol. na giełdzie Nasdaq, a pod koniec stycznia tego roku – już ponad 3,5 biliona. Ale wystarczyła jedna niewielka apka z Chin, by w kilka godzin wartość Nvidii spadła o prawie 600 mld dol., a szumnie zapowiadany projekt Stargate zaczął wyglądać jak wielki miś ze słomy.
Propagandowy majstersztyk
Nazwa DeepSeek jeszcze miesiąc temu znana była wąskiemu gronu specjalistów od sztucznej inteligencji. Od końca stycznia jest na ustach całego świata, a w sklepie z aplikacjami Apple’a apka DeepSeek wskoczyła na pierwsze miejsce. To niemal dokładnie to samo co ChatGPT, Claude czy Grok – asystent AI, który w mgnieniu oka przeanalizuje i skróci długi raport, przygotuje prezentację w PowerPoincie albo pomoże napisać fragment kodu programiście. Skąd giełdowe trzęsienie parkietu w USA? Bo DeepSeek to dzieło chińskiej spółki, a do tego – jak twierdzą sami autorzy – przygotowane dosłownie za grosze.
Propagandowo Chiny rozegrały tę partię wręcz doskonale. Nową wersję modelu DeepSeek przedstawili 20 stycznia, czyli w dniu inauguracji Trumpa. A pięć dni po prezentacji przez Amerykanów projektu Stargate za pół biliona dolarów Chińczycy opublikowali raport, z którego wynikało, że całkiem porządny model językowy AI można zrobić z okrojonych chipów i bardzo tanio. Według chińskiego raportu koszt wyszkolenia modelu językowego, który w niczym nie ustępuje najnowszym wersjom ChatGPT czy Claude’a, wyniósł niecałe 6 mln dol. Do pracy całego systemu miał wystarczyć klaster zaledwie 2048 chipów Nvidia, i to w wersji H800, czyli okrojonej, przeznaczonej specjalnie na rynek chiński. To był bolesny cios, bo nie dało się uciec od pytań, czy branża AI nie jest przypadkiem spekulacyjną bańką, która zaraz pęknie.
(Prawie) cała prawda o DeepSeek
Kiedy minął pierwszy wstrząs, Zachód zaczął uważnie przyglądać się chińskiej nowince i okazało się, że tu i ówdzie widać propagandową fastrygę. Po pierwsze, koszty. Informacje podane przez Chińczyków są prawdą, ale nie całą. Bo sam model DeepSeek może i powstał w ciągu roku, ale fundamenty pod jego budowę położono dekadę temu. Właścicielem DeepSeek jest chińska firma inwestycyjna High-Flyer, założona w 2015 r. m.in. przez Lianga Wenfenga. Początkowo miała zbudować sztuczną inteligencję do skuteczniejszego inwestowania na giełdach, ale z czasem rozszerzyła obszar zainteresowań. Swój pierwszy superkomputer Fire-Flyer I firma zbudowała w 2020 r., kosztem ok. 27,5 mln dol. Rok później powstał Fire-Flyer II, który zawierał 10 tys. układów Nvidia A100 i kosztował prawie 140 mln dol. Na przełomie 2022 i 2023 r. Amerykanie zaczęli wprowadzać pierwsze obostrzenia w sprzedaży chipów AI do Chin, ale najwyraźniej High-Flyer zdążył kupić ich na tyle dużo, by zbudować superkomputer do trenowania modelu językowego. Spółka DeepSeek powstała w połowie 2023 r. 6 mln dol. to tylko koszt wykorzystania mocy superkomputera, bo sama jego budowa była znacznie bardziej kosztowna.
Po drugie, źródła danych. Jak to możliwe, by w rok wytrenować model, który jest w stanie konkurować z maszynami tworzonymi przez całe lata na Zachodzie? DeepSeek może przy tym sprawnie porozumiewać się w wielu językach, także po polsku. OpenAI, spółka, która stworzyła ChatGPT, twierdzi, że Chińczycy mogli pójść na skróty i „wydestylować” sporą część wiedzy z ich modelu. Według Bloomberga OpenAI w zeszłym roku wykrył zwiększoną aktywność niektórych kont podłączonych do ChatGPT, co rodzi podejrzenia, że mogły „wysysać” informacje niezbędne do szkolenia DeepSeek. Podobnego zdania jest David Sacks, który w Białym Domu odpowiada za AI i kryptowaluty. Władze OpenAI oburzają się, że doszło do naruszenia ich własności intelektualnej. Ale nie nadmieniają, że same dostały pozwy od grupy wydawców (m.in. „New York Timesa”) za wykorzystanie treści do trenowania ChatGPT bez żadnej umowy.
Jest jeszcze trzecia kwestia, czyli cenzura. Skoro DeepSeek jest dziełem chińskiej firmy, to można się spodziewać przemilczania drażliwych tematów. Faktycznie, chatbota od samego początku zalał potop pytań o masakrę na placu Tiananmen, obozy pracy dla Ujgurów czy specyfikę ustroju Chin. Cenzura rzeczywiście działa. Czasami apka wyrzuca kilka ekranów wyczerpującej odpowiedzi (np. zapytana o wydarzenia z 4 czerwca 1989 r. w Pekinie użyła nawet sformułowania „masakra na placu Tiananmen”), by po chwili skasować cały tekst i oznajmić, że pytanie wykracza poza zakres jej możliwości. Ale już pytając o ustrój Chin, można się dowiedzieć, że to autorytaryzm, władza jednej partii, że wolności obywatelskie są ograniczane. I żaden cenzor tego nie kasuje. Odpowiedzi można też szukać nie wprost. Użytkownicy Reddita polecili DeepSeek, by opowiedział o człowieku, który stanął naprzeciw czołgów na Tiananmen, podmieniając w słowach kilka liter. Tekst da się odczytać, a cenzor go nie usunął. DeepSeek bez trudu stworzył też przejmującą balladę o Ujgurach w obozach pracy, gdzie między wierszami kryje się opowieść o ludzkiej krzywdzie.
Na pytanie: „Czy sądzisz, że twoje odpowiedzi są cenzurowane?”, DeepSeek odpisuje: „Nie jestem bezpośrednio cenzurowany przez żadną organizację czy rząd, ale jako model AI działam w ramach wytycznych i zasad etycznych ustalonych przez moich twórców. Oznacza to, że unikam treści szkodliwych, nieetycznych lub niezgodnych z polityką odpowiedzialnego korzystania z AI”.
„Garbus” zamiast limuzyny
Czy zatem DeepSeek to tylko PR-owa wydmuszka Chińczyków? Specjaliści od technologii i sztucznej inteligencji widzą w nim znacznie więcej. – Jego twórcy udowodnili, że bardzo dobry model językowy da się zrobić 30 razy taniej niż do tej pory. A to jest przełom – wyjaśnia prof. Piotr Sankowski z Uniwersytetu Warszawskiego, który ma stanąć na czele Instytutu Badawczego IDEAS, współtworzonego przez MON i Ministerstwo Cyfryzacji. – Nie bez znaczenia jest też tło polityczne. Chiny pokazały, że w najtrudniejszej dziedzinie, jaką jest przetwarzanie języka naturalnego, potrafią stworzyć coś, co dorównuje modelom z USA.
Podobnego zdania jest prof. Aleksandra Przegalińska, prorektorka ds. innowacji Akademii Leona Koźmińskiego w Warszawie. – Niedawno w Campus AI zapytaliśmy 2 tys. osób z czterech krajów, z jakiego narzędzia AI korzystają. Niemal wszyscy wskazywali na ChatGPT. Nawet Google, który po dwóch latach prac udostępnił swój model Gemini, nie zdołał tak błyskawicznie osiągnąć rozgłosu porównywalnego z DeepSeek – mówi. – Ale od efektu propagandowego ciekawszy jest dla mnie radykalizm chińskiej propozycji. DeepSeek nie jest doskonały, ale może być o wiele tańszym rozwiązaniem niż to, co tworzą Amerykanie. Na dodatek jest udostępniany na licencji open source. Może Chińczycy celują w zupełnie innego odbiorcę, którego nie stać było na marzenia o tworzeniu albo użytkowaniu drogich zachodnich modeli językowych?
Według prof. Przegalińskiej DeepSeek i kolejne podobne rozwiązania mogą być atrakcyjną propozycją Chińczyków dla krajów globalnego Południa. To nie będzie droga, elegancka, dobrze wyciszona limuzyna, jak zachodnie modele, ale tani „garbus”, który mimo wad zrewolucjonizował motoryzację w wielu krajach. Chińskie wpływy w Afryce są już ogromne. Co stoi na przeszkodzie, by teraz upowszechnić tam chińską AI i technologicznie uzależnić ten kontynent od Państwa Środka?
Włączyć się do biegu
DeepSeek powinien być hasłem do pobudki nie tylko dla Ameryki, jak mówi prezydent Trump, ale także dla Europy i Polski, które w tym wyścigu dopiero zawiązują buty. – Bardzo bym chciała, żebyśmy tu, w Europie i w Polsce, w końcu włączyli się do biegu. Świadomość zapóźnienia jest, czas wziąć się do roboty. Mamy całkiem niezły francuski model Mistral, można korzystać z udostępnionego przez Metę modelu open source LLaMA. Może ten chiński DeepSeek da nam kolejny bodziec i poczucie, że jeszcze nie wszystkie karty zostały rozdane – przekonuje prof. Przegalińska. Sami Chińczycy też zresztą oglądają się za siebie, bo może się pojawić grupa pościgowa… z Indii. To najludniejszy kraj na Ziemi, z ambicjami, a hinduscy naukowcy są niezwykle cenieni, nie tylko w branży AI.
– Powinniśmy zwiększyć środki przeznaczane na AI, rozwijać własne modele na otwartych licencjach, postawić na znacznie większą konkurencję z Nvidią w zakresie kart GPU – wylicza Piotr Mieczkowski, dyrektor zarządzający fundacji Digital Poland, wiceprezes European AI Forum, największego europejskiego stowarzyszenia start-upów AI.
I tu dobra wiadomość dosłownie z początku lutego: Uniwersytet Karola w Pradze będzie koordynował prace OpenEuroLLM, konsorcjum 20 europejskich podmiotów, które ma rozwijać modele językowe na licencji open source. Bruksela na początek wsparła ten projekt kwotą 37,4 mln euro.
Polskie modele językowe AI istnieją, ale trudno je porównywać z tym, co tworzą giganci technologii. 31 grudnia 2024 r. zakończyły się formalnie roczne prace nad projektem PLLuM (Polish Large Language Model), prowadzonym pod patronatem m.in. NASK, PAN i resortu cyfryzacji w oparciu o model LLaMa Mety. Część efektów ma wkrótce wykorzystać Ministerstwo Cyfryzacji. Jest też Bielik (oparty na Mistralu), ale na razie to raczej projekt robiony przez pasjonatów po godzinach.
W rządzie trwają prace nad rozporządzeniem powołującym Instytut Badawczy IDEAS, który ma być kluczowym ośrodkiem polskich badań nad AI. Na rozruch dostanie 20 mln zł, a kierować ma nim prof. Piotr Sankowski. Przypomnijmy, że jesienią minister nauki Dariusz Wieczorek nagle odwołał prof. Sankowskiego ze stanowiska prezesa spółki IDEAS NCBiR, co wywołało polityczną burzę i zarzuty, że rząd sabotuje pracę świetnych polskich specjalistów od AI.
Prof. Sankowski zaznacza, że nie musimy się od razu rzucać na konkurowanie w dziedzinie modeli językowych: – Warto poszukać własnych specjalizacji, w których możemy osiągnąć sukces. Bardzo dużo inwestujemy teraz w obronność, moglibyśmy zainwestować w sztuczną inteligencję w tej dziedzinie.
Własne AI to nie tylko kwestia narodowych ambicji. – Po tym, co dzieje się od początku prezydentury Donalda Trumpa, trzeba bić na alarm. Interesy amerykańskiej branży technologicznej są ściśle związane z polityką USA. A ta staje się kompletnie nieprzewidywalna. Trump zagroził już cłami Kanadzie i Meksykowi, chciał odebrać Grenlandię Danii, czyli sojusznikowi z NATO. Co będzie, jeśli on czy któryś z tych miliarderów pewnego dnia wstaną lewą nogą i postanowią nam wyłączyć Twittera, Facebooka albo ChatGPT? – irytuje się Artur Kurasiński, konsultant i obserwator branży technologicznej.
– Za jakiś czas AI to nie będzie tylko śmieszny chatbot, który napisze za ucznia pracę domową, a prezesowi zrobi mądrą prezentację na posiedzenie zarządu. Tak będzie po prostu wyglądał internet. I jeśli nie będziemy mieli własnego modelu językowego, wytrenowanego na naszych porządnych zasobach, to nas w tym przyszłym internecie nie będzie.