Pod koniec ubiegłego roku Uczestniczyłem w wydarzeniu zorganizowanym przez Google, aby uczcić postępy w sztucznej inteligencji. Domena firmy w nowojorskiej dzielnicy Chelsea rozciąga się teraz dosłownie na rzekę Hudson, a około stu z nas zebrało się w przestrzeni wystawienniczej mostde, aby obejrzeć przygotowane przez dyrektorów prezentacje i pokazy najnowszych osiągnięć. Przemawiając zdalnie z Zachodniego Wybrzeża, najwyższy kapłan firmy ds. obliczeń, Jeff Dean, obiecał „pełną nadziei wizję przyszłości”.
Tematem dnia było „odkrywanie (nie)możliwego”. Dowiedzieliśmy się, jak wykorzystuje się sztuczną inteligencję Google do walki z pożarami lasów, prognozowania powodzi i oceny chorób siatkówki. Ale gwiazdami tego programu były te, które Google nazwał „generatywnymi modelami sztucznej inteligencji”. Są to maszyny treści, wyszkolone na ogromnych zestawach danych treningowych, zaprojektowane do masowego tworzenia pism, obrazów, a nawet kodu komputerowego, który kiedyś tylko ludzie mogli stworzyć.
Coś dziwnego dzieje się w świecie AI. Na początku tego stulecia dziedzina wyrwała się z letargu — znanego jako zima sztucznej inteligencji — dzięki innowacjom „głębokiego uczenia się” kierowanym przez trzech naukowców. To podejście do sztucznej inteligencji zmieniło dziedzinę i sprawiło, że wiele naszych aplikacji stało się bardziej użytecznych, obsługując tłumaczenia językowe, wyszukiwanie, wyznaczanie tras Ubera i prawie wszystko, co ma „inteligentne” jako część swojej nazwy. Spędziliśmy kilkanaście lat w tej sztucznej wiośnie. Jednak mniej więcej w ciągu ostatniego roku doszło do dramatycznego wstrząsu wtórnego do tego trzęsienia ziemi, ponieważ pojawiła się nagła obfitość oszałamiających modeli generatywnych.
Większość zabawek, które Google zademonstrowało na molo w Nowym Jorku, pokazało owoce modeli generatywnych, takich jak flagowy model dużego języka, zwany LaMDA. Może odpowiadać na pytania i współpracować z kreatywnymi pisarzami, aby tworzyć historie. Inne projekty mogą tworzyć obrazy 3D na podstawie monitów tekstowych, a nawet pomagać w tworzeniu filmów, tworząc sugestie przypominające scenorysy na podstawie scen po scenach. Ale duża część programu dotyczyła niektórych kwestii etycznych i potencjalnych niebezpieczeństw związanych z uwolnieniem robotów generujących treści na świecie. Firma dołożyła wszelkich starań, aby podkreślić, jak ostrożnie postępowała w stosowaniu swoich potężnych kreacji. Najbardziej wymowne stwierdzenie pochodzi od Douglasa Ecka, głównego naukowca w Google Research. „Generatywne modele sztucznej inteligencji są potężne — nie ma co do tego wątpliwości” — powiedział. „Ale musimy również zdać sobie sprawę z rzeczywistych zagrożeń, jakie może stwarzać ta technologia, jeśli nie będziemy uważać, dlatego tak wolno je udostępniamy. I jestem dumny, że powoli je wypuszczaliśmy”.
Jednak konkurencja Google nie wydaje się mieć słowa „wolny” w swoich słownikach. Podczas gdy Google zapewnia ograniczony dostęp do LaMDA w chronionej aplikacji Test Kitchen, inne firmy oferują szwedzki stół typu „wszystko, co możesz zjeść” z własnymi chatbotami i generatorami obrazów. Zaledwie kilka tygodni po wydarzeniu Google pojawiło się najbardziej znaczące jak dotąd wydanie: najnowsza wersja własnej potężnej technologii generowania tekstu OpenAI, ChatGPT, błyskawicznego, logoreicznego gadżetu, który wypluwa spójne eseje, wiersze, sztuki teatralne, piosenki, a nawet nekrologi na najdrobniejszą wskazówkę. Korzystając z szerokiej dostępności chatbota, miliony ludzi majstrowało przy nim i dzieliło się jego niesamowitymi reakcjami, do tego stopnia, że stał się międzynarodową obsesją, a także źródłem zachwytu i strachu. Czy ChatGPT zabije esej z college’u? Zniszczyć tradycyjne wyszukiwanie w Internecie? Pozbawić pracy miliony copywriterów, dziennikarzy, artystów, autorów piosenek i asystentów prawnych?
Odpowiedzi na te pytania nie są teraz jasne. Ale jedno jest. Przyznanie otwartego dostępu do tych modeli zapoczątkowało mokre, gorące lato AI, które ożywia sektor technologiczny, nawet gdy obecni giganci zwalniają część swojej siły roboczej. Wbrew przekonaniu Marka Zuckerberga kolejnym wielkim paradygmatem nie jest metaverse — to nowa fala silników treści opartych na sztucznej inteligencji, która jest już dostępna. W latach 80. byliśmy świadkami gorączki złota produktów przenoszących zadania z aplikacji papierowych do aplikacji na komputery PC. W latach 90. można było szybko zarobić fortunę, przenosząc te produkty stacjonarne do sieci. Dziesięć lat później ruch dotyczył urządzeń mobilnych. W latach 20. XXI wieku duża zmiana dotyczy budowania z generatywną sztuczną inteligencją. W tym roku pojawią się tysiące startupów z biznesplanami opartymi na wykorzystaniu API tych systemów. Koszt wyprodukowania ogólnej kopii spadnie do zera. Pod koniec dekady systemy generowania wideo AI mogą zdominować TikTok i inne aplikacje. Mogą nie być tak dobre, jak innowacyjne dzieła utalentowanych ludzi, ale roboty będą dominować ilościowo.