Nowy poziom AI i ostatnia szansa dla VR. Co przyniesie rok 2024 w technologii?

2023 rok był przełomowy dla generatywnej sztucznej inteligencji. Gdy Satya Nadella, prezes Microsoftu, podczas prywatnego pokazu zobaczył możliwości dużego modelu językowego GPT-4, stwierdził, że cała firma musi zmienić kurs o 180 stopni, a celem jest właśnie AI. Współpraca z OpenAI i wprowadzenie chatbota do wyszukiwarki Bing czy wdrożenie usług marki Copilot do najpopularniejszego na świecie pakietu biurowego MS Office to zaledwie początek tych zmian. Obecnie Microsoft inwestuje 50 mld dolarów w centra danych do obsługi sztucznej inteligencji – to więcej niż cały roczny budżet na badania i rozwój Alphabet czy Apple. A wszystko po to, by nie przegapić kolejnej przemiany technologicznej, bo rewolucję smartfonową Microsoft przecież przespał.

AI stało się też priorytetem dla innych firm z wielkiej piątki, zwłaszcza dla Google, które niedawno zaprezentowało zupełnie nowy model językowy Gemini, teoretycznie mogący konkurować z najsilniejszym modelem GPT-4 Turbo od OpenAI. Meta również zamierza skupić się na AI i odejść od dotychczas promowanego przez siebie metawersum. Jakich trendów w obszarze sztucznej inteligencji można więc spodziewać się w 2024 roku?

Modele językowe we wszystkich odmianach i kształtach

Pierwszy trend, który zapewne będzie się rozwijał, to indywidualne wersje AI, dopasowane do określonych potrzeb. OpenAI udostępniło możliwość tworzenia w prosty sposób tzw. GPTs, czyli zindywidualizowanych wersji ChatGPT, wzbogaconych o indywidualny korpus wiedzy. W 2024 roku będzie powstawało coraz więcej wyspecjalizowanych chatbotów do poszczególnych zadań.

Na przykład chatbot prawniczy, który zawiera ogólną wiedzę z prawa amerykańskiego wzbogaconą o korpus wiedzy na ściśle określony temat, np. prawa pracy, by stać się ekspertem w określonym temacie. Tego kierunku zindywidualizowanych chatbotów można już teraz posmakować korzystając z polskiego projektu czat.ai, bazującego na najlepszym modelu językowym ChatGPT-4 Turbo, nieporównywalnie lepszym niż darmowa wersja ChatGPT, bazująca na modelu GPT-3.5.

Kolejny trend, to rozpowszechnianie się modeli językowych w coraz większej liczbie "edycji", w tym takich, które nie wymagają dostępu do internetu. Te tak zwane modele "nano" mogą działać na lokalnych urządzeniach bez dostępu do sieci i znacznie usprawniać ich pracę. Jeden z pierwszych tego typu modeli zaprezentowało Google – Gemini Nano będzie niebawem pozwalało np. na przygotowanie tekstowego podsumowania nagrania audio. W podobnym kierunku zmierza też Apple.

PLLuM, czyli narodowe modele językowe

W przypadku dużych modeli językowych (LLM) kluczowy jest zbiór danych, na bazie którego uczy się dany model. Mówiąc kolokwialnie, w procesie uczenia się LLM połyka ogólnodostępne treści z internetu uzupełnione o uporządkowane zbiory informacji, jak np. archiwum czasopism naukowych. Następnie całą tę olbrzymią wiedzę, zawierającą setki miliardów parametrów, transformuje się w model językowy. Niestety, najbardziej znane i użyteczne modele trenowane są przede wszystkim na języku angielskim.

Stąd coraz więcej inicjatyw, by tworzyć modele narodowe. I właśnie taki polski model będzie powstawał we współpracy NASK i pięciu innych jednostek badawczych. PLLuM ma być uczony przede wszystkim na danych w języku polskim oraz, co bardzo istotne, ma być modelem otwartym, a więc z jego możliwości w pełni i bez ograniczeń będą mogli korzystać wszyscy, tworząc różnorodne rozwiązania na nim oparte.

Próby regulacji AI

Jednak rok 2024 będzie stał nie tylko pod znakiem bardzo dynamicznego rozwoju systemów sztucznej inteligencji, ale też prób ich regulacji. Pionierem jest tutaj Unia Europejska, która jako pierwsza na świecie uzgodniła treść ustawy regulującej wykorzystanie AI, określającej m.in. czym są implementacje AI wysokiego ryzyka. Podobnych regulacji można się także spodziewać w kolejnych częściach świata. 

Rok 2024 będzie rokiem wyborczym dla ponad 2 mld ludzi z ponad 70 krajów świata. Wybory odbędą się też w Stanach Zjednoczonych, gdzie obywatele i obywatelki zdecydują, kto zostanie ich kolejnym prezydentem. I właściwie możemy mieć pewność, że generatywna sztuczna inteligencja odegra kluczową rolę w nadchodzącej kampanii – niekoniecznie pozytywną. Już teraz eksperci spodziewają się dezinformacji na niespotykaną dotąd skalę, bo przecież generowanie fałszywych zdjęć i nagrań audio jeszcze nigdy nie było tak proste jak obecnie.

Mijający rok nie pozostawia wątpliwości, że sztuczna inteligencja jest technologią przełomową. Dlatego w 2024 roku można się spodziewać tylko przyspieszenia i dominacji rozwiązań AI, które będą wkraczały w coraz więcej obszarów naszego życia.

Spatial Computing

Dzisiaj wiemy też, że rok 2024 będzie stał pod znakiem AR i VR, czyli rozszerzonej i wirtualnej rzeczywistości. A to wszystko za sprawą zaprezentowanego przez Apple w czerwcu 2023 roku urządzenia Vision Pro.

Mimo ekscytacji całej branży technologicznej wirtualną i rozszerzoną rzeczywistością nigdy tak naprawdę nie trafiła ona pod strzechy. W październiku 2021 roku Facebook zmienił nazwę na Meta i od tamtego czasu oficjalnie postawił na wirtualną rzeczywistość, jednak konsumenci nigdy się do niej nie przekonali. Gogle VR z serii Meta Quest nigdy nie wyszły poza niszę graczy komputerowych. Szacuje się, że od 2019 roku sprzedano ich około 20 mln sztuk, w stosunku do prawie 50 mln egzemplarzy PlayStation 5, które na rynku jest o ponad rok krócej. Popularności Questa nie sposób też porównywać do smartfonów – tylko Apple sprzedało ponad 225 mln iPhone'ów w samym 2022 roku. 

Dlatego to właśnie na tej firmie skupi się w marcu 2024 r. uwaga całej branży technologicznej, gdy swoją premierę będzie miało wspomniane Apple Vision Pro. Zdaniem kilku amerykańskich ekspertów, którzy mieli okazję testować urządzenie, jeśli Apple nie uda się stworzyć rynku dla AR i VR, to nie uda się to już nikomu. A szanse są, bo zdaniem testujących Vision Pro urządzenie jest przełomowe i zupełnie zmienia sposób, w jaki korzysta się z komputerów – wkracza w erę tzw. spatial computing. To zresztą określenie, którego używa Apple opowiadając o Vision Pro.

Użytkownicy Vision Pro będą w stanie wybierać elementy interfejsu samymi ruchami gałek ocznych, porozumiewać się z nim za pomocą głosu, a swoje wybory zatwierdzać jednym gestem dłoni. I to wszystko działa podobno w sposób idealny, prawie magiczny. Jakość obrazu jest z kolei tak dobra, że nie czuje się zmęczenia wzroku, a w trybie rozszerzonej rzeczywistości obiekty ze świata wirtualnego doskonale łączą się ze światem rzeczywistym. Ci, którzy mieli okazję testować Vision Pro, potwierdzają, że całościowe doświadczenie korzystania z urządzenia jest wyjątkowo dobre, nieporównywalne z niczym, co było dostępne dotychczas.

Czy to jednak wystarczy, by przekonać konsumentów do noszenia hełmu, pokazującego osobom wokół projekcję oczu noszącego, wyświetlaną na ekranie ciekłokrystalicznym? Cena urządzenia – 3,5 tys. dolarów – wskazuje, że nie jest ono skierowane do zwykłych konsumentów, ale do entuzjastów, geeków i deweloperów oprogramowania, a to, jak Vision Pro się przyjmie, zadecyduje o przyszłości branży AR/VR.

X kontra reszta świata

Wiemy też, że w 2024 roku Twitter, przemianowany przez Elona Muska na X, będzie mierzył się z coraz większą konkurencją. Uruchomiony w lipcu 2023 roku serwis Meta Threads miał po pięciu dniach od premiery 100 mln użytkowników, mimo że w Unii Europejskiej uruchomiono go dopiero w połowie grudnia. Na polu serwisów mikroblogowych rozpychają się też zdecentralizowane Mastodon i założone przez Jacka Dorseya, twórcę oryginalnego Twittera, BlueSky, które ma już ponad 2 mln aktywnych użytkowników.

X, posiadający ponad 528 milionów aktywnych użytkowników miesięcznie, wydaje się teoretycznie niezagrożony, ale kolejne kontrowersyjne działania i zachowania Elona Muska nie pomagają serwisowi. Ostatnio miliarder wzbudził olbrzymie kontrowersje swoją odpowiedzią na antysemicki post i wulgarnym zwrotem w kierunku reklamodawców, co zresztą doprowadziło do ich masowego odpływu z platformy. Rok 2024 na pewno będzie stał więc pod serią znaków zapytania dotyczących X.com, a dwa najważniejsze z nich to: czy platforma utrzyma swoją palmę pierwszeństwa? I czy przetrwa kolejny rok?

To oczywiście subiektywny wybór najważniejszych, zdaniem autora, trendów technologicznych w 2024 roku, wyłącznie takich, na temat których mamy już dzisiaj szereg potwierdzonych informacji. A najciekawsze zapewne będą te rzeczy, których dzisiaj nikt się nie spodziewa, tak jak premiery ChatGPT w grudniu 2022 r.