Gemini. Google pokazało superzaawansowane narzędzie AI. Są jednak kontrowersje

Gemini: nowe narzędzie AI od Google

Gemini to nie tylko kontynuacja wcześniejszych projektów, ale zupełnie nowy rezultat współpracy różnych zespołów Google. Jest to model multimodalny, przeznaczony do zaawansowanych zadań i zdolny do przetwarzania takich informacji jak tekst, obraz, wideo, dźwięk. Obejmuje też generowanie wysokiej jakości kodów w językach Java, Python, C++ i Go, a optymalizacja dla procesorów Tensor (TPU) v4 i v5e, przynosi znaczną przewagę pod względem wydajności i szybkości działania.

„Sztuczna inteligencja to szansa na to, aby pomagać każdemu niezależnie od tego, gdzie przebywa na świecie. Przyniesie innowacje, progres ekonomiczny i wiedzę oraz edukację w bezprecedensowej skali” –przekonywał prezes Google Sundar Pichai.

Google Gemini w wielu odsłonach

Nowy model jest dostępny w trzech wersjach: Ultra, Pro i Nano. Gemini Ultra to najbardziej wydajny model przeznaczony do zaawansowanych zadań. Jego wydajność ma przewyższać możliwościami nawet ChatGPT 4.0. Model Pro został stworzony do skalowania w szerokim zakresie zadań, z kolei Nano – przeznaczony jest do użytku na urządzeniach mobilnych.

Google zapowiada jednocześnie, że korzyści z Gemini będą szerokie i dostępne dla użytkowników wszystkich usług. W najbliższych miesiącach Gemini zostanie zintegrowane z kluczowymi usługami Google, takimi jak wyszukiwarka, Google Ads, Chrome, Duet AI, system operacyjny smartfonów Pixel, klawiatura Gboard.

Gemini 1.0 jest już dostępny w wielu usługach i na różnych platformach, a od 6 grudnia model Gemini Pro jest wykorzystywany w usłudze Bard w języku angielskim w ponad 170 krajach i regionach. Model działa obecnie tylko w języku angielskim, ale Google planuje wkrótce rozszerzyć dostępność modelu i udostępnić go w kolejnych miejscach i językach. 13 grudnia deweloperzy i klienci biznesowi dostaną też dostęp do modelu Gemini Pro poprzez Gemini API w Google AI Studio lub Google Cloud Vertex AI.

Google Gemini: nowa konkurencja dla ChatGPT?

W badaniach porównawczych z ChatGPT w wersji GPT-4, Gemini Ultra osiągnął lepsze wyniki w kluczowych obszarach, które obejmują wiedzę ogólną, rozumienie, matematykę i kodowanie. Model ten okazał się również pierwszym modelem językowym, który przewyższył ludzkich ekspertów w wielozadaniowym rozumieniu języka.

Imponujące możliwości Gemini zostały zaprezentowane na powyższym filmie promocyjnym – problem w tym, że Google rozminęło się w nim z rzeczywistością. Firma przyznaje, że na potrzeby zdynamizowania materiału dokonano pewnych uproszczeń. Np. gra w "papier, kamień, nożyce" naprawdę nie wygląda tak płynnie. Przed przygotowaniem video Gemini zostało nauczone rozpoznawania układu dłoni i kontekstu gry, a cały ten – przyznajmy uczciwie – żmudny proces, został opisany krok po kroku na blogu Google for Developers.

"Wszystkie polecenia użytkownika i wyniki w filmie są autentyczne, ale zostały one skrócone dla zwięzłości. Film ilustruje, jak mogą wyglądać wielomodalne doświadczenia użytkownika zbudowane przy użyciu Gemini. Stworzyliśmy go, aby zainspirować deweloperów" – tłumaczył na X kontrowersje wokół filmu Oriol Vinyals, wiceprezes zespołu DeepMind.

Gemini aktualnie nie jest więc tak zaawansowane i inteligentne, jak Google chciałoby je prezentować, co zresztą nie umknęło także uwadze osób komentujących film. Wiele z nich czuje się oszukanych przez firmę.

Przeczytaj całość ->