Parę dni temu Google ogłosił, że jego chatbot Bard przenosi się na nowy model językowy Gemini i szybko okazało się, że jest on dostępny niemal na całym świecie, ale… z wyjątkiem Unii Europejskiej. Teraz Google daje dostęp do modelu językowego Gemini programistom przez tzw. API i okazuje się, że model ten mówi po polsku, ale niestety nie do mieszkańców Polski – API również nie jest dostępne z terenu Unii.
Czym jest API i komu jest ono potrzebne? API (application programming interface) to zestaw reguł, według których język programowania może się kontaktować z jakąś usługą. Na przykład X (dawniej Twitter) i Facebook udostępniają swoje media społecznościowe nie tylko przez witrynę internetową, ale również przez API, pozwalając na przykład na analizę wpisów przy pomocy odpowiedniego oprogramowania.
Podobnie jest z dużymi modelami językowymi. Część z nich udostępnia chatboty do komunikacji z użytkownikami, ale wiele innych, zwłaszcza jeśli specjalizują się w innych zadaniach niż pogawędki z człowiekiem, komunikuje się ze światem zewnętrznym właśnie przy pomocy API.
Z punktu widzenia biznesu, który chciałby wbudować możliwości dużych modeli językowych w swoje oprogramowanie – czy to do celów własnych, czy to na sprzedaż – chatboty są mało użyteczne. Dostęp do API jest niezbędny.
O ile użytkownicy Barda odczują brak Gemini tylko w niewielkim stopniu – ciągle będą mogli korzystać ze starszego modelu językowego, który mówi po polsku – to w przypadku API sprawa jest bardziej skomplikowana – Google twierdzi, że API jego poprzedniego modelu PaLM wspierało tylko język angielski (jak twierdzi Google, używanie innych języków „może skutkować nieoczekiwanymi wynikami”), co czyni je bezużytecznym dla polskich firm chcących wykorzystać LLM od Google’a w swoich produktach.
Czemu Bard mówi po polsku, a będący jego podstawą PaLM już nie? Możemy tylko zgadywać, że znajomość języka polskiego została Bardowi dodana podczas tzw. fazy dostrajania modelu, model bazowy ma zaś tylko ograniczoną znajomość języka polskiego.
Ktoś mógłby wzruszyć ramionami i powiedzieć, że przecież niedługo – w połowie przyszłego roku, jak już pisaliśmy – będziemy mieć swoje własne modele językowe z projektu PLLuM. Jednak, po pierwsze, tych sześć miesięcy to w świecie AI bardzo długi czas (pamiętajmy, że rewolucja ChatGPT zaczęła się tylko trochę ponad rok temu), a po drugie część firm zapewne będzie planować ekspansję na rynki zagraniczne i będą one wolały budować swój biznes wokół modelu, który daje dostęp do innych języków. Chwilowo po polsku (dość) dobrze mówią GPT i, jak należy sądzić, Gemini.
Pewnym pocieszeniem jest fakt, że Google daje dostęp tylko do swojego mniej potężnego modelu Gemini Pro, a jego najpotężniejszy model Gemini Ultra pojawi się dopiero w pierwszych miesiącach następnego roku. Gorszą wiadomością jest to, że darmowy dostęp do API (przy pewnych limitach co do liczby zapytań na minutę) może zniknąć, zanim Google otworzy model dla krajów europejskich.
Ile będziemy musieli poczekać na dostęp do Gemini? Doświadczenia z Bardem pokazują, że prawdopodobnie kilka miesięcy. Bard został uruchomiony w marcu 2023, a w Unii Europejskiej został udostępniony dopiero cztery miesiące później, w lipcu.
Żródło zdjęcia: Google