5 kwietnia 2024

GenAI w firmie: Cohere oferuje nowy model, OpenAI nowe narzędzia

GenAI rozpala naszą wyobraźnię już od półtora roku, głównie możliwością przeprowadzenia interesującej pogawędki z chatbotem. Jednak podstawowe zastosowania dla tej nowej wciąż technologii to te biznesowe. I to właśnie takich zastosowań w firmie dotyczą nowe rozwiązania od Cohere i OpenAI. To, jak ważni są klienci biznesowi, świadczą słowa COO OpenAI Brada Lightcapa, który stwierdził, że 2024 będzie rokiem sztucznej inteligencji w dużych firmach.

Marcin Bokszczanin

0 komentarzy

Dziennikarz HomoDigital. Wcześniej redaktor w anglojęzycznym serwisie dla inwestorów – PAP Market Insider

O ile OpenAI jest firmą znaną szerszej publice, o tyle nazwa Cohere znacznie rzadziej pojawia się w mediach. Wynika to z faktu, że firma koncentruje się właśnie na rozwiązaniach biznesowych. I właśnie z myślą o klientach biznesowych udostępniła nowy model, Command R+.

Cohere nie jest jedyną firmą skupiającą się na klientach biznesowych. Innym deweloperem rozwiązań dla biznesu jest Anthropic.

Cohere odda Ci model do dyspozycji

Nowy model w sporej części testów miał dawać podobne lub lepsze wyniki niż GPT-4. W niektórych testach zachowywał się jednak istotnie gorzej – według informacji twórców. Gdzie leżą podstawowe zalety modelu?

Po pierwsze, używany na infrastrukturze firmy, model jest kilkukrotnie tańszy niż GPT-4 Turbo. Po drugie, oferuje tokenizer, a więc podsystem zamieniający słowa lub ich części w ciągi liczb. Taki system lepiej pracuje z językami innymi niż angielski, oferując w nich nawet 57% obniżkę kosztów. Ceny używania modeli są wyrażone zwykle w dolarach na token.

Po trzecie, model ma być dostępny na wszystkich głównych platformach chmurowych. Chwilowo na tych od Microsoftu i Oracle. Będzie go też można zainstalować na infrastrukturze klienta. To jest szczególnie ważne dla firm, które nie mogą sobie pozwolić na wyprowadzanie danych poza własną infrastrukturę. Takie ograniczenia dotyczą na przykład banków czy służby zdrowia. O tego typu możliwości klienci OpenAI czy Google (jeśli chodzi o modele Gemini) mogą tylko pomarzyć.

Zła wiadomość dla polskich firm jest taka, że wśród dziesięciu języków obsługiwanych przez Command R+ nie ma polskiego. Choć zapewne model taki, zwłaszcza na własnej infrastrukturze, można by dotrenować do używania naszego języka.

O tym, że polskie firmy, zwłaszcza te, które potrzebują używać modelu na własnej infrastrukturze, borykają się z problemem braku modeli dobrze operujących językiem polskim, pisaliśmy w tym artykule.

OpenAI modelu Ci nie da, ale da narzędzia, by go dostroić (a nawet stworzyć)

Klienci biznesowi są również bardzo ważni dla pioniera dużych modeli językowych, czyli OpenAI. Choć firma nie pozwala swoim klientom na instalowanie modeli na własnej infrastrukturze, to chce, by mogli oni dostosować modele firmy do swoich potrzeb.

Możliwość dostrajania modeli OpenAI nie jest nowa. Modele GPT-3.5 można dostrajać już od sierpnia 2023 roku. Jednak ogłoszone właśnie zmiany znacznie ułatwią dostosowywanie modelu do konkretnych potrzeb.

W szczególności, system będzie robił kopie zapasowe modelu przy każdej tzw. epoce dostrajania. A to po to, żeby nie trzeba było całego procesu zaczynać od nowa, jeśli proces pójdzie w niewłaściwą stronę (na przykład jeśli jest „przetrenowany”). Będzie można również porównać na bieżąco kolejne wersje modelu czy przeprowadzić kompleksową walidację modelu.

Klientom, którzy mają wysoce wyspecjalizowane potrzeby, OpenAI daje możliwość pogłębionego dostrajania modelu przy współpracy ze specjalistami firmy. Będzie również możliwość budowania modeli od podstaw – tam gdzie samo dostrajanie nie byłoby wystarczające.

Jak napisała firma we wpisie na swoim blogu, „wierzymy, że w przyszłości zdecydowana większość organizacji rozwinie zmodyfikowane modele dostosowane do ich sektora, biznesu czy zastosowania”.

To de facto oznacza, że firma OpenAI nie będzie obsługiwała kilku własnych modeli, ale raczej setki, jeśli nie tysiące, modeli swoich klientów.

Źródło grafiki: Sztuczna inteligencja, model Dall-E 3