Kiedy niemal rok temu współzałożyciel OpenAI Ilya Sutskever przyłączył się do buntu kierownictwa spółki przeciw dyrektorowi generalnemu Samowi Altmanowi, pojawiły się głosy, że to dlatego, że Ilya przestraszył się potęgi nowego modelu spółki o nazwie kodowej Q*. Po internecie zaczęło krążyć pytanie: „What did Ilya see?”
Teraz mamy zobaczyć jak działa Q*, bo Truskawka AI to właśnie tamten model, trochę tylko mniej groźnie nazwany. I, jeśli wierzyć doniesieniom medialnym, Ilya przestraszył się na wyrost.
Truskawka OpenAI jest jak system drugi myślenia — bardzo wolna
Czytaliście Pułapki myślenia. O myśleniu szybkim i wolnym Daniela Kahnemana? O tym, że mamy dwa systemy myślenia? Jeden intuicyjny, mniej logiczny, ale za to szybki? Tak w jakiejś mierze działają obecne modele językowe. Ze względu na swoją budowę, oferują nam na nasze pytania odpowiedzi, które — nieco upraszczając — są dla nich najłatwiej dostępne. Mówiąc kolokwialnie, mówią, co im ślina na język przyniesie.
No i mamy drugi system myślenia, bardziej logiczny, wymagający od mózgu istotnie więcej wysiłku. Włączany tylko wtedy, gdy system pierwszy nie daje rady. Taka właśnie ma być Truskawka AI — bardziej logiczna, uważniej przetwarzająca informację, ale w związku z tym baaaardzo wolna. Jak donosi The Information, generowanie pojedynczej odpowiedzi trwa 10-20 sekund. To tempo ślimacze w porównaniu do prędkości GPT-4o czy Claude 3.5 Sonnet.
Według doniesień serwisu model Strawberry AI zostanie udostępniony w ciągu dwóch tygodni zarówno jako funkcjonalność ChatGPT jak i jako osobny produkt. Na początku prawdopodobnie tylko wąskiej grupie klientów.
Po co komu nowa sztuczna inteligencja: Truskawka?
No właśnie, ale po co komu Strawberry OpenAI? Do znacznej części zastosowań AI — streszczeń i podsumowań, analizy sentymentu tekstu itp. – w zupełności wystarczają mniejsze modele, takie jak GPT-4o mini czy Claude Haiku. Do niektórych, bardziej wymagających zadań, potrzebne są mocniejsze modele, takie jak GPT-4o czy Claude Sonnet. Jak duże będzie zapotrzebowanie na usługi Truskawki, powolnego geniusza?
Biorąc pod uwagę, że lista jej przewag, tzn. myślenie logiczne, myślenie matematyczne i kodowanie, nie jest długa, to i lista zastosowań długa nie będzie. Tym bardziej że trudno jest zastosować tak wolny model na przykład jako pomocnika programisty — w funkcji Github Copilota raczej się nie sprawdzi, bo konieczność czekania niemal 20 sekund na każdą podpowiedź szybko doprowadziłaby do irytacji korzystającego z takiej „pomocy” dewelopera.
To nie znaczy, że Strawberry AI będzie siedzieć bezczynnie. Model jest już podobno używany do generowania syntetycznych danych, na których ma być trenowany nowy duży model językowy od OprnAI o nazwie kodowej Orion.
Aktualizacja 13 września: Truskawka już jest. Wbrew zapowiedziom, nie w ciągu dwóch tygodni, tylko już teraz. I… nazywa się o1. Jak chwali się OpenAI, jest świetna w rozumowaniu, w naukach przyrodniczych, matematyce i kodowaniu. Dostępna już teraz dla użytkowników planu ChatGPT Plus.
Źródło zdjęcia: Anastasia Zhenina/Unsplash