24 lipca 2024

Meta publikuje najpotężniejszy otwarty LLM – Llama 3.1 405B

Meta, właściciel Facebooka i Instagrama, opublikował najpotężniejszy w historii otwarty duży model językowy – Llama 3.1 405B. Opublikowane wyniki testów – zarówno te oficjalne, jak i nieoficjalne – pokazują, że w większości tzw. benchmarków model spisuje się równie dobrze jak najlepsze obecnie modele zamknięte. Czy to znaczy, że każdy użytkownik będzie w stanie pracować ze sztuczną inteligencją na najwyższym poziomie?

Marcin Bokszczanin

0 komentarzy

Dziennikarz HomoDigital. Wcześniej redaktor w anglojęzycznym serwisie dla inwestorów – PAP Market Insider

Jak nazwa modelu wskazuje, dysponuje on 405 miliardami parametrów. Jest niemal sześciokrotnie większy od dotychczas największego modelu Mety, Llama 3 z 70 miliardami parametrów.

Llama 3.1 405B dogania rozwiązania zamknięte

Pomimo dużego wysiłku wkładanego przez Metę w rozwój sztucznej inteligencji, jej dotychczasowe modele odbiegały w możliwościach od osiągnięć OpenAI, Google czy Anthropic. To najwyraźniej się zmieniło.

Wyniki oficjalnych testów przedstawionych przez Metę sugerują, że model ten dogonił rozwiązania rywali. Na czternaście przeprowadzonych testów, Llama 405B uzyskała pierwsze miejsce w siedmiu, Claude 3.4 Sonnet od Anthropica w sześciu, a GPT-4o od OpenAI w zaledwie trzech (były remisy, więc liczba pierwszych miejsc nie sumuje się do czternastu).

Zestaw mniej oficjalnych benchmarków również pokazuje przewagę najnowszego modelu Mety nad GPT-4o.

To nie koniec dobrych wiadomości. Bolączką dotychczasowych modeli od właściciela Facebooka były niewielkie tzw. okna kontekstowe, czyli ilość informacji, jaką model był w stanie przetworzyć jednorazowo. W nowym modelu jest ono sporo większe i liczy 128 tysięcy tokenów (jest to mniej więcej rozmiar średniej długości powieści). To mniej niż oferują modele Gemini od Google, ale tyle samo co GPT-4o.

Niestety, raczej nie zainstalujesz go na swoim komputerze

Największy model od Mety każdy może pobrać za darmo. Szanse na uruchomienie go na domowycm komputerze są raczej zerowe. Samo umieszczenie Llama 3.1 405B w pamięci będzie wymagało setek gigabajtów RAM. Do takich wyzwań potrzebne będą raczej rozwiązania chmurowe.

A te są dostępne od ręki. Llama 3.1 405B jest obecny na 10 platformach chmurowych, w tym tych największych: AWS, Azure i Google Cloud. Ceny różnią się znacznie, ale na niektórych platformach są niższe od tego, ile za dostęp do GPT-4o chce OpenAI.

Oczywiście, z zewnętrznych rozwiązań chmurowych nie będą musiały korzystać podmioty dysponujące własną infrastrukturą, na przykład klastrami obliczeniowymi. Ciekawe, czy model Llama 3.1 405B skusi polskie podmioty, takie jak Speakleash czy PLLuM (lub następca PLLuM-a) do przetrenowania modelu w języku polskim. Bo naszej, niestety, nie ma wśród języków oficjalnie wspieranych przez Llamę.

Źródło grafiki: Meta

Tagi:Sztuczna inteligencja