5 kwietnia 2024

Bielik wylądował – Polacy mają nowy model LLM

Bielik-7B-v0.1 to najnowszy LLM (duży model językowy, large language model) od projektu SpeakLeash. Tym samym kolejna polska organizacja dołączyła do wyścigu o najlepszy i najużyteczniejszy model sztucznej inteligencji. Czy Bielik może zostać nowym pomocnikiem w pracy biurowej? Sprawdzamy.

Sylwia Błach

1 komentarz

Pisarka, dziennikarka, felietonistka, blogerka, ambasadorka DigitalEU z ramienia Komisji Europejskiej. Zawodowo programistka. W wolnym czasie nałogowa czytelniczka książek i graczka

Bielik-7B-v0.1 to generatywny model tekstowy, który powstał na architekturze modelu Mistral-7B-v0.1. Według oficjalnej informacji podanej na stronie projektu zawiera on 7 miliardów parametrów. Bielik to tak naprawdę dwa modele: model bazowy, który jest dostępny do komercyjnego użytku oraz dostrojony model Bielik-7B-Instruct-v0.1, który ma większe możliwości, ale jest chwilowo dostępny na niekomercyjnej licencji CC BY NC 4.0 (ale pomysłodawca SpeakLeash Sebastian Kondracki zapewnia, że to się wkrótce zmieni).

Za stworzenie Bielika odpowiadają SpeakLeash oraz centrum High Performance Computing (HPC): ACK Cyfronet AGH. System szkolony był z użyciem polskich treści i dzięki polskiej wielkoskalowej infrastrukturze obliczeniowej, w tym z wykorzystaniem superkomputera Helios.

Bielik LLM lepszy od Qra!

Według przeprowadzonych testów model Bielik okazuje się lepszy od niedawno ogłoszonego modelu Qra (Polscy naukowcy z Llamy zrobili Qrę, czyli o nowym polskim LLM). Każdy z nas może samodzielnie go przetestować, dzięki udostępnieniu Bielik-7B-Instruct-v0.1 do testów.

Model z łatwością odpowiada na pytania zadane w języku polskim, choć krótkie testy wskazują, że wymaga bardziej precyzyjnego zadawania pytań niż powszechnie dostępne modele od największych firm technologicznych. Nie jest to oczywiście niespodzianką – polskie modele dopiero powstają, a każda wersja będzie zapewne lepsza od poprzedniej.

Dlaczego potrzebujemy modelu LLM?

Jak pisał Marcin Bokszczanin w artykule o modelu QRA, otwarty model mówiący po polsku ma jeszcze jedną zaletę – umożliwiałby szersze zastosowanie sztucznej inteligencji w polskich bankach czy instytucjach ochrony zdrowia. Są to podmioty, które ze względu na kwestie regulacyjne nie mogą wyprowadzać danych na zewnątrz.

Korzystanie przez polskie firmy z zagranicznych modeli (na przykład Anthropic), zwłaszcza w sytuacjach związanych z przetwarzaniem danych, jest często niemożliwe ze względów prawnych. Ten, kto pierwszy stworzy w pełni działający, zaawansowany model LLM ma szansę na wygranie wyścigu o współpracę z największymi polskimi instytucjami.

Autor zdjęcia: Karl Adami/Wikimedia Commons

Tagi:Sztuczna inteligencja