Użytek dozwolony… może jednak również w Polsce
Spójrzmy na tzw. dyrektywę DSM o prawie autorskim na jednolitym rynku cyfrowym. Unia Europejska wprowadza pojęcie dozwolonego użytku dzieł objętych prawem autorskim w przypadku eksploracji tekstów i danych (tzw. wyjątek TDM). Dyrektywa zakłada, że twórcy mogą zablokować taki dozwolony użytek poprzez odpowiednie oznakowanie swojego dzieła. Chodzi na przykład o grafiki czy teksty na stronie internetowej.
Jakie zapisy były zawarte w pierwotnej wersji projektu ustawy przygotowanego przez MKiDN mającego implementować dyrektywę DSM na gruncie polskim? Ministerstwo postanowiło nieco utrudnić korzystanie z wyjątku TDM. Po pierwsze, dozwolony użytek byłby możliwy tylko w takiej sytuacji, jeśli twórca odpowiednio oznaczy swoje dzieło. Domyślny jest więc brak zgody, a nie, jak w dyrektywie, zgoda. Jeśli natomiast dzieło miałoby być używane do budowania modelu generatywnej sztucznej inteligencji (GenAI), to w ogóle nie ma mowy o dozwolonym użytku.
Teraz, w wyniku konsultacji, ministerstwo wycofało się z tej drugiej propozycji, przyznając, że byłaby sprzeczna z dyrektywą. Problemy z pierwotnym kształtem ustawy – od strony wyłącznie formalnej – były dwa. Przede wszystkim, była ona sprzeczna z tekstem dyrektywy. Poza tym była sformułowana nieprecyzyjnie, na co wskazywali zarówno zwolennicy jak i krytycy ustawy.
Twórcy popierali wersję resortu kultury
Wśród stowarzyszeń twórców oraz firm z tak zwanego sektora kreatywnego dominował zachwyt nad pierwotną wersją ustawy. To zrozumiałe – strach przed generatywną sztuczną inteligencją jest powszechny wśród twórców na całym świecie. Niemal równie powszechna jest chęć zarobienia na tym, że sztuczna inteligencja uczy się na dziełach tych twórców.
Lęki twórców szczególnie dobrze widać w opinii ZAiKS-u do ustawy: „Potrzeba szybkiej reakcji legislacyjnej, żeby generatywna AI rozwijała się według określonych zasad” – apelują twórcy. Jakich zasad? „Zapewniających twórcom utrzymanie ze swojej pracy i talentu oraz minimalizujących ryzyko zastąpienia ludzkiej twórczości wytworami AI”.
Niektóre podmioty chciałyby jednak, żeby dozwolony użytek był wykluczony przy jakimkolwiek generowaniu utworów, nawet jeśli nie byłby używany do budowania modeli. Nie jest jasne, czy taka jest intencja tych podmiotów, ale to mogłoby wykluczać używania sztucznej inteligencji np. do generowania podsumowań stron. Taką możliwość oferuje aktualnie np. Copilot w przeglądarce Edge.
Nie wszystkie opinie szły aż tak daleko. Niektóre – jak ta z PWN – skupiały się na zabezpieczaniu wynagrodzenia dla twórców. W tej opinii liczy się samo zapewnienie dostępu do treści jako „konieczne”. Inne, jak TVP, choć niekoniecznie krytyczne wobec propozycji ministerstwa, odnotowywała jej niezgodność z dyrektywą. Jak widać, teraz również ministerstwo uznało, że poszło za daleko.
Jedyna droga to dogadać się z twórcami…
Pierwotna wersja ustawy miała dla twórców dwie podstawowe zalety. Modele generatywnej sztucznej inteligencji zostałyby wyłączone z dozwolonego użytku. Ktokolwiek więc chciałby w Polsce trenować takie modele, musiałby się dogadać z twórcami. To byłoby dość żmudnym i kosztownym procesem. Modele powstawałyby wolno a twórcy dostawaliby pieniądze – podwójna więc korzyść dla sektora kreatywnego.
Jednak nawet obecna wersja projektu ustawy zawiera przepis istotnie pomagający twórcom. To wspomniany domyślny brak zgody na korzystanie z wyjątku TDM. Możemy spokojnie założyć, że większość twórców treści stron internetowych czy grafik i zdjęć na nich umieszczonych nie zrobi nic, czyli nie pozwoli na dozwolony użytek. To udostępni do budowania modeli niewielką część polskiego internetu. Prawdopodobnie zbyt małą część, by wytrenować sensowny model mówiący w języku polskim.
To zwycięstwo strony twórców może się jednak również okazać tymczasowe. Jak wspomniałem, dyrektywa unijna przewiduje opt-out twórców, którzy nie chcą, by ich dzieła były używane na podstawie dozwolonego użytku w związku z wyjątkiem TDM. Rozwiązanie takie potwierdza również niedawno uzgodniony AI Act, który będzie stosowany w Polsce bezpośrednio. Polski opt-in może się w instytucjach europejskich nie ostać.
… ale firmy IT krytyczne, SoDA grzmi
Jak nietrudno się domyślić, przepisy zaproponowane przez ministerstwo nie wzbudziły zachwytu branży IT i Ministerstwa Cyfryzacji. Stowarzyszenie firm IT Software Development Association Poland (SoDA) skrytykowało nie tylko wspomnianą niezgodność z dyrektywą czy niejasne sformułowanie przepisu. SoDA uznała też, że zapisy w takim kształcie będą miały negatywny wpływ na branżę IT w Polsce. Według stowarzyszenia Polscy twórcy rozwiązań GenAI po prostu uciekną z kraju.
„Takie ograniczenie w istotny sposób uniemożliwi polskim przedsiębiorcom opracowywanie innowacyjnych rozwiązań z obszaru generatywnej sztucznej inteligencji” – twierdzi SoDA. Co jeszcze? „Z powodu braku takich ograniczeń w innych krajach UE czy USA, polska branża IT straci realną możliwość konkurowania w tym zakresie z innymi podmiotami oraz przyczyniania się do rozwoju polskiej gospodarki i zwiększania potencjału inwestycyjnego w Polsce dla podmiotów zagranicznych”. To brzmi całkiem poważnie.
SoDa uważa też, że ryzykowne jest wprowadzenie takich rozwiązań w okresie wzmożonego zainteresowania rozwiązaniami generatywnej sztucznej inteligencji na świecie. Sprawi to, że twórcy „zrezygnują z rozwijania swoich rozwiązań w naszym kraju, mając dużo lepsze warunki do prowadzenia działalności w tym zakresie w innych Państwach Członkowskich UE”.
Stowarzyszenie dodało, że implementacje dyrektywy we Włoszech, Francji, Belgii czy w Niemczech nie wyłączają generatywnej AI z dozwolonego użytku.
Ministerstwo Cyfryzacji też
Również Ministerstwo Cyfryzacji było krytyczne wobec przedłożenia kolegów z resortu kultury. Oprócz wskazywania na niezgodność z dyrektywą resort Krzysztofa Gawkowskiego wskazuje na kolejną wadę ustawy. Prawdopodobną nieefektywność regulacji w stosunku do podmiotów zagranicznych.
„Wątpliwa jest także skuteczność takiego rozwiązania w odniesieniu do zagranicznych podmiotów dążących do wykorzystania polskich danych” – napisał resort.
Ponadto resort uważa, że ustawa w takim kształcie byłaby zagrożeniem dla projektu PLLuM, którego celem jest stworzenie polskiego dużego modelu językowego.
Na brak przełożenia polskiej ustawy na podmioty zagraniczne zwraca również Zbigniew Okoń, specjalista od m.in. prawa autorskiego i przepisów AI w kancelarii Rymarz, Zdort, Maruta.
„Treść polskiej ustawy ma w tym zakresie [TDM] zerowe znaczenie dla działań podejmowanych poza terytorium Polski (np. w innych państwach UE lub w USA). Zgodnie z zasadą terytorializmu polska ustawa po prostu nie ma do nich zastosowania. Aby ominąć problem, wystarczy więc trenować modele poza terytorium Polski” – napisał on w komentarzu do projektu ustawy.
Wylewanie dziecka bez wylewania kąpieli?
Jakie więc będą konsekwencje, jeśli rząd i parlament przychylą się do najnowszej propozycji MKiDN?
Po pierwsze, modele generatywnej AI nie będą wyłączone z dozwolonego użytku na podstawie wyjątku TDM.
Po drugie, wszystkie treści będą domyślnie wyłączone z eksploracji tekstu i danych, w tym budowania polskich modeli GenAI przez polskie firmy. Twórcy takich treści będą musieli podjąć aktywne kroki, by swoje treści polskim firmom udostępnić. Należy się liczyć z tym, że będzie to mniejszość, a więc polskie firmy AI będą miały problemy z budowaniem modeli.
Po trzecie, zagranicznych graczy nie będzie to zasadniczo obchodzić. Będą zbierać dane z polskiego internetu – nieoznaczone jako wyłączone z dozwolonego użytku, bo u nas jest się domyślnie wyłączonym, więc kto by go tam wyłączał.
Summa summarum? Utrudnimy życie polskim firmom, a zagraniczni giganci sztucznej inteligencji, będą spokojnie wykorzystywać polskie treści do budowania modeli GenAI. Za darmo. A to od tych gigantów polscy twórcy najchętniej pobieraliby haracz za używanie ich dzieł, jeśli już używane być muszą.
No a Polskie firmy? Wyprowadzą się za miedzę. Co za problem, żeby zrobić model z centrum danych pod Berlinem zamiast centrum pod Warszawą?
Może jednak ktoś dostrzeże zasadniczy brak spójności ustawy z dyrektywą. Lub zda sobie sprawę, że Polska wylewa dziecko. Bez wylewania kąpieli.
Źródło grafiki: sztuczna inteligencja, model Dall-E 3