Partnerem strategicznym Homodigital.pl jest
1 października 2020

Dziennikarstwo czeka rewolucja. Poznajcie człowieka, który ją zaczyna: dr Przemek Chojecki

20 lat temu praca dziennikarza w dużej mierze polegała na przesiadywaniu w czytelni albo archiwum i przeczesywaniu wycinków. Dziś wszystko jest w Google, ale przed dziennikarzami kolejna rewolucja: „Sytuacja, do której dążymy, i która już za momencik pewnie będzie  realna, będzie wyglądała tak, że zbierasz dane, źródła, słowa kluczowe, wrzucasz je do programu komputerowego i dostajesz draft tekstu, który możesz sobie dowolnie przerobić” – mówi nam Przemek Chojecki, przedsiębiorca zajmujący się od lat sztuczną inteligencją, doktor matematyki i założyciel startupu Contentyze.com.

Cały wywiad możesz odsłuchać na podcaście Homodigital albo bezpośrednio na Anchor.fm.

Część I – Rewolucja w dziennikarstwie

Maciej Samcik: Od dwudziestu kilku lat zajmuję się dziennikarstwem. Jednym z Twoich przedsięwzięć jest firma, zajmująca się automatycznym tworzeniem treści. To znaczy, wyręcza takich ludzi jak ja w tworzeniu artykułów, czy takich ludzi jak PR-owcy w tworzeniu informacji prasowych. Jest to dla mnie dość niepokojąca sytuacja. Ostatnio “The Guardian” opublikował artykuł napisany przez AI. Czy Twoim zdaniem, tworzenie treści to już jest zadanie, które można w pełni zautomatyzować i czy jesteśmy w podobnej sytuacji, w której są kasjerzy? W każdym supermarkecie są już kasy automatyczne i właściwie można odliczać miesiące albo lata do tego momentu, w którym tradycyjni kasjerzy znikną. Czy z dziennikarzami może być tak samo? [Przeczytaj też: Robosamcik AI. Czy robot ze sztuczną inteligencją może zastąpić dziennikarza Macieja Samcika?]

Przemysław Chojecki: Myślę, że w tym momencie jesteśmy od tego jeszcze dość daleko. Nawet te najlepsze modele machine learning-owe, najlepsza sztuczna inteligencja, nie są w stanie generować treści tak dobrych, jakie stworzyłby dobry dziennikarz. To, co robimy w ramach Contentyze, czyli mojego startupu do tworzenia treści, to są treści bardziej copywriterskie, niż dziennikarstwo śledcze. Jeśli mówimy o tworzeniu treści, gdzie istotne jest docieranie do źródeł, ocena tego, czy coś jest prawdą, czy fałszem, to tutaj dziennikarze są bardzo potrzebni. Moja teza jest taka, że dziennikarstwo się zmieni. Dziennikarz będzie filtrować informacje pod kątem tego, co może być ciekawe i co jest prawdziwe. Bo z tym maszyny mają kłopot, z oceną tego, co jest prawdą. 

Maciej Samcik: Kiedyś pewne czasopismo branżowe zapytało mnie, czy obawiam się  robotów piszących artykuły. Ja uważam, że taki robot może mi bardziej pomóc w pracy niż mi przeszkodzić, ponieważ dzięki niemu nie będę musiał wykonywać wielu prostych czynności. Jako wieloletni pracownik redakcji wiem, ile takich powtarzalnych zajęć musi wykonać dziennikarz, zanim ukaże się jego artykuł. Robot może mnie w tym wyręczyć, a ja się zajmę czymś bardziej kreatywnym. 

Przemysław Chojecki: To jest dokładnie ten kierunek. 

Maciej Samcik: Jak dalece dzisiaj automat może zastąpić dziennikarza w tworzeniu treści faktograficznych i researcherskich? Gdybym chciał napisać artykuł o jakieś spółce, to czy za pomocą Twojego narzędzia mógłbym uzyskać w bardzo szybkim czasie informacje na jej temat? Albo nawet wręcz część artykułu? 

Przemysław Chojecki: Tak, jeśli masz źródła danych. Contentyze i konkurencyjne rozwiązania, działają na dostępie do danych, których mogą użyć. Nie zakładamy jeszcze, że maszyna jako robot sama je znajdzie (jest to też możliwe, ale jest to jeszcze coś innego). Treści, które mają swój szablon, są powtarzalne, depesze, newsy biznesowe o tym, że akcje danej spółki zwyżkują lub spadają, raporty finansowe – to są formaty, które w pierwszej kolejności są automatyzowane i będą jeszcze bardziej. Skrypty już istnieją od jakiegoś czasu i używając ich, takie rzeczy można robić. Co ciekawe, to co się zmieniło ostatnio, to doszły jeszcze silniejsze narzędzia sztucznej inteligencji, które sprawiają, że tekst jest żywszy, posiada bardziej zróżnicowane słownictwo i całość nabiera bardziej ludzkiego feelingu. 

Marcin Ledworowski: Mógłbyś wyjaśnić, tak dla zwykłego człowieka – co to znaczy skrypt? Czy to jakiś algorytm ?

Przemysław Chojecki: Skryptami są instrukcje w postaci „Jeśli .. to … „, które są odpowiednio zapętlone. Przykład: „Jeśli masz tabelę, w której są informacje o spółce giełdowej i jest tam napisane, że wzrost był więcej niż 10% w danym tygodniu, to napisz, że to był duży wzrost.” Setki takich instrukcji to jeden skrypt. Jest takie pojęcie jak „dziennikarstwo obliczeniowe” (computational journalism), w Stanach widziałem dwie książki na ten temat. Są profesorowie, którzy się tym zajmują, tj. starają się pisać skrypty, które pozwolą automatyzować tę część pracy. To nie jest sztuczna inteligencja, to jest po prostu skryptowanie, które zawiera sporo fizycznej manualnej pracy – trzeba przekuć wiedzę człowieka na tekst i zrobić to ręcznie. W ramach sztucznej inteligencji chcemy zastąpić ten element człowieka, który pisze teraz skrypty tak, aby wiedza była automatycznie ekstrahowana z tabel. 

Maciej Samcik: Właśnie o to chciałem zapytać, czy istnieją już takie urządzenia, automatyzujące pracę dziennikarza, w których jest rzeczywiście wykorzystywana sztuczna inteligencja?    

Przemysław Chojecki: Jak najbardziej np. to, co my robimy. W Contentyze możesz wpisać nagłówek tekstu (mówimy tu o języku angielskim) i dostajesz draft tekstu czy paragrafu, na bazie tego nagłówka. Przy czym, to jest dobry draft, a nie efekt końcowy. Bo będzie tam jeszcze sporo nieścisłości związanych z tym, że maszyna nie ma dostępu do aktualnych informacji, nie zrobiła swojego research-u i tak dalej. Więc to jest dobre narzędzie, kiedy masz już jakieś dane i chcesz je opisać. Sytuacja, do której dążymy, i to za momencik pewnie będzie realne, z perspektywy dziennikarza będzie wyglądać tak, że zbierasz dane, źródła, słowa kluczowe, wrzucasz je do maszynki i dostaniesz draft tekstu, który możesz sobie dowolnie przerobić.

Maciej Samcik: Popraw mnie, jeśli się mylę, gdybym w tym momencie miał dostęp do Twojego urządzenia, i chciałbym napisać artykuł o jakimś banku, który ma problemy finansowe, to mogę wpisać w okienku wyszukiwania nazwę tego banku, frazę: bankructwo i otrzymam gotowy materiał na ten temat? 

Przemysław Chojecki: Tak. Pewnie najbardziej kreatywną częścią takiej pracy jest dotarcie do informacji, że ten bank bankrutuje i poparcie tego jakimiś cytatami. Więc praca dziennikarza, która jest nie do zautomatyzowania, to docieranie do danych i weryfikacja faktów. 

Maciej Samcik: I wyciąganie wniosków jak sądzę. Bo z informacji, w której są dane liczbowe, ja mogę powiedzieć, że prawdopodobieństwo bankructwa tego banku wynosi tyle i tyle procent. A narzędzia, które mają zastąpić moją pracę, jeszcze tego nie potrafią. Chociaż z drugiej strony, gdyby je wypuścić do Internetu, to one by pewnie były w stanie ocenić jaka część banków -będących historycznie w analogicznej sytuacji –  upadała. 

Przemysław Chojecki: Tak i to akurat teoretycznie powinna robić lepiej maszyna, niż człowiek. Z dokładnie tego powodu, o którym powiedziałeś: jeżeli będzie miała dostęp do większej historii, to może przeanalizować więcej danych, niż Ty kiedykolwiek zobaczysz w życiu, bo nie jest możliwe przejrzenie milionów tabel z danymi. 

Maciej Samcik: Jakiego rodzaju wartość dodaną do Waszego narzędzie wnosi sztuczna inteligencja?

Przemysław Chojecki: Generowanie tekstów zupełnie bez skryptowania, czyli wrzucasz nagłówek i dostajesz tekst. I to jest taka sztuczna inteligencja per se. Możesz wrzucić dowolny nagłówek, cokolwiek wymyślisz i dostaniesz tekst. Tam nie ma żadnych skryptów w środku. 

Marcin Ledworowski: Chciałem jeszcze wrócić do wątku zasilania danymi modeli. Gdyby tak rozważyć prosty model machine learning, w którym dostajesz tabelę piłkarską i wydarzenia w trakcie meczu, to czy można by takiego sportowego dziennikarza zastąpić takim modelem? 

Przemysław Chojecki: Tak, jak najbardziej. To już działa i akurat jest super łatwe. W Szwecji już to zrobili. Szwedzi są tak samo dobrzy w piłkę jak Polacy, ale tak samo się futbolem pasjonują, więc jest to podobny rynek pod tym kątem. Z tą różnicą, że oni mają dziesiątki lig. W pewnym momencie Redakcje chciały odciążyć dziennikarzy, którzy lokalnie opisywali nawet najmniejsze ligi i zaczęli ten proces automatyzować. Nagle okazało się, że są w stanie tworzyć więcej tekstów, nawet o tych najmniejszych drużynach, a to im podniosło czytelność razy dwa! Jeśli jest jakaś drużyna, która ma powiedzmy – tysiąc fanów, to teoretycznie nie opłaca się o niej pisać, bo to jest zbyt mały odbiorca, ale z drugiej strony, jak mamy setki takich drużyn, które mają po tysiąc fanów i wszystkie je opiszemy, to nagle okazuje się, że mamy ciekawy materiał. A takie teksty, szczególnie o piłce nożnej, są bardzo powtarzalne. Szwedzi mają więc teraz cały magazyn, który w zautomatyzowany sposób pisze o wszystkich wydarzeniach sportowych. Więc to jest absolutnie do zrobienia i chętnie to zrobię w Polsce 🙂  

Marcin Ledworowski: Następny pomysł: zrobić tak samo dla wyników giełdowych.     

Przemysław Chojecki: To również jest proste i dzieje się na zachodzie. Associated Press zaczęło to robić jakiś czas temu. Zauważyli, że w spółkach, o których zaczęli pisać, a o których wcześniej nic nie pisali, bo były zbyt małe, nagle poprawiła się płynność, ich akcje zaczęły być częściej kupowane. Okazało się, że samo opisywanie ich przez dziennikarzy, ma wpływ na to, jak spółki zachowują się na giełdzie.   

Maciej Samcik: Tu też mogą być pomyłki. Był w Polsce taki eksperyment, jedna z agencji prasowych zastosowała coś w rodzaju robota giełdowego. Problem pojawił się, kiedy robot zrobił opis sesji w dniu, w którym sesji nie było, z powodu święta. Robot tego nie wiedział i wypuścił materiał, z którego wnioski były takie, że wszystko spadło o 100%
[gromki śmiech na sali]

Przemysław Chojecki: Dlatego tak ważne jest jakimi danymi zasilamy takie maszyny!

Maciej Samcik: Przemku, gdzie biznesowo chcesz być za 5 lat?

Przemysław Chojecki: Chciałbym mieć dużą firmę i nie koniecznie mam na myślę liczbę osób, ale o to, żeby te osoby były super utalentowane i żebyśmy rzeczywiście robili coś ciekawego globalnie, jeżeli chodzi o sztuczną inteligencję. Chciałbym wciąż móc być między Polską, Londynem a Kalifornią. Zależy na tym, żeby robić ciekawe rzeczy produktowe, czyli rozwijać algorytmy i zrobić narzędzie, które byłoby np. dla Was, dla dziennikarzy, użyteczne i żeby dużo ludzi z niego korzystało.   

Maciej Samcik: Życzymy Ci więc na tej drodze wszystkiego najlepszego. A dziś bardzo dziękujemy za to spotkanie. Ja bardzo dużo się dzięki tej rozmowie nauczyłem. 

Przemysław Chojecki: Dziękuję za ciekawe pytania i polecam się na przyszłość!


Dalsza część rozmowy z Przemkiem Chojeckim:

Cześć II. Czy AI może być nieetyczna? (tekst)

Część III: Czy AI zabierze nam pracę ? (tekst)


Rozmawiali:

Maciej Samcik – założyciel, redaktor naczelny i autor HomoDigital. Publicysta, ekonomista, analityk zjawisk finansowych. Od 2009 roku właściciel serwisu „Subiektywnie o finansach”.

Marcin Ledworowski – założyciel i autor HomoDigital. Absolwent studiów telekomunikacyjnych i MBA w Gdańsku  (University of Strathclyde & GFKM). Doświadczony menedżer z sektora finansowego i telekomunikacyjnego.

Tekst opracowała: Natalia Mituniewicz

Zdjęcie ilustracyjne z archiwum Przemka Chojeckiego.

 

Home Strona główna Subiektywnie o finansach
Skip to content email-icon