McAfee nazwał projekt opracowania tej technologii projektem Mockingbird, czyli projektem „przedrzeźniacz” – od gatunku północnoamerykańskiego ptaka, który znany jest z tego, że doskonale imituje głosy innych ptaków.
Jak podaje VentureBeat, cytując zapewnienia firmy, technologia ta rozpoznaje wyprodukowane przez sztuczną inteligencję ścieżki dźwiękowe z dokładnością do 90%.
Skąd zainteresowanie właśnie ścieżkami dźwiękowymi? Bo stworzenie przy ich pomocy deepfake’u jest relatywnie proste i trudniejsze do wychwycenia niż zmanipulowane filmy, w których często pojawiają się tak zwane artefakty, czyli błędy w generowaniu obrazu wideo, które ułatwiają rozpoznanie go jako fałszywki.
Używając podstawienia tylko dźwięku, można uniknąć tego problemu, biorąc na przykład materiał wideo, w którym narrator pokazywany jest tylko na początku. W tym przypadku pozostawia się głos narratora nietknięty dla tego początkowego fragmentu, a zastępuje się jego głos deepfakiem ze zmanipulowanym przekazem dla pozostałych fragmentów. W tym celu wykorzystuje się technologię tzw. klonowania głosu (voice cloning). Jak ta technologia działa, możecie sprawdzić sami przy pomocy otwartego modelu klonowania głosu OpenVoice.
Chcesz wiedzieć, jak wykryć sfałszowane zdjęcie? Opisaliśmy to w tym artykule.
Deepfake’i stają się coraz większym problemem, mogą bowiem służyć do wyłudzeń (w postaci np. zaawansowanej technologicznie metody „na wnuczka”), przez promowanie fałszywych treści i podpieranie się autorytetem organizacji medialnej, której treści zmanipulowano, po tworzenie fałszywek na użytek kompanii wyborczych.
Ten ostatni motyw, a więc manipulacje w trakcie kampanii wyborczej, staje się szczególnie ważny w Stanach Zjednoczonych w kontekście zbliżających się prawyborów oraz wyborów prezydenckich.
O tym, że obawy o manipulację przy pomocy sztucznej inteligencji istniały również w Polsce, pisaliśmy przed jesiennymi wyborami. A tu możecie obejrzeć, jak można zmanipulować wypowiedź polityka – tym razem na szczęście dla żartu.
McAfee zapewnia, że jego projekt Mockingbird wyszedł już z fazy doświadczalnej i firma obecnie buduje podstawę technologiczną do wprowadzenia tej funkcjonalności do swoich produktów.
CES – premiery technologii, które zmieniły świat
W ciągu swojej pięćdziesięciokilkuletniej historii CES był świadkiem premier wielu przełomowych technologii. W 1970 roku Philips zaprezentował na targach pierwszy magnetowid kasetowy do użytku domowego, 11 lat później miała miejsce premiera odtwarzacza płyt CD, opracowanego wspólnie przez Sony i Philipsa.
Lata 1980. to premiery komputerów domowych: Commodore 64 czy Atari ST. W 1996 na targach zadebiutował odtwarzacz DVD, a w 2001 Microsoft zaprezentował na targach Xboxa, swoją konsolę do gier.
W 2005 Bill Gates zaprezentował najnowszą konsolę Microsoftu, Xbox 360. Niestety podczas prezentacji konsola wyświetliła błąd Out of memory, budząc rozbawienie publiki. Trzy lata później Bill Gates skorzystał z obecności na CES, by ogłosić, że odchodzi od bieżącego zarządzania Microsoftem.
Lata 2010. to z kolei wiele premier smartfonów i tabletów. W ostatnich latach, imprezom targowym szczęście nie sprzyjało. Wzrastająca rola komunikacji elektronicznej nadszarpnęła pozycję sektora targowego, a pandemia Covid-19 wbiła gwóźdź do trumny niejednej imprezy.
CES miało więcej szczęścia. Mimo tego, że część dużych firm technologicznych postanowiło iść tropem Apple i dokonywać prezentacji kluczowych produktów na osobnych imprezach firmowych (a Covid-19 ten trend pogłębił), to wszystkie BigTechy poza Apple są na imprezie obecne.
W tym roku w centrum uwagi targów znajduje się sztuczna inteligencja, która zdetronizowała faworytów zeszłorocznych targów, czyli blockchain i metaverse. Ponieważ CES to tak naprawdę targi elektroniki użytkowej, to sztuczna inteligencja jest obecna w prezentowanym sprzęcie, nie zaś schowana w wielkich centrach danych jak modele LLM od OpenAI, Google’a czy Mety.
Żródło grafiki: Sztuczna inteligencja, model Dall-E 3