Model sztucznej inteligencji wykrywa bezobjawowe zakażenia Covid-19 poprzez badanie mowy i kaszlu. Dzięki tej innowacji już wkrótce możliwe będzie stworzenie prostej aplikacji do przesiewowych testów na masową skalę. Czy sztuczna inteligencja naprawdę pomoże nam pokonać pandemię?
Na łamach naszego bloga pisaliśmy już, że cuda technologiczne nie uchroniły nas przed pandemią. Niewiele też pomagają w jej trakcie. Marcin z Maćkiem pisali o aplikacji StopCovid. Postulowali, że gdyby tylko była popularniejsza, budziła większe społeczne zaufanie, to jest istnienie mogłoby w jakiś sposób pomóc w walce z pandemią. Marcin przekonywał, że zamiast marudzić, trzeba ją zainstalować. Ja poszedłem nawet krok dalej: uznałem, że zainstalowanie takowej czy podobnej mogłoby być obowiązkowe. W imię wyższych celów. W trójkę uznawaliśmy jednak, że jeśli jakieś wybawienie od tej paskudnej pandemii ma nadejść, to będzie ono pochodziło ze strony technologii.
Czego ucho nie słyszy
Nasze modlitwy zostały wysłuchane. Badacze MIT (Massachusetts Institute of Technology) odkryli, że osoby bezobjawowe mogą różnić się od osób zdrowych sposobem kaszlu. Różnice te nie są możliwe do rozszyfrowania przez ludzkie ucho. Okazuje się jednak, że subtelne dysproporcje może wychwycić sztuczna inteligencja. W artykule opublikowanym niedawno w IEEE Journal of Engineering in Medicine and Biology zespół donosi o modelu sztucznej inteligencji, który odróżnia ludzi bezobjawowych od zdrowych poprzez nagrania wymuszonego kaszlu, które ludzie dobrowolnie przesyłali.
Nagrania zarejestrowane przez telefony komórkowe i laptopy – zarówno od osób chorych (z objawami i bez), jak i zdrowych stanowiły bazę do nauki algorytmu. Kiedy „nakarmili” model nowymi zapisami kaszlu, dokładnie zidentyfikowali 98,5% kaszlu od osób, u których potwierdzono obecność Covid-19, w tym 100% kaszlu od osób bezobjawowych, które zgłosiły, że nie mają objawów, ale mają pozytywny wynik testu na obecność wirusa. To imponujący wynik!
Co oko zobaczy
Jak wiadomo, osoby chorujące na SARS-CoV-2 bez żadnych objawów są szczególnie niebezpieczne. Nie sprawdzają też, czy są zarażone, bo przecież czują się dobrze. Trudności z dostępem do testów powodują, że nie fatygują się same, by się przebadać. Przekonane, że są wolne od zagrożenia mogą przenosić infekcję na inne osoby. Tak powstaje lawina zarażeń.
Obecnie zespół MIT pracuje nad włączeniem modelu do przyjaznej dla użytkownika aplikacji. Mogłaby ona być potencjalnie darmowym, wygodnym, nieinwazyjnym narzędziem do wstępnego badania przesiewowego. To byłaby najprostsza metoda w identyfikowania osób, które mają w sobie koronawirusa Covid-19.
Jakby to miało wyglądać? Użytkownik mógł logować się codziennie, kaszleć do telefonu i natychmiast uzyskiwać informacje o tym, czy może być zarażony. Jeśli aplikacja wskazywałaby, że owszem, delikwent jest chory, ten mógłby stosując najwyższe standardy ostrożności zbadać się profesjonalnym testem. Rzut oka wystarczy, żeby wiedzieć czy jest się wedle dużego prawdopodobieństwa zdrowym.
„Skuteczne wdrożenie tego grupowego narzędzia diagnostycznego mogłoby ograniczyć rozprzestrzenianie się pandemii, gdyby wszyscy go użyli przed udaniem się do klasy, fabryki lub restauracji” – wyjaśniał w komunikacie współautor wspominanej publikacji Brian Subirana, naukowiec z Laboratorium Auto-ID MIT
Od Alzheimera się zaczęło
Model stworzony przez badaczy MIT to nie pierwszy algorytm wykrywający chorobę z głosu. Przed nadejściem pandemii grupy badawcze już trenowały algorytmy na podstawie nagrań z telefonów komórkowych dotyczących kaszlu. Miało to służyć dokładnemu diagnozowaniu schorzeń, takich jak zapalenie płuc i astma. W podobny sposób zespół MIT opracowywał modele sztucznej inteligencji do analizy nagrań wymuszonego kaszlu, aby sprawdzić, czy mogą wykryć objawy choroby Alzheimera, choroby związanej nie tylko z osłabieniem pamięci, ale także z degradacją nerwowo-mięśniową, taką jak osłabienie strun głosowych.
Najpierw wyszkolili ogólny algorytm uczenia maszynowego. Jego zadaniem było rozróżnianie dźwięków związanych z różnymi stopniami siły strun głosowych.
Zespół wyszkolił pierwszą sieć neuronową, aby rozróżniać stany emocjonalne widoczne w mowie. Dlaczego było to tak potrzebne? Pacjenci z chorobą Alzheimera, i ogólnie osoby z zaburzeniami neurologicznymi, częściej przejawiają pewne uczucia, takie jak frustracja lub płaski afekt. Rzadziej wyrażają radość bądź są spokojne. Naukowcy opracowali drugą sieć, czyli model klasyfikatora mowy. Trenowali go na dużym zbiorze danych aktorów intonujących stany emocjonalne, takie jak neutralny, spokojny, szczęśliwy i smutny. Następnie naukowcy wyszkolili trzecią sieć neuronową na bazie danych kaszlu, aby wykryć zmiany w wydolności płuc i układu oddechowego.
Wreszcie zespół połączył wszystkie trzy modele i nałożył algorytm, aby wykryć degradację mięśni. Dzięki modelowi sztucznej inteligencji zespół wprowadził nagrania dźwiękowe, w tym pacjentów z chorobą Alzheimera. Wyniki pokazały, że siła strun głosowych wraz z wydolności a płuc i układu oddechowego oraz degradacją mięśni były skutecznymi biomarkerami w diagnozowaniu choroby.
Bez wspólnych danych nie byłoby sukcesu
To właśnie te badania były podstawą stworzenie modelu do wykrywania koronawirusa. Już w kwietniu badacze MIT postanowili posłużyć się modelami badającymi mowę, by pomóc w diagnostyce koronawirusa. Już wtedy badacze założyli stronę internetową, na której ludzie mogli nagrywać serię kaszlu za pomocą telefonu komórkowego lub innego urządzenia z dostępem do Internetu.
Uczestnicy wypełniali również ankietę dotyczącą objawów, których doświadczają, niezależnie od tego, czy mają Covid-19, czy nie, i czy zostali zdiagnozowani na podstawie oficjalnego testu. Do tej pory naukowcy zebrali ponad 70 000 nagrań, z których każde zawierało kilka kaszlu, co dało łącznie 200 000 próbek dźwiękowych wymuszonego kaszlu.
Jest to największy zbiór danych dotyczących kaszlu na świecie. Zarazem też przykład, że wystarczyło jednie 200 000 tysięcy próbek do stworzenia algorytmu sprawnego w 100%. Coraz lepsze mechanizmy nauczania maszynowego sprawiają, że coraz mniej danych jest potrzebnych. Ostatnio MIT Technology Review pisało nawet o machine learningu bez danych!
Krok milowy dla AI
Przełomowy model i powstająca właśnie aplikacja może być przykładem pierwszego skutecznego wykorzystania sztucznej inteligencji do walki z pandemią koronawirusa.
Obecnie badacze MIT współpracują z kilkoma szpitalami na całym świecie. Celem jest zebranie większego, bardziej zróżnicowanego zestawu zapisów kaszlu. To pomoże wyszkolić i wzmocnić dokładność modelu.
„Pandemie mogą należeć do przeszłości, jeśli narzędzia do wstępnej selekcji są zawsze włączone w tle i stale ulepszane” – przekonują w publikacji IEEE Journal of Engineering in Medicine and Biology. Zdaniem badaczy modele audio AI, takie jak ta tutaj opisana, mogą zostać włączone do inteligentnych głośników i innych urządzeń szeroko pojętego Internetu Rzeczy.
W przypadku kolejnych epidemii, już po Covid-19 – a te będą się zdarzać – szybkie, podręczne narzędzia diagnostyczne z naszych smartfonów – mogą być skuteczną odpowiedzią. Być może dzięki tego typu aplikacjom uda nam się lepiej zarządzać kryzysami epidemicznymi, bez lockdownu i tęsknego wyczekiwania szczepionki. O ile znów nie wzniecimy buntu przeciw technologii. To już zadanie dla naukowców, rządów i przede wszystkim korporacji: nauczyć nas zaufania do technologii. Uda to się im tylko wtedy gdy sami będą uczciwi. Czy ten plan to już czyste Science-fiction?
A co z osobami bezobjawowymi,które nie mają także objawowego kaszlu – bo jak brak objawów,to brak!?Czy tu komuś czegoś innego nie zbrakło?! 😉
Jeśli mogą mówić to aplikacja też pomoże 🙂