27 kwietnia 2021

Powiedz dwa zdania, a powiemy ci na co jesteś chory. Voice markery rewolucji

Alexa, czy mam Covid-19? Nie, analiza twojego głosu na to nie wskazuje. Ale słyszę pierwsze symptomy depresji, powinieneś skontaktował się z lekarzem. Czy to scenariusz z przyszłości? A jeśli tak, to jak odległej? Rok 2030? A może 2045? Tu małe zaskoczenie: to się dzieje teraz. Wszystko dzięki voice bio markers, czyli medycznym markerom głosowym.

Piotr Dominik

0 komentarzy

Konsultant startupów w zakresie go-to-market. Współpracownik funduszy inwestycyjnych. Wykładowca SGH

Alexa, czy mam Covid-19? Nie, analiza twojego głosu na to nie wskazuje. Ale słyszę pierwsze symptomy depresji, powinieneś skontaktować się z lekarzem. Tak mówią voice markery.

Czy to scenariusz z przyszłości? A jeśli tak, to jak odległej? Rok 2030? A może 2045? Tu małe zaskoczenie: to się dzieje teraz. Wszystko dzięki voice bio markers, czyli medycznym markerom głosowym. Czy voice markery to rewolucja w medycynie?

Czym one są? To element prężnie rozwijającej się cyfrowej analizy ludzkiego głosu w celu wykrycia zaburzeń zdrowotnych. Taka analityka diagnozuje coraz więcej chorób i może być to przyszłość medycyny.
Zdefiniowane, „wyszlifowane” algorytmy, które przy pomocy różnych urządzeń wejściowych będą w stanie diagnozować pierwsze symptomy chorobowe z dokładnością do 99,9% będą więcej warte niż wszystkie patenty szczepionek ludzkości. Tak pojmowana diagnostyka jest świętym Graalem medycyny.

Voice markery pytają: co słychać?

Głos, jego brzmienie, a także nasz subiektywny dobór słów, którymi opisujemy rzeczywistość są bardzo złożonymi narzędziami. Sam proces mówienie wymaga koordynacji wielu struktur. Płuca zaopatrują nas w powietrze, które przechodzi przez struny głosowe. Dźwięk kształtowany jest przez język, usta i jamy nosowe. Sam mózg zajmuje się zaś koordynacją całości.

PRZECZYTAJ RÓWNIEŻ: Czy nauka zdalna szkodzi? Nie zawsze.

Sekret polega na tym, że sami nie słyszymy subtelnych, zmian jakie zachodzą w naszym głosie. Ludzkie ucho ma zakres słyszalności od 20 HZ do 20 000 HZ i nie słyszy nic poniżej i powyżej tych częstotliwości. A systemy zajmujące się analizą dźwięków, a w tym przypadku mowy, słyszą. Dlatego tak łatwo wyłapią każdą anomalię. Marshall Davis Jones, założyciel firmy MindBodySpeak podsumowuje to tak:

„Cały system wokalny jest pętlą sprzężenia zwrotnego, pracującą w sposób, o którym byśmy nigdy nie pomyśleli. Przyglądamy się multimodalnemu przenoszeniu danych, nawet poprzez zmysły. Dopiero teraz zdajemy sobie powoli sprawę, jak wszystkie nasze systemy są połączone”.

– Głos jest niezwykle bogaty pod względem przenoszenia emocji – mówi Charles Marmar, psychiatra z New York University.

– Tempo, rytm, głośność, wysokość, akcent i intonacja, wystarczają, aby określić czy pacjent jest przygnębiony, pobudzony lub zniechęcony – podkreśla Marmar, który wykorzystał w swojej pracy naukowej uczenie maszynowe do zidentyfikowania 18 cech wokalnych związanych z zespołem stresu pourazowego. Analizując dane stworzył system, który z dokładnością 90% klasyfikował, którzy z weteranów mieli zespół stresu pourazowego.

Kroki milowe, czy raczej słowa klucze

Pierwszą ważna grupą dla rozwoju voice marketów były dzieci z nadpobudliwością psychoruchową. Mówiły szybciej niż ich rówieśnicy, a ich głos wykazywał więcej zmęczenia. Dało się więc dość łatwo wyłonić specyficzne dla tej grupy markery. Pomogło to w badaniach nad wczesnym wykrywaniem spektrum autyzmu u dzieci na bazie analizy głosu.

Kolejnym etapem rozwoju markerów głosowych były zaburzenia depresyjne. Monotonna pauza, powolna wymowa, oraz wiele innych charakterystyk głosowych pozwoliło na stworzenie markerów głosowych opisujących chorobę afektywną dwubiegunową i depresję.

Dziś możliwość wykrywania zaburzeń psychicznych na bazie markerów głosowych to dynamicznie rozwijająca się kategoria e-medycyny. Nie bez powodu, doświadczamy właśnie pandemii chorób psychicznych, a będzie jeszcze gorzej. Potrzebne są więc wszystkie ręce na pokład. A właściwie wszystkie usta i uszy.

Co mówi Parkinson?

Kolejną grupą badań jest choroba Parkinsona. Jak wiadomo, wywiera ona spory wpływ na mowę, dlatego naukowcy dość łatwo zbudowali bazę anomalii głosowych. Utrata kontroli nad mięśniami przekłada się na sposób mówienia, chorzy mają coraz cichszy i słabszy głos.

Dziesięć lat temu Max Little, badacz zajmujący się uczeniem maszynowym wykorzystał algorytmy przetwarzania mowy, aby zidentyfikować dziesięć cech akustycznych typowych dla Parkinsona. To m.in. sposób oddychania, wysokość głosu, jego barwa. Wykorzystując te cechy stworzył on system, który z 99% dokładnością jest w stanie zidentyfikować pierwsze objawy występowania tej podstępnej choroby.

Według Little’a analiza wokalna to szybki i niedrogi sposób monitorowania osób z wysokim ryzykiem choroby. Co ważne, tego typu technologia nie wymaga kontaktu z lekarzem. To ważne, bo Parkinson – choroba, na którą cierpi 6,5 mln ludzi na całym świecie – nie ma biomarkerów. Aby ją wykryć nie możemy więc po prostu zbadać sobie krwi. Dysponujemy jedynie 20-minutowym badaniem neurologicznym.

Trwają także prace nad zbudowaniem markerów głosowych charakterystycznych dla Alzheimera. Naukowcy z Toronto, którzy zajęli się tym tematem wyłonili finalnie 35 cech wokalnych. Za pomocą tych cech stworzony został system identyfikujący występowanie Alzheimera z 92% dokładnością. Jest to możliwe dzięki wychwytaniu krótszych słów, mniejszego zasobu słownictwa pacjenta, ale też problemów z prawidłowymi nazywaniem kategorii przedmiotów. Niektóre ze zmian głosu pojawiają się już we wczesnych stadiach choroby, a to daje szanse na stworzenie narzędzia, które pomoże we wczesnej diagnostyce. I to jest najważniejsze – im wcześniej medycyna pomoże nam we wczesnej diagnostyce chorób przewlekłych, tym szybciej uda się wygrać tę nierówną walkę.

Aplikacje, próbki głosu i Izrael

Dynamiczny rozwój uczenia maszynowego oraz całej kategorii AI przez ostatnie lata pozwolił na znaczną akcelerację badań w zakresie markerów głosowych. Aby było to możliwe, potrzebne są jak największe bazy danych. Słowem: każdy głos jest na wagę złota.

W Izraelu oddawanie głosu pomaga w walce z pandemią koronawirusa. Tamtejsze Ministerstwo Obrony wraz ze startupem Vocalis Health poprosiło ludzi o „oddanie głosu”, by stworzyć algorytm do wykrywania biomarkerów Covid-19.

Firma Vocalis jest przygotowała aplikację na smartfony VocalisTrack, która wykrywa zaostrzenie przewlekłej, obturacyjnej choroby płuc, poprzez nasłuchiwanie sposobu oddychania w trakcie mówienia.

Osoby, które miały pozytywne wyniki testów na Covid-19 mogły pobrać wspominaną aplikację. Następnie poproszono je o uruchomianie jej raz dziennie. Ich zadaniem było opisywanie na głos pojawiającego się obrazu, musieli także policzyć od 50 do 70, a także po prostu porozmawiać przez telefon. Próbkami ich głosów zajęły się później komputery, porównując je z głosami ludzi zdrowych. Izraelski startup chwali się, że jego aplikacja wykrywa Covid-19 z 81% skutecznością, nawet w przypadku bezobjawowego przebiegu choroby.

Voice markery telemedycznej rewolucji

W ramach nieustannych wysiłków w walce z pandemią COVID-19 grupa finansowanych przez UE naukowców stworzyła aplikację na telefony komórkowe, która zbiera dane mające pomóc w zdiagnozowaniu tej choroby. Aplikacja posłuży naukowcom do stworzenia algorytmów uczenia maszynowego, które na podstawie głosu, kaszlu i oddechu użytkownika będą automatycznie określać, czy jest on chory na COVID-19.

Nad aplikacją mobilną, która na podstawie głosu i kaszlu użytkownika ocenia, czy jest on zarażony nowym koronawirusem pracuje także Uniwersytet Cambridge w ramach projektu EAR.

– Z rozmów z lekarzami wynika, że jednym z najczęstszych objawów, które zauważają u pacjentów z wirusem jest łapanie powietrza w czasie mówienia, suchy kaszel i przerywany oddech

– mówi prof. Cecilia Mascolo z Uniwersytetu w Cambridge, koordynatorka projektu EAR. Oprócz próbek głosu, oddechu i kaszlu aplikacja gromadzi również podstawowe dane demograficzne i medyczne użytkowników, a także informacje o tym, czy uzyskali kiedykolwiek pozytywny wynik testu na obecność koronawirusa. Aplikacja będzie dostępna w kilku językach.

Przez ostatnią dekadę wykorzystanie sztucznej inteligencji dotyczyło głównie prób tworzenia biomarkerów głosowych w zakresie demencji, depresji, autyzmu oraz chorób serca, czyli najpopularniejszych chorób cywilizacyjnych. Specjaliści zwracają jednak uwagę, że dalszy rozwój tej dziedziny e-medycyny będzie łatwiejszy ze względu na wszechobecność mikrofonów w produktach konsumenckich. Choć rodzi to pytania o kwestie naruszania prywatności i etyki medycznej. Z pewnością temat ten będzie wymagał wielu regulacji prawnych.

Voice markery to także temat Amazona. Dzięki ich patentom Alexa jest w stanie rozpoznać na podstawie markerów głosowych fakt, że właśnie jesteśmy przeziębieni.

Co będzie słychać w przyszłości?

Technologia markerów głosowych ma przed sobą wiele zastosowań. Ale także jeszcze więcej ograniczeń. Wyzwaniem dla badaczy są m.in choroby współistniejące, zaburzające prostą diagnozę medyczną. Problemem jest też kwestia zmiany głosu człowieka w czasie różnych jego aktywności fizycznych. Ważna jest też kwestia wielkości próby badawczej. Największe ze startupów działające w kategorii mają zbiory danych wynoszące kilkanaście tysięcy osób. To za mało, by tworzyć wzorce, który na pewno zadziałają w przypadku milionów osób. Ale im więcej słuchamy, tym lepiej słyszymy.

Chcesz wiedzieć więcej? Zobacz wystąpienie Jima Harpera z Sonde Health „Your Health Speaks”.