Sztuczna inteligencja może przewidzieć chorobę 10 lat wcześniej!

Ten generatywny model AI opracowali naukowcy z Europejskiego Laboratorium Biologii Molekularnej (EMBL), Uniwersytetu w Kopenhadze i Niemieckiego Centrum Badań Nad Rakiem (DKFZ). Stworzono go wykorzystując koncepcje algorytmiczne podobne do stosowanych w dużych modelach językowych (LLM).
Delphi-2M został wytrenowany na zanonimizowanych danych pacjentów pochodzących od 400 000 uczestników brytyjskiego Biobanku, a przetestowany na danych 1,9 miliona osób z Duńskiego Krajowego Rejestru Pacjentów.
Chociaż nie jest jeszcze gotowy do bezpośredniego zastosowania klinicznego, oferuje nowe sposoby badania chorób i lepszego planowania strategii opieki zdrowotnej.

"Nasz model to dowód słuszności koncepcji, pokazujący, że sztuczna inteligencja jest w stanie nauczyć się wielu długoterminowych wzorców zdrowotnych i wykorzystać te informacje do generowania sensownych prognoz" – wyjaśnił Ewan Birney, tymczasowy dyrektor wykonawczy Europejskiego Laboratorium Biologii Molekularnej (EMBL).
Tak jak duże modele językowe potrafią uczyć się struktury zdań, Delphi-2M uczy się 'gramatyki" danych zdrowotnych, aby modelować historie chorób jako sekwencje zdarzeń rozwijających się w czasie. Do zdarzeń tych należą diagnozy lekarskie lub czynniki związane ze stylem życia, takie jak palenie tytoniu.
Model uczy się prognozować ryzyko chorób na podstawie kolejności występowania tych zdarzeń i czasu, jaki upływa między nimi.

Model sprawdza się szczególnie dobrze w przypadku schorzeń o wyraźnych i spójnych wzorcach progresji, takich jak niektóre rodzaje nowotworów, zawały serca i posocznica, która jest rodzajem zakażenia krwi. Mniej wiarygodne są prognozy dotyczące bardziej zmiennych schorzeń, jak zaburzenia zdrowia psychicznego lub powikłania związane z ciążą, które zależą od nieprzewidywalnych zdarzeń życiowych.
Podobnie jak prognozy pogody, Delphi-2M pozwala określić prawdopodobieństwo, ale nie daje pewności. Nie przewiduje dokładnie, co stanie się z daną osobą, ale oferuje dobrze skalibrowane szacunki prawdopodobieństwa wystąpienia określonych schorzeń w danym okresie – na przykład prawdopodobieństwo rozwoju choroby serca w ciągu najbliższego roku.
Systematyczna ocena danych z UK BioBank, niewykorzystanych do celów szkoleniowych, wykazała, że obliczone ryzyko dobrze odpowiada obserwowanej liczbie przypadków w grupach wiekowych i płciowych.

Model jest skalibrowany tak, aby generować dokładne szacunki ryzyka na poziomie populacji, prognozując częstotliwość występowania określonych schorzeń w grupach ludzi. Jednak, jak każdy model sztucznej inteligencji, ma on ograniczenia.
Na przykład, ponieważ dane treningowe modelu z brytyjskiego Biobanku pochodzą głównie od osób w wieku 40–60 lat, zdarzenia zdrowotne w dzieciństwie i okresie dojrzewania są niedoreprezentowane. Model zawiera również błędy demograficzne wynikające z luk w danych treningowych, w tym niedostateczną reprezentację niektórych grup etnicznych.
Europejskie Laboratorium Biologii Molekularnej (EMBL) przewodzi i koordynuje działalność w zakresie nauk przyrodniczych w całej Europie, zapewnia szkolenia dla studentów i naukowców, napędza rozwój nowych technologii i metod w naukach przyrodniczych oraz oferuje najnowocześniejszą infrastrukturę badawczą. EMBL jest organizacją międzyrządową zrzeszającą 29 państw członkowskich, jedno stowarzyszone i dwa przyszłe państwa członkowskie. W sześciu ośrodkach EMBL w Barcelonie, Grenoble, Hamburgu, Heidelbergu, Hinxton koło Cambridge i Rzymie naukowcy starają się lepiej zrozumieć życie w jego naturalnym kontekście, od cząsteczek po ekosystemy.