System wspomagania decyzji klinicznych dla pacjentów chorych na cukrzycę poprzez prognozowanie cukrzycy typu 2 przy użyciu algorytmów uczenia maszynowego
Streszczenie
Cukrzyca jest jedną z najpoważniejszych chorób przewlekłych, której następstwo stanowi wysokie stężenie glukozy we krwi. Wczesna predykcja może znacząco zmniejszyć potencjalne ryzyko i ciężkość cukrzycy. W tym badaniu zastosowano różne algorytmy uczenia maszynowego (ML, machine learning) w celu przewidzenia cukrzycy u nieznanej populacji chorych. Głównym celem badań było zapewnienie systemu wspomagania decyzji klinicznych (CDSS, clinical decision support system) poprzez przewidywanie cukrzycy typu 2 przy użyciu różnych algorytmów ML. Do celów badawczych wykorzystano ogólnodostępny zbiór danych Pima Indian Diabetes (PID). Wśród metod zastosowano wstępne przetwarzanie danych, k-krotną walidację krzyżową, dostrajanie hiperparametrów i różne klasyfikatory ML, takie jak klasyfikator K-najbliższych sąsiadów (KNN, K-nearest neighbor), drzewo decyzyjne (DT, decision tree), losowy las decyzyjny (RF, random forest), naiwny klasyfikator bayesowski (NB, Naive Bayes), maszyna wektorów nośnych (SVM, support vector machine) i wzmacnianie gradientu w oparciu o histogram (HBGB, histogram-based gradient boosting). Użyto także kilku metod skalowania w celu poprawy dokładności wyniku. W dalszych badaniach zastosowano podejście oparte na regułach w celu zwiększenia efektywności systemu. To spowodowało, że dokładność DT i HBGB przekroczyła 90%. Na podstawie tego wyniku wdrożono CDSS, w którym pacjenci mogą za pośrednictwem internetowego interfejsu
użytkownika podać wymagane parametry wejściowe, aby uzyskać pomoc w podejmowaniu decyzji opartą na wynikach analitycznych i uwzględniającą przypadek konkretnego chorego. Wdrożony system CDSS będzie pomocny dla lekarzy i pacjentów przy podejmowaniu decyzji dotyczących rozpoznania cukrzycy oraz będzie oferować oparte na analizach w czasie rzeczywistym sugestie mające na celu poprawę jakości leczenia. Jeśli w przyszłych badaniach uda się zebrać codzienne dane dotyczące pacjenta chorego na cukrzycę, można będzie wdrożyć lepszy system wsparcia klinicznego, który będzie wspomagał codzienne podejmowanie decyzji przez pacjentów na całym świecie.