Дипломна работа

Диагностициране и предсказване на болестта на Алцхаймер чрез анализ на медицински данни | Защитена на: 01/01/1900

Болестта на Алцхаймер е хронично невродегенеративно заболяване, което обикновено се развива бавно и постепенно се влошава с времето. При подозрения за развитие на болестта, диагнозата обикновено се потвърждава с оценка на поведението и когнитивни тестове, последващи от различни видове изследвания. Техниките за машинно обучение, по-специално задачите за класификация, предлагат подход за диагностициране и предсказване на болестта на Алцхаймер въз основа на данни за пациенти. Тази дипломна работа има за цел да изследва и приложи класификационни модели, използвайки базата данни на Инициативата за невроизобразяване на болестта на Алцхаймер (ADNI), за да подпомогне прогнозирането и диагностицирането на болестта.

Задачи, произтичащи от целта включват проучване на областта на изследване и запознаване с предоставените данни за болестта на Алцхаймер. Данните са предварително обработени и приведени във вид удобен за прилаганите алгоритми. Извършен е статистически анализ на данните, които съдържат информация за общо 2404 пациента, които са изследвани и 2370 пациента, които имат поставена диагноза на първото посещение. Базата данни ADNI съдържа информация за демографски данни, медицинска история, когнитивни оценки, клинични диагнози, функционален статус, данни за поведението. Клиничните диагнози са пет и са използвани за предсказване на състоянието на пациента – CN, AD, LMCI, EMCI и SMC. От предоставените данни са дефинирани информативни пространства на базата на съществуваща експертна информация и чрез приложение на подходящ алгоритъм за избор на значими характеристики (SelectKBest).

Приложени са различни класификатори за оценка на биологичния статус в ограниченията на предоставените данни – Decision Tree, Random Forest, XGBoost, KNN, SVM, MLP, Naïve Bayes и Logistic Regression. От проведените експерименти върху различни информативни пространства, най-висока точност показват моделите, обучени върху информацията от когнитивни тестове, достигайки точност ~0.94. Направен е сравнителен анализ на резултатите, от което са избрани трите най-ефективни класификатора за този набор от данни – Random Forest, Logistic Regression и XGBoost. Приложени са тези класификатори за различно целево множество за предсказване на ATN статуса на пациентите за оптимизиране на диагностиката на предсказване. Проследено е развитието на болестта във времето чрез анализ на принадлежността на отделни пациенти към различните групи, от където са направени изводи за прогреса на различни характеристики във времето. Най-добри резултати се получават, когато се вземе предвид множество времеви точки и се изследват промени в данните с течение на времето, подобрявайки точността на прогнозиране в сравнение с подходите, които отчитат само една времева точка. Анализирани, визуализирани и интерпретирани са резултатите, като е представена цялостна оценка на приложените методи за изпълнение на формулираната цел.

Scroll to Top