Дипломна работа

Структуриране и визуализация на данни в граф база данни | Защитена на: 01/01/1900

Резюме на дипломна работа

 

Тема на дипломната работа: “Структуриране и визуализация на данни в граф база данни”

От дипломант: Катя Иванова Чердонева, специалност: „Софтуерни технологии“,

Ф.№: 26495

Научен ръководител: доц. д-р Десислава Петрова-Антонова, Катедра “Информационни технологии”, ФМИ-СУ

Консултант: София Лазарова

 

Цел на дипломната работа:

Целта на дипломната работа е да се извърши обзорен анализ на инструменти и библиотеки за визуализация на данни и да се изследва тяхното приложение върху граф база от данни.

  • За целта да се разработи Neo4j база от данни, в която са структурирани данни от областта на здравеопазването.
  • За визуализация на данните да се разработи уеб приложение с възможност за тяхното представяне в граф с различни оформления и стилове.
  • Да се изгради Neodash табло с различни типове диаграми на база на потребителски заявки за филтриране.

 

Задачи, произтичащи от целта:

  1. Обзорен анализ на инструментите и библиотеките за визуализация на данни
    • Типове визуализация на данни, съхранени в граф бази данни;
    • Библиотеки за визуализация;
    • Инструменти за визуализация;
    • Сравнителен анализ и избор на инструменти и библиотеки въз основа на предварително дефинирани критерии.
  2. Анализ на избраните технологии за разработка
    • Граф бази данни – същност, предназначение;
    • Граф бази данни с Neо4j и Cypher;
    • Neodash - функционалност, предназначение и архитектура;
    • js - функционалност, предназначение и архитектура.
  3. Проектиране и реализация на граф база данни с Neo4j и Cypher.
  4. Проектиране и реализация на уеб интерфейс за визуализация на данни.
  5. Анализ на получените резултати и идентифициране на възможности за подобрение и бъдеща работа.

 

Анотация:

Ежедневието на хората в съвременния свят е свързано с непрекъснато генериране на данни. Тяхното структуриране, обработка и анализиране се извършва в широк спектър от сфери – икономика, здравеопазване, образование, и др. За да бъде подпомогнат по-добре процесът за вземане на решение, данните е необходимо да бъдат визуализирани по начин, който да е разбираем за заинтересованите страни. Подходящото представяне на данните с възможност за получаване на различни сечения по множество параметри е съществен компонент от техния жизнен цикъл, върху който се фокусира и настоящата дипломна работа.

Ползите от дипломната работа са да се анализират и сравнят актуални инструменти и библиотеки за визуализация в различни категории.

За изпълнението на първата задача е представен анализ на текущото състояние на предметната област, идентифицирани са видовете инструменти и библиотеки за визуализация и сравнени техните характеристики. Обзорният анализ би могъл да се използва като базово знание за избор на средства за визуализиране на граф данни. За настоящата работа се използва за избор на библиотека и инструмент с функционалност за разработка (за по-лесна работа на разработчика с граф данни) и функционалност за отчети (създаване на отчети с граф данни).

За изпълнението на втората задача са разгледани изисквания към средствата, видове средства за визуализация спрямо тяхната архитектурата и избор на най-подходящи средства за целите на дипломната работа. Избрани са две средства за визуализация – Neodash и Cytoscape.js Те се различават по архитектурата, функционалността, която предлагат и други. Neodash е самостоятелен инструмент с функционалност за създаване на отчети, докато Cytoscape.js е библиотека с функционалност за разработка и анализ на граф данни. Инструментът Neodash разполага с готов интерфейс, с който могат да се създават табла с отчети. Докато библиотеката Cytoscape.js разполага с разнообразие от алгоритми, стилове и оформления за графи, но интерфейса се имплементира от разработчика.

Проектирани и реализирани са:

  • Граф база данни с Neo4j, като в нея са структурирани данни за изследвания на индивиди, отнасящи се до болестта на Алцхаймер.
  • Уеб приложение за визуализация на граф данни за по-лесна работа на разработчиците с графи. Дизайна е изчистен и лесен за използване, тъй като съдържа само необходимите за графът функционалности. То може да бъде вградено във всяко приложение. Лесно за надграждане с още функционалности.
  • С цел анализ и отчет на данните е разработено табло с различни типове диаграми на база потребителски заявки за филтриране. Таблото се запазва и споделя. Разработени са полезни и интересни отчети и анализи на Neo4j граф данните. Инструмента има директна връзка с Neo4j.

Като заключение на дипломната работа се обобщава, че изборът на средства за визуализация е труден при наличието на голямо разнообразие на технологичния пазар. Изборът се улеснява когато заинтересованите страни имат ясна визия за визуализацията на граф данните:

  • Целта, за която ще се използват визуализациите на граф данните – за разработка, за изследване, за анализ или за създаване на отчети;
  • Функционалността, която е необходима – алгоритми, оформления, стилове, диаграми и други подходящи за идентифицирането на тенденции, модели и отклонения в данните;
  • Архитектурата – библиотека, която има възможност да се вгради в уеб приложение, самостоятелен инструмент за създаване на табла със визуализации, техническа рамка и други.

Други допълнителни критерии, също биха помогнали за избирането на инструмент или библиотека за визуализация.

Дипломантът направи заключения, че има възможност да се развие и оптимизира уеб приложението за по-лесната работа на разработчика с графи. Neodash таблото да се усъвършенства с добавяне на още отчети, за идентифициране на модели в данните чрез характеристиките на индивидите – пол, раса, години, диагнози, семеен статус и други.

 

Scroll to Top