Дипломна работа

Извличане на зависимости от данни на училищата в България | Защитена на:

В наши дни информацията става все по - ценна. С всяка минута генерираните данни се увеличават. Такава е ситуацията и с данните за училищата в България. Тяхното анализиране и изследване би открило нови възможности и би подпомогнало вземането на решения в различни области. С такова изследване се занимава и дипломната работа. Целта е чрез методите на машинното самообучение да се направи анализ на успеваемостта на училищата в България, като се открият съществуващи групи на училища и се анализира и проследи принадлежност към тях.

Търси се модел за анализиране на данните, който да е приложим за различни учебни години и за различни типове училища. Този модел трябва да може да се използва независимо от населеното място, в което се намира учебното заведение. За да се намери такъв модел, трябва да се премине през процеса за откриване на знания. В Глава 2: Изложение на проблема, предизвикателства и мотивация се описва именно този процес и приложението му в рамките на дипломната работа. Разгледани са съществуващите методи за намиране на значимост на атрибути и методите за групиране на данни. Направен е сравнителен анализ между тях и са избрани най - подходящите за целта на дипломната работа. Те са SVM - RFE и kMeans++ и са подробно разгледани в следващата Глава 3:  Използвани методи, обосновка.

Първият етап от процеса за откриване на знания в контекста на дипломната работа е обработка и трансформация на данните. Той е разгледан в Глава 4: Предпроцесна подготовка на данните. Описани са различните методи за почистване, филтриране и трансформация на данните. Разгледан е оригиналният формат на данните и как той може да се промени, така че да е по - удобен за работа. В тази глава се въвеждат и нови атрибути, които се използват в изследването. Като резултат е получен формат на информацията, който е удобен за използване в следващите етапи от процеса.

В следващата Глава 5: Процедура за оценка на успеваемостта  се дава по - подробен модел на цялостната процедура за оценка на успеваемостта на училищата в контекста на дипломната работа. Тя включва: обработка и трансформация , анализ на данните, оценка и визуализация. Разгледани са етап 2: Анализ и етап 3: Оценка и визуализация.

Процедурата, посочена в Глава 5: Процедура за оценка на успеваемостта, е приложена върху данни за училищата в България за периода 2011-2015 година включително. Това включва информация за четири учебни години. Получените резултати са анализирани и е избран модел за всеки един тип училище. Резултатите и изводите са описани в Глава 6: Анализ на получените резултати.

Като част от дипломната работа е разработено софтуерно приложение, което улеснява използването на предложената методология на работа. Глава 7: Разработка на софтуерно приложение описва целта и изискванията към софтуерното приложение. Представена е неговата архитектура и са дадени примери за случай на употреба. Тази глава включва и инструкции как системата може да бъде стартирана.

В заключение са описани резултатите от дипломната работа и предложения за бъдещо развитие.

Scroll to Top