Информационна система за дипломанти - Катедра Софтуерни технологии

Дипломна работа

Класифициране, разпознаване, откриване и препоръчване на музикални изпълнения | Защитена на: 28/02/2017

Целта на дипломната работа е да провери дали анализът на звук и извличането на характеристики от него биха могли да помогнат за препоръчването на музика. Първата основна задача се състои в проучването на съществуващите инструменти за анализ и обработка на звук и това какви характеристики на звука могат да се извлекат с тях. Втората основна задача е прилагането на алгоритми за машинно самообучение върху основни характеристики на звука с цел препоръчване на музика. Накрая резултатите трябва да бъдат анализирани и да се направи извод има ли смисъл да се използват характеристиките на звука с цел препоръчване на музика.

За целите на задачата е направено подробно проучване на съществуващите статии и решения. Резултатите показват, че няма много разработки в областта решаващи дадената задача. Официално само Spotify са публикували, че правят подобно нещо (с комерсиална цел).

Текущата теза първо разглежда какво представляват звука, музиката и основните характеристики, които ги описват. След това се разглеждат основни методи и подходи в машинното самообучение. Определят се основните методи и критерии за анализ и оценка на задачи от областта на машинното самообучение. Освен това е направено и подробно проучване на проблемната област. След това проучване са разгледани обстойно различни инструменти за извличане на характеристики от звук. Въз основа първоначално зададените критерии, на които трябва да отговаря даденият инструмент, е избран инструментът jAudio. Също така за целите на експериментите е избран подходящ списък от песни – топ 100 на billboard за всички времена. Всички музикални произведения са преобразувани до подходящ формат и са обработени с jAudio. След това са намерени доброволци, които да изслушат и да класифицират ръчно избраните песни. Извлечените характеристики от музикални произведения и класификацията на доброволците са обединени с цел образуване на набор от данни. Въз основа опит и направените проучвания е избран най-подходящия алгоритъм за машинно самообучение. Накрая е изградена система, която да послужи за провеждането на необходимите експерименти. Използвайки всичко изброено до тук са проведени успешно необходимите експерименти. Резултатите са представени и анализирани. Дадени са и препоръки за бъдещо развитие.

По време на експериментите са разгледани класификациите направени от 19 потребителя. Максималната постигана средна точност е 68.16%. Разликата между най-добрият резултат и конфигурацията от характеристики с най-слаб резултат е 5.26%. Разликата между най-добрият резултат и изходното ниво е 18.17%. Имайки предвид, че в текущата теза основната цел е подобряване на средната точност, максималната постигната точност за отделен потребител е от 91%. От разгледаните характеристики най-значещи се оказват тези със спектъра, плътността и най-силният бийт. Изводът, който може да се направи е, че има смисъл да се анализира звук с цел препоръчване на музика.