Генериране на реч и имитиране на гласове от текст чрез методи от машинното самообучение | Защитена на:
Тази дипломна работа представя генеративен модел, базиран на използването на
дълбоко учене с рекурентни и дълго краткотрайно помнещи невронни мрежи, с които
могат да се генерира и имитира успешно речта на човешкият глас.
Разглеждат се важните концепции в областта на лингвистиката, които се използват
в извличането на отличителните характеристики в естествените езици.
Маркирани са някои от подходите, които се прилагат в областта на обработката на
сигнали и синтезирането на реч като са отбелязани техните предимства и недостатъци.
Описват се начинът на работа на скритите модели на Марков, дълбоките, рекурентните и
дълго краткотрайно помнещите невронни мрежи. Демонстрирана е архитектура и
реализация на модел, който генерира естествено звучаща човешка реч. Проведени и
описани са експерименти, които имитират човешки клас, произнасящ произволно
зададена реч. Възможна е опцията за обучение за имитация на произволен такъв глас. В
някои от случаите синтезираните гласове са достатъчно убедителни и погрешно описани
като естествено генерирани от доброволци, участващи в тестването.
Предложени са бъдещи насоки за развитие на разработката, като са отбелязани
възможните приложения в областта на бизнеса и медицината. Не на последно място, са
отбелязани и етичните въпроси, които един мощен генеративен модел от подобен
характер може да създаде в обществото.