Информационна система за дипломанти - Катедра Софтуерни технологии

Дипломна работа

Тази дипломна работа представя генеративен модел, базиран на използването на

дълбоко учене с рекурентни и дълго краткотрайно помнещи невронни мрежи, с които

могат да се генерира и имитира успешно речта на човешкият глас.

Разглеждат се важните концепции в областта на лингвистиката, които се използват

в извличането на отличителните характеристики в естествените езици.

Маркирани са някои от подходите, които се прилагат в областта на обработката на

сигнали и синтезирането на реч като са отбелязани техните предимства и недостатъци.

Описват се начинът на работа на скритите модели на Марков, дълбоките, рекурентните и

дълго краткотрайно помнещите невронни мрежи. Демонстрирана е архитектура и

реализация на модел, който генерира естествено звучаща човешка реч. Проведени и

описани са експерименти, които имитират човешки клас, произнасящ произволно

зададена реч. Възможна е опцията за обучение за имитация на произволен такъв глас. В

някои от случаите синтезираните гласове са достатъчно убедителни и погрешно описани

като естествено генерирани от доброволци, участващи в тестването.

Предложени са бъдещи насоки за развитие на разработката, като са отбелязани

възможните приложения в областта на бизнеса и медицината. Не на последно място, са

отбелязани и етичните въпроси, които един мощен генеративен модел от подобен

характер може да създаде в обществото.