Информационна система за дипломанти - Катедра Софтуерни технологии

Дипломна работа

Прилагане на методи от машинния превод за изграждане на диалогова система за отговаряне на често задавани въпроси | Защитена на: 01/01/1900

Целта на тази дипломна работа е да се изследва приложимостта на дълбоки изкуствени невронни мрежи за създаване на диалогова система за отговаряне на често задавани въпроси.

По-точно, изучава се модел seq2seq в детайли. Този модел произхожда от сферата на машинния превод и е предназначен да преобразува редици(изречения) от един език в съответните редици (преводи) от другия език. По същият начин, моделът разглеждан в тази работа разглежда въпросите като входни данни и отговорите като целеви.

В процеса на работа типичният форум Qatar Living бе превърнат в двойки от (въпрос, отговор), както се изисква от процедурата по машинно самообучение. Предприемат се няколко мерки за предварителна обработка, за да се намалят произволните флуктуации в данните. Също така, се използва най-развитият класификатор за определяне на уместността, за да се ограничат данните само до уместни отговори.

Интегрира се Seq2seq модела и различни подходи за избиране на най-добрия модел се изучават. Най-значимо е предлагането на нова техника за избиране на модели, която разчита на "златни" преценки относно уместността на дадените отговори. Тази метрика предполага, че генерираните от модела отговори трябва да са подобни на маркираните като полезни отговори от човешки анотатори.

Прави се както ръчна така и автоматична оценка на разработените модели. Представя се анализ на резултатите и се коментират недостатъците на seq2seq процедурата.

Диалоговата система се използва за извличане на няколко нови свойства на разглежданите въпроси и отговори. Тези свойства се добавят към свойствата използвани от най-развитата система за определяне на уместност. Системата се претренира и полученият класификатор се преоценява. Въпреки че резултатите за оценка на класирането остават на същото ниво, забелязваме подобрение в класификационните метрики характеризиращо се с напредък от 2 точки в F1.