Дипломна работа

Създаване на електронен речник на българския жестов език с модул за администриране и модул за свободен достъп до въведеното съдържание | Защитена на: 01/01/1900


Софийски университет „Св. Кл. Охридски”
Факултет по математика и информатика
Катедра „Софтуерни технологии”


РЕЗЮМЕ

на дипломна работа на тема

“Създаване на електронен речник на българския жестов език с модул за администриране и модул за свободен достъп до въведеното съдържание”

 

Дипломант: Петя Кирилова Пеева
Специалност: Технологично предприемачество и иновации в ИТ
Факултетен номер: 23015

Научен ръководител:
гл. ас. Сия Цолова, катедра „Софтуерни технологии“, ФМИ, СУ
Консултант:
доц. Петко Русков, катедра „Софтуерни технологии“, ФМИ, СУ

София, 2022 г.

 

Първото мащабно лингвистично проучване на българския жестов език (БЖЕ), проведено през 2017 г., установява, че БЖЕ представлява самостоятелен език, различен от говоримия български език и има собствена граматика и лексика. Емпирично установеният лексикон на БЖЕ ще послужи като база в унифициране на жестовите знаци и създаване на официален стандарт за социалната практика и обучението. През 2021 г. е приет закон, който също признава БЖЕ за самостоятелен и естествен.
Линвистичните изследванията на БЖЕ продължават, като към момента няма създаден онлайн речник със стандартизирано жестово съдържание. Съществуват отделни тематични речници, както и някои електронни ресурси за обучение. Без наличието на машинно четими жестови ресурси за БЖЕ, не могат да се правят стъпки например към бъдеща автоматизация на преводи и обучаване на изкуствен интелект за разпознаване на изображения и видеа, паралелно с развитието на технологиите. В електронен вариант един речник на БЖЕ може да предостави разширена информация, полезна в практиката - например видеоклип, показващ жеста, а не само картинка, вариациите на жеста, видеоклипове с примерна употреба и др.
Настоящата дипломна работа има за цел разработването на система, чрез която може да се създаде базов онлайн речник на БЖЕ. Това включва администраторски модул за въвеждане на видео жестови единици с описание на изпълнението и езиковите им характеристики и модул за свободен достъп до съдържанието на речника. Стремежът е съдържанието на речника да е от полза, както за широк кръг от потребители, така и за лингвистични изследвания.
Задачите, произтичащи от поставените цели, са следните:
❖ Обзор на историята и статута на българския жестов език и напредъка до момента в лингвистичното му изследване
❖ Проучване на ползата от наличието на електронен речник за изследователски и информативни цели
❖ Събиране на изискванията към описанието на жестовите единици в речника
❖ Създаване на модел на данните за съдържанието на електронен речник на БЖЕ
❖ Проектиране на администраторски модул на електронен речник на БЖЕ и модул за достъп до съдържанието на речника
❖ Анализ и подбор на технологични средства за създаване на администраторски модул на електронен речник на БЖЕ и модул за достъп до съдържанието на речника
❖ Програмиране на администраторски модул на електронен речник на БЖЕ и модул за достъп до съдържанието на речника
❖ Валидиране от лингвист и жестов преводач на администраторски модул на електронен речник на жестовия език и модул за достъп до съдържанието на речника
❖ Описание на предложения за бъдещо развитие и употреба на електронния речник на БЖЕ

Изброените задачи са постигнати в отделните глави на дипломната работа. Направен е обзор на жестовите езици и тяхното лингвистично изследване. Разгледан е статута на БЖЕ и наличните към момента хартиени и електронни речници, както и резултатите от проведеното национално изследване на БЖЕ. Направен е преглед на някои от съществуващите чуждестранни онлайн речници за жестови езици.
Изведени са функционалните изисквания към речник на БЖЕ, съгласувани с чуващ лингвист, носител на БЖЕ. Изброени са полетата, които ще описват лексемите в речника. Споменати са накратко и минималните нефункционални изисквания към речника. Описани са работните процеси, които ще залегнат във функционалностите на речника.
Направено е кратко сравнение на потенциалните технологии, които могат да се използват - база данни и програмни езици за сървърна и клиентска логика. На база на пригодността им за разработване на онлайн речника като SPA уеб приложение и отчитайки нивото на владеене на съответната технология от дипломанта, а оттам и отражението върху времето за разработка, са избрани C# (.Net Framework, ASP.NET Core Web API) за сървърната част, Vue.js като фреймуърк за клиентската част и MS SQL Express като база данни.
Съставена е архитектура на приложението. Направена е диаграма на модела на данните и са описани използваните таблици в базата. Показани са прототипи на екрани за модул за администриране на съдържанието и модул за свободно търсене и преглед на въведеното съдържание.
Онлайн речникът на БЖЕ е разработен, описана е техническата реализация. Показани са извадки от отделните модули на сървърната и клиентската част на приложението. Добавени са някои екрани от извършените тестове на REST услугите в сървърната част, както и от основните сценарии за успех, по които са тествани функционалностите на речника. Онлайн речникът е внедрен пробно на виртуален сървър, с публичен достъп до сайта. Въведени са примерни данни с ограничен набор от жестове.
В края на дипломната работа е добавена и обратна връзка от страна на представители на глухата общност и препоръки за бъдещото използване и развитие на речника. С оглед на продължаващата изследователска работа върху БЖЕ и неговата стандартизация, както и бъдещото създаване на Съвет за българския жестов език и обучението на глухи лингвисти, разработената система може да бъде използвана като основа за създаване на централизиран единен онлайн речник на БЖЕ. Това може да се осъществи в сътрудничество със заинтересованите представители от научната среда и глухата общност.
Разработеният електронен речник би бил най-пълноценен, ако се осигури възможността не само за въвеждане на съдържание, но и за одобрението му, така че да се публикуват само стандартизирани лексеми, до които да има свободен достъп. Това означава да се направи разграничение на администраторските роли на потребителите, които ще въвеждат и оценяват съдържанието и да се въведе допълнителна стъпка на одобрение на лексемите, които ще се виждат публично. Препоръчва се да се направи разграничение и на критериите за търсене, използвани от специалистите, които работят върху съдържанието, и външните потребители.

Scroll to Top