Дипломна работа

Откриване и разпознаване на лица в архивни снимки | Защитена на: 01/01/1900

Архива на Троянският музей съдържа голямо количество черно-бели изображения на музейни експонати, старинни документи, сгради и масови мероприятия, както и много портретни и групови фотографии. Ръчното сравняване на изображенията и лицата в тях би било много бавно и неефективно. За разрешаване на тази задача, в дипломната работа се разглеждат подходи за автоматично откриване и разпознаване на лица основани на дълбоки невронни мрежи. Основните цели на дипломната работа са сравняване на ефективността на съществуващи решения и провеждане на експерименти за подобряването им.

Сравнението на съществуващи решения започва с преглед на областта, в който се разглеждат както класически подходи, утвърдени с времето, така и съвременни подходи, които са изчислително по-сложни, но по-успешни. Ефективността на съществуващите алгоритми се проверява чрез специализиран набор от данни, изграден от архивни снимки. Сравнението е проведено върху предварително обучени модели с публично достъпни тегла, от които 7 алгоритъма за откриване на лица (OpenCV, Dlib, MTCNN, YOLOv5, RetinaFace, SCRFD, TinaFace) и 12 алгоритъма за разпознаване на лица (VGGFace, FaceNet, OpenFace, DeepFace, DeepId, Dlib, SFace, ArcFace, AdaFace, MagFace, CurricularFace и CosFace).

Експериментите за подобряване на ефективността на алгоритмите в задачата за откриване на лица са проведени посредством допълнително обучение на TinaFace модела, при който се наблюдава увеличение на точността от малко под 6 процент пункта. За подобряване на моделите за разпознаване на лица са проведени по-задълбочени експерименти, включващи използване на различни архитектури на невронната мрежа (GhostNet, MobileNet, ResNet-50 и ResNet-100), различни функции на загубата (CosFace, ArcFace, CurricularFace, MagFace и AdaFace) и замразяване на различни части от моделите. Най-високи резултати, от проведеното допълнително обучение на 20 различни модела, бяха постигнати при комбинация на GhostNet архитектура и MagFace функция на загуба при обучение само на последните 9 слоя от мрежата. Наблюдаваното увеличение на точността при този модел е почти 30 процент пункта.

За демонстриране на работата на разработените алгоритми е създаден прототип на уеб базирана система за откриване и разпознаване на лица в архивни снимки, която позволява намиране на изображения в които присъства търсено лице.

Scroll to Top