Дипломна работа

Софтуерна система за откриване на семантично плагиатство във файлове | Защитена на: 01/01/1900

С развитието на новите технологии, достъпът до информация от каквото и да е естество става все по-лесен. Това колкото и удобно и полезно да е за хората, задълбочава проблема с интелектуалната собственост и спомага за развитието на плагиатството. Затова инструмент за откриване на плагиатство сред дадена група от файлове би бил изключително полезен в редица професии, например сред преподавателите. В тази дипломна работа се анализира, моделира, проектира, разработва и тества софтуерна система за откриване на плагиатство във файлове посредством метода на размитото хеширане (fuzzy hashing).

 

Първата основна цел на дипломната работа е обстойно проучване и изследване на областта на намиране на прилики между файлове. Трябва да се отговори въпросът: Прилагано ли е размито хеширане в тази област? Също така основна задача е да се обясни какво представлява размитото хеширане, и подходящо ли е то за решението на поставения проблем - откриване на семантично плагиатство. Втората основна цел е да бъде разработено софтуерно приложение за откриване на семантично плагиатство измежду файлове в предварително зададена директория. Тази софтуерна система може да послужи като инструмент, в помощ на преподаватели в проблема за намиране на семантично подобни файлове в определена директория. Може да се използва за текстови файлове и за html файлове. Предоставя и модул за работа с html файлове, който може да изпълнява проверка дали даден html файл спазва зададена структура. Също така html файловете са третирани специално от системата - за подобност се взема предвид само тяхното съдържание (не и структурата им). Системата предоставя за работа както потребителски графичен интерфейс, така и интерфейс с команден ред.

 

След реализацията на гореописаната система, заключителната цел е да се проведат редица експерименти, които да отговорят на въпроса: Би ли могъл метода на размито хеширане да помогне за справянето с проблема за откриване на плагиатство. Важна задача е също така резултат от проведените експерименти да бъде определена стойност, праг на подобност, над който системата би сигнализирала за плагиатство.

 

Взети заедно, гореописаните цели и задачи представят обстойно и детайлно областта на размито хеширане в контекста на плагиатство.

Scroll to Top