Дипломна работа

Модел и платформа за изчисляване на индикатори за оценка на умен град | Защитена на: 01/01/1900

Обобщение. Урбанизираните територии са една от областите, в които граждани и администратори, наред, приветстват положителни промени. Счита се, че правилният начин за взимане на решения използва кибернетичен модел на обратна връзка от последиците от предходни решения, както и чрез обективно разбиране за на действителните ситуации чрез емпирични показатели на състоянието. Умните решения водят до ефикасно управление на ресурси, наличие на адекватни услуги и дългосрочно устойчиво поведение. В контекстна на умните градове индикаторите се считат за мощно средство за оценяване на това дали, колко добре и по какъв начин желаните последствия от действия и политики са се реализирали. За да постигнат тази си цел индикаторите разчитат на данни – събрани, обработени, приравнени или стандартизирани, и изчислени. Важно изискване към стойностите на индикаторите е да позволяват сравнение. Дипломната работа разглежда предметната област на индикатори, използвани в умни градове – тяхната обосновка, характеристики и връзки. Анализът е фокусиран върху моделирането на данни от различни източници и за различни теми. Основен ключов момент е осъзнаването на връзките между отделни данни и няколко концепции: смисълът (значението) на стойността; нейният метод за изчисление (или измерване); пространствената област и времевата област, за които се отнася (е валидна) стойността; референтна система на мерни единици. Предложен е модел, който да обхваща и използва всички тези понятия, с цел постигане на изчислимост и сравнимост на индикатори. Преимуществена характеристика на модела е че изчислимостта може да се възползва от движение (скалиране) на референтния обхват по пространствените или времевите обхвати ако има налични функции на преход за стойностите. Допълнителни усилия са вложени в съпоставянето на идентичност между членове на обособени системи на рефериране. Също така е предложена и модулна архитектура на технологична платформа за индикатори. Прототип на платформа, базирана на описаната архитектура, е реализиран, за да валидира концепциите и предложенията на модела.

Ключови думи: умни градове, индикатори за оценка, модел за изчисляване, системи на рефериране

1. Въведение

Постигането на ефикасност е еволюционно предимство. В природата на хората е, независимо дали съзнателно или не, да търсят, измислят и прилагат нови инструменти и процеси, за да го придобият. Градските пространства, които населяваме, са едни от многото области, в които ние – граждани или администратори – приветстваме положителни промени. Имайки предвид наличието на целта за подобрение, или промяна към желано състояние, то можем да разглеждаме взаимодействията ни на обитатели или влияещи на околната ни среда като част от една кибернетична система. Постоянни цикли от действие, възприемане (усещане), сравняване, възможно разбиране, опционално коригиране на следващото действие и извършване на следващо действие. (Pangaro) Но в стъпките на възприемане и сравняване с желано състояние са заложени аргументите за съществени изисквания към начините, по които да се изпълнят. Като за начало, да може обективно да се представи ситуацията, тъй като субективно възприятие за нея може да доведе до неадекватно на реалността ответно действие. Друго изискване е това представяне на събитие или обстоятелства да позволява сравнение, което идва със собствено предусловие – да бъде измеримо (по подобие на измеримостта като качество на поставяни цели в S.M.A.R.T. модела (Doran)).

Напредъкът в информационните и комуникационни технологии (ИКТ), които включват, но не са ограничени, до Големи данни, Интернет на нещата и Облачни технологии, позволяват все по-добро възприемане, съхранение и обработка на събития и ситуации чрез усъвършенствани сензори, процесори и мрежи, но ключова съставка във всяка от тези сфери си остават данните, които преминават през тях. Пресичането на данни и градове е все по-съществено защото мнозинството хора живеят в градски територии и разходват по-голямата част от ресурсите – 72% от населението в ЕС живее в урбанизирани зони и използва 70% от електрическата енергия (Петрова Антонова и др. 1) Поради тази причина ефективното управление и употреба на ресурси имат пряко и значимо влияние върху ежедневния живот на много хора. С цел взимане на компетентни решения подходът на засичане, остойностяване, събиране, съхранение, проверка, рефериране и сравняване на дигитализирана реалност е предизвикал употребата на много термини, опитващи се да уловят и пресъздадат промяната в естеството на това как влияем и ни влияят градовете, в които живеем. „Умен град“ е названието най-разпознаваемо в публичното пространство. Въпреки че няма универсално прието определение за умен град, повечето му описания включват подобряване на състояния чрез разработка и прилагане на информационни и комуникационни технологии. Независимо че умните градове са считани за полезно средство за дефиниране, подход и постигане на цели, практическото средство, на което разчитат, за да оценят ефектите от действия, са индикаторите. Те са инструмент за остойностяване на състояние, така че влиянието върху него чрез действия или политики да може да бъде засечено, измерено, разбрано, използвано. Индикаторите са начин за обобщаване и разбиране на събрани данни.

По отношение на данните може да се каже, че колкото са повече, толкова са по-ценни. Въпреки това, в прехода към Големи данни се появяват следните предизвикателства, свързани с техни характеристики:

Обем – как големи обеми данни да бъдат записвани и подреждани, така че да няма значителни намаления на бързодействието при работа с тях – търсене, промяна и адресиране.
Разнообразие – това може да се отнася както за типа и естеството на самите данни, така и по отношение на техните източници. Разминавания в смисъла или представянето на данни изискват коригиращи действия, за да не се загуби от тяхната използваемост.
Скорост – как при голяма скорост на постъпване на данни те да бъдат приети и обработени в (почти) реално време. Това е особено интересно при нарастваща скорост на генериране срещу еластичност на ангажираните ресурси.
Истинност – какви решения могат да се прилагат, за да предотвратим проблеми с използването на липсващи, неверни или грешни данни.

Никое от тези предизвикателства не отпада в случаите на разглеждане на големи данни в контекста на умни градове. Напротив, има множество източници на данни, които може да нямат като цел, желание или стимул за координираност помежду си. Съчетаването им може да бъде улеснено от рамков модел за описание и обработка, използващ обобщаващ речник и съобразен за представяне на разнообразни взаимоотношения.

Дипломната работа анализира областта на индикатори на умни градове. Основната ѝ цел е формулиране на подобен модел, който да спомага за изчисляване и сравняване на стойности на индикатори. Специфичният му фокус е върху характеристиката „разнообразие“ на Големите Данни. Това е придружено от изисквания и дизайн на платформа, която да може да валидира модела.

Останалата част от дипломната работа е със следната структура. Глава 2 разглежда предметната област на индикатори за оценка, свързаните с тях понятия и известни предизвикателства. Глава 3 разглежда критериите за избор на решения и техни елементи, както и кои технологии и инструменти, ще бъдат използвани при реализацията. Анализ на предметната област и формулиране на модел, както и изисквания към техническа реализация се намират в глава 4. Глава 5 съдържа архитектурен дизайн както на общата платформа, така и на нейните компоненти. Описание на имплементацията, както и планове за нейното тестване и практическо прилагане (deployment) са поместени в глава 6. Глава 7 завършва работата с обобщение на основните заключения, както и предложения на насоки за бъдещо изследване и подобрения.

2. Разглеждане на индикатори за оценка на умни градове, набори (frameworks) от индикатори и платформи за практическо приложение

В търсене на инструменти, които да им помогнат да разберат света, хората се стараят да намерят неща, които да го отразяват в достатъчно добра степен. Проследява се развитието на това търсене до индикатори за оценка на умни градове, допълнително подбирани за включване в набори с определена насоченост. Също както идеите получават стойност чрез практическото си приложение, така и платформите за индикатори осъществяват практическото реализиране на потенциала на индикаторите.

Приема се, че взимането на адекватни решения има нужда от точна представа за средата. Това е от значение и след приложение на взетото решение. Постигнатият ефект от действието или политиката е нужно да се сравни с очаквания. Същевременно светът е голяма и сложна система и обхващане на всичките ѝ аспекти е невъзможно. Поради тази причина ние оценяваме определени нейни характеристики и ги свеждаме до количествени стойности. В случаите на характеристики, които нямат естествено стойностно измерение, то са разработени специфични методи, например скала на Ликерт, които да постигнат подобно преобразование. Налага се и друго допълнително действие по разбиране на света – намаляване на възприеманите единици, за да може съзнанието ни да ги обхване. Това са в същността си измерванията и индикаторите. Това е основата за значимата роля, която Големите Данни играят в умните градове.

В контекстна на умните градове индикаторите се считат за мощно средство за оценяване на това дали, колко добре и по какъв начин желаните последствия от действия и политики са се реализирали. За да постигнат тази си цел индикаторите разчитат на данни – събрани, обработени, приравнени или стандартизирани, и изчислени. Важно изискване към стойностите на индикаторите е да позволяват сравнение. То може да е както в рамките на един град – за разбиране на ефекта от действията върху него – така и между различни градове – за съпоставяне на еднакви или алтернативни действия в разнородни среди.

Управление на производителността чрез измерване на производителността е все по-прилаган подход. Градските управление и администрации споделят запознатост с тези идеи и надежди, че умният град е отговор на въпроса за по-добри градове. Въпреки това, те все още имат колебания, неясноти и предизвикателства (Kontinakis and De Cunto 13): трябва да се създадат рамки и платформи за употреба; нужни са консистентни политики и проекти за общите цели; много решения водят градовете към обвързване с конкретен търговец или технология; употребата на ИКТ повдига въпроси за поверителност и сигурност; липсват бизнес модели за публично-частни инициативи; измерването на ефекта и ефикасността на самите действия по постигане на „умни услуги“ също трябва да се случва.

Индикаторите за оценка на умни градове могат да се категоризират по няколко характеристики: Свойство, която се измерва, като това е или реална даденост или абстрактно разбиране, което се калкулира (квантифицира). Възможни типово естество на стойността на индикатора са число – абсолютна стойност, например население; съотношение – числова стойност, което е пропорция или съотношение на две стойности, например безработица; стойност на скала – числово представяне на качествено измерване, например степен на информираност за физкултурни прояви, представена чрез скала на Ликерт. Единица на измерване – някои индикатори имат подобна характеристика, други – не. Литературата съветва да се избягват абсолютни стойности, тъй като затрудняват сравнение със случаи в други области, различаващи се по размер, икономически дейности и др. Препоръчва се да се използват стойности върху скала или да се прилага нормализация чрез стандартизиращ метод, например z-трансформация, която ги преобразува към единна скала със среда 0 и стандартно отклонение 1. Обхватът на представяне (среща се и като „начин на изчисление“) представлява позиция по спектъра от представане на една физическа характеристика до сложна или абстрактна идея, преустановявайки притежание на единица на измерване по пътя. Допустими стойности са: единични, агрегиращи (събирателни), композитни (съпоставящи) или индекси. Под цел на индикатора се разглежда първичната му цел: оценка при оценяване на производителност или устойчивост на град; изследване при оценка на състояние на градски аспект; валидация при оценяване на очакванията за резултат от действие или политика. Тип на предмета на оценяване се използва за разграничаване дали се оценява входно свойство на града, чието състояние може да се приеме за причина за инициатива; резултат от действия или инициатива; процес – когато се оценява производителността на инициатива или политика.

Индикаторите преминават през няколко различни фази, представени на Фигура 2. Тъй като фокусът на дипломната работа не включва стъпката на дизайн и оценка, част от характеристиките на индикаторите не представляват интерес. От значение се считат типовото естество на стойността, мерната единица, обхватът на представяне.

Разбираемо, след достатъчна употреба може да се пристъпи към промяна на индикатора или формулиране на нов. Съществен пример е как през 2010 Индексът на Човешко Развитие (Human Development Index – HDI) бива преработен като се променя не само математическата му формула, а цялостният състав на използвани стойности, като при това се запазва името му. (Angelova 55)

С цел предлагане на цялостен поглед върху един град се формулират набори (frameworks) от индикатори. Те допринасят освен с подбор, а и с организация на индикаторите в различни класификации.

Разполагайки с индикатори, които представляват интерес, се налага практическото им изчисление да бъде осъществено, за да могат да се използват. Това от своя страна изисква данни да бъдат събрани, обработени, изчислени и приготвени за употреба. Именно техническите измерения на тези задачи се адресират от платформи за индикатори. Те предлагат структурирани подходи за тези задачи, и включват системна и компоненти архитектури, описание на процеси, предписания за внедряване и др. Дали платформите трябва да са готови приложения на определен framework или да позволяват дефиниране на данни, източници, преобразования, изчисления и индикатори в рамките на самата платформа остава въпрос отворен за дискусия.

Чрез платформи за улавяне и обработка на данни, нужни за изчисляване на индикатори, проектирани да дават проницателност, взимащите решения могат да получат полезни насоки. Умните решения водят до ефикасно управление на ресурси, наличие на адекватни услуги и дългосрочно устойчиво поведение. В контекстна на умните градове индикаторите се считат за мощно средство за оценяване на това дали, колко добре и по какъв начин желаните последствия от действия и политики са се реализирали.

3. Избор на технологии, платформи и методологии

Ограниченията могат да бъдат полезни като насоки. Тъй като не се разглежда конкретен град и неговите заинтересовани страни, които да споделят своите работни процеси, няма да се проектират действия специфични за тях. Разглеждания модел и платформа ще предлагат разширяема основа, която да осигурява фундаменталната базова функционалност, използваема във всеки контекст.

При допитвания градове са изразили оправданото притеснение, че „много решения водят градовете към обвързване с конкретен търговец или технология.“ (Kontinakis and De Cunto 13). При дизайна и имплементацията ще се предпочитат отворени технологии. Избор на затворена или търговски-обвързваща технология ще бъде съпроводен с усилия за преносимост към алтернативни предложения.

Установени инструменти ще получават приоритет пред експериментални технологии.

ИКТ секторът получава нарастващ интерес, тъй като предоставя полезни решения, както и осигурява много работни места. Разбираемо, той се радва на значителни инвестиции в изследване и разработка, които са направили достъпни множество иновации в различни сфери.

Има множество възможности за организация, съхранение и обработка на данни – релационни, обектно-ориентирани, графови бази данни, полу-структурирани хранилища[1], хранилища на наредени тройки (triplestores), архитектури и инструменти, разглеждащи данните като потоци и събития. Програмните езици също са огромен брой (над 250 според TIOBE) предлагащи различни подходи и парадигми – императивни, декларативни, процедурни, обектно-ориентирани (клас- и прототип-базирани), функционални, логически. Резултатите могат да се изпълняват върху физически или виртуални машини, или дори върху безсървърни среди. Някои езици и платформи формират цели екосистеми от библиотеки, инструменти и рамкови среди (frameworks) около себе си. А се случва и рамкови среди да доведат до създаването на екосистеми около себе си.

В контекста на подобно изобилие и предвид целите на разработваната платформа избраните технологии са:

.NET Core e framework с отворен код, позволяващ многоплатформена разработка и изпълнение. (.NET Core 2.2 - Supported OS versions) Той е значително по-лек и модулен от предшественика си .NET Framework и може лесно да се използва в комбинация с контейнери. Основните доставчици на облачни услуги вече го поддържат или са обявили планове да го направят. Има богата екосистема от библиотеки и инструменти. Nancy е лек и минималистичен framework за разработка на услуги базирани на HTTP. Предоставя стандартен начин за разработка, но и се характеризира с изключителна разширяемост, позволяваща конфигуриране или постигане на специфично поведение при нужда. Възможностите му за описание на правила за насочване на изпълнението, договаряне на съдържанието и обработка на параметри към модели са значителни. Изборът на средство за съхранение на данните е Microsoft SQL Server – релационна система за база данни – която е добре установена и надеждна. Версия 2017 добавя поддържа за определени Линукс дистрибуции, както и за Docker, което трябва да намали пречките за вписването ѝ в съществуващи инфраструктури, не базирани на продукти на Майкрософт. Освен това, неговата разработка активно се стреми да постига големи нива на скалируемост. Независимо от това, трябва да се отбележи, че той е изключение, тъй като е единственият proprietary (собственически) софтуер в списъка. MediatR е имплементация на вътре-процесен разпределител на съобщения. Може да се разглежда и като медиатор или шина за съобщения. Позволява отделяне на елементи на приложението като същевременно осъществява и тяхната интеграция. Dapper е прост object-mapper (транслатор на обекти) удобен за параметризиране на заявки към база данни, както и за преобразуване на резултатите от тях. Има много малко отрицателно влияние върху бързодействието за сметка на значителна удобство при работа с конкретни типове. FluentValidation е библиотека позволяваща задаване и валидиране на правила за проверка на екземпляри на класове. По този начин валидацията може да бъде обособена в повторно използваеми елементи и интегрирана като напречна грижа. Интегрира се много добре както с Nancy, така и с MediatR. Шаблонът на инжектиране на зависимости (Dependency Injection pattern) ще се използва като един от принципите при дизайн на композицията на класове и средство за изолиране на функционалност чрез псевдо-имплементации (fake objects) при тестване. Като контейнер за обръщане на контрола (Inversion of Control) ще се използва StructureMap, който ще отговаря за създаването и инжектирането на зависимости. Въпреки, че проектът е замразен откъм разработка на нова функционалност, той все още е в етап на поддържка и е считан за развит и използваем продукт. Тестовете към проектите ще бъдат написани за рамковата среда за тестване xUnit.net и изпълнявани през нейния инструментариум. Методите, предоставяни от библиотеката FluentAssertions, ще бъдат използвани за указване на очакваното поведение и състояние в тестовете. При нужда от псевдо-обекти (fake objects) за изолиране на поведение, което се тества, те ще бъдат създавани, описвани, и проверявани чрез библиотеката FakeItEasy. Application Insights е услуга за управление на производителността на приложения, използваема от множество платформи. Позволява получаването на телеметрични данни и предоставя инструменти на наблюдение, анализ, засичане на поведение, проблеми и производителност.

Всеки от основните елементи в концептуалния модел ще използва Uniform Resource Name (URN) като идентификатор, лесно използваем от хора. Тъй като не разполагаме с регистрирано пространство от имена (namespace), било то формално или неформално, а експерименталните такива (започващи с „X-“) са преустановени, ще се използва измисленото пространство „test“. Колкото до реалните данни, за тях ще се използва предложеното от RFC6963 пространство „example“. В частта за текст, специфичен в пространството от имена, (namespace-specific string – NSS) ще се използва елементарна структура за смислово именуване. Детайлното ѝ дефиниране може да бъде предмет на допълнително изследване.

4. Анализ на изискванията

Възприетият тук подход ще е да се разгледа общ случай, при който има множество източници на данни. Няма да се правят допускания за степента на обработеност на постъпващите в платформата данни, т.е. те могат да бъдат както първични, така и междинни или направо готови изчислени индикатори. Поради тази причина трябва да се предвиди, че постъпващите в платформата данни могат да претърпят различна степен на обработка – от това директно да са готови като отговор на заявки до това да са сурови първични данни. Също така трябва да се вземе предвид, че една и съща стойност, като стойност и като смисъл, може да бъде едновременно както краен индикатор, така и междинна стъпка в изчислението на други стойности.

Съобразявайки се с това разнообразие на природата на стойности, се предлага всички те да бъда третирани еднакво, т.е. от гледна точка на платформата да не се прави разграничение между първични данни, междинни стойности и крайни индикатори. Крайният концептуален модел е илюстриран на Фигура 3. Следват стъпките на неговото формиране.

Започвайки от двойката „стойност – смисъл“ получаваме две основни понятия – „Получена стойност“ (Resolved Value) и „Понятие за стойност“ (Value Concept). Умишлено се използва „получена“ (resolved), за да не се вменява какъв е начинът и къде се е случило получаването на тази стойност – дали е измерване, допитване, обработка, изчисление. От тази отправна точка има четири насоки за изследване:

Ситуационно отношение – за къде и кога е стойността?
Получаване – по какъв метод се е стигнало до стойността?
Произход – What is the lineage of the data that was or was transformed to the eventual resolved value?
Класификация на семантичното понятие в рамките на схема или рамков набор (framework).

В контекста на умен град една стойност, дори и натоварена със смисъл, е неизползваема без референция към реалния свят в неговите измерения. По този начин се стига до връзка между получена стойност и пространствен и времеви обхват – Spatial и Temporal Scope. Но те не са достатъчни. Следното важи и за двата вида. Тъй като е възможно данни да пристигат за един и същ пространствен обхват от различни източници, които не използват еднакви идентификатори за този обхват, се налага и едната референция и другата да бъдат приети като за едно и също нещо. Именно за това се дефинира абстрактен обхват (abstract scope), към който всеки конкретен може да бъде отбелязан като идентичен. При тези условия и използвайки транзитивност на релацията „… е еднакъв на…“ можем да получим идентичност на конкретни обхвати. От друга страна, различните идентификатори най-вероятно са валидни от гледна точка на различни референтни системи (scope reference system), които също могат да намерят място в модела. Практиката показва, че в тези системи често има йерархична организация, а това изисква в модела връзка на композиция (scope composition) между отделни обхвати.

Избраните мерни единици влияят върху сравнимостта на стойности, отнасящи се за различни обхвати – особено за различаващи се по размер, демография, икономически отрасли и д.р. Нужно е да се знае мерната единица (unit of measurement) за всяка стойност. Но има поне един случай, когато това не е достатъчно, за да могат стойностите да са сравними – при скали на Ликерт. Когато те се използват да се получи числова стойност на неколичествена характеристика е възможно да се използват различни точки за краища на скалата, например 0 до 9, 0 до 10, 1 до 10, 0 до 100, 1 до 100 и т.н. Това води до вмъкването на междинно звено между стойност и мерна единица – референта система на единици (unit reference system), която да включва и въпросните граници като „референтни точки“. Поради възможността за промяна в начина на изчисление на едно понятие, но и при наличие на желание да се запази проследимостта на това изчисление, между стойността и нейния смисъл се добавя самостоятелен елемент – „метод на оценка“ (evaluation method). Умишлено се използва оценка, а не изчисление, за да се запази богатството от интерпретации. По този начин „понятието за стойност“ започва да се явява като псевдоним на актуалния „метод за оценка“. Когато методът е наистина „изчисление“ – формирането на стойност въз основа на други стойности – то зависимостта от тези други стойности е всъщност от други методи на оценка. Тези зависимости се отразяват в едноименната същност (Evaluation Method Dependencies). Възможно е за определено ниво на обхват стойността да трябва да се получи от обхващащия или обхващаните обхвати, например популацията на една зона е сбор на популациите на съставящите я под-зони. Функциите на формиране от съседни обхвати наричам „функции на преход между обхвати“ (Scope Transition Functions). Примерни функции са сбор, средно аритметично, най-малка стойност, последна стойност (взимайки предвид времето), наследяване (от обхващаща зона) и др. Същевременно, няма изискване подобни функции да са част от един метод на оценка.

Текущият дизайн на изчисление не се влияе от произхода на стойности. Поради тази причина той не е част от модела.

Отделните рамкови набори от индикатори организират съдържанието си по различен начин – от брой нива на групиране до имена на използваните категории. Приемайки това, в модела се позволява отворена схема за структуриране с произволен брой нива. Независимо от това, те не влияят върху изчислението на стойности.

Какво вече бе споменато, може да се направи разлика между получаването на стойността от гледна точка на ползвател на платформата и изчисляването на стойността в платформата. Фигура 4 илюстрира връзката между двете понятия, както и други елементи от концептуалния модел, например формули за трансфер (transition formulas - TF).

Две основни групи функционални изисквания могат да бъдат определени: общи и специфични (свързани с конкретни индикатори). Решено е планираната платформа да включва реализацията на определени индикатори в себе си, а не да позволява тяхното дефиниране чрез инструментариум. Избраните индикатори са взети от секция „Икономическо представяне“ на рамковия набор CITYkeys (Bosch [CITYkeys list of city indicators] 10)), както и Индексът на човешко развитие на Програмата на ООН за развитие (ПРООН). Започвайки от тези четири индикатора и проследявайки техните зависимости се разкрива мрежа от стойности, които също трябва да бъдат получени, при това ограничайки се да не изчисляваме GDP, MDI и GNI. (виж Фигура 5)

Общите функционалности на платформата са свързани с пространствените и времеви обхвати, тъй като те са независими от конкретните индикатори, които ще се използват. А също така се разглеждат и базовите изисквания към модулите, които са отговорни за притока на данни към платформата. Като допълнително преимущество е посочена възможността за мониториране на изпълнението, производителността и грешките на модулите чрез специализирана услуга.

Очаква се платформата да може да даде отчет за кои индикатори може да бъде попитана, както и за известните ѝ мерни единици, референти системи на мерни единици, пространствени и времеви референтни системи, дефинираните пространствени и времеви обхвати.

Всеки от избраните индикатори, както и неговите зависимости, е анализиран и описан. Посочени са и проблемни подходи в описанието им в рамковия набор.

5. Дизайн

Едно от основните предизвикателства през платформа за индикатори е как да приеме нужните данни за изчисление от множество източници, които могат да са с различно ниво на зрялост, различен механизъм на достъп, различни обеми, формати, ритъм на актуализация и др. Съществен фактор при дизайна на подобна система е да не се разчита на контрол над тези източници.

Предложената архитектура (виж Фигура 6) черпи вдъхновение от ETL процеси, като се придържа към принципите за модулност и разширяемост. Това позволява адаптивност към специфични нужди.

Интересно е да се отбележи, че посоката на движение на данни е отгоре надолу. Изключение прави единствено записът на изчислени стойности от RM в VS.

Единствено на „портиерите на данни“ (data-porters) им се налага да се занимават с външния свят по отношение на данни за вход. Поради модулността си позволяват индивидуално актуализиране. Заблуждаващо е да се приема, че външните системи винаги са пасивни участници и портиерите са тези които „взимат“ данни. Портиерите може да предоставят интерфейси за подаване на данни, които да се използват от трети страни – например така може да се реализира ръчното зареждане на данни в платформата, за което споменават някои автори (Петрова-Антонова и др. 4). Няма изискване портиер на данни задължително да поддържа и ползва междинна зона за данни (staging area) – това зависи от естеството на данните и други фактори.

Съвпадението на броя външни системи, портиери, методи за оценка и външни потребителски интерфейси е случайно.

Дипломната работа включва примерен портиер, занимаващ се със зареждането на пространствени обхвати от „Единен класификатор на административно-териториалните и териториалните единици“ (ЕКАТТЕ) в платформата.

Хранилището на стойности (Values Store) е централното място за съхранение на данни на платформата. Данните в него са организирани в релационен модел, като допълнително са групирани в няколко схеми въз основа на степента на приложение на модела. Схема noms (съкратено от номенклатури), съдържа мерните единици и референтните системи на единици. Схема defs (съкратено от дефиниции) съдържа понятията за стойност, методите на оценка и техните зависимости, свързаните с обхватите данни – пространствени, временни, абстрактни и референтни системи. Заедно двете схеми се считат за основни структури на модела, тъй като в различни случаи на реализация на системата те ще останат непроменени като структура, въпреки възможността за различаващи се данни в тях. Показани са на Фигура 9.

Променливите данни се намират в схема data. Замисълът е че за всеки метод на оценка ще има отделна таблица, в която се записват резултатите (или импортираните данни). Пример с „население“ е показан на Фигура 10. Имайки предвид, че за всеки метод и таблица ще има връзка към Ако се проследят връзките се наблюдава прогресия: data → defs → noms.

Модулът за получаване (Resolution module) има две основни отговорности: получаване на стойности, включително и чрез оценка, и обслужване на заявки. Въз основа на това той може да бъде разделен на два слоя (виж Фигура 11). Изпълнението на алгоритъма за получаване, методите на оценка, спомагателните операции с обхвати се изпълняват от самостоятелни единици (handler), извиквани през шината за съобщения.

Задълженията за визуализация са делегирани на външни модули. Модулът за получаване би трябвало да предоставя достатъчна функционалност под формата на API.

6. Имплементация

Имплементацията следва предложения дизайн и използва вече избраните инструменти и технологии (виж 3).

Фокусът на тестването е върху модула за получаване. Тестовите сценарии разчитат на определена структура от пространствени обхвати (виж Фигура 12) да е налична в хранилището на стойности. Нужната подредба се постига чрез SQL скриптове.

Тестваната функционалност е систематизирана в три групи: тестове на конфигурирането на обхвати; тестове на определянето на обхвати; тестове на определянето на стойности (вкл. изчисление).

7. Заключение

Дипломната работа разглежда предметната област на индикатори, използвани в умни градове – тяхната обосновка, характеристики и връзки. Анализът е фокусиран върху моделирането на данни от различни източници и за различни теми. Основен ключов момент е осъзнаването на връзките между отделни данни и няколко концепции: смисълът (значението) на стойността; нейният метод за изчисление (или измерване); пространствената област и времевата област, за които се отнася (е валидна) стойността; референтна система на мерни единици. Предложен е модел, който да обхваща и използва всички тези понятия, с цел постигане на изчислимост и сравнимост на индикатори. Преимуществена характеристика на модела е че изчислимостта може да се възползва от движение (скалиране) на референтния обхват по пространствените или времевите обхвати ако има налични функции на преход за стойностите. Такива функции могат да бъдат: сума; средна аритметично; най-малка или най-голяма стойност; най-ранна или най-късна стойност, наследяване (идентичност). Допълнителни усилия са вложени в съпоставянето на идентичност между членове на обособени системи на рефериране. Също така е предложена и модулна архитектура на технологична платформа за индикатори. Прототип на платформа, базирана на описаната архитектура, е реализиран, за да валидира концепциите и предложенията на модела.

Набелязаните насоки за изследване и бъдещи подобрения включват:

Времево ограничаване на валидност на пространствени обхвати или тяхна композиция.
Възможност за одит на получаването / изчисляването.
Множество източници на данни за едно понятие, придружени с ранг.
Допълнителни атрибути към обхвати.
Семантична карта на екземпляри на модела за подпомагане на споделянето на понятия, обхвати и стойности като свързани данни.

Цитирани източници

Doran, George. T. "There's a S.M.A.R.T. way to write management's goals and objectives". Management Review, vol. 70, no. 11, 1981, pp. 35–36.

Petrova-Antonova, Dessislava, et al. “Towards a technological platform for transparent and flexible assessment of smart cities”, 10th International Conference on Knowledge Discovery and Information Retrieval, DOI: 10.5220/0007230203740381

Petrova-Antonova, Dessislava, and Sylvia Ilieva. “Smart Cities Evaluation – А Survey of Performance and Sustainability Indicators”

Giffinger, Rudolf, et al. “Ranking of European medium-sized cities”, Centre of

Regional Science, Vienna University of Technology, 2007, www.smart-cities.eu/download/smart_cities_final_report.pdf

Kontinakis, Nikolaos, and De Cunto, Anja Katalin, “Overview of the needs”, CITYkeys, 2017

Bosch, Peter, and et. al. “Deliverable 2.1 Definition of data sets”, 2015, p. 9

Bosch, Peter, and et. al. “CITYkeys list of city indicators”, 2017

Angelova, Polya. “Human Development Index – Methodological and Applied Aspects”. Statistics, National Statistical Institute, no. 2, 2016, pp. 55-76

“2018 Revision of World Urbanization Prospects”, 16 May 2018, p. 1, www.un.org/development/desa/publications/2018-revision-of-world-urbanization-prospects.html

Barro, R. J., Lee, J.-W. (2010). “A New Data Set of Educational Attainment in the World, 1950–2010” National Bureau of Economic Research, Working Paper No. 15902, April 2010. www.nber.org/papers/w15902

“Paul Pangaro | What Is Cybernetics?”, YouTube, uploaded by Indrid Cold, 31 August 2016, youtu.be/Oad8Ro8j_fE

“TIOBE Programming Community Index Definition”, www.tiobe.com/tiobe-index/programming-languages-definition/#instances

“z-Transform”. Fundamentals of Statistics. www.statistics4u.info/fundstat_eng/ee_ztransform.html

Saint-Andre, P. “RFC6963: A Uniform Resource Name (URN) Namespace for Examples”. tools.ietf.org/html/rfc6963

OECD. “Gross Domestic Product”. stats.oecd.org/glossary/detail.asp?ID=1163

“.NET Core 2.2 - Supported OS versions”. .NET Core 2.2 Release Notes. github.com/dotnet/core/blob/master/release-notes/2.2/2.2-supported-os.md

“Transitive law”. Encyclopaedia Britannica. www.britannica.com/topic/transitive-law

Appendix 1: List of figures

Фигура 1. Случаи на сравнение през пространството и времето. 6

Фигура 2. Етапи от „живота“ на индикатори на умни градове. 7

Фигура 3. Концептуален модел. 12

Фигура 4. Алгоритъм за получаване (resolution) 15

Фигура 5. Зависимости между разглежданите индикатори. 16

Фигура 6. Обща архитектура на платформата. 17

Фигура 7. Компоненти свързани с „ЕКАТТЕ“-портиер. 18

Фигура 8. Действия свързани с „ЕКАТТЕ“-портиер. 19

Фигура 9. Основни таблици във Value Store. 20

Фигура 10. Примерна таблица с данни във Values Store. 21

Фигура 11. Структура на модул за получаване (resolution) 22

Фигура 12. Подредба на пространствени обхвати за тестови цели. 23

Table of Contents

Въведение 3
Разглеждане на индикатори за оценка на умни градове, набори (frameworks) от индикатори и платформи за практическо приложение 5
Избор на технологии, платформи и методологии. 8
Анализ на изискванията. 11
Дизайн. 16
Имплементация. 22
Заключение 23

Цитирани източници. 25

Appendix 1: List of figures 27

[1] Набрали популярност като NoSQL в края на първото десетилетие на 21^ви век.