Национална интердисциплинарна изследователска Е-инфраструктура (КЛаДА-БГ)

Национална интердисциплинарна изследователска Е-инфраструктура (КЛаДА-БГ)

Национална интердисциплинарна изследователска Е-инфраструктура (КЛаДА-БГ) за ресурси и технологии за българското езиково и културно наследство, интегрирана в рамките на европейските  инфраструктура CLARIN

Описание и дейности на инфраструктурата:

Основната цел на инфраструктурата КЛаДА-БГ е да се създаде национална технологична инфраструктура за ресурси и технологии за езиковото, културното и историческото наследство. КЛаДА-БГ осигурява публичен достъп до езикови ресурси и дигитални представяния, програмни средства и услуги за посочените области.

Инфраструктурата ще поддържа решаването на различни задачи, насочени към специализирана и към широка аудитория.

Тази цел ще бъде постигната чрез:

  1. Адаптиране на българските условия към европейските постижения в областта на езиковите технологии чрез близка интеграция с европейската инфраструктура CLARIN ERIC и в областта на културно-историческите технологии чрез интеграция с европейската инфраструктура DARIAH ERIC.
  2. Допълване на съществуващите езикови ресурси и технологии, както и създаване на нови като необходим минимум за функционирането на националната инфраструктура за обработка на текстове на български език.

По-нататъшно развитие на съществуващите технологии при културно-историческото наследство (предимно 3D технологии и семантични технологии) и дигитализацията на база данни за културно-историческото наследство, за да се подпомогне функционирането на националната инфраструктура в изкуствата и хуманитарните науки.

Компютърна лингвистика: разработка на програмни средства за създаване и управление на двуезични ресурси (двуезични онлайн речници и двуезични подравнени корпуси с български език), на съвместими с TEI морфо-синтактични спецификации за българския език (за кодиране и анотиране на български езикови корпуси и лексикони) и създаване на езикови ресурси.

Теоретична и съпоставителна лингвистика: оценъчна морфология; семантика (формално моделиране на семантични явления); аспектология; писмени системи, тяхната история и типология.

Главните научни и научно – приложни резултати, постигнати от сътрудниците на секцията в областта на технологии за обработка на знания и мултимедийни технологии, са дигитални библиотеки, представяне и обработка на електронно съдържание за културно-историческо наследство, интерактивни платформи за електронно учене и разработване на съдържанието им, приложения в информационната сигурност и семантичния Интернет.

 

Научен и технически екип на научната инфраструктура:

Над 50

Участие в европейска инфраструктура:

Националната инфраструктура КЛаДА-БГ (към БАН) е член на CLARIN ERIC

Година на включване:  2012 г. Предвижда се членство в DARIAH ERIC

 

Координатор:

Институт за информационни и комуникационни технологии, Българска академия на науките (ИИКТ-БАН), София, България

Местоположение на инфраструктурата:

Инфраструктурата е виртуална и е разпределена в няколко региона на страната

Български консорциум:

Финанансов координатор:

Министерство на образованието и науката

Научен координатор:

Институт за информационни и комуникационни технологии към Българска академия на науките (ИИКТ-БАН);

Членове на консорциума:

  • Институт за математика и информатика към Българска академия на науките (ИМИ-БАН);
  • Софийски университет “Св. Климент Охридски” (СУ);
  • Нов български университет (НБУ);
  • Шуменски университет “Константин Преславски” (ШУ);
  • Булгариана – организация с нестопанска цел за опазване на културното наследство (Bulgariana);
  • Югозападен университет “Неофит Рилски” (ЮЗУ)
  • Сирма медия (СМ)
  • Кирило-Методиевски научен център към Българска академия на науките (КМНЦ–БАН);
  • Институт за Балканистика с Център по тракология към Българска академия на науките (ИБЦТ–БАН);
  • Институт за Етнология и фолклористика с Етнографски музей към Българска академия на науките (ИЕФЕМ–БАН);
  • Бургаски свободен университет (БСУ)
  • Народна библиотека “Иван Вазов” – Пловдив (НБИВ-Пловдив);
  • Исторически музей – София
  • Онтотекст АД (в Сирма Груп – водеща българска софтуерна компания)

Област на дейност:

Социални и културни иновации

Проект за бюджет за периода 2018-2022:

общо: 7.7 млн. лв.