| |
Гібридний підхід до пошуку та обробки складноструктурованих даних великого обсягу для побудови інтегрованого алгоритму аналізу культурної спадщини України [Електронний ресурс] / Н. О. Шибаєва, Д. С. Шибаєв, С. І. Гришин [та ін.] // Вісник Вінницького політехнічного інституту. – 2025. – № 6. – С. 127-138. – DOI: https://doi.org/10.31649/1997-9266-2025-183-6-127-138.
Запропоновано гібридний підхід на базі розробки інтегрованого алгоритму обробки та аналізу даних, який поєднує парсинг інтернет-ресурсів, методи оптичного та рукописного розпізнавання текстів, технології обробки природної мови, механізми виявлення дублікатів і недостовірних фактів, а також побудову графа знань з подальшим застосуванням алгоритмів кластеризації. Особливістю системи є наявність адаптивного пошукового модуля, що забезпечує автоматичне вилучення, структуризацію та перевірку даних, а також інтерактивна мапа з геоприв'язкою діячів культурної спадщини, реалізована засобами бібліотеки Leaflet і технологій OpenStreetMap. Архітектура системи передбачає багаторівневу обробку інформації - від нормалізації, лематизації та ідентифікації сутностей до семантичного аналізу, асоціативного пошуку та формування прогнозних моделей розвитку культурних процесів. Проведені обчислювальні експерименти підтвердили ефективність запропонованого підходу, що свідчить про придатність її використання у режимі реального часу. |