Електронний каталог науково-технічної бібліотеки
Вінницького національного технічного університету

ПРАВИЛА КОРИСТУВАННЯ ЕК
          Савчук, Т. О.
    Удосконалений метод виявлення ключових слів у Web-тексті [Текст] / Т. О. Савчук, Ю. В. Горобець
    // Інформаційні технології та комп'ютерна інженерія. – 2018. – № 3 (43). – С. 43-47.

   Запропоновано удосконалення методу виявлення ключових слів і словосполучень у web-тексті. Розглянуто такі основні етапи формування множини ключових слів та словосполучень з метою знайти шляхи підвищення швидкодії індексації та реферування web-текстів, як токенізація вихідного тексту, виключення стоп-слів, відсікання основ і закінчень із тексту, формування ключових слів та словосполучень з вихідного тексту. Запропоноване удосконалення базується на використанні словника предметної області, складеного експертом. Аналіз показав, що запропонований удосконалений метод виявлення ключових слів та словосполучень в україномовних і англомовних web-текстах, надасть можливість виявляти релевантні слова та словосполучення з підвищенням їх F-міри на 9.5%, а повноти та точності - на 15%.

  УДК 004.8


            


Є складовою частиною документа Інформаційні технології та комп'ютерна інженерія [Текст] : міжнародний науково-технічний журнал. – 2018. – № 3 (43).



Теми документа






Український Фондовий Дім Інформаційно-пошукова система
'УФД/Бібліотека'