|
Костенко, С. В. Модель оцінки властивостей алгоритмів виправлення орфографічних помилок та її використання для україномовних застосунків [Текст] / С. В. Костенко, В. А. Литвинов // Математичні машини і системи. – 2021. – № 2. – С. 62-73.
Розглядаються інструментарій (імітаційна модель (ІМ)) та пробні результати оцінки коригуючих властивостей деяких алгоритмів по відношенню до виправлення типових помилок тайпінгa в україномовних словах за умови попередньої індексації словника. Пробне моделювання проведено для фонетичних алгоритмів Soundex і Metaphone, адаптованих до української мови. Загальний алгоритм обробки слова, в якому виявлено помилку, включає попередній вибір (ПВ) множини слів-кандидатів за правилами алгоритму індексації та остаточний вибір (ОВ) - пріоритезація обраних слів і звуження області пошуку "правильного" слова за прийнятими критеріями близькості до слова, що виправляється, і різними критеріями відбору. Обговорюються результати моделювання, що містять загальну кількість коректованих помилкових слів за видами помилок, кількість коректних пропозицій слів-кандидатів, кількість помилкових пропозицій, кількість відсутніх пропозицій, середню кількість кандидатів у пропозиціях на етапах ПВ і ОВ. |