| |
Ісак, Л. М. Підхід до донавчання великих мовних моделей на українських текстових корпусах [Текст] / Л. М. Ісак, О. А. Бабак // Математичні машини і системи. – 2026. – № 2. – С. 46-57.
У статті запропоновано підхід до донавчання великих мовних моделей на українських текстових корпусах, який базується на формалізації процесу відбору навчальних даних та їх структуризації за набором параметрів. Розроблено модель формування оптимальної навчальної підмножини, що враховує якість текстів, доменну належність, структурну різноманітність та рівень анотованості. Показано, що використання багатокритеріальної цільової функції дозволяє керовано формувати навчальну вибірку з урахуванням обмежень обчислювальних ресурсів. |