Abstract:
Метою статті є аналіз ефективності алгоритмів машинного навчання та пошук оптимальних підходів для їх використання в умовах високого навантаження і великих обсягів інформації. Особливу увагу приділено завданням, які
потребують високої точності та швидкості, зокрема фінансові прогнози, медична діагностика та аналіз поведінкових даних. Методологія дослідження включала порівняльний аналіз різних алгоритмів машинного навчання, таких як лінійна
регресія, дерева рішень, метод опорних векторів та глибокі нейронні мережі. Оцінювалися ключові фактори, що впливають на швидкість та точність обробки даних, зокрема розмір даних, складність моделей, обчислювальні ресурси та
якість вхідних даних. Було проведено серію експериментів на реальних наборах даних, щоб оцінити результативність кожного алгоритму з погляду точності, часу навчання та потреби в обчислювальних ресурсах. У результатах дослідження встановлено, що глибокі нейронні мережі забезпечують високу точність на неструктурованих даних, але мають значні
вимоги до обчислювальних ресурсів і часу навчання. Алгоритми, такі як лінійна регресія та дерева рішень, показали високу швидкість обробки на простіших наборах даних, проте їх точність знижується зі збільшенням складності завдань.
Метод опорних векторів продемонстрував ефективність у завданнях класифікації та прогнозування, зокрема у фінансових та медичних застосуваннях. Випадкові ліси виявилися ефективними для текстової класифікації та забезпечили баланс між швидкістю і точністю. Висновки свідчать, що вибір алгоритму залежить від специфіки завдання, розміру даних та вимог до точності. Оптимізація моделей для роботи в умовах розподілених обчислень є ключовим напрямом для підвищення продуктивності, оскільки дозволяє паралелізувати процеси й зменшити час навчання.
Description:
Бондарчук О. І. Аналіз ефективності алгоритмів машинного навчання в обробці / О. І. Бондарчук, В. Ю. Козуб, Ю. Г. Козуб // Комп’ютерно-інтегровані технології: освіта, наука, виробництво. — Луцьк, 2024. — № 56. — С. 107-116.