| dc.description.abstract |
Запропоновану статтю присвячено особливостям сентимент-аналізу текстів. Обґрунтовано необхідність ураховувати тональність як важливий компонент змістового наповнення тексту з метою досягти еквівалентности в художньому перекладі та забезпечити збереження емоційно-експресивного фону й виразности оригіналу. Визначено важливість автоматизації процесів вияву тональности художньої прози для отримання більш якісних та точних результатів. Окреслено основні методики попереднього опрацювання текстової інформації та визначено набір найпопулярніших підходів у машинному навчанні, що може бути використано за класифікації тональности. Зокрема, увагу зосереджено на моделях Bag-of-Words, TF-IDF Vectorizer, Word2Vec, які застосовують для перетворення текстових даних на числові. Проаналізовано алгоритми-класифікатори як подальший крок в опрацюванні даних (зокрема, баєсів, максимальної ентропії, опорних векторів тощо). Окремо описано переваги програмного забезпечення LIWC-22, що добре зарекомендувало себе й успішно пройшло апробацію із залученням фахівців у галузі психології, соціології та лінґвістики. Із використанням згаданого лексикону здійснено сентимент-аналіз трьох варіантів перекладу оповідання Ю. Винничука «Вишиваний світ» англійською мовою (авторського – перекладач М. Найдан та автоматизованих: перекладачі Google та DeepL). Установлено загальну кількість слів, визначено показники автентичности та тональности (у системі бінарних координат «позитивно/негативно») кожного з варіантів перекладу. Сформульовано перспективу подальших наукових досліджень у сфері аналізу тональности для інтерпретації оригінального й перекладного тексту. |
uk_UA |