В представленной работе рассматривается пошаговый алгоритм для того, чтобы произвести анализ тональности текстовых данных с использованием машинного обучения. В статье дано представление о возможных подходах к решению задачи. Обозначены следующие шаги для выявления эмоциональной окраски текстов: очистка текстовых данных, токенизация, нормализация, извлечение признаков из текстов, обучение моделей на данных. В качестве подходов к нормализации представлены стемминг и лемматизация. Для того, чтобы извлекать признаки из текста предлагается использовать мешок слов, TF-IDF. Оценка качества модели представлена с помощью метрик precision, recall, f1-score.
Язык оригиналарусский
Страницы (с-по)326-330
Журнал ПРОЦЕССЫ УПРАВЛЕНИЯ И УСТОЙЧИВОСТЬ
Том6
Номер выпуска1
СостояниеОпубликовано - 2019
Опубликовано для внешнего пользованияДа

    Области исследований

  • machine learning, natural language processing, sentiment analysis, анализ тональности, машинное обучение, обработка естественного языка

ID: 78409095