Правильная ссылка на статью:
Никитин П.В., Осипов А.В., Плешакова Е.С., Корчагин С.А., Горохова Р.И., Гатауллин С.Т..
Распознавание эмоций по аудио сигналам как один из способов борьбы с телефонным мошенничеством
// Программные системы и вычислительные методы. – 2022. – № 3.
– С. 1-13.
DOI: 10.7256/2454-0714.2022.3.38674.
DOI: 10.7256/2454-0714.2022.3.38674
Читать статью
Аннотация: Актуальность исследования продиктована современным состоянием в области телефонного мошенничества. Согласно исследованиям, проводимые «Лабораторией Касперского» доля пользователей, столкнувшихся весной 2022 года с различными нежелательными, спам-звонками, была на уровне 71%. Предметом исследования являются технологии машинного и глубокого обучения для определения эмоций по тембру голоса. Авторами подробно рассматривают такие аспекты как: создание размеченного датасета; преобразование звукового формата WAV в числовой вид, удобный для быстрой обработки; методам машинного обучения для решения задачи многоклассовой классификации; построению и оптимизации архитектуры нейросети, для определения эмоций в реальном времени. Особым вкладом в исследование темы является то, что авторами был реализован быстрый способ преобразования звуковых форматов в числовые мел-кепстральные коэффициенты, что значительно повысило скорость обработки данных, практически не пожертвовав их информативностью. В следствии этого обучение моделей алгоритмами машинного обучения происходило быстро и качественно. Особо отметим, что была смоделирована архитектура сверточной нейронной сети, которая позволила получить качество обучения модели до 98%. Модель получилась легковесной и была взята за основу обучения модели по определению эмоций в реальном времени. Результаты работы модели в реальном времени были сопоставимы с результатами обученной модели. Разработанные алгоритмы могут быть внедрены в работы сотовых операторов или банков в борьбе с телефонным мошенничеством. Статья подготовлена в рамках государственного задания Правительства Российской Федерации Финансовому университету на 2022 год по теме «Модели и методы распознавания текстов в системах противодействия телефонному мошенничеству» (ВТК-ГЗ-ПИ-30-2022).
Ключевые слова: мошенничество, телефонное мошенничество, искусственный интеллект, машинное обучение, нейросетевое обучение, классификация, сверточные нейронные сети, мел-кепстральные коэффициенты, информационная безопасность, эмоции
Библиография:
Janssen R.J., Mourão-Miranda J., Schnack H.G. 2018. Making Individual Prognoses in Psychiatry Using Neuroimaging and Machine Learning. Biological Psychiatry: Cognitive Neuroscience and Neuroimaging. 3(9):798-808. DOI: 10.1016/j.bpsc.2018.04.004
Durstewitz D., Koppe G., Meyer-Lindenberg A. Deep neural networks in psychiatry. Molecular Psychiatry. 2019; 24:1583-1598. (In Eng.). DOI: 10.1038/s41380-019-0365-9
Tatarintsev, M.; Korchagin, S.; Nikitin, P.; Gorokhova, R.; Bystrenina, I.; Serdechnyy, D. 2021. Analysis of the forecast price as a factor of sustainable development of agriculture. Agronomy, 11, 1235. https://doi.org/10.3390/agronomy11061235.
Shah, K., Patel, H., Sanghvi, D., & Shah, M. (2020). A comparative analysis of logistic regression, random forest and KNN models for the text classification. Augmented Human Research. 5(1). pp. 1-16.
Pranckevičius T., Marcinkevičius V. Comparison of naive bayes, random forest, decision tree, support vector machines, and logistic regression