Библиотека
|
ваш профиль |
Филология: научные исследования
Правильная ссылка на статью:
Жикулина К.П., Перфильева Н.В.
Коммуникативный потенциал русскоязычных и англоязычных голосовых систем
// Филология: научные исследования.
2023. № 7.
С. 39-49.
DOI: 10.7256/2454-0749.2023.7.40465 EDN: TUJKVM URL: https://nbpublish.com/library_read_article.php?id=40465
Коммуникативный потенциал русскоязычных и англоязычных голосовых систем
DOI: 10.7256/2454-0749.2023.7.40465EDN: TUJKVMДата направления статьи в редакцию: 15-04-2023Дата публикации: 04-08-2023Аннотация: В статье описывается проведенный анализ «спонтанного» диалога двух российских и зарубежных голосовых систем. Исследование является актуальным, так как в настоящее время не изучены возможности коммуникации введения «спонтанного» диалога русскоязычными и зарубежными голосовыми системами. Объектом исследования стали две русскоязычные системы – Алиса компании Яндекс и голосовой ассистент приложения Сбербанк и англоязычные голосовые системы – Siri компании Apple и Google Assistant, в том числе их русскоязычные версии. Выбор обусловлен их популярностью у носителей русского языка, которая определялась по запросам данных голосовых помощников в сети Интернет. Период выборки составил с 1 января 2021 года по 20 декабря 2022 года. Русскоязычные и англоязычные голосовые системы были выбраны методом сплошной выборки. В статье делаются выводы в том числе и о коммуникативных возможностях русскоязычных голосовых систем и зарубежных аналогов с встроенной функцией перевода на русский язык. Научной новизной является анализ «спонтанной» диалогической речи и анализ её соответствия нормам современного русского языка. В конце статьи подводятся итоги анализа зарубежных небольшим количеством вариантов фраз и выражений для генерации ответа пользователю на основании материалов из корпуса русского языка. Также, не редко выявляются черты машинного перевода в зарубежных голосовых аналогах в отличие от русскоязычных голосовых помощников. Ключевые слова: русскоязычная голосовая система, англоязычная голосовая система, голосовой ассистент, голосовой помощник, коммуникативная функция, машинный перевод, распознавание речи, вариативность, синтаксис, корпус русского языкаAbstract: The article describes the analysis of the "spontaneous" dialogue of two Russian and foreign voice systems. The study is relevant because the possibilities of communication of the introduction spontaneously dialogue between Russian-speaking and foreign voice systems have not been studied by now. The objects of research have become two Russian-speaking systems – Alice by Yandex, voice assistant application by Sberbank; two English voice systems – Siri by Apple Ink and Google Assistant, including their Russian version. The choice is due to their popularity among native speakers of the Russian language, which was determined by the requests of these voice assistants on the Internet. The sampling period was from January 1, 2021 to December 20, 2022. Russian-speaking and English-speaking voice systems were selected by a continuous sampling method. The article draws conclusions, including about the communicative capabilities of Russian-speaking voice systems and foreign analogues with a built-in translation function into Russian. The scientific novelty is the analysis of "spontaneous" dialogic speech and the analysis of its compliance with the norms of the modern Russian language. At the end of the article there are results of the analysis of foreign phrases and expressions with a small number of variants are summarized to generate a response to the user based on materials from the corpus of the Russian language. Also, it is not uncommon to identify features of machine translation in foreign voice analogues, unlike Russian-speaking voice assistants. Keywords: Russian-speaking voice system, English-speaking voice system, voice assistant, voice helper, communicative function, machine translation, speech recognition, variability, syntax, Russian language corpusВведение В последние пять лет цифровые или виртуальные технологии продолжают активно развиваться; голосовые помощники используются во многих сферах жизни: автомобильных навигаторах, системах поддержки банковских услуг, встроенных голосовых ассистентах социальных сетей, мессенджерах, онлайн-магазинах, умных часах, умных колонках и в «Умном доме» [6]. Биометрическая аутентификация, такая как сканирование отпечатков пальцев, повторное сканирование, распознавание лиц, голоса используется в интеллектуальных персональных помощниках. Системы в Интернете уже давно используют голос динамиков в качестве средства взаимодействия пользователя с машиной. Голосовые помощники, такие как Google Assistant, Amazon Alexa, Siri и другие, широко используются в домах для управления бытовой техникой с помощью интеллектуальных динамиков [5]. Отметим, что наименования голосовых систем в настоящее время не кодифицированы в словарях в статусе термина, однако активно употребляются в обозначениях голосовых систем, поэтому их можно рассматривать как терминоиды, за которыми в ближайшее время будет закреплён статус термина. Виртуальный ассистент – это искусственный интеллект, который способен распознавать голос пользователя и выполнять голосовые команды. В современном мире насчитывается около 100 видов голосовых помощников, цели и задачи которых сильно различаются [7]. У многих голосовых систем есть функция имитации живого общения с человеком, которая стала объектом исследования в языкознании, коммуникации и компьютерной лингвистике [8]. Статистический анализ голосовых помощников, взятый из статьи А.С. Яковлева «Лучшие голосовые помощники», выявил следующее: в 2022 году самым функциональным ассистентом в Европе стал голосовой помощник AmazonAlexa; самым отзывчивым помощником считают GoogleAssistant; самым распространённым голосовым помощником является Siriкорпорации ‘Apple’. Русскоязычная голосовая система Алиса компании «Яндекс» названа самым «разговорчивым» помощником [10]. Критерием выбора для исследования русскоязычных и англоязычных голосовых систем послужили данные, собранные компанией «Медиалогия», которая проводит мониторинг Интернет-пространства и учитывает количество запросов о голосовых помощниках в русскоязычном сегменте, а также отзывы о них на всех основных платформах соцмедиа. Обзор коммуникативных функций российских голосовых систем Исследование показало, что русскоязычные пользователи активно искали информацию о двух голосовых системах:Алиса компании Яндекс и голосовой ассистент Сбер. Представим обзор данных голосовых систем, выбор которых обусловлен популярностью у носителей русского языка. 1.Характеристики языкаголосовой системы Алиса Наибольшее количество запросов (420,1 тысяч упоминаний пользователями в Интернет-пространстве по данным «Медиалогии») было сделано по голосовому помощнику Алиса, созданную в 2016 году. Изначально голосовой помощник мог только находить информацию в Интернет-пространстве, а в 2021 году разработчики добавили в функционал Алисы распознавание человеческой речи, анализ голосового вербального материала, умение определять тему диалога и синтезировать ответ пользователю на материале корпуса электронных текстов. В настоящее время устныеразговоры с Алисой близки к естественной диалогической речи. Банк реплик голосового помощника основан на корпусе русскоязычных текстов и в основном соответствует нормам современного русского языка [9]. У голосового помощника Алиса большой потенциал вариантов ответа, которые невозможно предугадать. Для иллюстрации живого разговорного общения с голосовым помощником Алиса был проведён небольшой эксперимент. Эксперимент №1 Голосовой системе Алиса было задано 70 разных вопросов. Представим данные, полученные на один из них: «Алиса, ты по мне скучала?». Ответные реплики собирались до того момента, пока не начинался повтор ответа на вопрос. Общее количество полученных данных составляет 14 ответных реплик, представленных в Таблице 1. Таблица 1. Варианты ответных реплик голосовой системы Алиса на вопрос: «Ты по мне скучала?» Ответные реплики голосового помощника Алиса отвечают нормам современного русского языка. Активно используются разговорные варианты лексики, такие как междометие ха, глагол поболтать, наречие теперь. В активной лексике оказываются слова, используемые в повседневном общении, значение которых понятно всем носителям русского языка [3, с. 51]. Синтаксическому строю в репликах Алисы характерны инверсионные формы высказывания «скучала, и очень сильно», «по вам всегда скучаю», что соответствует конструкциям, которые часто употребляются в разговорной речи. А.А. Евтюгина подчёркивает, что разговорному стилю присуща грамматическая простота текста, доступность, которые выражаются в использовании несложных грамматических структур, большого количества глаголов, коротких предложений [2, с. 14]. В ответных репликах Алисы часто употребляются ироничные конструкции и лексика: «…а вы по кому-то ещё скучали?», «…все глаза выплакала», «…места себе не находила», «до сих пор скучаю». А.А. Евтюгина также подчёркивает что грамматическим особенностям разговорного стиля характерны незаконченные и не всегда упорядоченные конструкции предложений [2, с. 15]. Стоит отметить, что Алиса отвечает на вопросы прямо, не отклоняясь от темы. В некоторых вариантах можно увидеть попытку продлить диалог с человеком: «…а вы по мне?», «Как прошёл день?», «Как ваши дела?», «А вы по кому-то ещё скучали?». Другими словами, происходит имитация обиходно-разговорного диалога и реализуется коммуникативная цель – непосредственное общение между людьми (в нашем исследовании – между человеком и голосовым помощником) [2, с. 13]. Эксперимент №1 показал, что реплики голосовой системы соответствуют нормам современной разговорной речи носителей русского языка. Таким образом, можно сделать вывод, что голосовой помощник Алиса обладает высокой способностью вести «спонтанные» диалоги с человеком в соответствии с нормами разговорной речи: неподготовленность, непринуждённость и естественность. Естественность достигается с помощью соотношения естественного и семантического языка. Семантический язык представляет собой определённый набор элементарных семантических единиц, с помощью которых передаётся содержание естественного языка, а наибольшее число элементарных единиц даёт очень большое число возможных комбинаций [4, с. 151]. 2. Характеристики языка голосового ассистента Сбер На втором месте по количеству запросов (157,4 тысяч упоминаний пользователями в Интернет-пространстве по данным «Медиалогии») оказалась «семья» виртуальных русскоязычных ассистентов Сбербанка: Афина, Джой и Сбер. Для данных голосовых помощников характерен ограниченный функционал, и коммуникативная функция ведения «спонтанного» диалога не реализуется в полной мере. Афина, Джой и Сбер помогают пользователям совершать переводы денег и платежей, сообщают о состоянии счёта и т.д. Эксперимент №2 Голосовой системе Сбер были заданы те же вопросы, которые задавались голосовому помощнику Алиса. Представим данные, полученные на один из них: «Привет, ты по мне скучал?». Ответные реплики собирались до того момента, пока не начинался повтор ответа на вопрос. Общее количество полученных данных составляет 3 ответные реплики, представленные в Таблице 2. Таблица 2. Варианты ответных реплик голосового ассистента Сбер на вопрос: «Привет, ты по мне скучал?» Ответные реплики голосового ассистента Сбер не отличаются высокой вариативностью, как у голосового помощника Алиса, но являются более остроумными и сложными в построении высказываний и их компонентов. Если голосовая система Алиса использует простые предложения в ответных репликах, то у Сбера мы видим конструкции со сложным подчинением: «Я скучаю по вам, как Супермен по Криптону, когда он поднимает глаза в небо». Сложноподчинённые предложения – это манера изложения в деловом, научном и публицистическом стилях. Хотя деловая речь тяготеет к обобщённым названиям и понятиям, научная – к строгости и объективности высказываний, то можно сделать вывод, что голосовой ассистента Сбер выполняет несколько функций одновременно: эстетическую, деловую и коммуникативную [2, с. 8]. Во многих ответах Сбера содержатся пассивная лексика, то есть имена супергероев из американских сериалов, комиксов и серий книг, известные, в основном молодёжи: Супермен, Доктор Стрэндж и Вонг. На основании проведённого Эксперимента №2 можно сделать следующие выводы: ассистент не обладает функцией «спонтанного» диалога, так как в банке реплик присутствуют предложения со сложноподчиненными конструкциями, которые не являются типичными для разговорной речи. Сбер использует смешение стилей: официально-деловой и разговорный. Функциональная ограниченность голосового ассистента Сбер обусловлена целевой аудиторией, то есть пользователями, которые используют помощника для осуществления операций с деньгами в банке, где коммуникативная функция не является ведущей. Обзор коммуникативных функций зарубежных голосовых систем Исследование показало, что носители русского языка сделали наибольшее количество запросов по следующим зарубежным голосовым системам в сети Интернет:GoogleAssistant и Siriкорпорации ‘Apple’. Были получены следующие данные: 1. Характеристика языка голосового помощникаGoogleAssistant На первом месте по популярности среди русскоязычных носителей (108,6 тысяч упоминаний в Интернет-пространстве по данным «Медиалогии»)оказался GoogleAssistant. Данный голосовой помощник был разработан на основе собственной технологии искусственного интеллекта корпорации ‘Google’, установлен на более, чем 1 миллиарде устройств в мире, доступен в использовании в 90 странах и «говорит» на 30 языках [9]. Представим данные проведённого эксперимента возможности GoogleAssistant ведения диалога на русском языке. Эксперимент №3 Голосовому помощнику GoogleAssistantбыло задано 70 вопросов, приведем в пример ответные реплики на один из них: «Привет, ты по мне скучал?». Ответные реплики собирались до того момента, пока не начинался повтор ответа на вопрос. Общее количество полученных данных составляет 3 ответные реплики, представленные в Таблице 3. Таблица 3. Варианты ответных реплик голосового помощника Google Assistant на вопрос: «Привет, ты по мне скучал?» Анализ ответных реплик GoogleAssistantпоказывает меньшее количество вариантов ответных реплик. На вопрос «Ты по мне скучал?» голосовой помощник 6 раз подряд отвечает «очень», только после этого появляется не однословные ответные реплики. В структуре реплик GoogleAssistant используется односоставное определенно-личное предложение: «Так давайте общаться чаще». В таких предложениях выражается действие, соотнесённое с определённым деятелем, который словесно не обозначен. Мы знаем, что английскому языку – язык разработчиков GoogleAssistant – свойственна грамматическая временная парадигма, поэтому и в русскоязычном варианте реплик голосового помощника она выражается с помощью конструкций определённо-личных предложений. Синтаксическое значение времени в подобных синтаксических конструкциях либо получает конкретное выражение настоящего и будущего в формах изъявительного наклонения, либо проявляется как обобщённость – в форме повелительного наклонения. Специфика определённо-личных предложений определяется в неполноте временной парадигмы и конкретное предложение не может быть переведено, например, в прошедшее время без изменения структуры [3, с. 385-386]. На основании этого можно сделать вывод, что голосовой помощник GoogleAssistant использует определённо-личное предложение не для реализации коммуникативной функции разговорного стиля речи, а для подстраивания временных рамок английского языка в соответствии с похожими моделями синтаксиса в русском языке. Проведенный Эксперимент №3 показал, что для русскоязычного функционала ответных реплик GoogleAssistant не характерна функция ведения «спонтанного» диалога. Построение фраз на русском языке, скорее всего, основано на алгоритмах машинного перевода с английского языка. 2. Характеристики языка голосового помощника Siri Второе место по популярности среди российских пользователей (106,8 тысяч упоминаний в Интернет-пространстве по данным «Медиалогии»). занимает Siri компании ‘Apple’, её считают совершенным коммуникативным голосовым помощником XXI века. Siriпервой получила функцию говорения (на английском языке). В настоящее времяSiri поддерживает диалог с человеком, используя разные технологии голосового синтеза. Siriумеет запоминать привычки своего пользователя и обладает совершенной коммуникативной функцией на английском языке: она способна быть инициатором диалога [9]. Представим данный эксперимент с возможностямиSiri ведения диалога на русском языке. Эксперимент №4 Голосовой системе Siri было задано около 70 вопросов, в пример приведём ответные реплики на один из них: «Siri, ты по мне скучала?». Ответные реплики собирались до того момента, пока не начинался повтор ответа на вопрос. Общее количество полученных данных составляет 3 ответные реплики, представленные в Таблице 4. Таблица 4. Варианты ответных реплик голосовой системы Siri на вопрос: «Ты по мне скучала?» Коммуникативные возможности голосового помощника Siri часто не соответствуют нормам современного русского языка. На вопрос «Ты по мне скучала?» она даёт уклончивый ответ: «Я же постоянно с вами…». Можно предположить, что на построение предложений у Siriвлияет функция машинного перевода, для которого характерны конструкции с подчинительной связью и порядком слов, не отвечающим нормам современного русского языка и разговорному стилю: «Вместо того, чтобы скучать по вам, я всегда остаюсь с вами». Для грамматических особенностей разговорного стиля в русском языке характерны структуры простых предложений с прямым порядком слов, среди которых преобладают разные виды неполных предложений. Неполнота предложений обычно восполняется ситуацией и делает их естественными и понятными [2, с. 16]. Хотя реплики Siri и сохраняют разговорно-обиходный стиль – неформальное общение, можно сказать, что они осложнены: «Вместо того, чтобы скучать по вам, я всегда остаюсь с вами». Также, мы видим, что в отличие от русскоязычного голосового помощника Алиса, Siri не задаёт дополнительных вопросов пользователю с целью продолжения коммуникации, а выступает посредственным коммуникантом. Таким образом, функция «спонтанного» диалога у голосовой системы Siri и диалогические реплики представляют собой тексты, вероятно, полученные с помощью машинного перевода. Заключение В своей работе «Моделирование системы языка в аспекте языковой личности» В.Н. Денисенко говорит следующее: «Исследователь языка как системы неизменно встречается со многими противоречиями этой системы и рано или поздно задумывается над тем, что стоит за её границами и не кроются ли многие особенности в том, что к этой системе и не относится, но без чего тем не менее она не может существовать». Там же, В.Н. Денисенко подчёркивает, что моделирование некоторых систем имеет свои особенности и из-за этого подобные модели не всегда поддаются экспериментальной проверке [1, с. 139]. Исследовав коммуникативный потенциал русскоязычных и англоязычных голосовых систем; подробно проанализировав возможности ведения «спонтанного» диалога у русскоязычного голосового помощника Алиса, голосового ассистента Сбер и зарубежных аналогов GoogleAssistant и Siriсо встроенными опциями коммуникации на русском языке, мы можем сделать вывод, что язык голосовой системы Алиса оказался намного ближе по интересам русскоязычной аудитории, так как языковой потенциал данного голосового помощника не только соответствует нормам современного русского языка, но и показывает интересный результат при анализе языкового вербального материала от пользователя. Также, голосовой помощник способен продолжать разговор на обиходно-бытовые темы, задавать дополнительные вопросы и использовать активную и пассивную лексику. Количество вариантов ответных реплик у Алисы значительно преобладает над возможностями других голосовых систем, исследованных в данной статье. Анализ языка, используемого голосовым ассистентом Сбер, выявил, что в его ответных репликах содержится смешение стилей: официально-делового и разговорного. Это обусловлено тем, что данный голосовой ассистент предназначен не для массового использования, а для ограниченной аудитории. Однако синтаксический анализ реплик показывает, что помощник Сбер использует сложные конструкции предложений с подчинительной связью, что соответствует нормам современного русского языка. Более того, в лексике у ассистента содержатся наименования, популяризированные для нашего лингвистического времени – имена героев известных супергероев и отсылка к сюжетам, связанным с их приключениями. Зарубежные голосовые помощники GoogleAssistant и Siri со встроенными функциями перевода на русский язык часто используют сложные конструкции предложений, инверсивный порядок слов, смешение функциональных стилей речи. Это позволяет нам предполагать, что подобное построение фраз, предложений, а также лексический строй подбирается не человеком, а основан на машинном переводе, без использования корпуса русскоязычных текстов. На основании этого можно утверждать, что большинство реплик не соответствует нормам современного русского языка, поэтому голосовые системы не пользуются большой популярностью у русскоязычных пользователей. Также, при анализе коммуникативного потенциала GoogleAssistant видно, что изначально данный голосовой ассистент создавался не для коммуникации, а для быстрого сбора информации в поисковой системе Google. Подводя итоги, стоит отметить, что русскоязычные голосовые системы отличаются интересными генерациями текстов и во многом соответствуют нормам современного русского языка. Популярность русскоязычных голосовых систем стремительно возрастает за счёт развивающихся коммуникативных возможностей и обновлениям корпусов текста разработчиками и пользователями. В будущем русскоязычные голосовые системы, направленные на массовое использование, могут развить функцию «спонтанного» диалога с человеком до высокого уровня, с практически незаметными отклонениями от норм естественной человеческой речи.
Библиография
1. Валентинова О.И., Денисенко В.Н., Преображенский С.Ю., Рыбаков М.А. Системный взгляд как основа филологической мысли. – М.: Издательский Дом ЯСК, 2016. – 440 с.
2. Евтюгина А.А.. Функциональная стилистика / учебн. Пособие / Екатеринбург: Изд-во Рос. гос. проф.-пед. ун-та, 2018. – 75 с. 3. Лекант П.А. Современный русский язык : учебник для бакалавров / П. А. Лекант, Е. И. Диброва, Л. Л. Касаткин, Е. В. Клобуков / под ред. П. А. Леканта. — 5-е изд. — М. : Издательство Юрайт, 2014. — 559 с. 4. Красина Е.А., Перфильева Н.В. Основы филологии: лингвистические парадигмы: учеб. пособие / – 3-е изд., стер.– М.: ФЛИНТА: Наука, 2016. – 408 с. 5. Acharya R., Kotta H., Patil A.T., Patil H.A. (2021) Energy Separation Based Features for Replay Spoof Detection for Voice Assistant / Virtual, Toronto / URL: https://eurasip.org/Proceedings/Eusipco/Eusipco2020/pdfs/0000386.pdf (accessed 14.04.2023) 6. Hoy M.B. (2018) Alexa, SIRI, cortana, and more: An introduction to voice assistants / Medical Reference Services Quarterly, vol. 37, no. 1, pp. 81– 88. 7. Kim S., Choudhuy A. (2021). Exploring older adults’ perception and use of smart speaker-based voice assistants: A longitudinal study. Computers in Human Behavior. URL: https://doi.org/10.1016/j.chb.2021.106914 (accessed 11.01.2023) 8. Nicola Combe, David Harrison, Hua Dong, Salmaan Craig & Zachary Gill (2011) Assessing the number of users who are excluded by domestic heating controls, International Journal of Sustainable Engineering, 4:1, pp. 84-92. 9. [электронный ресурс] Медиалогия – автоматической системы мониторинга и анализа СМИ и соцмедиа в режиме реального времени / URL: https://www.mlg.ru/~UG0qb (дата обращения: 04.10.2023) 10. [электронный ресурс] Яковлев А.С., Лучшие голосовые помощники / 2022 / URL: https://smarthomegadget.ru/luchshie-golosovye-pomoshhniki/?ysclid=laamncty9l444180884 (дата обращения: 02.10.2023) References
1. Valentinova O.I., Denisenko V.N., Preobrazhensky S.Yu., Rybakov M.A. System view as the basis of philological thought. – Moscow: Publishing House YASK, 2016. – 440 p.
2. Yevtyugina A.A. Functional stylistics / textbook. Manual / Yekaterinburg: Publishing house of the Russian State Prof.-ped. un-ta, 2018. – 75 p. 3. Lekant P.A. Modern Russian language : textbook for bachelors / P. A. Lekant, E. I. Dibrova, L. L. Kasatkin, E. V. Klobukov / edited by P. A. Lekant.-5th ed. — Moscow : Yurayt Publishing House, 2014. — 559 p. 4. Krasina E.A., Perfilieva N.V. Fundamentals of philology: linguistic paradigms: textbook. manual / – 3rd ed., ster.– M.: FLINT: Nauka, 2016. – 408 p. 5. Acharya R., Kotta H., Patil A.T., Patil H.A. (2021) Energy Separation Based Features for Replay Spoof Detection for Voice Assistant / Virtual, Toronto / URL: https://eurasip.org/Proceedings/Eusipco/Eusipco2020/pdfs/0000386.pdf (accessed 14.04.2023) 6. Hoy M.B. (2018) Alexa, SIRI, cortana, and more: An introduction to voice assistants / Medical Reference Services Quarterly, vol. 37, no. 1, pp. 81– 88. 7. Kim S., Choudhuy A. (2021). Exploring older adults’ perception and use of smart speaker-based voice assistants: A longitudinal study. Computers in Human Behavior. URL: https://doi.org/10.1016/j.chb.2021.106914 (accessed 11.01.2023) 8. Nicola Combe, David Harrison, Hua Dong, Salmaan Craig & Zachary Gill (2011) Assessing the number of users who are excluded by domestic heating controls, International Journal of Sustainable Engineering, 4:1, pp. 84-92. 9. [electronic resource] Medialogia – automatic monitoring and analysis system of mass media and social media in real time / URL: https://www.mlg.ru /~UG0qb (accessed: 04.10.2023) 10. [electronic resource] Yakovlev A.S., The best voice assistants / 2022 / URL: https://smarthomegadget.ru/luchshie-golosovye-pomoshhniki /?ysclid=laamncty9l444180884 (accessed: 02.10.2023)
Результаты процедуры рецензирования статьи
В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
|