Библиотека
|
ваш профиль |
Litera
Правильная ссылка на статью:
Лю Ц.
Модель «машинный перевод + постмашинное редактирование перевода» на платформе YiCAT: на примере дисциплины «Стилистическое постмашинное редактирование текста» для студентов первого курса магистратуры Высшей школы перевода МГУ
// Litera.
2024. № 8.
С. 90-99.
DOI: 10.25136/2409-8698.2024.8.71506 EDN: MYZKDK URL: https://nbpublish.com/library_read_article.php?id=71506
Модель «машинный перевод + постмашинное редактирование перевода» на платформе YiCAT: на примере дисциплины «Стилистическое постмашинное редактирование текста» для студентов первого курса магистратуры Высшей школы перевода МГУ
DOI: 10.25136/2409-8698.2024.8.71506EDN: MYZKDKДата направления статьи в редакцию: 13-08-2024Дата публикации: 20-08-2024Аннотация: В данной статье автором анализируется процесс машинного перевода и постмашинного редактирования китайскими студентами на занятиях по дисциплине «Стилистическое постмашинное редактирование текста» при помощи платформы для перевода YiCAT, которая использует модель сочетания машинного перевода и постмашинного редактирования в целях организации учебного процесса и распределения учебного времени. Правительство России в 2017 году утвердило «План цифровой экономики Российской Федерации», в результате чего процесс цифровизации постепенно проник во все научные сферы. Автор статьи приходит к выводу о том, что российским университетам следует обращать большее внимание на обучение машинному переводу и постмашинному редактированию перевода. Помимо этого, в статье представлена идея о том, что кафедры перевода современных университетов должны фокусироваться на внедрении и применении переводческих технологий и новейших инструментов перевода в рамках обучения навыкам перевода. В России имеется лишь несколько сотен статей, затрагивающих особенности машинного перевода. Большинство из них посвящены изучению имеющихся ограничений, возможностей развития и путей улучшения систем машинного перевода. В то же время статей, затрагивающих особенности постмашинного редактирования текста перевода, представлено чрезвычайно мало. Число таких статей не превышает нескольких десятков. Таким образом, в области исследований постмашинного редактирования перевода существует множество вызовов, которые следует решить как можно скорее для того, чтобы сфера постмашинного редактирования перевода могла соответствовать эпохе искусственного интеллекта. Одновременно с этим российским вузам следует обратить внимание на преподавание дисциплин, затрагивающих средства машинного перевода и навыки постмашинного редактирования. Крупные переводческие факультеты должны активно использовать переводческие технологии и инструменты машинного перевода на занятиях, добавлять новые учебные дисциплины, подразумевающие ознакомление и применение студентами подобных технологий и инструментов, а также встраивать такие дисциплины в рамки имеющихся программ обучения специалистов в области перевода. Все это позволит вузам сформировать надежную основу для воспитания современных и квалифицированных специалистов, отвечающих требованиям новой эпохи. Ключевые слова: постмашинное редактирование перевода, китайско-русский машинный перевод, план обучения специалистов, платформа для перевода, новая модель перевода, Высшая школа перевода, эпоха искусственного интеллекта, обучение навыкам перевода, переводческая деятельность, новая эпохаAbstract: In this article, the author analyzes the process of machine translation and post-machine editing by Chinese students in classes on the discipline "Stylistic post-machine text editing" using the YiCAT translation platform, which uses a model of combining machine translation and post-machine editing in order to organize the educational process and allocate study time. In 2017, the Russian government approved the "Digital Economy Plan of the Russian Federation", as a result of which the digitalization process gradually penetrated into all scientific spheres. The author of the article concludes that Russian universities should pay more attention to teaching machine translation and post-machine translation editing. In addition, the article presents the idea that the translation departments of modern universities should focus on the introduction and application of translation technologies and the latest translation tools in the framework of teaching translation skills. There are only a few hundred articles in Russia dealing with the specifics of machine translation. Most of them are devoted to the study of existing limitations, development opportunities and ways to improve machine translation systems. At the same time, there are extremely few articles dealing with the features of post-machine editing of the translation text. The number of such articles does not exceed several dozen. Thus, there are many challenges in the field of post-machine translation editing research that should be addressed as soon as possible so that the field of post-machine translation editing can correspond to the era of artificial intelligence. At the same time, Russian universities should pay attention to the teaching of disciplines involving machine translation tools and post-machine editing skills. Large translation faculties should actively use translation technologies and machine translation tools in the classroom, add new academic disciplines implying the familiarization and application of such technologies and tools by students, as well as integrate such disciplines into the framework of existing training programs for specialists in the field of translation. All this will allow universities to form a reliable basis for the education of modern and qualified specialists who meet the requirements of the new era. Keywords: post-machine translation editing, Chinese-Russian machine translation, specialist training plan, translation platform, the new translation model, Higher School of Translation, the era of artificial intelligence, learning translation skills, translation activities, A new era
Введение Машинный перевод (Machine Translation, MT), также известный как автоматический перевод или компьютерный перевод, — это процесс применения компьютеров для преобразования текста на одном естественном языке (исходный язык) в текст на другом естественном языке (целевой язык). По мере бурного развития интернет-технологий, а также стремительного расширения объемов информации, представленной на различных языках, технология машинного перевода постепенно перестала быть исключительно развлекательной, став эффективным инструментом преодоления естественных языковых барьеров в обществе. В условиях постепенного развития технологии машинного перевода все больше исследователей обращает внимание на вопрос возможностей постмашинного редактирования перевода [1]. В настоящее время машинный перевод во многих случаях помогает или даже заменяет человека при переводе. Однако, несмотря на быстрое развитие данной технологии, машинный перевод по-прежнему имеет определенные качественные недостатки. На практике переводчикам сложно выполнить большой объем переводческой работы за ограниченное время в современных рабочих условиях, используя только человеческие ресурсы. Вместо этого многие переводчики используют средства машинного перевода, а также выполняют постмашинное редактирование перевода. Таким образом, постмашинное редактирование текста является необходимым компонентом в работе современных письменных переводчиков. Однако, как в России, так и в Китае существуют пробелы в области построения систем оценки сложности постмашинного редактирования, проектирования вспомогательных систем перевода, а также разработки и исследований инструментов постмашинного редактирования. Помимо этого, в России имеется лишь несколько сотен статей, затрагивающих особенности машинного перевода. Большинство из них посвящены изучению имеющихся ограничений, возможностей развития и путей улучшения систем машинного перевода. В то же время статей, затрагивающих особенности постмашинного редактирования текста перевода, представлено чрезвычайно мало. Число таких статей не превышает нескольких десятков. Таким образом, в области исследований постмашинного редактирования перевода существует множество вызовов, которые следует решить как можно скорее для того, чтобы сфера постмашинного редактирования перевода могла соответствовать эпохе искусственного интеллекта. Одновременно с этим российским вузам следует обратить внимание на преподавание дисциплин, затрагивающих средства машинного перевода и навыки постмашинного редактирования. Крупные переводческие факультеты должны активно использовать переводческие технологии и инструменты машинного перевода на занятиях, добавлять новые учебные дисциплины, подразумевающие ознакомление и применение студентами подобных технологий и инструментов, а также встраивать такие дисциплины в рамки имеющихся программ обучения специалистов в области перевода. Все это позволит вузам сформировать надежную основу для воспитания современных и квалифицированных специалистов, отвечающих требованиям новой эпохи. Данный вопрос уже был актуализирован некоторое время назад. Так, в четвертом выпуске журнала «Вестник Московского государственного университета» за 2019 год декан факультета «Высшая школа перевода» Гарбовский Н. К. совместно с заместителем декана факультета Костиковой О. И. опубликовали статью «ИНТЕЛЛЕКТ ДЛЯ ПЕРЕВОДА: ИСКУСНЫЙ ИЛИ ИСКУССТВЕННЫЙ?». Авторы статьи утверждают следующее: «Сегодня рождается новое понятие — «цифровой перевод», определяющее новый вид технологии перевода, систему сетевого взаимодействия переводчика и цифровых информационно-коммуникационных средств, искусственного интеллекта (ИИ), призванный повысить эффективность переводческого искусства и качество переводческой продукции. Перевод в цифровую эпоху представляет собой сложную систему противоречивых отношений в биноме «человек — умная машина» [2]. Помимо этого, в 2022 году Гарбовский Н. К. и Костикова О. И. сформировали учебно-исследовательскую группу. В состав группы вошли 3 преподавателя китайского языка Высшей школы перевода МГУ и 4 аспиранта. В результате исследования с 8 февраля 2022 года была запущена новая дисциплина для китайских студентов первого курса магистратуры под названием «Стилистическое постмашинное редактирование текста». Причина создания данной дисциплины заключается в том, чтобы соответствовать тенденциям развития эпохи искусственного интеллекта, а также в обновлении программы обучения специалистов для развития всесторонних переводческих компетенций, отвечающих потребностям современных цифровых технологий. 1.Организация дисциплины «Стилистическое постмашинное редактирование текста» При подготовке программы дисциплины авторы изучили и проанализировали множество источников на русском и китайском языке, включавших научную литературу и статьи, которые затрагивали процесс обучения навыкам постмашинного редактирования перевода. Было установлено, что большая часть существующих исследований сосредоточена на ошибках и стратегиях англо-русского машинного перевода. Небольшое количество исследований было посвящено ошибкам и стратегиям перевода в рамках китайско-русского машинного перевода. Существует лишь несколько исследований, посвященных процессу обучения постмашинному редактированию китайско-русского перевода, а также типам ошибок, возникающих в процессе постмашинного редактирования, и методам их исправления. При этом в представленных исследованиях в основном использовались такие средства машинного перевода как Google Translate и Deepl Translator, в результате чего у данных исследований имеется единый объект, в то время как полученные результаты не имеют широкого применения. Поскольку разные языки имеют различные лингвистические характеристики, а разные системы перевода - разные характеристики перевода, типы ошибок в машинном переводе отличаются. Программа обучения и профессиональной подготовки по данной дисциплине должна охватывать такие аспекты, как технологии машинного перевода, стратегии постмашинного редактирования перевода, лингвистические знания и т. д. Существуют некоторые исследования, в которых рассматривается отношение студентов к постмашинному редактированию перевода и их пользовательский опыт, а также способы разработки эффективных учебных программ по постмашинному редактированию [3]. Данные исследования стали источником важной информации о возможностях постмашинного редактирования при подготовке соответствующей дисциплины. «Стилистическое постмашинное редактирование текста» — это обязательный курс второго семестра для студентов магистратуры первого курса, который дает 2 кредита и подразумевает освоение программы в течение 72 академических часов (32 академических часа отводится на занятия лекционного типа и семинарского типа; 40 академических часов отводится на самостоятельную работу обучающихся). Содержание дисциплины разделено на следующие модули: 1. Ознакомление с существующими программами машинного перевода, сравнительный анализ преимуществ и недостатков каждой программы; 2. Постмашинное редактирование перевода по теме «новости»; 3. Постмашинное редактирование перевода по теме «общественные тексты»; 4. Постмашинное редактирование перевода по теме «кулинария и ресторанное меню»; 5. Постмашинное редактирование перевода по теме «инструкции»; 6. Постмашинное редактирование перевода по теме «описание города»; 7. Постмашинное редактирование перевода по теме «деловая переписка».
Результаты обучения по дисциплине:
Итоговой экзамен по дисциплине проводится в форме зачета с соответствующими вариантами оценки: зачтено/ не зачтено. 2. Учебная платформа для дисциплины «Стилистическое постмашинное редактирование текста» YiCAT (oфициальный сайт YiСat: https://www.yicat.vip)— это онлайн-платформа управления переводами, разработанная компанией Shanghai Yizhe Information Technology Co., Ltd. (Tmxmal), цель которой заключается в том, чтобы предоставлять пользователям более быстрые и эффективные решения по переводу и локализации. С момента своего запуска на платформе YiCAT поддерживается профессиональный уровень обслуживания, а также ведутся разработки новых решений в таких областях, как анализ многоязыковых больших данных, машинный перевод с применением искусственного интеллекта, обработка естественного языка, интеллектуальная обработка текста и обработка файлов в различном формате и т. д. Платформа YiCAT предлагает пользователям на выбор множество продуктов, включая групповую версию, корпоративную версию и университетскую версию платформы. Любую версию платформы можно бесплатно использовать по запросу, что очень удобно для пользователей. В результате проведенного сопоставления нескольких схожих платформ мы пришли к выводу о том, что YiCAT действительно является подходящим средством для преподавания и практики в рамках дисциплины постамашинного редактирования. Данная платформа подходит для преподавательской деятельности по переводу, основанной на реальных переводческих проектах, что позволяет преподавателям выполнять задачу по обучению наиболее качественно и системно, а также надлежащим образом воспитывать специалистов, сочетающих как языковые, так и необходимые технические навыки. Ключевые причины выбора данной платформы следующие: 1. Платформа практики перевода, идеально подходящая для студентов Процесс перевода отображается визуально. Преподаватели могут в любое время проверять ход выполнения заданий учащихся. Они могут настраивать различные опции, такие как самостоятельная оценка студентов, взаимная оценка и оценка преподавателя, а также накапливать корпус перевода в процессе практики. 2. Интеграция нескольких систем машинного перевода Платформа подключена к десяткам китайских и зарубежных систем машинного перевода, таких как Google и Baidu, между которыми происходит плавное переключение в процессе работы. На платформе поддерживается процесс редактирования машинного перевода, а также функция быстрого вызова средств машинного перевода для удовлетворения потребностей отдельных проектов и задач. 3. Глубокая интеграция технологий искусственного интеллекта В сочетании с алгоритмами искусственного интеллекта платформа может автоматически наполнять перевод специальными отметками, автоматически оптимизировать результаты машинного перевода, а также интегрировать указанную терминологическую базу данных или базу памяти в результаты машинного перевода, позволяя пользователю удобнее внедрять перевод в работу. 4. Поддержка 30 основных форматов файлов Платформа поддерживает 30 форматов файлов, таких как doc/docx, xls/xlsx, ppt/pptx, pdf, txt, html и т. д. 5. Наличие 46 языков Платформа использует 46 языков, в том числе: китайский, английский, японский, корейский, русский, немецкий, испанский и португальский. 6. Сохранение формата файлов Платформа поддерживает экспорт в 30 файловых форматов. Экспортируемое оформление и содержание остается неизменным, в то время как открытие и чтение документов становится более удобным для пользователя. 7. Сохранение записей перевода Платформа сохраняет записи о сделанных переводах. При повторном скачивании не требуется дополнительная оплата. 8. Преобразование PDF-документов На платформе поддерживается функция преобразования PDF в форматы Word, PPT и Excel с точным сохранением содержания и оформления исходного файла. 9. Упрощение процесса обучения и интегрированное управление При помощи данной платформы преподаватель может объединять разработки учебных курсов и программ, формировать классы, подготавливать домашние задания и экзамены, осуществлять корректировку перевода, а также использовать иные функции. Все это позволяет сделать процесс обучения переводу проще, реализовать его в более замкнутом формате. Процесс управления выглядит следующим образом: Максимальное количество студентов — более 500 человек; количество файлов в одном проекте — 300; количество предложений в одной базе памяти — 3 000 000; количество записей в терминологическом корпусе — до 1000. Этапы обучения в рамках дисциплины «Стилистическое постмашинное редактирование текста» 1. Эффективное распределение учебных часов и разделение 16 занятий на пять этапов обучения. Вступительный этап (1-я и 2-я недели обучения). Студенты знакомятся с процессом работы платформы YiCAT и средств машинного перевода, выполняют простые упражнения по машинному переводу новостных статей, а также выполняют редактирование машинного перевода. На этом этапе стоит задача дать студентам быстрее привыкнуть к применению платформы. Предполагается, что студенты уже встречались ранее с новостными статьями во время обучения в бакалавриате. Независимо от того, практикуются ли студенты в аудировании или в чтении, большинство выбирает новостной стиль, который требуется при переводе новостных текстов. Поскольку учащиеся только находятся на вступительном этапе дисциплины, чтобы уменьшить чрезмерную тревогу, связанную с обучением, преподаватель может снизить сложность заданий и дать задания для группового выполнения. Это также позволит студентам развивать навыки работы в команде. Начальный этап (с 3-ей по 6-ю неделю обучения). Студенты уже знакомы с правилами использования платформы. Студенты могут попытаться перевести тексты базового характера, такие как общественные тексты или ресторанные меню. Тексты такого типа тесно связаны с жизнью студентов и достаточно просты с точки зрения грамматической структуры, что делает их умеренно сложными для перевода. Данный подход позволяет повысить интерес учащихся к редактированию машинного перевода. Продвинутый этап (с 7-ой по 10-ю неделю обучения). Для того, чтобы осуществить плавный процесс обучения и постепенно повысить уровень сложности, на данном этапе происходит изменение содержания переводческих задач. В частности, происходит переход от перевода коротких общественных текстов к более длинным предложениям, представленных в инструкциях. При переводе инструкций машинный перевод имеет множество весомых преимуществ. Например, с помощью лингвистических корпусов или базы больших данных машина может точно подобрать нужный вариант перевода отдельных терминов, что значительно повышает эффективность работы переводчика. Финальный этап (с 11-ой по 15-ую неделю обучения). После 10 недель обучения студенты могут перейти к практике перевода текстов различных стилей. К примеру, возможен перевод на тему городского описания или деловой переписки. Преподаватели проводят проверку окончательного перевода, после чего оставляют свои комментарии. Помимо этого, преподаватели осуществляют корректировки перевода, делают отметки и выбирают лучший перевод при помощи специальных инструментов на платформе. Во время обсуждения переводов в классе все студенты делятся своим переводом. Студенты суммируют виды ошибок машинного перевода и предлагают соответствующие стратегии перевода для каждого неправильного варианта. На основе определенных стратегий перевода студенты повторно просматривают переводы каждой группы и составляют отчеты, указывая на ошибки, возникшие после собственного редактирования машинного перевода. В течение контрольного периода (16-я неделя) в конце семестра организуется устный и письменный экзамены.
Заключение Инструменты перевода на основе применения искусственного интеллекта являются современным и быстрым методом перевода, повышающим эффективность работы переводчика. Однако у данного метода существует ряд определенных недостатков. В настоящее время постмашинное редактирование перевода особенно важно. При этом систематическое обучение стратегиям перевода и воспитание более развитого мышления у переводчиков, выполняющих постмашинное редактирование перевода, является еще более важной задачей[4]. С помощью платформы YiCAT учащиеся могут проходить курсы постмашинного редактирования перевода, что значительно повышает эффективность их обучения и позволяет преподавателям в режиме реального времени отслеживать прогресс студентов, выполняющих задания. Помимо этого, на платформе происходит архивирование данных и коммуникация участников процесса обучения, что позволяет преподавателям проводить оценку результатов и успеваемости студентов в любое время. Данные о процессе обучения также позволяют проследить закономерности в приобретении учащимися знаний о переводе, что дает возможность преподавателям корректировать учебные материалы с учетом ошибок учащихся при переводе. Это значительно оптимизирует эффективность обучения. По сравнению с традиционными моделями обучения под руководством преподавателя, студенты чувствуют большее удовлетворение при использовании модели онлайн-обучения постмашинного редактирования, которая также повышает их чувство сопричастности. Таким образом, модель, применяющая сочетание машинного перевода и постмашинного редактирования, закладывает основу для развития специалистов в области перевода, требующихся в условиях новой эпохи.
Библиография
1. 肖志清,金鸣.国内机器翻译译后编辑研究现状、问题与展望——基于中国知网数据库(1995—2022 年)[J]. 民族翻译,2022(04):68-76.) (Сяо Чжицин, Цзинь Мин. Современное состояние, проблемы и перспективы исследований постмашинного редактирования перевода в Китае: на основе базы данных CNKI (1995–2022 гг.). Национальный перевод. 2022 (04): 68–76).
2. Гарбовский, Н. К., Костикова О. И. Интеллект для перевода: искусный или искусственный? // Вестн. Моск. ун-та. Сер. 22.Теория перевода. 2019. №4. С. 3-25. 3. 王华树, 刘世界.人工智能时代翻译技术转向研究[J]. 外语教学, 2021(05):42. (Ван Хуашу, Лю Шицзе. Изменения в технологии перевода в эпоху искусственного интеллекта. Обучение иностранным языкам. 2021 (05): 42). 4. 程维,魏子杭.翻译技术教学中的高阶思维培养 [J].上海翻译,2021(3):39-44.(Чэн Вэй, Вэй Цзыхан. Воспитание развитого мышления в преподавании технологиям перевода. Шанхайский перевод. 2021(3): 39-44. References
1. Xiao, Z., & Jin, M. (2022). Current status, problems and prospects of post-machine translation editing research in China: based on CNKI database (1995-2022). National Translation, 4, 68-76.
2. Garbovsky, N. K., & Kostikova, O. I. (2019) Intelligence for translation: artificial or artificial? Vestnik of Moscow University. Series 22. Theory of Translation, 4, 3-25. 3. Wang, H., & Liu, S. (2021). Changes in translation technology in the era of artificial intelligence. Foreign Language Teaching, 5, 42. 4. Cheng, W., & Wei, Z. (2021). Cultivating developed thinking in teaching translation technology. Shanghai translation, 3, 39-44. |