Северина Е.М., Фёдоров Н.А. —
Проект Chekhov Digital: семантическая разметка параллельного корпуса переводов художественной прозы А. П. Чехова на немецкий язык
// Филология: научные исследования. – 2024. – № 4.
– С. 73 - 82.
DOI: 10.7256/2454-0749.2024.4.70560
URL: https://e-notabene.ru/fmag/article_70560.html
Читать статью
Аннотация: В статье рассматриваются вопросы разработки принципов семантически размеченного параллельного корпуса переводов художественной прозы А.П. Чехова на немецкий язык в рамках проекта Chekhov Digital цифрового академического издания собрания произведений писателя в формате TEI (Text Encoding Initiative). Проект параллельного корпуса ориентирован на создание цифровой инфраструктуры для изучения произведений писателя, позволяющей исследователям анализировать и сравнивать оригинальные тексты с их переводами. Были выявлены сложности, связанные с интерпретацией значимых элементов произведений писателя, спецификой их перевода на немецкий язык и семантической разметкой переводов художественной прозы, например, возникли сложности с определением границ и связей между элементами семантической разметки. Предложены пути их преодоления, включая использование цифровых методов и технологий обработки естественного языка. В проекте используются цифровые методы и технологии обработки естественного языка, стандарт цифровой публикации Text Encoding Initiative (TEI). Структура разметки текстов, основанная на стандарте TEI, делает документы машиночитаемыми, что позволяет разрабатывать инструменты сложного семантического поиска информации. Включение в проект Chekhov Digital параллельных корпусов переводов произведений А. П. Чехова на разные языки позволяет расширить исследовательские инструменты в области переводоведения, давая возможность сравнивать тексты переводов и оригиналов, обнаруживать сходства и различия в лексике, грамматике, стиле и культурных отсылках, а также автоматизировать рутинные процессы исследования, что делает значительно более эффективным поиск и анализ информации на больших объемах текстов. Результаты проекта будут вносить вклад в развитие цифровой гуманитарной среды, способствуя сохранению и популяризации литературного наследия А.П. Чехова. Создание семантически размеченного параллельного корпуса переводов будет иметь важное значение для литературоведов, лингвистов и переводчиков, позволяя им изучать специфику переводов произведений Чехова и развивать новые формы анализа и интерпретации текстов. Опыт, полученный в ходе проекта, будет ценным для будущих исследований и практических применений, демонстрируя эффективность цифровых технологий в гуманитарных исследованиях и образовании.
Abstract: The article discusses the issues of developing the principles of a semantically marked parallel corpus of translations of Chekhov's fiction into German within the framework of the Chekhov Digital project, a digital academic publication of the writer's collected works in TEI (Text Encoding Initiative) format. The parallel corpus project is focused on creating a digital infrastructure for studying the writer's works, allowing researchers to analyze and compare original texts with their translations. Difficulties were identified related to the interpretation of significant elements of the writer's works, the specifics of their translation into German and the semantic markup of translations of fiction, for example, difficulties arose with defining the boundaries and relationships between the elements of semantic markup. Ways to overcome them are proposed, including the use of digital methods and natural language processing technologies. The project uses digital methods and technologies of natural language processing, the standard of digital publication Text Encoding Initiative (TEI). The text markup structure based on the TEI standard makes documents machine-readable, which allows to develop tools for complex semantic information retrieval. The inclusion in the Chekhov Digital project of parallel corpora of translations of A. P. Chekhov's works into different languages makes it possible to expand research tools in the field of translation studies, making it possible to compare texts of translations and originals, detect similarities and differences in vocabulary, grammar, style and cultural references, as well as automate routine research processes, which makes search and analysis much more effective information on large volumes of texts. The results of the project will contribute to the development of the digital humanitarian environment, contributing to the preservation and popularization of the literary heritage of A.P. Chekhov. The creation of a semantically marked parallel corpus of translations will be important for literary critics, linguists and translators, allowing them to study the specifics of translations of Chekhov's works and develop new forms of text analysis and interpretation. The experience gained during the project will be valuable for future research and practical applications, demonstrating the effectiveness of digital technologies in humanitarian research and education.
Северина Е.М., Ларионова М.Ч. —
Новые филологические практики: семантическое издание текстов А. П. Чехова
// Филология: научные исследования. – 2020. – № 10.
– С. 13 - 21.
DOI: 10.7256/2454-0749.2020.10.33970
URL: https://e-notabene.ru/fmag/article_33970.html
Читать статью
Аннотация: Авторы представляют концепцию семантического цифрового издания текстов А. П. Чехова, уделяя особое внимание научно-исследовательскому проекту Chekhov Digital, который реализуется в Южном федеральном университете и Южном научном центре РАН. Цель проекта – создание семантической разметки собрания произведений писателя с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI), позволяющей представить текст в виде доступных для компьютерной обработки связанных данных, а также на стандарты электронного формата русскоязычных литературных текстов, представленного в Семантическом издании текстов Л. Н. Толстого [6; 7]. Важнейшая задача проекта – предусмотреть полезные для исследователя цифровые инструменты, включая удобный семантический поиск, инструменты статистической обработки и визуализации. Основной источник – академическое Полное собрание сочинений и писем А. П. Чехова в 30 томах (1974-1983) (ПССиП). В данный момент разработана предварительная структура разметки некоторых категорий, существующих в чеховских текстах, примечаний и комментариев, описание томов ПССиП, что позволяет организовать семантический поиск исследовательской информации, сделать редакционные примечания машиночитаемыми и более приспособленными для изучения с помощью не только традиционных подходов, но и компьютерных методов. Авторы подчеркивают, что текстовая разметка будет расширяться за счет включения новых категорий, и само семантическое издание в целом будет расширять свою сеть за счет включения справочных и редакционно-критических текстов, выходящих за рамки ПССиП.
Семантическое издание Chekhov Digital дает основания для нового типа комментария, объединяющего смыслы и факты, усложняющего и обогащающего понимание текста. Такое издание представляет интерес для исследователей, преподавателей, студентов, заинтересованных читателей.
Abstract: The authors present the concept of semantic digital publication of A. P. Chekhov's texts, giving special attention to the research project Chekhov Digital implemented in Southern Federal University and the Southern Scientific Center of the Russian Academy of Sciences. The goal of the project consists in creation of semantic marling of the compilation of writer’s works supported by the standards for digital publication Text Encoding Initiative (TEI) that allows presenting the text in format that can be processed by a computer, as well as the standards for electronic format of Russian-language literary texts displayed in the Semantic edition of the texts of L. N. Tolstoy. The crucial task of the project consists in provision of digital tools useful for the researchers, including convenient semantic search, statistical processing and visualization tools. The main source is the Academic Compilation of Complete Works and Letters of A. P. Chekhov in 30 volumes (1974-1983). Currently, a preliminary structure of markup is developed for some categories that exist in Chekhov's texts, notes, commentaries, and description of the volumes of Academic Compilation of Complete Works and Letters of A. P. Chekhov, which arranging semantic search of information, make editorial notes computer-readable, and more adjusted to studying not only the traditional approach, but also computer methods. It is underlined that text markup would expand due to inclusion of new categories; and the semantic edition itself would broaden its network due to inclusion of reference and editorial-peered texts that are beyond the scope of the Academic Compilation of Complete Works and Letters of A. P. Chekhov. Semantic edition Chekhov Digital gives grounds for a new type of commentary that incorporates meanings and facts, complicates and enriches the interpretation of text. Such edition is valuable for the researchers, pedagogues, students, and audience interested in the topic.
Северина Е.М. —
Культурный концепт в когнитивном измерении
// Человек и культура. – 2020. – № 6.
– С. 81 - 93.
DOI: 10.25136/2409-8744.2020.6.34161
URL: https://e-notabene.ru/ca/article_34161.html
Читать статью
Аннотация: В статье рассматриваются методологические принципы изучения культурных концептов в контексте когнитивного подхода, возможности проведения реконструкции некоторых фрагментов языковой картины мира на материале электронных корпусов текстов. С опорой на когнитивный подход к концепту как единице структурированного и неструктурированного знания, образующего когнитивность отдельного человека и культуры в целом, результаты концептуального исследования авторских текстов философов, рассматривавших культуру как символическое творчество человека, связанное со свободой (концепции И. Канта, Э. Кассирера, Н. А. Бердяева), была проведена реконструкция некоторых фрагментов языковой картины мира и обыденного сознания, соотнесенных с концептом «культура», в русскоязычной и англосаксонской культуре. Изучение контекстов употребления вербальных репрезентаций концепта «культура» в электронных корпусах текстов русского и различных вариантов английского языка показало, что важнейшими мировоззренческими ценностями англосаксонской языковой картины мира являются следующие представления: культура носит инструментальный характер; цивилизация рассматривается как путь развития человечества в целом; свобода предстает в качестве неотъемлемого права на свободу, которую нужно защищать, т.е. изначальной и неотъемлемо присущей человеку. В русскоязычных текстах культура обозначает ценностное отношение к миру, чаще связанное с национальной культурой; цивилизация рассматривается в контексте ценностного отношения к миру, но как путь развития человечества в целом; свобода имеет ценностную личностную, персоналистскую окраску, должна быть полной, абсолютной, часто понимается как свобода действий и выбора. Показано, что использование корпусных методов позволяет реконструировать способы формирования картины мира, выбор ценностных приоритетов, механизмы восприятия окружающей действительности в конкретной культуре из контекстов реального употребления вербальных проявлений культурных концептов.
Abstract: This article reviews the methodological principles of studying cultural concepts in the context of cognitive approach, possibilities for conducting reconstruction of certain fragments of linguistic worldview based on the material of digital text corpora. Leaning on the cognitive approach towards concept as a unit of structured and unstructured knowledge that forms cognition of a separate individual and culture as a whole, results of conceptual research of the texts of philosophers who view culture as symbolic creativity of a person associated with freedom (concepts of I. Kant, E. Cassirer, N. A. Berdyaev), the authors conducted reconstruction of certain fragments of the linguistic worldview and ordinary consciousness, correlated with the concept of “culture” in digital text corpora in the Russian and Anglo-Saxon cultures. Examination of the contexts of usage of verbal representations of the concept of “culture” in the digital text corpora of Russian language and different varieties of English language demonstrates that the crucial ideological values of Anglo-Saxon linguistic worldview are the following representations: culture is of instrumental nature; civilization is considered as the path development of humanity; freedom is viewed as an intrinsic right to freedom that should be protected, i.e. initial and inherent to a human. In the Russian-language texts, culture implies the value-based attitude towards world, mostly associated with the national culture; civilization is viewed in the context of a value-based attitude towards world, but as the path of development of humanity as a whole; freedom has value-based individual, personalistic connotation, supposed to be full, absolute, which is often understood as the liberty of action and choice. It is underlines that utilization of corpus methods allows reconstructing the techniques of formation of worldview, choice of value priorities, mechanisms of perception of surrounding reality in a specific culture from contexts of practical usage of the verbal manifestations of cultural concepts.
Северина Е.М. —
Цифровой текст в пространстве современной культуры
// Человек и культура. – 2019. – № 5.
– С. 65 - 72.
DOI: 10.25136/2409-8744.2019.5.30967
URL: https://e-notabene.ru/ca/article_30967.html
Читать статью
Аннотация: Автор рассматривает проблему культурфилософского изучения текста в пространстве современной цифровой культуры, уделяя особое внимание анализу концепций текста в контексте взаимодействия культуры и языка. С опорой на текстоцентрические культурфилософские подходы - концепцию диалогизма М. М. Бахтина, постструктуралистскую практику деконструкции текста в концепциях Ж. Деррида и Р. Барта, феноменологическую концепцию новых медиа Л. Мановича автор предпринимает попытку выявить основополагающие принципы понимания феномена цифрового текста, а также изучения новых культурных практик в пространстве цифровой культуры. В качестве методологического основания исследования выступает когнитивный подход к культуре и языку, методологическая междисциплинарность Digital Humanities. Основу содержания исследования составляют результаты компаративного анализа концепций текста в различных культурфилософских системах в контексте осмысления взаимодействия мышления, культуры и языка, анализа функционирования текста в цифровую эпоху. В процессе исследования применялся аналитический, компаративистский, интроспективный подход, концептуальный и структурно-семиотический анализ. Проведенное исследование показало, что предметом культурологического изучения должна стать двойная логика функционирования цифрового текста. При этом автор полагает, что понятие гипертекстуальности играет особую роль в понимании цифрового текста, а деконструктивистская практика чтения-письма переходит на уровень «материальной интервенции» читателя в цифровой текст, превращая его в бесконечную автокоммуникацию Автора-Читателя, опосредованную логикой компьютерного интерфейса, язык которого выступает в роли нового культурного метаязыка, организуя специфическим образом передаваемую информацию и оказывая влияние на функционирование текста как культурного объекта и его восприятие пользователем.
Abstract: The author examines the problem of cultural-philosophical analysis study of the text in the space of modern digital culture, focusing attention on analysis of the concepts of text within the framework of interaction between culture and language. Leaning on the textocentric cultural-philosophical approaches – M. M. Bakhtin’s concept of dialogism, poststructuralist practice of text deconstruction in the concepts of J. Derrida and R. Bart, L. Manovich’s phenomenological concept of the new media, the author attempts to determine the principles of understanding of the digital text phenomenon, as well as studying the new cultural practices in the space of digital culture. Methodological foundation became the cognitive approach to culture and language, and methodological Interdisciplinarity Digital Humanities. The content of this work comprise the results of comparative analysis of the concepts of text in various cultural-philosophical systems in the contexts of understanding the interaction between reasoning, culture and language, as well as analysis of functionality of the text in digital era. The conducted research demonstrates that the dual logics of functionality of the digital text must become the subject of culturological study. At the same time, the author assumes that the concept of hypertextuality plays a special role in understanding of the digital text, and the deconstructive reading-writing practice advances to the level of “material intervention” of a reader into the digital text, turning it to an endless Author-Reader communication, mediated by the logics of computer interface, which language plays a role of the new cultural metalanguage, arranging the conveyed information in a peculiar way and affecting functionality of the text as a cultural object and its perception by the user.