Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Историческая информатика
Правильная ссылка на статью:

Опыт применения инструментов геоинформатики в кодикологическом исследовании писцовых книг

Фролов Алексей Анатольевич

ORCID: 0000-0003-2366-6545

доктор исторических наук

ведущий научный сотрудник, Институт всеобщей истории РАН, руководитель, Лаборатория исторической геоинформатики

119334, Россия, г. Москва, Ленинский пр-т, 32A, каб. 1405

Frolov Alexey

Doctor of History

Leading researcher, Institute of World History of the Russian Academy of Sciences, head of Historical Geoinformatics Laboratory

119334, Russia, Moscow, Leninskii Prosp., 32A, kab. 1405

npkfrolov@gmail.com
Другие публикации этого автора
 

 

DOI:

10.7256/2585-7797.2020.2.33330

Дата направления статьи в редакцию:

27-06-2020


Дата публикации:

30-07-2020


Аннотация: Предметом изучения в статье являются способы обобщения и визуализации кодикологических наблюдений над архивной рукописью средствами геоинформатики. Данное решение позволяет систематизовать сведения исторического источника и делает их максимально доступными для широкого круга пользователей сети Интернет. Созданный в результате веб-проект может использоваться не только в исследовательских, но и в образовательных целях. Материалом для данной работы послужили результаты кодикологического изучения новгородской писцовой книги Водской пятины письма С. Клушина, работа над которой была завершена в 1542 г. (хранится в РГАДА). В рамках предлагаемого подхода материальный носитель исторического текста, рукопись, рассматривается как особое пространство в собственной системе координат. Это делает применимыми для установления топологии (то есть взаимного соотношения) ее объектов методы геоинформатики. Предлагаемый подход реализуется на практике впервые, поэтому основное внимание уделено описанию важнейших этапов обработки исходных кодикологических материалов для превращения их в ГИС-проект, основанный на реляционной базе данных. Результатом проделанной работы стал веб-ресурс, позволяющий визуализировать значительный объем данных о рукописи. Его, однако, не следует считать картой или картоидом. Более корректным представляется обозначить его как кодикологическую схему рукописи, созданную в среде ГИС и опубликованную как веб-ресурс, но без карты как таковой. Полученная схема корректируется и управляется средствами, которые используются при работе с базами данных и не ограничены картографическим интерфейсом.


Ключевые слова:

геоинформатика, источниковедение, кодикология, базы данных, веб-ресурс, новгородские писцовые книги, Новгородская земля, визуализация, пространство исторического источника, моделирование пространства

Abstract: The article discusses methods of systematization and visualization of codicological observations on an archival manuscript by means geoinformatics. This solution provides for summarizing the information of a historical source and its maximum accessibility for a wide range of Internet users. The web project created can be used not only for research but educational purposes as well. The paper grounds on the results of 1542 Semen Klushin’s codicological study of Novgorod pistsovaya kniga covering Vodskaya Pyatina (The work is stored in the Russian State Archive of Ancient Manuscripts, RGADA). The physical medium of a historical text, i.e. a manuscript, is considered as a special space in its own reference system. This makes geoinformatics methods applicable to determine the topology (i.e. the mutual relationship) of its objects. The approach proposed is tested for the first time that's why the main attention is paid to the description of the most important stages followed when processing the source codicological materials to turn them into a GIS project based on a relational database. The web resource created provides for visualizing a significant bulk of manuscript data. However, it should not be considered a map or a spatial model. It may be determined as a manuscript codiological GIS scheme published as a web resource but without a map. The scheme is adjusted and controlled by tools which are used when working with databases and are not limited to the cartographic interface.


Keywords:

geoinformatics, historical source studies, codicology, data bases, web resource, Novgorod cadaster books, Novgorod land, visualization, historical source space, spatial modeling

Введение

Кодикология — это специальная историческая дисциплина, занимающаяся выяснением происхождения рукописного сборника на основе изучения его общих внешних (место хранения, количество листов, формат, переплет, сохранность, водяные знаки, разлиновка и т. п.) и внутренних (состав, заголовки, нумерация тетрадей, нумерация листов, записи, пометы) признаков [7, с. 25]. В решении своих задач кодикология обращается к географическим аспектам лишь эпизодически, и далеко не они находятся в ее фокусе. Вместе с тем, если выразиться иносказательно, свой основной предмет изучения, кодекс, кодикология рассматривает как особое пространство, имеющее собственные координаты. Поэтому методы картографирования могут быть приспособлены для исследования данного пространства. Отдельные материальные части кодекса, такие как листы, тетради, группы тетрадей, можно сравнить с физическим ландшафтом, который задает важнейшие параметры ландшафта культурного, представленного в данном случае главами, абзацами, почерками, номерами тетрадей, маргиналиями и т. п. Карта же помогает представить взаимосвязь всех этих элементов «ландшафта».

Кодикология — специальная историческая дисциплина не только по предмету своего исследования. Систематически ее методы применяет относительно узкий круг ученых, о результатах работы которых историческое сообщество не всегда осведомлено — они публикуются в основном в профильных изданиях небольшими тиражами. Между тем круг потенциальных потребителей этих результатов значительно шире — в него попадает любой профессиональный историк, студент, архивист, преподаватель, исследователь генеалогии, если он использует сведения из рукописи в своей работе. Знакомство с тем, что представляет из себя кодекс как материальный носитель этих сведений, может принести заметную пользу, а иногда даже лечь в основу исследовательской концепции. К примеру, для датировки исторического источника по содержащейся в его тексте датированной записи критически важно знать, находится ли этот текст на замененном (добавленном) листе или запись была сделана при создании рукописи. Корреляция определенной категории сведений с вторжениями в текст книги редакторского почерка и нехарактерных сортов бумаги явно характеризует вторичность этих сведений относительно основного текста рукописи.

Особое значение в эпоху «визуального поворота» в гуманитарных науках приобретает публикация результатов кодикологического исследования в виде изображения. Такая форма не только упрощает понимание логики, которая привела кодиколога к определенным результатам, но и служит уникальной эвристической основой для последующих построений. А современный уровень развития веб- и ГИС-технологий радикально упрощает доступ к результатам такой визуализации любому пользователю сети Интернет.

Впрочем, графическое отображение топологии (то есть взаимного расположения) различных элементов, которые выделяет и исследует в рукописи кодикология, далеко не всегда актуально. Случается, что книга написана одним почерком и имеет лишь две-три замены листов, которые сразу видно невооруженным глазом. Мне, однако, на такие экземпляры никогда не везло, и чаще разбираться приходилось с результатами сложной работы по формированию современного «ландшафта» книги, к которому приложили руку несколько переписчиков, а затем еще и несколько «редакторов». Нередко они заменяли или дополняли листы уже почти готовой рукописи, тем самым создавая сложную стратиграфию сведений источника. Речь идет об определенной категории памятников деловой письменности Руси — писцовых, дачных, отдельных (так называются книги, в которых фиксировался «отдел» земель в поместье), платежных книгах конца XV-XVII в. Отдельные отметины «ландшафт» этих документов получал во время долгого использования в приказных учреждениях, при снятии с них списков, при нахождении в Новгороде во время «шведской оккупации» 1610-х гг. и в результате других событий.

Характеристика исторического источника

Практически предлагаемый подход применен мной в ходе изучения писцовой книги поместных земель Водской пятины Новгородской земли писцов Семена Ивановича Клушина и Шемета Резанова, создание которой было завершено зимой 1541-1542 гг. [5]. Рукопись являет собой пример сложной кодикологической истории, для систематизации фактов которой пришлось призвать на помощь геоинформатику. Это не только принесло пользу для верификации наблюдений над сортами бумаги и системами нумераций тетрадей, сделанных в архиве, но и позволило применить компьютерные технологии для подготовки набора схем, которые визуализируют результат реконструкции состава почти каждой из 141 тетради рукописи. Следует отметить, что указанное число тетрадей условно — полистный состав некоторых из них все же не удалось достоверно определить, поэтому нельзя исключать, что некоторые листы, идущие подряд и не связанные друг с другом в пары, являются фрагментами разных тетрадей. Конечным продуктом применения инструментов геоинформатики в кодикологическом исследовании стала веб-ГИС.

Подробному анализу наблюдений над сортами бумаги, почерками, нумерациями тетрадей, маргиналиями посвящена отдельная статья [9]. Здесь же достаточно охарактеризовать некоторые количественные показатели, во многом определившие сложность всего исследования и необходимость применения в нем ГИС-технологий. Всего в рукописи сохранилось 1054 листа бумаги формата «в четверку» 10 различных сортов. При этом 996 листов покрыты скорописью — выделено 10 основных почерков и еще 9, интерпретируемых как редакторские, поскольку они встречены исключительно на замененных или добавленных листах. Текст книги разбит на 29 глав, и еще один раздел, последний, — это тетрадь, в которую записаны сведения о льготах, упомянутых в писцовой книге. Ценнейшим для кодиколога источником являются записи различного содержания на полях кодекса. Среди них есть записи, связанные с двумя валовыми нумерациями тетрадей рукописи, одной системой нумерации тетрадей внутри каждой главы, пометы, объясняющие вклейку отдельных листов на завершающем этапе изготовления книги, отмечающие разделение на «статьи» при снятии списка в XVII в. и др. Всего учтено 306 таких записей, относимых к XVI-XVII вв.

Выбор технического решения для визуализации

Важнейшим структурным элементом для кодикологических наблюдений является тетрадь — для делового письма в книжном формате стандартной является восьмилистная, полученная путем вложения одной в другую четырех парных листов. Архивные рукописи в современном их состоянии редко сохраняют физическую сопряженность парных листов, так что кодикологу приходится реконструировать ее с помощью наблюдений над филигранями, их смещением относительно оси листа. Почти вся бумага исследуемого периода имеет филигрань, которая видна на просвет. Особенности изготовления рукописи формата «в четверку» таковы, что около половины ее листов обычно вовсе не имеют филиграни, остальные же содержат либо верхнюю, либо нижнюю часть филиграни. При отсутствии на листе филиграни необходимо убедиться по меньшей мере в принадлежности бумаги к одному сорту. Для этого замеряется расстояние между понтюзо. Так назывались проволочные элементы каркаса сетки, использовавшейся при изготовлении бумаги, которые оставляли след в бумаге в виде паралельных полос. На листах формата «в четверку» понтюзо идут поперек — от внешнего края к корешку. Парными в тетради могут быть только два листа одного сорта бумаги без филиграни либо два листа, один из которых имеет верхнюю, а второй нижнюю половину филиграни одного типа. Два листа разного сорта, две верхних или две нижних половины филиграни одного сорта, лист с половиной филиграни и лист без филиграни не могут быть парными. Таким образом выявляется симметрия, позволяющая судить о составе тетради.

Отклонения от стандартной восьмилистной формулы, как правило, сигнализируют о вторжениях в первоначальный состав тетради. Суждения о характере такого вторжения делаются по тому, как оно связано со сменой почерка, пометами на полях и другими признаками. В связи с исключительной важностью результатов реконструкции состава тетрадей, так или иначе они должны быть представлены читателю. Это может быть отражено в таблице, где для каждой выделенной тетради указана последовательность листов с филигранями (например, «-н-вн-в-» означает, что листы 2 и 5 имеют нижнюю половину филиграни, листы 4 и 7 — верхнюю, на остальных филиграни нет (рис. 1)).

Рис. 1. Пример табличного представления тетрадной формулы [10, с. 480], Приложение 7 составлено Л. В. Мошковой.

Более доступен для восприятия графический метод, отображающий листы как бы с торца тетради (рис. 2 — этот пример относится к пергаменной, а не бумажной рукописи, но уместен, поскольку также характеризует топологию ее листов).

Рис. 2. Пример графического представления топологии листов («вид с торца») [6, с. 152]

Не менее наглядно, но более компактно это можно сделать с помощью графической схемы, где парные листы соединены скобкой, а вложенность скобок соответствует вложенности парных листов, образующих тетрадь (рис. 3 – также пергаменная рукопись, рис. 4).

Рис. 3. Пример графического представления топологии листов («графы-скобки») [8, с. 127]

Рис. 4. Пример графического представления топологии листов («графы-скобки») [3, с. 78], кодикологическое описание выполнено О. Л. Новиковой.

Графическая форма скобки мне представляется оптимальной, и в настоящей работе будет применена именно она.

В современную эпоху, оснащенную компьютерной техникой и «софтом» на любой вкус, легко можно найти множество способов отрисовать такие схемы. Соблазнительно также насытить схему как можно более широким спектром сведений о листе и тетради, речь о котором шла выше. Однако использование графических пакетов или сервисов создания схем имеет существенный недостаток — представленная с их помощью информация доступна лишь визуально, но анализировать и корректировать представленные таким образом данные какими-либо вычислительными методами невозможно. Поэтому соответствующие трудозатраты на отрисовку, как мне представляется, себя не оправдывают, если необходимо не только изготовить аккуратную схему, но и как-то проанализировать данные. Чем больше данных, которые мы пытаемся отобразить, тем более актуален поиск более «продвинутых» методов.

Немного более перспективной является технология гиперссылок, которая позволяет (например, через веб-браузер) извлекать те или иные сведения по клику мышки, при этом сами эти сведения можно хранить как структурированные нужным образом атрибуты. Но одним из наиболее информативных, на мой взгляд, является представление рукописи в ГИС-проекте, потому что, с одной стороны, это сообразуется с предложенным выше взглядом на кодекс как на пространство в собственных координатах (и, следовательно, дает максимальные возможности для визуализации и навигации), а с другой стороны, в основе такого проекта лежит БД, поэтому анализ материала не привязан к форме его презентации. Управлять атрибутами, характеризующими рукопись, можно теми средствами, которые используются для работы с базами данных. В настоящей статье изложен опыт такого рода работы.

От кодекса к веб-ресурсу. Алгоритм работы.

В целом предпринятые шаги можно сгруппировать по нескольким логическим этапам.

1. Подготовка накопленного кодикологического материала для БД.

Исходным материалом послужила электронная таблица MS Excel, которая заполнялась в РГАДА при исследовании самой рукописи. Информация в ней была недостаточно структурирована, поскольку предварительно не было идеи представить атрибуты кодекса в виде БД. В частности, в таблице каждая запись содержала сведения об одной выделенной тетради или нескольких листах между тетрадями. Комбинация обозначений, характеризующих формулу тетради, хранилась целиком в одной ячейке (подобно тому, как это сделано на рис. 1), поэтому для создания главной таблицы БД, где объектом является один лист, необходимо было развернуть содержимое ячейки Excel в ряд записей. Для превращения комбинации строчных символов из одной ячейки в набор строк, каждая из которых характеризует отдельный лист по филиграни (или ее отсутствию), порядковому номеру листа в тетради и по общему числу листов в тетради, пришлось применить несложный скрипт на языке программирования Python с вложенным циклом, который обработал экспорт электронной таблицы в формат *.csv. После того, как в полученную таким образом таблицу было добавлено обозначение каждого листа по современной архивной пагинации, все атрибуты, характеризующие свойства листа (сорт бумаги, почерк, тетрадь, урок, глава), добавлялись в нее простым соответствием по данному полю как ключевому. Эта таблица стала основой БД.

2. Проектирование БД.

Для работы использовалась открытая (то есть непроприетарная, некоммерческая) объектно-реляционная (то есть реляционная, но реализующая объектно-ориентированный подход: в структуре БД существуют объекты, классы и наследование) СУБД PostgreSQL (v. 11.2.), которая имеет специальное расширение PostGIS для геоданных [12, 13]. Забегая вперед, скажу, что картографическая составляющая в реализации рассматриваемой задачи минимальная, так что для ее решения было бы достаточно и более простой в использовании открытой реляционной СУБД, имеющей клиент-серверную архитектуру, MySQL, например, или открытой нереляционной (noSQL) СУБД MongoDB. Однако PostgreSQL интегрирована в стек технологий NextGIS, конечным звеном которого является веб-сервер NextGIS Web [11], позволяющий реализовать созданную базу геоданных в виде веб-ресурса. Стеком технологий (англ. stack – стопка) называют набор инструментов, применяющийся при работе в проектах и включающий языки программирования, фреймворки, СУБД, компиляторы и т. д. От выбранного разработчиком стека технологий зависят производительность работы, требования к аппаратным ресурсам, надежность работы программного обеспечения. Это и определило выбор СУБД в данном случае. Вариант с СУБД, использующими файл-серверную архитектуру, здесь не рассматривался: они плохо приспособлены для работы за пределами персонального компьютера, а это важно (хотя и не необходимо) при создании веб-ГИС.

Пометы на полях относятся к числу атрибутов, характеризующих лишь некоторые листы кодекса, причем иногда на один лист приходится по нескольку записей. Поэтому они сохранены в отдельной таблице БД и связаны с основной таблицей по внешнему ключу. Также был создан ряд таблиц справочного характера, хранящих данные о сортах бумаги, почерках, главах. Основная таблица ссылается на них по внешнему ключу.

3. Снабжение координатами объектов основной таблицы.

Перед загрузкой таблицы с описанием каждого листа рукописи в БД (она, как отмечалось выше, стала центральной в БД) каждый из них получил свои координаты. В действительности, геоинформатика не требует непременной привязки картографируемых объектов к реальным координатам. Некоторые историки, используя инструментарий ГИС, даже реальные объекты располагают в собственной системе координат, которая несовместима с какой-либо из существующих. В данном случае такой выбор был сделан намеренно — в силу специфики предмета. Вместе с тем, через координаты удобно устанавливать топологию объектов. И можно почувствовать себя создателем земной тверди. Естественно, правила разметки собственного космоса можно написать любые, но чем нагляднее они будут отображать взаимосвязь объектов, тем лучше.

Для формирования «координатной сетки» пространства рукописи по оси Х за условную единицу было принято расстояние между объектами-листами. Координаты первого листа кодекса, таким образом, попадают в начало координатной сетки, а каждый соседний лист на единицу сдвигается от предыдущего по оси X вправо. Переход от одной тетради к другой показан удвоенным расстоянием.

Но размещение тысячи листов в одну линию неудобно для восприятия на экране. Кроме того, кодикологические наблюдения позволили не только восстановить изначальный порядок листов и места лакун, но и разделить рукопись на отдельные группы тетрадей. Внутри каждой такой группы работа могла вестись последовательно и передаваться от одного переписчика к другому. Но от изготовления тетрадей соседних групп эта работа не зависела, они могли переписываться параллельно. Такой компактный фрагмент текста, который брался в работу одним или несколькими подьячими, источники называют «уроком». В описываемом ГИС-проекте каждый «урок» получил собственную координату Y. Таким образом, тетради располагаются в несколько рядов в количестве, равном числу выделенных «уроков», а каждый ряд состоит из тетрадей одного «урока», сдвигаясь относительно предыдущего по оси Y вниз.

Как отмечалось выше, многие листы рукописи были заменены на завершающем этапе работы над ней — они переписаны другими почерками на бумаге, отличной по сорту от основной бумаги «урока». Это делает стратиграфию книги более сложной, что может быть отражено в виде вертикальной координаты. Для этого каждый лист получил атрибут, определяющий его отношение к первоначальному составу тетрадей — основной или вставленный/добавленный. В зависимости от этого координата Z равняется 0 или 1. Для листа, о существовании которого в книге позволяет говорить анализ тетрадной формулы и содержания текста, но который отсутствует в настоящее время (то есть образует лакуну), вертикальная координата может быть оценена как -1.

Общий интерфейс для обмена пространственными данными между различными программами и сервисами предоставляет формат wkt (well known text), определенный Открытым геопространственным консорциумом (Open Geospatial Consortium, [15]). Для того, чтобы значения записанных нами трехмерных координат были адекватно интерпретированы ГИС, мы должны указать их в предназначенном для этого поле в текстовом формате в следующем виде: например, запись в поле wkt вида «Point (0 0 0)» будет присвоена первому листу первой тетради первого урока, атрибутированному как неизменявшийся в процессе работы над текстом; точка «Point (226 0 -1)» соответствует одному из утраченных листов в первом «уроке».

Для расчета координат каждого объекта достаточно воспользоваться возможностями формул, встроенных в электронные таблицы. Например, формула «=ЕСЛИ(L4<>L3;M3/4+3+R3;R3)» в ячейке R4 позволяет для листа рукописи, описанного в строке 4 таблицы, рассчитать координату Y следующим образом: при переходе от одного «урока» к другому (его номер записан в поле L) необходимо разделить максимальное количество листов в тетради предыдущего урока (из поля M) на 4, прибавить к нему отступ, комфортный для отображения атрибутивных данных в подписях (в данном случае взято 3) и прибавить координату Y, которая была у листов предыдущего «урока». Значение поля M необходимо учитывать потому, что чем больше листов оказывается в ряду, тем больше места понадобится на следующих шагах алгоритма для отображения связей между парными листами – скобок. При наличии тетради в 16 листов максимальное число пар будет равняться 8. Если высоту скобки, соединяющей два соседних листа (и, соответственно, шаг между двумя соседними скобками, вложенными одна в другую), принять равной единице расстояния, то значение M нужно делить пополам. Но для компактности отображения высоту скобки было решено принять равной 0,5, поэтому в приведенном примере максимальное число листов в тетради предыдущего урока я делил на 4. Если же лист не является первым листом «урока», то координата Y не меняется.

Подобным образом рассчитывается и координата X, только при переходе к новому «уроку» она обнуляется, а при переходе от одной тетради к другой к координате X прибавляется не 1, а 2 (если мы хотим разместить соседние листы, принадлежащие разным тетрадям, на удвоенном удалении). Формула конкатенации позволяет сформировать нужный вид записи для поля wkt, после чего файл в *.csv или *.xls можно передать в ГИС-приложение, которое моментально преобразует слой в геоданные, если указать в качестве поля геометрии подготовленное нами поле wkt. В данном случае использована QGIS 2.18 [14]. Пакет второй мажорной версии в данном случае предпочтительнее третьей: последняя (QGIS 3) использует Python 3, и пока это чревато проблемами совместимости с программным стеком NextGIS. Переход на «тройку» разработчики NextGIS давно готовят и планируют завершить в этом году.

Если файл *.csv правильно распознан ГИС-приложением, созданный на его основе слой можно преобразовать в формат *.shp (в таком случае поле wkt исчезает из числа видимых, поскольку данные из него преобразуются из атрибутивных в координатные), либо в слой PostGIS (для хранения в виде таблицы PostgreSQL — в этом случае текстовое поле wkt также преобразуется в поле геометрии, представленное в СУБД в эквивалентном двоичном формате wkb (well known binary), оставаясь видимым пользователю).

4. Объединение листов в пары по результатам кодикологического анализа рукописи.

Технически это можно выполнить различными способами, мне наиболее удобным показалось выделять в пространственном слое в QGIS пары соответствующих точек и присваивать им общий номер пары. После этого несложный SQL запрос «собирает» таблицу с описанием таких пар, включая их координаты. Фактически это координаты крайних точек ребра графа, который демонстрирует наглядно связь между листами. А поскольку, вслед за кодикологической традицией отображения сопряженности листов, ребро графа решено было нарисовать в виде скобки, потребуются еще две точки для изображения ребра графа. Их координаты по оси абсцисс легко рассчитываются по координатам крайних двух: X2 = X1, X3 = X4 . Координаты Y находятся сложнее, поскольку их значения зависят от того, на каком расстоянии друг от друга находятся парные листы. Пару из двух соседних листов в середине тетради соединяет самая короткая скобка, вложенная во все остальные, поэтому высота скобки будет минимальной (0,5). Скобка для пары листов, в которую вложены средние листы тетради, – в стандартной восьмилистной тетради это третий и шестой листы, будет длиннее, а высота ее станет равной 0,5 + 0,5 = 1 и т.д.

Более простой технически, но более сложный по числу манипуляций над данными способ нарисовать скобку – это еще раз явным образом записать координаты wkt, создав специальное поле с помощью «калькулятора полей» QGIS, выгрузить таблицу в формат *.xls или *.csv, с помощью формул электронных таблиц рассчитать координаты недостающих двух точек, собрать координаты четырех точек, но уже в качестве координат четырех вершин линии и вернуть таблицу обратно в QGIS, указав уже в качестве поля геометрии только что созданное поле wkt для линейных объектов.

Есть, однако, более технологичный способ, который предполагает использование более «продвинутых» возможностей дескриптивного языка SQL и, собственно, ГИС-инструментария PostGIS. Он заключается в том, чтобы в PostgreSQL создать представление (view) для слоя с ребрами графа, основанное на таблице полистного описания рукописи, которое «на лету» вычисляет координаты двух недостающих точек графа на основе wkb-геометрии двух известных, формирует из четырех точек коллекцию и преобразует ее в линейный объект. Удобство такого решения в том, что при редактировании точечного слоя с листами рукописи (например, при выделении еще одной пары листов) нет необходимости корректировать отдельно граф: он отрисовывается моментально — как только две точки объединяются в пару.

5. Агрегация данных по отдельным атрибутам.

Центральное место в БД занимает, как уже отмечалось, описание по листам. Но для анализа различных аспектов истории кодекса полезно рассматривать в качестве особых объектов и другие сущности. Например, почерк — важная характеристика большинства листов кодекса, но, с другой стороны, она соответствует конкретному человеку, принимавшему участие в работе либо в роли основного исполнителя, либо в роли редактора, который переписывал и заменял (или добавлял) листы, написанные другими. Чтобы визуализировать сразу весь вклад его в общую работу, можно агрегировать данные БД, сгруппировав их по атрибуту почерка. Полученная в результате таблица в качестве объекта учитывает отдельный почерк, который может быть встречен на сотнях листов или, наоборот, лишь на одном-двух. Функции PostgreSQL позволяют не потерять при агрегации данные об этих листах, сохранив их в специальном поле. Более того, при агрегации все точечные геометрии, отображающие соответствующие листы, можно объединить в один объект типа Multipoint и вывести его на карту.

6. Загрузка созданных слоев ГИС-проекта на геосервер и создание веб-ГИС.

Веб-сервер НекстГИС работает как с *.shp файлами, так и с PostGIS слоями, поэтому характер связи опубликованных слоев с исходными данными БД может быть различным. При использовании для обработки самих данных сервера PostgreSQL, размещенного «в облаке» (соответственно, открытого для круглосуточного обмена данными с геосервером), рациональнее, конечно, держать на геосервере не сами данные, а слои, динамически формирующиеся по соединению с СУБД. В этом случае любое редактирование исходных данных автоматически отображается на геосервере. Если же исходные данные существуют в виде *.shp, то достаточно скопировать его на геосервер и поддерживать в актуальном состоянии.

В любом случае созданные слои точек и линий необходимо передать в «облако», то есть на геосервер, и настроить их представление в веб-проекте. Результат работы с писцовой книгой С. Клушина доступен по ссылке [2].

Использованный для этого сервис NextGIS Web постоянно развивается и, по-видимому, не достиг еще предела своих возможностей. Но уже сейчас он предоставляет большое количество средств, полезных для кодикологического веб-проекта. Например, веб-технологии в связке с возможностями геосервера позволяют подключать слой проекта лишь в заданном диапазоне масштабов. На мелком масштабе слои, отображающие конкретные листы рукописи, все равно не будут видны, они будут лишь загромождать видимое пространство и мешать восприятию. Поэтому на мелком масштабе отрисовывается только слой «стратиграфии» «уроков» (рис. 5).

Рис. 5. Общий вид веб-проекта на мелком масштабе и навигация по листам с помощью пространственного индекса листов рукописи в функциональной панели «Описание».

Здесь отдельный лист представлен в виде прямоугольника, высота и цвет которого зависят от того, как он атрибутирован в кодикологическом исследовании. Зеленым цветом показаны листы, изначально составлявшие рукопись и незамененные впоследствии. Синим цветом закрашены листы, которые либо добавлены к «зеленым», либо заменили собой удаленные листы (в связи с исправлением ошибок или внесением новой информации — это не всегда можно установить). Красный цвет обозначает лакуну. В конце рукописи к писцовой книге добавлена тетрадь с описанием льгот, данных на отдельные владения. По содержанию и происхождению это, несомненно, часть кодекса, но структурно и содержательно она отличается от остального текста, а почерк, которым исписана «льготная тетрадь», в писцовой книге является редакторским. Поэтому на «стратиграфии» «уроков» эти листы получили свой особый цвет.

Место в этой «цветной» структуре конкретного листа, тем не менее, отыскать легко и на мелком масштабе. Можно воспользоваться поиском по атрибутивной таблице слоя. Ее можно открыть, выбрав кликом мышки один из слоев веб-проекта, а затем в выпадающем меню «Слой» кликнув пункт «Таблица объектов». Открывшаяся внизу экрана таблица имеет поле текстового поиска (суммарно по всем полям), предоставляет возможность выделить отдельный объект и перейти к его положению на «карте».

В случае с кодикологической схемой рукописи поиск через таблицу, однако, не всегда эффективен — указав номер нужного листа, мы можем получить в подборке множество записей с тем же числовым значением из других полей (номер тетради, номер основного почерка и т. д.). Поэтому для реализации поиска были задействованы возможности другого компонента веб-интерфейса NextGIS Web — функциональной панели «Описание», доступной в левой части рабочей области. По клику на значке панели (буква «i» в круге) загружается пространственный индекс листов рукописи. В индексе листы приведены в порядке возрастания (это не всегда соответствует их порядку в тетрадях и в «уроках», поскольку в рукописи есть перебивки листов). Здесь номер нужного листа найти проще. Номер работает как гиперссылка, по клику на которую искомый объект оказывается в центре рабочей области, не меняя масштаба отображения.

На среднем масштабе информация о номерах листов становится необходимой, поэтому при увеличении «карты» эти номера появятся на экране. Также можно будет увидеть ребра графа, связывающие парные листы. По ним также возможна навигация и поиск через соответствующую атрибутивную таблицу (рис. 6).

Рис. 6. Веб-проект на среднем масштабе отображения с открытой функциональной панелью «Слои» и навигацией через атрибутивную таблицу слоя «Парность листов» (выбрана пара листов 342–347).

На самом крупном масштабе подгружаются также подписи, сообщающие о сортах бумаги парных листов. Кроме того, становится виден слой с текстом маргиналий и номеров тетрадей кодекса (рис. 7).

Рис. 7. Веб-проект на крупном масштабе отображения с навигацией через атрибутивную таблицу слоя «Пометы на полях» (выбрана помета на л. 266).

В слое «пометы на полях» также возможен поиск по тексту и навигация на выбранный объект. Слой «почерки по листам» визуализирует результаты агрегации данных (рис. 8), описанной выше (логический этап 5).

Рис. 8. Веб-проект на мелком масштабе отображения с навигацией через атрибутивную таблицу слоя «Почерки по листам» (выбраны листы, заполненные «первым редакторским» почерком).

Не менее полезным является получение атрибутов по клику прямо на объекте. В таком случае все атрибуты появляются во всплывающем окне «поп апа» (англ. – pop up). По умолчанию геосервер выводит на карте координаты в географической системе координат WGS84 (EPSG:4326), что никак не соотносится с нашей сеткой в условных «метрах». Однако в выпадающем меню «поп апа» можно заменить систему координат на Pseudo Mercator ( EPSG:3857). Тогда мы увидим те координаты листа, которыми снабдили объект в БД на этапе 3, только не в математическом (сначала ось абсцисс, затем ось ординат), а в географическом (сначала ось ординат, затем ось абсцисс) представлении (рис. 9).

Рис. 9. «Поп ап» с атрибутами объекта в слое «Листы рукописи», прямоугольные координаты соответствуют координатам, присвоенным объекту в базе данных.

Заключение

В этой статье нет обоснования тех выводов кодикологического исследования, визуализация которых была сделана с помощью ГИС-инструментария. Их изложение публикуется в издании, более традиционном для такого рода специальных исследований. Здесь речь шла только об основных составляющих технического решения, приведшего к созданию веб-ГИС, и лишь по необходимости — об особенностях источникового материала. Второй задачей статьи было продемонстрировать информативные возможности примененного подхода. Тем не менее, полученный благодаря описанным процедурам веб-ресурс и сам способствовал анализу собранных исходных данных. И, конечно, представленная на нем сейчас версия топологии листов кодекса не является окончательной. Она подлежит корректировке, которая будет учтена в последующих источниковедческих изысканиях.

Важно отметить, что описанная технология максимально учитывает эту перспективу корректировать исходные данные: создание новых пар листов, возможный пересмотр некоторых атрибуций и даже уточнение деления рукописи на «уроки» не повлечет за собой переделки всего «с нуля». Большинство созданных слоев — это комбинирование данных нескольких таблиц БД с помощью представлений view. Сложность SQL запросов к исходным данным в СУБД является залогом простоты корректировки результирующих слоев: так, расхождения между позиционированием а) листа из слоя с полистным описанием; б) вершин графа, связывающего его с соответствующей парой; в) места привязки помещенной на этом листе маргиналии невозможны ни при каких корректировках, поскольку во всех этих случаях слои веб-ГИС ссылаются на координаты одного и того же объекта в БД. Изменение координат объекта БД влечет за собой автоматическое изменение и всех производных объектов в результирующих слоях веб-ГИС. То же касается и любых атрибутивных данных — как это и должно быть реализовано в БД, они не повторяют друг друга в разных таблицах.

Я старался избегать здесь употребления слова «карта» для описания полученного результата. «Анаморфированными картами», «картоидами», «ментальными картами» и т. п. принято называть различного рода абстракции, так или иначе отталкивающиеся от изображения реальных территорий [1, с. 54–63; 4, с. 88–92]. Но в данном случае созданное пространство полностью абстрагировано от поверхности астрономических объектов. Думаю, что корректнее говорить об использовании инструментария ГИС для создания кодикологической схемы рукописи, о ГИС-проекте, опубликованном как веб-ресурс, но без карты как таковой. Хочется думать, что предлагаемая форма подачи результатов кодикологического исследования окажется понятной не только кодикологам и даже не только историкам. Она имеет и образовательный потенциал, поскольку демонстрирует, каким образом мелочная, казалось бы, работа с почерками, филигранями, нумерациями тетрадями и прочими незаметными на первый взгляд частностями, требующая многих недель работы в архиве, превращает рукопись из «вещи в себе» в «новую землю».

Библиография
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
References
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Рецензируемая статья имеет довольно нестандартный предмет исследования: автор предлагает интересную методику использования геоинформационных технологий в кодикологических изысканиях. Такая необычная постановка вопроса мотивируется стремлением приблизить результаты кодикологических исследований – весьма специфических и порой достаточно трудных для восприятия – к широкому кругу потребителей этих результатов путем их визуализации. Статья, как подчеркивает сам автор, носит сугубо методический характер.
Методология статьи основана на представлении кодикологии как особого пространства с собственными координатами, где отдельные материальные части изучаемого произведения (кодекса) можно представить как физический ландшафт, в рамках которого формируется ландшафт культурный, представленный структурными частями работы. Фактически это разновидность системного подхода, адаптированного к довольно специфическому предмету исследования. В работе излагается методика исследования, основанная на применении геоинформационных систем и технологий при изучении писцовых книг.
Актуальность представленной работы лежит на поверхности – представлены новые методики и техники изучения памятников кодикологии (в данном случае – писцовых книг). Однако можно увидеть и более глубокие моменты, связанные с пониманием того, что современные информационные технологии не только являются «ускорителем» и «оптимизатором» уже известных методов, но позволяют создавать возможности для принципиально новых подходов к традиционным исследованиям.
Научная новизна статьи определяется тем фактом, что автору удалось свести в одну упряжку две, казалось бы, малосовместимые вещи – сугубо гуманитарную историческую дисциплину кодикологию и современные информационно-компьютерные технологии изучения пространственных представлений и закономерностей. Для этого понадобился весьма нестандартный ход, заключающийся в переформировании традиционного понимания пространства.
Работа написана хорошим научным стилем, близким к традиционному. Статья хорошо структурирована и с точки зрения логики изложения практически безупречна. Она начинается с вводных замечаний и характеристики источников. Наиболее интересная часть статьи – собственно методическая. Автор показывает различные способы кодикологической визуализации, плавно подводя читателя к необходимости и возможности использования ГИС-технологий. Представляется очень важным изложение в статье общего алгоритма работы. Важным моментом является «многослойность» представления пространства изучаемых кодексов – от «уроков» к листам рукописи с получением при этом все более детальной информации. Анализ работы показывает, что автору статьи удалось создать весьма наглядный и чрезвычайно полезный инструмент кодикологического исследования, который дает новые возможности изучения письменного памятника, но, подчеркнем, оптимизирует, а не заменяет работу собственно исследователя-гуманитария.
Статья содержит небольшую, но очень полезную библиографию, которая дает общее представление о проблематике статьи и может быть использована для знакомства с вопросами кодикологии.
В изложенном автором статьи материале не акцентируется дискуссионность рассматриваемых положений, это по своему характеру методическая статья, в которой важны не столько результаты, сколько пути их достижения.
Статья полностью соответствует формату журнала, в который она представлена для публикации, демонстрирует высокий научный уровень ее автора и, безусловно, представит интерес для самой разнообразной читательской аудитории.
Вместе с тем в работе есть несколько недочетов в оформлении, которые предлагается устранить. В первом абзаце раздела «Введение» есть текстовая ссылка (С. М. Каштанов, Л. В. Столярова. С. 25), которую следует оформить обычным способом, принятым в журнале. Аналогичным образом следует поступить с другой текстовой ссылкой (архивный шифр Российского государственного архива древних актов: Ф. 137. Новгород. № 5. Ч. 2) в первом абзаце раздела «Характеристика исторического источника». В этом же абзаце, а также в ряде других мест статьи в скобках иногда указывается (Примечание: и далее текст, объясняющий термин или высказанное положение). Рекомендуется убрать в таких случаях слово «примечание», которое выглядит явно лишним. Вообще, автор, как кажется, злоупотребляет таким знаком препинания, как скобки, хотя это замечание является, скорее, вкусовым.
После устранения недочетов статья может быть опубликована. В настоящее время она рекомендуется к доработке. Замечания главного редактора от 3.07.2020: "Автор доработал статью в соответствии с замечаниями рецензента"