Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Историческая информатика
Правильная ссылка на статью:

База данных «Эшелонные списки переселенцев в Калининградскую область (1946-1947 годы)»: архитектура, источники, опыт ввода данных, первые результаты

Баранова Елена Вячеславовна

кандидат исторических наук

директор, Научно-исследовательский центр социально-гуманитарной информатики, доцент, Институт гуманитарных наук, Балтийский федеральный университет им. И. Канта

236022, Россия, Калининградская область, г. Калининград, ул. Чернышевского, 56а, каб. 35

Baranova Elena

PhD in History

Director, Reseacrh Center of Social and Humane Information Science, associate professor, Humanes Institute, Kant Baltic Federal University

236022, Russia, Kaliningradskaya oblast', g. Kaliningrad, ul. Chernyshevskogo, 56a, kab. 35

EBaranova@kantiana.ru
Маслов Виталий Николаевич

кандидат исторических наук

научный сотрудник, Научно-исследовательский центр социально-гуманитарной информатики, доцент, Институт гуманитарных наук, Балтийский федеральный университет им. И. Канта

236022, Россия, Калининградская область, г. Калининград, ул. Чернышевского, 56а, каб. 35

Maslov Vitalii

PhD in History

Researcher. Research Center of Social and Humane Information Science, associate professor, Humanes Institute, Kant Baltic Federal University 

236022, Russia, Kaliningradskaya oblast', g. Kaliningrad, ul. Chernyshevskogo, 56a, kab. 35

w_maslow@mail.ru
Лопатин Михаил Михалович

ORCID: 0000-0003-4379-5723

младший научный сотрудник, Научно-исследовательский центр социально-гуманитарной информатики, Балтийский федеральный университет им. И. Канта

236041, Россия, Калининградская область, г. Калининград, ул. А. Невского, 14

Lopatin Mikhail

Junior Researcher, Research Center for Social and Humanitarian Informatics, I. Kant Baltic Federal University

236041, Russia, Kaliningradskaya oblast', g. Kaliningrad, ul. A. Nevskogo, 14

mikhaillopatin28@gmail.com
Другие публикации этого автора
 

 

DOI:

10.7256/2585-7797.2020.4.33950

Дата направления статьи в редакцию:

22-09-2020


Дата публикации:

29-12-2020


Аннотация: Рассматриваются аспекты создания базы данных о перемещении выходцев из РСФСР и БССР для заселения сельских территорий Калининградской области. Актуальность работы связана с недостаточной изученностью комплекса статистических сведений об одном из крупнейших миграционных процессов, организованных советской властью во второй половине XX в. и занимающем значимое место в становлении нового региона. Впервые создается информационный ресурс, вмещающий в себя данные из большого комплекса первичных учетных документов, оформлявшихся в связи с массовым перемещением на эшелонах будущих жителей области и их последующем расселением. Приводится описание источника, подробно рассматриваются наиболее типичные виды из составляющих его документов: эшелонные списки, акты о прибытии эшелонов и сводные списки к ним.   Обсуждаются принципы построения базы данных, обосновывается выбор в пользу источнико-ориентированного подхода. Приводится концептуальная структура базы данных с обращением к некоторым особенностям устройства ее логической модели и организации графического интерфейса пользователя. Описана организация процесса заполнения базы данных большой группой студентов в условия работы со сведениями ограниченного доступа. Предварительный анализ, проведенный на основе внесенных к настоящему моменту в БД сведений, показывает, что в 1946 г. около 2/5 прибывших было нетрудоспособными (в первую очередь по возрасту), ту же долю, но уже среди глав семей занимали одинокие — не имевшие или потерявшие супругу / супруга, абсолютное большинство глав переселенческих хозяйств — мужчины.


Ключевые слова:

Калининградская область, миграция, переселение, Вторая мировая война, эшелонные списки, база данных, источниковедческий анализ, информационная модель, социальный портрет, демография

Исследование выполнено при финансовой поддержке РФФИ и Калининградской области в рамках научного проекта № 19-49-390002 «Исследование социально-демографического потенциала сельского населения Калининградской области в 1946-1947 годах с использованием системы управления базами данных»

Abstract: This article considers some aspects related to a database covering migrants from the Russian Federation and the Belorussian Republic to Kaliningradskaya Oblast. The topicality of the study is the poor knowledge bulk related to statistics of such a large-scale migration process initiated by the Soviet Union in the middle of the 20th century which played an important role in the new region formation. It is the first time when an information resource is created that contains data from a large complex of nominative records made along the way with the mass resettlement of new residents of the region by means of train echelons. Besides the description of the source, the most typical types of its documents (echelon lists, acts on arrival and consolidated lists) are considered in detail. The authors discuss the principles to build the database and substantiate the choice in favor of the source-oriented approach. The describe the conceptual structure of the database with reference to some specific features of its logical model and the organization of the graphical user interface. The article describes how a large group of students added limited access data to the database. A preliminary analysis of the database information shows that in 1946 about 2/5 of the arriving people were unable to work (primarily due to their age). The same share, however among the heads of families, was characteristic of single people without a spouse. The absolute majority of household heads were men.


Keywords:

Kaliningrad region, migration, resettlement, World War II, echelon lists, database, source analysis, information model, social portrait, demography

Актуальность исследования, выполняемого совместно Балтийским федеральным университетом им. И. Канта и Государственным архивом Калининградской области (ГАКО), определяется необходимостью изучения комплекса статистических сведений, связанных с процессами формирования слоя сельских жителей как одного из значительных компонентов социально-экономического и демографического развития Калининградской области в первые годы после ее образования. До сих пор не введен в научный оборот массив первичных данных из эшелонных списков переселенцев. Между тем, калининградские сельскохозяйственные кадры сложились, прежде всего, за счет миграции, организованной властями, а совокупность информации о составе семей переселенцев, их национальности, образовании, профессии, трудовой активности, имуществе и местах выхода вплоть до сельских советов сосредоточена именно в эшелонных перечнях и других сопровождающих материалах, хранящихся в ГАКО.

Создаваемая впервые на их основе база данных (БД) переселенцев 1946–1947 гг. сконцентрирует в одном ресурсе указанные сведения, сделает их пригодными для машинной обработки. Актуальность проекта в настоящее время, когда отечественная историческая наука только приступает к сплошному статистическому анализу миграционных процессов второй половины ХХ в., предопределяется также потребностью в поиске и апробации эффективных методов количественного анализа массовых перемещений трудоспособных граждан и членов их семей после Второй мировой войны.

Послевоенные миграции советского населения — как насильственные, так и добровольные — изучаются рядом современных российских ученых. Например, в учебном пособии О. Д. Воробьевой, Л. Л. и О. Л. Рыбаковских [1] кратко освещаются причины массовых перемещений в масштабах всей страны, формы государственного воздействия на процессы внутренней миграции, стимулирование сельхозмиграций и организованного набора рабочих, пристальное внимание уделяется системе льгот для переселенцев в 1940-е – 1980-е годы. Историк из Благовещенска С. А. Пискунов исследует проблемы миграции сельского населения в этот же период. Он рассмотрел правовой статус переселенцев, государственную помощь им, организацию их перевозки по стране, обеспечение переселенцев жильем, выделил этапы сельскохозяйственных переселений (см. [2; 3] и др.). Усилия ученых в целом направлены на изучение общих, юридических, организационных вопросов переселенческих кампаний в СССР во второй половине ХХ в.

Калининградские исследователи также внесли вклад в изучение послевоенных миграционных процессов в СССР. В работах профессора Ю. В. Костяшова [4] и статьях Д. В. Манкевича [5; 6] охарактеризованы законодательная база переселенческой кампании, ход вербовки, условия переселения, результаты этой масштабной акции, причины так называемого «обратничества». Кроме того высказаны мнения о трудностях обустройства, проблемах профессионального подбора переселенцев и их национальной принадлежности в целом по области. М. Г. Шендерюк на основе анализа 288 анкет-заявлений предприняла попытку оценить социальную структуру, профессиональную принадлежность и образовательную дифференциацию сельских переселенцев [7].

Источники:

1. Эшелонные списки содержат информацию о примерно 100 тысячах переселенцах, приехавших в калининградские села в 1946-1947 гг. из российских и белорусских регионов [8]. В типовых формах эшелонных списков, единых для России и Белоруссии, сведения о переселенцах сгруппированы по семьям. Данные списки составлялись в регионе выхода мигрантов. В них внесены все, согласившиеся переехать в Калининградскую область, и вычеркнуты те, кто не отправился в нее с формулировками «Отказался», «Не поехали», «Не прибыли», «Не отпустили с работы» и т. д. В пути могли вносить записи о том, что какой-либо переселенец отстал от эшелона, умер или же родился.

2. Сводные списки семей, прибывших в Калининградскую область, представляют собой перечни переселенческих хозяйств, идентифицируемых по фамилии главы семьи, и включающие ряд дополнительных данных об этих семьях. Сводные списки могли составляться как в пути, так и по прибытии эшелона в Калининградскую область. Эти списки стали базовым документом для выборки статистических сведений о семьях, приехавших в Калининградскую область, так как именно в этих таблицах зафиксированы данные о людях, реально прибывших в регион, и об имуществе, которое они привезли на новое место жительства.

Впрочем, иногда отмечается несоответствие сведений о количестве переселенческих семей в эшелонных и сводных списках из-за того, что часть листов тех или других перечней может быть утрачена. В этом случае списки не только дополняют друг друга в наборе данных, но и позволяют получить более точную информацию о числе мигрировавших хозяйств и людей. Кроме того, в таком наборе материалы, относящиеся к каждому эшелону, не всегда сохранились, поэтому иногда только эшелонные или же только сводные списки являются единственным источником сведений по довольно большим группам переселенцев.

Эшелонные и сводные списки в совокупности являются главным первичным источником сведений для БД.

3. В Калининградскую область могли передаваться составленные в районах выхода пофамильные списки колхозников, получивших от органов НКВД / МВД разрешение на переселение, и списки мигрантов, к примеру, имевших скот и домашнее имущество, прошедших санобработку. В этих перечнях по-разному комбинировались сведения, уже вошедшие в эшелонные и сводные таблицы. Вместе с тем в ряд списков внесены редко встречающиеся данные о национальности и образовании, а также партийности и должности каждого переселенца, а не только глав семей. В архивные дела иногда подшивали регистрационные списки колхозников, прибывших на постоянное жительство в районы Калининградской области. При этом указывались места расселения, делались отметки о выбытии целых семей или отдельных селян. Такие материалы либо подтверждают информацию, содержащуюся в сводных и эшелонных таблицах, либо существенно дополняют их.

4. В актах приема - передачи эшелонов фиксировались даты и станции отправления и прибытия переселенческих эшелонов, общая численность переселенцев. Однако имеющаяся совокупность актов не дает полного представления о количестве мигрировавших сельских жителей, так как не все такие документы сохранились.

Принцип построения БД

Для определения рациональных алгоритмов работы с материалами были проанализированы с точки зрения их содержания, особенностей и вариантов составления документы, сосредоточенные в деле № 19 из фондов ГАКО о заселении Правдинского района Калининградской области в сентябре — декабре 1946 г. Для сравнения данных привлеклись выбранные случайным образом материалы из других архивных дел. В результате выявлены типичные черты, присущие всему комплексу документов, связанных с массовым заселением сельских районов региона.

Перед разработкой структуры БД было решено следовать так называемому источнико-ориентированному подходу в противовес проблемно-ориентированному. При источнико-ориентированном подходе, обычно, БД уже на этапе проектирования имеет более сложную структуру, дабы приблизиться к воспроизведению источника во всей полноте его информации. Кроме того, как это было и в нашем случае, по ходу заполнения БД ее приходится пересматривать. На стадии планирования невозможно досконально изучить все листы архивных дел (мы ограничились случайной выборкой). Уже в процессе наполнении БД каждый новый документ может нести прецедентный вид информации, который нельзя игнорировать. Из-за чего приходится вносить корректировки в структуру БД, чаще всего приводящие к ее еще большему разрастанию и усложнению.

В настоящее время до внесения сведений в БД стали составлять полистную схему каждого дела, чтобы выявить разрозненно подшитые листы, относящиеся к одному эшелону; по возможности датировать материалы; обнаружить дублирующие списки и не допустить повторного включения в базу сведений об одних и тех же переселенцах. Также схемы дел содержат записи о том, какой тип документа находится на каждом листе архивной единицы хранения.

Среди причин, послуживших в пользу выбора источнико-ориентированного подхода, стоит отметить следующие:

1. Хоть и имеются различия в комплектах документов на разные эшелоны, в них все же представлен достаточно большой набор однородных сведений, а отклонения не носят кардинальный характер. Кроме того, источник сам по себе относительно хорошо структурирован — в форме таблиц.

2. Повторное обращение к источнику такого объема за ранее «не вычерпанными» данными или излишне огрубленными (например, унификацией) при переносе в БД скорее всего окажется более трудоемким, чем создание изначально более полной БД. Кроме того, при частом обращении нарушается сохранность ряда источников, написанных или напечатанных на не всегда качественной бумаге, поскольку любая активная работа, грозит, как минимум, их частичной потерей.

3. Предполагается, что БД будет востребована у широкого круга пользователей, которые могут интересоваться разнообразными аспектами истории заселения Калининградской области.

Следование источнико-ориентированному подходу имеет свои ограничения — в БД не предполагается воспроизводить внешний вид источника. Создание БД такого рода может пониматься как семантическая оцифровка (в противовес оцифровке физического носителя информации). Однако дополнить БД представлением внешнего вида источника будет достаточно легко, поскольку она содержит полистную разметку архивных дел; к записям можно прикрепить световые копии листов.

Так как источник относительно хорошо структурирован в виде таблиц, то выбор был оставлен на реляционных БД. Используется клиент-серверная СУБД MySQL, а для создания пользовательского интерфейса, как оболочка, — Microsoft Access. Такая связка (через прикладной программный интерфейс Open DataBase Connectivity) в сравнении с использованием только Access — и как файл-серверной СУБД, и как оболочки интерфейса — позволяет, с одной стороны, достаточно быстро создать графический интерфейс, а с другой — избежать проблем в сетевой работе. В последних версиях Access была исключена функция репликации БД, но все еще осталась возможность «разделить» файл БД на два — объектов данных и объектов приложения. В профессиональной среде бытует мнение о низком уровне стабильности сетевой работы в Access, однако в нашем выборе бо́льшую роль сыграло желание для надежной работы физического сервера использовать на нем операционную систему из семейства GNU/Linux и иметь возможность работать с БД на нем. Версии же Access для других операционных систем помимо Windows — отсутствуют. Выбранная нами MySQL является кроссплатформенной и, оставаясь достаточно простой СУБД, имеет гораздо более высокий уровень надежности. Ее функционал богаче, особо стоит отметить востребованную при создании БД возможность создавать такой объект как View (представление) — скорость исполнения сложных рекурсивных запросов, используемых как источник данных для форм, значительно выше, чем в Access.

Сведения, переносимые в БД из эшелонных и других списков, можно разделить на 5 блоков – а) личная (анкетная) информация (основные биографические сведения о переселенцах), б) трудовая деятельность, в) место выхода, г) место вселения, д) данные о перемещении семьи, е) имущество переселенцев.

К личной информации относятся фамилия, имя и отчество, пол, год рождения, родственные отношения к главе семьи, образование, национальность и партийность переселенца. Блок информации анкетного характера, размещенный в эшелонном и сводном списках, вносится в две группы полей – «Сведения о переселенце» и «Членство в организациях».

Фамилия, имя и отчество каждого мигранта обязательно указывались в эшелонных списках. Варианты их воспроизведения были разными. Фамилии переселенцев старались писать полностью. Однако для обозначения однофамильцев нередко применялся знак повтора. При этом часто не учитывали пол переселенца. Фамилия мужского рода могла соотноситься с членами семьи женского пола и наоборот. В таких случаях в БД вписывается фамилия из списка, после нее в скобках указывается правильное окончание, например, Полевой(-ая) или Китайгородская(-ий). Если есть разночтения в буквах, при явно различном написании фамилии одного и того же человека в эшелонном и сводном списке через слеш пишется два варианта фамилии.

Имя и отчество переселенца составители списков или фиксировали полностью, или сокращали до первых слогов, инициалов. Знаки дублирования могли применяться для повторяющихся отчеств. Имя и отчество главы семьи можно уточнить, если они полностью приведены в сводном списке крестьянских семей, прибывших в Калининградскую область. Для остальных членов семьи такой подход не применим. Полное или менее усеченное, чем инициалы написание имен и отчеств получается восстановить по другим перечням, например, по спискам НКВД, если они, конечно, передавались в Калининградскую область и сохранились в архивных делах. Если эту личную информацию не удается выверить по разным источникам, то сокращенные записи имен и патронимов, даже имеющие грамматические ошибки, переносятся в БД. Нередко имена младших членов семей записывали в уменьшительно-ласкательной форме. При внесении в БД такие имена не меняются на полное официальное написание. Детей, родившихся в пути, фиксировали в эшелонных списках, но их имена и отчества чаще всего не вписывали, поэтому в полях БД выбирается запись «Не указано».

Пол переселенцев в списках не отмечался. Он всегда определяется по фамилии и имени или по названию родственной связи с главой семьи. Впрочем, в редких случаях при фамилиях, мужская и женская форма которых совпадает, и при отсутствии полного имени или статуса в семье половая принадлежность остается не установленной. Запись о поле («Женский», «Мужской», «Не установлено») выбирается из закрытого списка.

Год рождения переносится в БД из эшелонного списка. Если, что встречается крайне редко, данные ячейки таблиц в первичных материалах оставались незаполненными, то в поле БД вписывается число «9999». Описки (например, вместо 1888 года рождения записывали 1988) исправляются в результате анализа состава семьи и на основе здравого смысла.

Статус члена переселенческой семьи устанавливается по записям в эшелонных списках. Для заполнения БД предусмотрен выпадающий список, в который включены базовые эгоцентрические термины родства русского литературного язык. Запись «Неизвестно» выбирается, если родственное/свойственное отношение с главой семьи не зафиксировано. В единичных случаях отмечено использование диалектных и/или иноязычных лексем. Так, например, в Белоруссии писали «небож», «швагер», «швагерка». В подобных случаях из списка выбирается русский аналог, а в поле для комментариев переносится оригинальный термин. Нечасто, но наблюдаются записи типа «сирота», «воспитанник», «няня», «сосед» и др. — по мере обнаружения они добавляются в список.

Документы, в которых есть графы об образовании, пока крайне редко встречаются. Формализованный список национальностей подготовлен по итогам переписи населения 1959 г. [9]. Более ранних детальных сведений о национальном составе калининградцев нет.

Информация о партийности членов переселенческих хозяйств имеется в сводных списках, составленных по главам семей, поэтому членство в коммунистической партии и комсомоле чаще всего не персонифицировано. В перечнях указывается применительно к переселенческому хозяйству количество комсомольцев, коммунистов и кандидатов в члены ВКП(б). В соответствующих графах сводных списков могли писать «б/п» (беспартийный), а при отсутствии в семье членов партии и ВЛКСМ оставляли соответствующие ячейки пустыми или заполняли их прочерками. В БД таблица «Партийность» относится ко всей семье, однако если встречаются сведения о партийной принадлежности, соотнесенные с конкретной личностью, то они фиксируются на индивидуальных страницах переселенцев.

Кроме того, к личной информации можно отнести и отметки о семьях или конкретных гражданах, не приехавших в Калининградскую область. При наличии таких записей в соответствующих формах выбирается время выбытия — «до отправления», «в пути» или «после вселения» (при этом дополнительно можно указать точную дату и место, куда произошло выбытие), а также «неизвестно» — и его причина. Последняя выбирается из открытого для дополнения выпадающего списка; в ходе работы по наполнению БД в него были включены, например, такие записи: «отказался», «отказалась семья», «вычеркнут», «вычеркнут и заменен», «причина не установлена», «выделился в отдельную семью», «по болезни», «не отпущен с производства», «обучается в техникуме», «обучается в ВУЗе», «изменилось семейное положение», «ошибочно зачислен», «в РККА», «умер», «отказано», «не явился(-ись)».

Блок о трудовой деятельности включает сведения о выработанных по прежнему месту жительства трудоднях и демобилизации из Вооруженных сил (вносятся в поля, объединенные в группу «Основания для переселения»), профессии переселенца (отражаются в специальном поле на персональной странице мигранта).

В постановлениях союзного правительства отмечалось, что при отборе переселенцев преимущество должно отдаваться тем, кто имел высокие показатели в трудовой деятельности. В обрабатываемых документах нет, применяя современную терминологию, экспертных оценок трудовой активности переселенцев, поэтому ее может отразить только количество трудодней, выработанных в год предшествующий переезду. Этот показатель находим в сводных списках. При этом чаще всего не указывалось, выработаны трудодни только главой семьи или же всеми трудоспособными. В связи с этим по умолчанию считаем, что в сводные списки включены и вносятся в поле «Трудодни» сведения на всю семью. В редких случаях дифференциации показателей в поле вписывается общее количество трудодней, а персональные сведения вносятся на личной странице конкретного переселенца. Если в списках отмечали количество трудодней за два года, то в поле «Трудодни» вносим данные за год предшествовавший миграции, а в комментариях записываем число трудодней, выработанных в год переселения.

Преимуществом при отборе переселенческих хозяйств пользовались также демобилизованные воины. Факт демобилизации помечался в источниках записями «Демобилизованный» и сокращениями этого слова, «РККА» (Рабоче-Крестьянская Красная Армия) и «ВМФ» (Военно-морской флот). В таблицах встречаются прочерки или нули в ячейках для записи трудодней и отсутствуют записи о демобилизации, поэтому в поле БД, предназначенном для сведений о количестве демобилизованных, проставляется комбинация цифр «9999».

Профессия или специальность в источниках соотносится, прежде всего, с главой переселенческой семьи; это обязательная запись в сводном списке. При этом могли указать более одной профессии. Все они заносятся в БД. Подобные сведения могли в каких-либо иных документах указать и для других членов семей, поэтому соответствующее поле создано на индивидуальных страницах, пока в него, чаще всего, вставляется запись «Не предусмотрено формой». Наименование профессий выбирается из формализованного списка, составленного на основе общесоюзного классификатора 1975 г. [10]. Данные в этом документе, конечно, избыточные для мигрантов второй половины 1940-х годов, несмотря на то, что среди них были и городские жители, поэтому после года наполнения БД «лишние» названия будут удалены. Одновременно предусмотрено дополнение сокращенного перечня при заполнении БД.

Также в этот блок включаются сведения о количестве в семье трудоспособных мужчин и женщин. Правительственные постановления требовали, чтобы в переселенческом хозяйстве было не менее двух трудоспособных. Их число можно установить по году рождения и принятым в СССР в то время границам трудоспособного возраста, хотя в этом случае не учитываются нетрудоспособные инвалиды. В базу переносятся данные из сводных списков, в которых имелась специальная графа о количестве мужчин и женщин. Этот материал позволяет также частично компенсировать утраченные сведения о полово-возрастном составе семьи при наличии только сводного списка на переселенческий эшелон.

Информация о месте выхода указывается в двух полях в форме с личной информацией о переселенце, так как оно, в отличие от места вселения, не всегда было общим для всех членов семьи — некоторые из них могли проживать, например, в другом районе. В первом поле выбирается запись из перечня административно-территориальных единиц, составленного на основе официальных справочников, которые изданы в Белоруссии и России в 1947 и 1948 гг. [11; 12], т. е. во время послевоенных миграций. Он представляет собой набор записей о разноуровневых единицах административно-территориального деления (союзных республиках, автономных республиках, областях, районов и городов, сельских советов), хранящихся в одной реляционной таблице и иерархически упорядоченных по подчиненности (через поле с указание id родительской записи и поле с указанием материализованного пути). Для подстановки можно выбрать единицу любого уровня вплоть до сельсоветов — в зависимости от того, как подробно указана информация в документах. В форме для просмотра справочника пользователем единицы представлены вместе со всей цепочкой единиц, к которым они принадлежат, предусмотрено поле для задания поискового запроса, возможность сортировки записей и различные фильтры для них. Во второе поле, озаглавленное «Как в оригинале», записываются топонимы, написание которых в источниках отличается от тех, что представлены в справочнике, или для которых в нем не были найдены подходящие варианты; туда же заносятся названия колхозов и деревень.

Аналогично устроена группа полей «Место вселения» на форме с информацией о семье переселенцев. Сейчас в первое поле этой группы, в котором выбираются значения из справочника, как место вселение указывается название района, который отмечен на обложке архивного дела, формировавшегося по районам размещения переселенцев, или в заголовках документов. Вообще же в справочник административно-территориальных единиц включены все населенные пункты Калининградской области, переименованные Указами Президиума Верховного Совета РСФСР в 1947 и 1950 гг. [13; 14]. Однако пока конкретные населенные пункты из справочника БД не используются, так как в документах приводятся немецкие названия поселков с многочисленными ошибками и искажениями при транскрибировании. Наименования селений дословно переносятся из источников с добавлением номеров домов и квартир, если они указаны, в поле «Как в оригинале» для последующей верификации.

Сведения о перемещении семьи вносятся в БД на основе акта приема-передачи эшелонов. Чаще всего в них указывались номер эшелона, даты и места их отправления и прибытия. Формализованный список станций отправления составлен по официальным справочникам административно-территориального деления Белоруссии и России во второй половине 1940-х годов. Однако, как оказалось, не все станции в них были включены, поэтому для станции прибытия поле не ссылается на справочник, а открыто для заполнения, так как станции Калининградской области указывались не строго. Часто это была попытка составителя документа транскрибировать/транслитерировать немецкое название, нередко сильно измененное.

В ряде актов указаны несколько дат отправления и столько же чисел прибытия эшелона одного номера (групп семей из эшелона). В этом случае на каждую пару дат отправления и прибытия создаем свой поезд. В БД предусмотрены комментарии к записи о поезде, количестве семей и людей в нем.

Переселенцы имели право перевозить в эшелонах необходимое продовольствие и скот. Пересекающиеся и дополняющие друг друга сведения об имуществе мигрантов содержатся в эшелонных, сводных и некоторых других списках. Колхозники везли в Калининградскую область коров, телят, овец и коз, свиней, домашнюю птицу, сельскохозяйственный инвентарь, продовольственное зерно и муку, овощи (картофель), зернофураж, грубые корма, домашние вещи. При этом составители списков не всегда добросовестно подходили к заполнению заголовков граф в таблицах. Имеются, например, в неозаглавленных колонках записи о каких-то домашних животных, видовую принадлежность которых установить не удается.

Поля блока «Имущество», представленного в виде таблицы с заголовками: «Название имущества» и «Количество» формируются по шаблону: из выпадающего списка заносятся все виды имущества из «шапок» сначала сводного, а затем эшелонного списков. Также отмечается наличие справок о бескоровности, обменных квитанций на картофель и зерно. Каждая строка с видом имущества нумеруется. При первом заполнении шаблона у каждого вида ставится «0» (ноль), эта запись меняется, если у переселенческой семьи было какое-либо имущество. При внесении записей меры веса приводятся к единообразию. Центнеры, тонны и пуды переводятся в килограммы.

Описанные блоки информации организованы в 32-х реляционных таблицах. Логическая схема БД представлена на рис. 1.

Рис. 1. Логическая модель БД с элементами концептуального описания

Работа в архиве

Государственный архив Калининградской области предоставил помещение, в котором оборудовали 6 рабочих мест, на основе привезенных из БФУ им. И. Канта компьютеров. Ключевым звеном системы является компьютер, работающий на операционной системе Ubuntu, который стал сервером. По локальной сети при помощи коммутатора к нему подключили 6 рабочих компьютеров. Только студенты и участники проекта по персональному логину и паролю имеют доступ к БД, т.е. внесенные записи могут быть идентифицированы.

Участники проекта после создания базы данных начали ее заполнять, выполнили первоначальное тестирование базы, выработали алгоритм работы с ней. Затем с небольшими группами студентов проводились обучающие занятия. После этого кураторы индивидуально консультируют студентов при возникновении вопросов и проблем.

Первоначально наполнение БД было организовано в рамках научно-исследовательской работы у магистрантов программы «Цифровые технологии в гуманитарных науках». Студенты прошли регистрацию в архиве, подписали специальный перечень обязательств. В частности, каждый подтвердил понимание того, что распространение информации, к которой он получил доступ, «может нанести как прямой, так и косвенный ущерб ОГКУ «ГАКО» и субъектам персональных данных». В связи с этим, студенты обязались «не разглашать указанную выше информацию, не предоставлять доступ к документам, ее содержащим, посторонним лицам без разрешения руководства ОГКУ «ГАКО», не копировать, в том числе средствами фото-, видеотехники и мобильной связи, не выносить копии документов из здания ОГКУ «ГАКО», не уничтожать их, не информировать об их содержании посторонних лиц и сотрудников ОГКУ «ГАКО» без разрешения руководства ОГКУ «ГАКО», не оставлять в кабинете посторонних лиц, убирать документы в целях предотвращения несанкционированного доступа к ним».

С сентября 2020 г. к работе в рамках курсах «Цифровая гуманитаристика» подключились студенты бакалавриата 2 курса направления подготовки «История», «Филология», «Документоведение и архивоведение», «Политология», «Философия». Предмет предусматривал часы, которые были посвящены теоретическому изучению основ базы данных, информированию о работе в архиве и непосредственно реализации проекта.

После этого в Google-документах сделано «живое» расписание, где студенты самостоятельно выбирали свою смену. Всего в день предусматривалось 4 смены (10.00-11.30, 11.30-13.00, 14.00-15.30, 15.30-17.00). Работа шла с понедельника по пятницу включительно. В конце учебного семестра некоторые студенты, не набравшие необходимое количество записей, могли оперативно «забронировать смену» и отработать задолженность. Студенты трудились в парах, один человек вносил информацию, второй диктовал и анализировал документы. За смену пара должна была внести в базу как минимум 10-12 семей.

Вручную велась запись глав переселенческих семей, внесенных в базу из эшелонных списков. Для записи выдавался бланк. Так как над одним архивным делом работали по несколько пар студентов, то перед началом работы они должны были по рукописным перечням и по поиску в БД проверить семьи, которые планировалось включить в базу, чтобы не допустить повторного внесения переселенческих хозяйств. Если семья была зафиксирована в БД (совпадали ФИО главы, количество членов семьи, регион выхода в России или Белоруссии, район вселения), то сведения из обрабатываемого источника сверялись с уже имеющимися материалами, добавлялась новая информация, уточнялись имена и отчества глав семей и т.п., указывались данные нового источника; разночтения и дополнения оговаривались в комментариях.

Заполнив данные по эшелонному списку при наличии к нему сводного перечня, студенты делали закладку с текстом «Дело № ____. Эшелонный; Сводный; Другой (подчеркнуть) список на листах ______. Данные внесены в базу». После завершения работы со всем архивным делом проверяются сводные списки, при отсутствии закладки сведения из таких таблиц, не имеющих эшелонных списков, заносятся в базу.

В среднем раз в месяц проводится выборочная проверка дел. Затем в группе сети «ВКонтакте» размещается информация о допущенных студентами недочетах. Стоит отметить, что типичные ошибки и проблемы, возникающие при внесении данных в базу, анализируются и объясняются в специальной, постоянно обновляемой памятке. В представленной ниже таблице отражены наиболее ситуации, при разрешении которых студенты часто испытывали затруднения.

Табл. 1. Типичные ошибки при заполнении БД

Поле

Ситуация

Запись в поле

Запись в комментариях

Фамилия

Фамилия написана неразборчиво

Фамилию писать, как прочитали.

Если есть разночтения в буквах (непонятно, например, «о» или «а» и т.д.), через слеш писать два варианта

Фамилия написана неразборчиво

Фамилия

При использовании знака повтора «-//-» фамилия главы семьи переносится на остальных членов семьи без учета их пола

В поле вписывается фамилия главы семьи, после нее в скобках указывается правильное окончание.

Пример: Полевой(-ая) или Китайгородская(‑ий)

-

Фамилия

Неизвестна (не указана) фамилия члена семьи

Создается страница на члена семьи.

В поле «Фамилия» пишем: «Неизвестный # в семье ID [цифры]», где # — порядковый номер неизвестного в семье: 1, 2, 3, ... .

Заполняем на этой странице известные данные

-

Партийность

Есть прямое указание на то, что данный переселенец кандидат или член компартии, член ВЛКСМ (комсомолец). Например:

Иванов И.И. – член ВКП(б)

Иванов П.П. - ВЛКСМ

Только в этом случае на персональной странице конкретного переселенца в поле «Партийность» выбираем соответствующую запись.

Если прямого указания на членство в партии или в комсомоле нет, то в поле «Партийность» остается автоматически сформированная запись «Не предусмотрено формой»

Место выхода /вселения

Адрес в источнике выходит за пределы значений в справочнике (т.е. уровнем ниже сельского совета — колхоз, деревня и т. д.)

Из справочника выбираем сельский совет, а в поле «Как в оригинале» переносим полную информацию из источника

-

Место выхода

В эшелонном списке не указан район выхода, но имеется название сельсовета

Район устанавливается по названию сельсовета в классификаторе (справочнике) областей выхода

-

Имущество

Имущество в сводном и эшелонном списках различаются

- за основу принимаем сводный список (имущество, которое привезли в калининградскую область) для домашнего скота и птицы

- остальные сведения переносим из эшелонного списка

Для домашнего скота и птицы:

В эш. сп. коров…, телят…, свиней… и т.д.

В эшелонном списке есть сведения, отсутствующие в сводном списке

Имеющиеся сведения обязательно заносим в шаблон из эшелонного списка

Сведения перенесены из эш. сп.

Анализ

В связи с закрытием архива из-за введения режима самоизоляции, работы по набивке данных были остановлены в апреле 2020 г. В БД на сегодняшний момент внесена информация о 50 596 переселенцах (10 372 семьях), т.е. о 85% сельских жителей, приехавших в область в 1946 г. Они прибыли из 7 областей БССР (Гомельская, Бобруйская, Минская, Витебская, Могилевская, Полоцкая, Полесская), 20 российских областей (Рязанская, Тамбовская, Владимирская, Горьковская, Московская, Ярославская, Брянская, Орловская, Воронежская, Ульяновская, Кировская, Великолукская, Новгородская, Псковская, Костромская, Калининская, Куйбышевская, Курская, Пензенская, Калужская) и двух автономных республик РСФСР (Чувашская, Марийская).

Из них женщин - 26 572, мужчин - 21 108, не установленных по полу 2916 человек; нетрудоспособных (детей, стариков) - 35,8%, трудоспособных - 49,2%, в 15% возраст не указан. Среди внесенных в БД переселенцев 20,5% относятся к категории «глава семьи», в которой можем выделить две крупные группы – состоявшие в браке и не состоявшие в нем или вдовые. Среди переехавших в Калининградскую область в 1946 г. 60,9% глав семей состояли в браке, одинокими или вдовыми были – 39,1%. Среди таких глав хозяйств абсолютное большинство (97,0%) принадлежало мужчинам. Главы мужского пола преобладали и во всей категории глав семей. Их доля составляла 74,3%.

Анализируя социальные характеристики, стоит отметить, что они чаще всего относились лишь к главе семьи, по которому заполнялись сведения из сводной ведомости. Так, непосредственно рядовых колхозников было 21,7% от общего количества глав семьи, из них партийных 9,6%. Полученные предварительные результаты в дальнейшем при обработке всех данных за 1946-1947 гг. будут корректироваться и дополняться для получения более ясного коллективного портрета первых переселенцев.

Планы

Наша работа в данный момент преодолела этап разработки структуры базы данных и ее тестирования в полевых условиях. Исследование демографических характеристик сельских жителей области на основе анализа всей совокупности имеющихся статистических данных позволит составить «социальный портрет» переселенцев в начальный период заселения области, выявить степень их закрепления в колхозах и совхозах, трудовой потенциал прибывавших сельских жителей, существенно влиявший на развитие сельского хозяйства и всей экономики области.

В ближайшие планы, помимо внесения в БД сведений за 1946-1947 гг., входит анализ большого массива данных о составе переселявшихся семей; партийности, образовании, профессии, национальности и трудовой активности мигрантов; привезенном ими имуществе, количестве домашнего скота и птицы, фуража и продовольствия. Также предполагается проверка гипотез о соотношении числа переселенцев, закрепившихся на новом месте жительства и покинувших калининградские села и о степени готовности переселенцев к социально-экономическому освоению региона.

Библиография
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
References
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Предметом изучения рецензируемой статьи является анализ основных принципов и методики создания базы данных «Эшелонные списки переселенцев в Калининградскую область (1946-1947 годы)» (далее – БД «Эшелонные списки»), а также рассмотрение первых итогов ее заполнения и стоящих перед разработчиками базы дальнейших задач.
Методология исследования базируется на системно-структурном подходе, основных принципах и правилах создания реляционных баз данных, а также выработанных в современной исторической науке принципах информационной подготовки источника для внесения его информации в разрабатываемую базу. Работа несколько облегчается наличием уже готовых структур внутри взятых за основу источников, однако, в ходе их анализа возникает немало проблем, которые нашли отражение в статье и для решения которых авторами были предложены соответствующие решения.
Актуальность работы хорошо обоснована в первом разделе статьи, связана она в первую очередь с необходимостью изучения формирования массового заселения региона из других республик и областей СССР и формирования местного населения как результата масштабной миграции.
Научная новизна работы обусловлена привлечением к исследованию массовых исторических источников (прежде всего это эшелонные списки и сводные списки семей, прибывших в Калининградскую область) и выработке соответствующих методик для их полного изучения. Эта работа очень технологична и подразумевает использование прежде всего технологии разработки и создания баз данных для дальнейшего историко-демографического анализа.
Следует отметить, что статья очень хорошо структурирована, при этом соблюдается логика изложения материала. Вначале достаточно подробно отмечена актуальность исследования, включая краткий обзор историографии. Следующий раздел посвящен источникам создания БД «Эшелонные списки». Характеристика источников выглядит вполне достаточной для формата статьи. Основная часть работы посвящена собственно созданию базы данных. Автор(ы) обосновывает выбор источнико-ориентированного подхода, при этом важнейшим аргументов в его пользу является возможность дальнейшего использования БД «Эшелонные списки» для исследования истории региона. Далее в статье обоснован выбор программного обеспечения, после чего дается подробное описание данных, вносимых в базу. Логическая модель базы данных представлена в соответствующей иллюстрации. Интересным представляется и раздел, посвященный организации заполнения базы, осуществляемый в архиве силами прежде всего студентов. Выделены типичные ошибки при заполнении. Статья заканчивается кратким анализом уже имеющихся результатов и характеристикой дальнейших перспектив исследования. Работа написана научным стилем, материал изложен последовательно, жанр статьи можно определить прежде всего как методический, где основной упор сделан на основные этапы и детали создания БД «Эшелонные списки».
Библиография статьи в целом небольшая, она отражает источники и историографию исследования. При этом вызывает некоторое удивление полное отсутствие ссылок на теоретические и практические работы по разработке и созданию исторических баз данных, хотя список такой литературы только на русском языке на сегодняшний день весьма обширен.
Научно-методический характер статьи во многом определил отсутствие в ней элементов научной дискуссии.
Статья имеет некоторые недочеты, помимо уже сказанного можно указать на очень небольшой по объему аналитический раздел, однако, главной целью работы является все-таки изложение методики и техники исследования, и в этом плане статья соответствует формату журнала «Историческая информатика» и будет полезна как опытным исследователям, так и только начинающим свое знакомство с информационными технологиями. Статья рекомендуется к публикации.