Текстобзор: архив документов «Прожито»
04.10.2025
Описание
«Прожито» — набор проектов, связанных с оцифровкой дневников и других личных документов. Основные компоненты — Корпус дневников и Архив «Прожито». Проекты развиваются с 2015 года.
Корпус
Корпус — это каталог размеченных текстов без привязки к сканам. Разметка означает, что к каждому тексту прикреплена дополнительная информация: автор, даты, места, упомянутые люди. По этим данным можно искать записи в корпусе.
Корпус «Прожито» — электронная библиотека дневниковых записей, которая позволяет пользователям работать не только с конкретными дневниками, но и со всей совокупностью текстов эпохи: получать выборки по датам, полу, возрасту, месту ведения дневника и т. д. С 2019 года корпус пополняется также и мемуарными текстами.
Корпус мультиязычный: он включает в себя русский, украинский, белорусский и казахский языковые разделы. По состоянию на март 2023 года в корпусе аннотировано более 9 тысяч авторов, загружены дневники 2 727 из них, около 700 дневников — первопубликации проекта. Общий объем корпуса — более 626 тысяч подневных записей XVIII–XX веков.
Главный каталог в корпусе — по авторам:

Есть возможность фильтрации авторов по набору параметров.

Возможен поиск по тексту дневников с учётом морфологии. В результатах поиска можно применить фильтр по автору.

Для каждого автора указана дополнительная информация и список дневников.

Из карточки автора можно перейти к самим дневниковым записям.

В некоторых местах дневников размещены пометки: при наведении на них появляется комментарий.

Архив «Прожито»
Наш основной проект — цифровой архив Центра «Прожито» ЕУСПб. В рамках проекта мы создаем сводный каталог содержимого частных и государственных собраний документов, к которому можно будет прикреплять цифровые копии и текстовый слой. Наш архив построен на демократических принципах комплектования и пополняется копиями документов из семейных архивов без учета возраста, пола или социальной траектории жизни их авторов. Доступ к тексту, условия и срок его возможной публикации регламентируются договором.
Для пользователей этой системы мы разрабатываем унифицированные правила описания, оцифровки, расшифровки и разметки документов из частных и государственных собраний. Благодаря этому мы не просто создаем коллекцию исторически значимых документов: унифицированное машиночитаемое описание документов и текстовый слой с семантической разметкой превратят наше собрание в большие данные для компьютерного анализа в парадигме Natural Language Processing, который многое поможет понять об общественных настроениях описываемых исторических периодов, а также о природе разных жанров документирования себя и эпохи.
Архив представлен в трёх срезах: документы, собрания, персоны.

Фильтры и способ поиска для каждого среза отличаются. Поиск по документам осуществляется по аннотациям.

Поиск по собраниям — по аннотации собрания.

Собрание — это коллекция документов.

Основная часть документа — скан. Также в каждом документе есть аннотация и описание. Аннотация концентрируется на содержании, а описание включает характеристики бумаги и другие особенности материала.

Для сканов работает удобная функция увеличения.


В документах размечаются упомянутые персоны и населённые пункты. Можно искать документы по упоминанию населённого пункта.
Текстового слоя или оцифрованного текста в документах найти не удалось.
Книги, исследования, новости
На сайте размещены ссылки на несколько книг, созданных на основе дневниковых материалов. Некоторые книги можно купить в печатном виде, есть ссылки на Яндекс.Диск для скачивания отдельных изданий, но на момент проверки ссылки не работают.

Также упоминаются исследования, выполненные на основе оцифрованных материалов:
Одно из ведущих направлений работы Центра «Прожито» — изучение теории и существующих в современной России практик общественной архивистики. До 2020 года в российском научном языке не использовалось это понятие — впервые оно прозвучало во время проведения панели «Общественная архивистика в России: история и современные практики», которую организовывал Центр «Прожито» в Европейском университете в Санкт-Петербурге.
Под «общественной архивистикой» понимаются все практики взаимодействия архивных институций с обществом. С одной стороны, это все области низовых инициатив, связанных с архивными практиками, с другой — вся область работы негосударственных архивных учреждений или учреждений, в деятельности которых большую роль играют архивные практики. Это поле взаимодействия находится сегодня на пересечении архивной практики и практики публичной истории.
Центр «Прожито» изучает все практики общественной архивистики в России, различные формы существования архивных практик вне архивных учреждений (например, домашних архивов), а также историю взаимодействия архивов и общества в Советском Союзе.
Подробнее см.: Павловская А. Ю., Павловский А. Ф., Мельниченко М. А. «Цифровая общественная архивистика»: «Прожито» как цифровой архив, сообщество интерпретации и волонтерское движение // Память в Сети: цифровой поворот в Memory Studies / под ред. А. Ф. Павловского и А. И. Миллера. СПб.: Издательство Европейского университета в Санкт-Петербурге, 2023. С. 256–274.
В разделе новостей публикуются сообщения о выходе книг, анонсы событий, таких как обсуждения материалов.

Новости также публикуются в Телеграм-канале. Примеры сообщений:
Наши коллеги из Арт-Лаборатории ВДНХ подготовили спектакль-читку по дневнику Сергея Попадюка — одного из семи дневниковых текстов, вошедших в сборник «Хочется жить во всю силу…».
30 сентября в 18:30 состоится совместное чтение и обсуждение с Татьяной Мироновой фрагмента ее книги «Оптика документальности. Практики работы с историей и памятью в современном искусстве». Встреча пройдет онлайн. Регистрация.
Волонтеры
К работе над аннотациями и оцифровкой привлекаются волонтёры.
Все рукописные документы, загруженные в архив, должны быть снабжены текстовым слоем. Поэтому основной объем работы, который мы предлагаем нашим волонтерам, связан с расшифровкой рукописного текста.
Мы высылаем материалы небольшими порциями, для подготовки которых нужно несколько рабочих дней. Мы просим, чтобы работа над материалами не затягивалась больше месяца, но готовы ждать, если вы планируете довести ее до конца. Важно, чтобы материал не зависал: если хотите взять перерыв, отказаться от материала или поменять его, обязательно напишите об этом координатору, с которым работаете.
Работа с рукописью делится на два этапа: расшифровка и сверка. Расшифровка — это черновой набор текста, который должен быть еще раз проверен другим участником. Сверка — это построчное сличение рукописи и расшифровки предыдущего участника, с исправлением ошибок и попытками раскрытия всех неразобранных моментов.
Чтобы стать волонтёром, нужно заполнить анкету.



Для волонтёров есть чат в Telegram, в котором обсуждаются рабочие вопросы. Студенты могут пройти практику, работая над проектом.
«Прожито» круглогодично принимает студентов гуманитарных специальностей со всей России на удаленную практику. У нас есть опыт сотрудничества со студентами ЕУСПб, ИТМО, Московского Политеха, НИУ ВШЭ (Москва, Санкт-Петербург, Пермь и Нижний Новгород), ПГНИУ, РАНХиГС, РГГУ, СНИУ, ТГУ, ТвГУ, УрФУ, ЧелГУ и ЯГПУ.
Заключение
Проекты «Прожито» сосредоточены на определённой теме: дневники, воспоминания, переписка. Работа с такими материалами сложнее, чем с печатными книгами: труднее разобрать почерк, материалы разнородны, сложнее проверять подлинность и решать другие связанные проблемы. Судя по описанию и наполнению, проект развивается и адаптируется, стремясь найти наилучший способ организации хранилища подобных материалов.
Не удалось найти текстовый слой в рукописях, однако присутствует разметка по населённым пунктам, персонам и датам дневниковых записей. В корпусе интересен способ добавления комментариев — с помощью специальных меток и всплывающих подсказок.
Возможно, в будущем для всех или для особенно важных текстов будет организована связь между рукописями и итоговыми напечатанными произведениями. В печатных изданиях с научным аппаратом иногда встречаются комментарии, основанные на рукописях, но сами рукописи не публикуются. В электронном виде можно было бы удобно и целостно соединить все этапы создания текста.