Нужно ли исправлять ошибки в текстах во время оцифровки?
15.03.2026
На этот вопрос можно ответить так: «В результате оцифровки должен получиться текст, посимвольно соответствующий бумажной версии книги». Этот ответ — абстракция, оторванная и от книги, и от задач оцифровщика. Чтобы обосновать эту мысль, обратимся к опыту текстологии. Оцифровка отличается от текстологии тем, что работает с печатными изданиями, которые уже обработали текстологи, а не с авторскими рукописями. Несмотря на это, опыт текстологии во многом применим и к оцифровке.
Исправление ошибок
Рассмотрим простой случай: в советских книгах попадаются вклейки или страницы со списком опечаток.

В «Повести о жизни» К. Г. Паустовский рассказывает, что в начале 1920-х некий знаменитый одесский наборщик утверждал, что книг без опечаток не бывает. При Сталине, однако, опечатки грозили в лучшем случае потерей работы, в худшем — расстрелом. Вспомним главу «Типография» из фильма Андрея Тарковского «Зеркало». Но и после смерти Сталина корректорская традиция сохранялась, так что если открыть, к примеру, любую книгу из полного собрания сочинений Белинского или академического (неполного) 10-томника Короленко, то там не найдется ни одной опечатки. Правда, к концу 1950-х в книги начали все же вкладывать бланки, где читателя просили сообщать о замеченных ошибках. Потом вернулась традиция, бытовавшая до революции, сохранявшаяся до середины 1930-х годов и полностью исчезнувшая во времена Большого террора, — вкладыши с перечислением опечаток.
Уже в наше время это привело к другой крайности. С 2000 года издается 100-томник Толстого, свет увидели пока только 12 томов, но к ним пришлось добавить еще один — как нарочно, 13-й, — с подзаголовком «Исправления и дополнения к третьему тому»; в нем таблица, указывающая «ошибки, оплошности, несообразности», занимает без малого 90 страниц. По традиции, если филолог цитирует какое-то произведение, он должен ссылаться на последнее его академическое издание. То есть роман «Семейное счастье» или рассказ «Три смерти» теперь нужно цитировать по этому тому... (Источник)
Список опечаток публиковали из-за технических трудностей: исправить ошибки в уже напечатанной книге невозможно. Издатели были бы рады их исправить, но не могли. Электронная версия позволяет внести правки сразу в текст, а не публиковать список отдельно. Главная цель книги — чтобы её было удобно читать. Список опечаток не добавляет пользы читателю, а лишь мешает — он лишний. Такой список может пригодиться историку-текстологу: например, чтобы понять, где ошибок было больше, а где меньше, и какие они были. Но в этом случае исследователь обратится к оригиналу или фотокопии. В этом случае историк-текстолог изучает не само произведение, а конкретный тираж.
Наличие списка опечаток в конце книги — простой случай. Что делать, если его нет или найдены другие ошибки? Для принятия решения ошибки можно разделить на два вида: бессмысленные и осмысленные.
Бессмысленные ошибки — это ошибки, в результате которых возникает слово, которого не существует, или слово в несоответствующей контексту форме, или очевидно ошибочная пунктуация (например, две запятые подряд). Если такая ошибка найдена в печатном тексте, её следует исправить, даже если это приведёт к расхождению с бумажным вариантом.
Исправить найденную ошибку просто, но даже «очевидные» ошибки не всегда легко отличить от специально задуманного автором выражения.
Впрочем, борьба с опечатками приводит иногда к забавным недоразумениям. Например, в «науковском» 10-томнике А. С. Пушкина 1977–1979 годов, который является сокращенным вариантом юбилейного 16-томника 1935–1937 гг., редакторами была найдена и исправлена такая «опечатка». В письме, где Пушкин рассказывает о поминках своего дяди Василья Львовича, упоминается между прочим, что присутствовавшие «арзамасовцы» ели в память о нем «вотрушки». Написание слова объясняется тем, что в «Арзамасском обществе» у Василья Львовича было прозвище «Вот!». В 10-томнике же мы теперь читаем «ватрушки» (источник).
Из этого следует: даже для исправления простых ошибок нужно понимать текст. Нельзя вносить изменения только на основе правил орфографии и пунктуации, не учитывая смысл.
«Литературовед не может быть не текстологом, то есть лицом, не умеющим разобраться в тексте. Равно и текстолог явится в весьма жалком виде, если он не будет литературоведом, то есть не сумеет разобраться в смысле изучаемого и издаваемого текста» — эти слова Б. В. Томашевского остаются в силе и в наши дни (Рейсер С. А. Основы текстологии).
При оцифровке нужно понимать текст и корректировать его. Значит, оцифровщик по сути становится редактором электронного издания. Это добавляет работе сложности и ответственности: если делать исправления, то должны быть серьёзные основания.
Исправление дефектного текста или какой-нибудь его части при отсутствии необходимых документов (только на основании догадок) и называется конъектурой.
Первое правило, которым должен при этом руководствоваться текстолог, — это осторожность. Увлекаться конъектурами было бы ошибочно. Они должны применяться лишь там, где текст явно дефектен, и лишь тогда, когда догадка исследователя имеет значительную правдоподобность. Правдоподобие же, естественно, возникает там, где предложенную конъектуру можно объяснить и доказать ее преимущество перед прежним текстом. При равноправности нескольких вариантов лучше оставлять текст без исправления, оговорив в примечаниях возможные замены. Практически следует помнить старинное правило: при наличии двух чтений вероятнее более трудное (lectio dificilitor) — упрощение возникает обычно в процессе бытования текста (Рейсер С. А. Основы текстологии).
Оставлять ошибки в тексте, если они уже найдены, — это капитуляция перед сложностями. Это надежда на то, что когда-нибудь кто-то более опытный доделает эту работу. Возможно, этим займётся специальная общественная организация будущего. Однако маловероятно, что ей помешают исправления, сделанные сейчас, даже если они ошибочны. А может, такой организации и не возникнет. Или её появление зависит, в том числе, от масштабов и качества текстологической работы сейчас.
Кроме относительно очевидных ошибок есть более сложные случаи. Например, стоит ли править ошибки, которые, вероятно, допустил автор? Однозначного ответа нет, но в текстологической практике такие исправления применяются.
С конъектурой не следует смешивать исправление некоторых ошибок писателя. Так, в «Подростке» Достоевского одно из действующих лиц именуется в первой и во второй частях Дарья Онисимовна, а в третьей — Настасья Егоровна. Текстологу следует унифицировать и дать в романе единое имя: в данном случае, кажется, естественнее выбрать первое. В примечаниях ошибку писателя надо, разумеется, оговорить. Точно так же текстолог должен устранить ошибку Чернышевского в повести «Алферьев», где Прасковья Филипповна (глава II, 2) далее в тексте именуется Софьей Филипповной — вероятно, здесь надо выбрать более частое, второе имя. В «Прологе» Илатонцев в части первой называется Николаем Андреевичем (или Петровичем), а во второй- — Виктором Львовичем (или Борисовичем). Его дочь Надежда Николаевна, а потом Викторовна. А. П. Скафтымов, вполне обоснованно, упорядочил этот текст (Полн. собр. соч., т. XIII, 1949, с. 910 — 911). (Рейсер С. А. Основы текстологии)
Если рассматривать оцифровку как часть текстологической работы, то применим следующий принцип: «Первая задача текстологии — установление точного текста произведения». Но понятие «точного текста произведения» только кажется простым. Проблем множество: авторские ошибки-опечатки, внешняя цензура и самоцензура, исправления корректорами и издателями. Бывает, что одна версия текста издана, а потом автор внёс исправления, но не опубликовал их. Во всех этих случаях нельзя универсально ответить, какую версию текста взять и исправлять ли ошибки. Текст, напечатанный в академических изданиях, во многом коллективный продукт автора и текстологов-исследователей.
К тексту произведений не имеет смысла относиться как к чему-то неизменному, созданному и авторизованному автором раз и навсегда. Хотя, конечно, могут быть исключения, если имеется явно выраженная авторская воля. В то же время для внесения изменений в текст должны быть серьёзные основания.
Приведение в современную норму
Отдельный случай для внесения изменений — правила орфографии и пунктуации. Как и исправление ошибок, этот вопрос дискуссионный. Одно из мнений об изменении орфографии:
Очень разнообразная, в течение долгого времени неупорядоченная или упорядоченная по отличным от сегодняшних правописных норм орфография должна воспроизводиться по нынешним правилам. Нет никакого резона сохранять архаическую орфографию самое по себе, разве что специально для целей стилизации. Впрочем, поскольку все памятники издаются ныне только по нормам современного правописания (1918 г. с поправками 1956 г.), то, что принято у пуристов называть «рисунком» или «стилем» страницы, все равно разрушено, в этих условиях заботиться о воспроизведении каких-то деталей — тщетная и неблагодарная работа (Рейсер С. А. Основы текстологии).
В частности, по этому вопросу А. С. Рейсер приводит высказывание Н. Г. Чернышевского:
Если в отношении пунктуации автор бывает требователен и настойчив, то лишь в немногих случаях он настаивает на той или другой орфографической системе. Чернышевский прямо называл ее «вздором»: «.. само собою разумеется, что для меня всякая: моя ли, чужая ли орфография совершенно все равно». С ограничениями он отстаивал лишь свою пунктуацию, да и то только там, где она имеет значение для «колоризации произношения» (Рейсер С. А. Основы текстологии).
Но есть и противоположные аргументы. Для художественной литературы может иметь значение, как текст «звучит». Иногда изменение орфографии влияет на смысл: в некоторых выражениях снимается неоднозначность, а в других появляется. Есть аргументы против и за частичную модернизацию текста.
В. Э. Вацуро, будучи противником выборочной модернизации, отмечает, что современное лингвистическое сознание читателя, сталкиваясь с текстом, в котором, с одной стороны, опускаются ‘ять’, ‘фита’, твердый знак в конце слова, меняются падежные окончания прилагательных с ‘-аго’ на ‘-ого’, а с другой – оставляются типовые элементы старой орфографической и пунктуационной системы, неизбежно воспринимает их как индивидуальные особенности стиля (например, ‘мущина’ и ‘щастье’). Проблема не возникает только тогда, когда «читатель имеет дело с целостной системой передачи текста, принимая ее „правила игры“» (Рейсер С. А. Основы текстологии).
Если полное собрание сочинений издаётся длительное время, то изменение орфографии может привести к тому, что часть томов будет по одним правилам, а часть — по другим. Это ещё одна ситуация, связанная с ограничениями бумаги.
Издательская подготовка первого тома началась в 1948 году. И в том же 1948-м Сергей Иванович Ожегов приступил к работе над орфографическим словарем русского языка. Путь к нему не был легким. С 1948 по 1957 год вышло семь «пробных» выпусков этого словаря, очень небольших, страниц по 150, иногда и меньше. Каждый из них содержал малое количество лексики, зато лексики неожиданной. Постепенно отметались одни виды написания слов и утверждались другие. «Чорта» Ожегов предложил реформировать — и это произошло. Из «перрона» он убрал одну «р» по аналогии с «тротуаром», в котором двойную «т» найдешь теперь разве что у Блока, но это не прижилось. Наконец, в 1957 году вышел однотомный орфографический словарь под редакцией С. И. Ожегова и А. Б. Шапиро со словником в 110 000 единиц, едва уместившихся на 1260 страницах. Он действительно завершил давнюю реформу — и тотчас Адуев-дядя вместо «чорта» сказал «черт» (источник).
Иногда особенности пунктуации связаны с отсутствием технической возможности. Например, на печатной машинке могли отсутствовать разные виды кавычек. В этом случае логично приводить текст к современным нормам. Но не всегда орфография и пунктуация зависят от технических возможностей: они могут быть продуктом редактора издания.
С. А. Рейсер указывает на целый ряд более «прозаических» вопросов, которые приходится выяснять текстологу: «Для произведений большей части авторов, в особенности XIX века, мы сплошь и рядом сталкиваемся не столько с орфографической и пунктуационной системой автора, сколько с навыками писаря или корректора. Эта орфография и пунктуация, в свою очередь, редко была следствием научной эрудиции, а чаще всего результатом обычаев. Не забудем, что приблизительно до третьей четверти XIX в. русская орфография вообще была не упорядочена». «Обычаи» существовали и в самих редакциях. В ряде случаев текстолог сталкивается со спецификой корректорского упорядочивания орфографии в той или иной редакции. Интересно свидетельство одного корректора журнала «Время» (журнал Михаила и Федора Достоевских): «С теми немногими орфографическими особенностями, которые исключительно принадлежат „Времени“ (напр., потому что писать слитно, в прилагательных муж. р. в родительном ед. ч. писать ого вместо аго, если ударение находится на предпоследнем слоге, и друг.), типография познакомила меня скоро» (Печерская Т. И. Текстология и комментарии текста).
Фиксация корретировок
В любом случае, если производятся корректировки, лучше это указать. В формате Комтекст для этого есть несколько способов:
- поле
textual-noteв метаданных, - комментарии текстолога внутри текста
[comment текст комментария], - обычные примечания.
Возможно, в будущем получится разработать более удобные средства для представления и сравнения разных вариантов текста.
Заключение
Не получится ограничиться универсальным правилом: исправлять или не исправлять ошибки для любых оцифровываемых книг. Выбор может зависеть от многого: типа издания (академическое или другое), жанра текста (художественная литература, научный текст и др.), года издания (XX или XIX век и др.) и других факторов.
Несмотря на то, что воспроизведение текста посимвольно выглядит как цель ради цели, в некоторых случаях применим и этот подход. Например, если для обоснования изменений текста не хватает времени или квалификации.
Нет подхода, который одинаково подойдёт для Полного собрания сочинений В. И. Ленина, собрания сочинений Н. Г. Чернышевского и сборников Ильенковских чтений. Для каждого случая придётся выбирать подходящий способ оцифровки.
Менять текст, не имея достаточной подготовки и оснований, неправильно. В то же время не менять его, когда для этого найдены основания, тоже выглядит неверным. Это перенос задачи на «умных людей, которые придут в будущем».
В заключение — примечательное замечание монахов по поводу исправления опечаток из книги А. С. Рейсера:
Это чувство ответственности за текст очень хорошо ощущали уже в Древней Руси. Монахи-переписчики смиренно просили простить им невольные ошибки, допущенные промахи и погрешности текста. «Где прописался аз грешный не разумом, или немыслием, или недоумием, или непокорством, или непослушанием, или не рассмотрел, или поленился рассмотреть, или не дозрил, — и вы меня, ради бога, простите и не кляните, а сами собою исправливайте» (Рейсер С. А. Основы текстологии).