Текстология
Mastodon
Telegram
Mastodon
Telegram

Текстобзор 22: оцифрованные собрания сочинений В. И. Ленина

18.02.2026

Другие выпуски Текстобзора

В обзоре рассмотрены проекты по оцифровке и вычитке 5-го издания собрания сочинений В. И. Ленина.

Оглавление

  • Оглавление
  • Сайт Василия Грозина (uaio.ru)
    • Структура
    • Технологии
  • marxism.online
    • Концепция
    • Опечатки и типографика
      • Том 6, страница 4
      • Том 24, страница 27
      • Том 24, страница 15
      • В целом про опечатки
    • Форматирование
      • Том 30, страница 225
      • Том 24, страница 22
      • Том 3, страница 248
      • Том 3, страница 286
    • Другое
    • Бот для поиска
    • Технологии
    • «Марксизм.онлайн» в целом
  • Копии uaio.ru
  • Возможные улучшения HTML-версий собрания сочинений
    • Указатели
    • Ссылки на таблицы
    • Поиск
  • FB2-версия от «Литрес»
  • PDF-версии с сайта jvc-site.ru
  • doc-версия с библиотеки «Нестор»
  • Общее заключение

Сайт Василия Грозина (uaio.ru)

Собрание сочинений В. И. Ленина на сайте Василия Грозина — известная электронная версия. Многие сайты берут её за основу. На главной странице указана дата последнего обновления — 25.12.2017. Неизвестно, продолжается ли работа над проектом.

Сообщение от 06.11.2010:

Данная электронная версия Полного собрания сочинений В. И. Ленина в 55-ти томах (5-е издание) пока содержит немало погрешностей и недоделок. Работа над версией продолжается.

На сегодняшний день в неудовлетворительном состоянии находятся тома 28 и 29 в основной своей части - ввиду сложности материала этих томов. Они содержат черновики, конспекты, в которых присутствует множество пометок, отчеркиваний, графических выделений фрагментов текста, стрелок, больших скобок и так далее.

В прочих томах негодные к употреблению страницы относятся только к разделам черновиков (Подготовительные материалы), к документам сложной формы (Анкеты, Замечания и т.п.) в разделах Приложения, а также к отдельным схемам, особо сложным для воспроизведения в электронном гипертекстовом формате.

Остальной материал Собрания Сочинений приведен к читабельному виду, мало отличающемуся от оригинала.

Нужно иметь в виду, что выделения фрагментов текста курсивом, жирным шрифтом, разрядкой, мелким шрифтом – сделаны не везде. Эта работа продолжается. Возможны отдельные ошибки и опечатки, внесенные как на этапе автоматического распознавания текста, так и при ручном редактировании. Не везде в тексте правильно проставлены сноски на подстраничные примечания (звездочки). (Источник)

Структура

Оглавление собрания сочинений состоит из ссылок на HTML-страницы. Каждая страница — отдельный том.

Каждый том содержит обложку, титульные листы, введение, примечания, указатели, оглавление и деление на страницы — то есть почти полностью воспроизводит печатное издание.

Обложка первого тома.
Обложка первого тома.
Титульный лист первого тома.
Титульный лист первого тома.
Предисловие в первом томе.
Предисловие в первом томе.

Так как другие сайты воспроизводят версию с uaio.ru, описание деталей уместно в сравнении с другими версиями оцифрованного собрания сочинений.

Технологии

Сайт сделан крайне просто — чистый HTML с минимальными стилями CSS без скриптов. За счёт этого у сайта максимальная доступность, скорость и безопасность. Так как сайт старый, можно предположить, что HTML созданы вручную, база данных и серверные скрипты не используются.

У старого сайта есть обратная сторона: такой подход к разработке устарел. Используется кодировка windows-1251. Элементы P не содержат закрывающих тегов: это считается ошибкой в современном HTML.

<P><HR><A NAME=s37> </A><P ALIGN=CENTER>37
<BR>НОВЫЕ ХОЗЯЙСТВЕННЫЕ ДВИЖЕНИЯ В КРЕСТЬЯНСКОЙ ЖИЗНИ

Для перехода по страницам используются якоря. В коде выше страница 37 помечена идентификатором s37. Ссылка на нужную страницу будет выглядеть так:

http://www.uaio.ru/vil/01.htm#s37

Сайт использует http, а не https протокол.

marxism.online

marxism.online — онлайн-библиотека, на которой размещены собрания сочинений В. И. Ленина, К. Маркса и Ф. Энгельса и И. В. Сталина. Сайт в разработке с 2022 года.

Данный проект не относится к какой-либо организации или политической партии. Автором идеи, разработчиком и реализатором библиотеки является частное лицо. Проект не перейдет в распоряжение какой-либо партии или организации, так как библиотека, как и сами сочинения классиков, должны быть достоянием общественности и не должны носить рекламу какой-либо партии или организации. (Источник)

На сайте указаны организации, поддерживающие проект:

На сайте РТФ находится следующее описание проекта:

На главной странице «Марксизм.онлайн» отображаются новости, последняя новость была 22.09.2024:

Добавлен поиск по собранию сочинений И. В. Сталина. Результаты поиска будут зависеть от индексации поисковой системы Яндекс.

В будущем постараемся добавить другие варианты поиска.

У библиотеки есть канал ВКонтакте и Телеграме. В них публикуются новости проекта и развлекательные ролики.

Концепция

Проект создан для изучения марксизма на электронных устройствах (главная страница marxism.online)

Для собрания сочинений В. И. Ленина за основу взята оцифрованная версия Василия Грозина.

Данный проект был бы невозможен без той огромной работы, которую сделали мои предшественники. Библиотека представляет новую попытку улучшить юзабилити в изучении марксизма. Проект будет иметь следующие особенности:

  • все тома разбиты на страницы. Номер страницы в пагинации совпадает с номером в бумажной версии
  • на каждой странице — доступ к содержанию всего тома
  • быстрый поиск по содержанию тома без перезагрузки страницы (в разработке)
  • удобная навигация с поиском по предметному указателю (в разработке)
  • поиск по всему собранию сочинений (реализовано поисковыми системами) (Источник)

Так как функции поиска и навигации не реализованы, то «улучшение юзабилити в изучении марксизма» заключается в том, что исходные тексты поделены на страницы и на каждой странице можно открыть оглавление. Эти улучшения должны помочь решить следующие проблемы:

Сочинения классиков марксизма найти в интернете несложно. Современные поисковые системы дают возможность найти нужную работу, нужный том за несколько минут. Много тематических сайтов, в которых выложены работы в текстовом, отсканированном с распознаванием и без, виде.

Но вот работать с ними тяжеловато. Если нужно найти какую-то информацию, высказывание, упоминание, то такая работа с источниками напоминает работу с бумажной версией — открываем отсканированный предметный указатель и листаем до нужного термина. Выписываем страницы и номера томов, открываем нужный том и листаем. Это даже более неудобно, чем с бумажным вариантом. Многие термины их предметного указателя имеют ссылки на множество томов и страниц.

Но кое-какие продвижения в создании удобных для работы материалов есть. Некоторые энтузиасты занимались оцифровкой классиков и переводом в html-формат, вплоть до проставления гиперссылок. Но полученные на выходе материалы представляли собой длинную «простыню» — один html-файл на весь том. С ними также работать не очень удобно. (Источник)

Исходная проблема и способ её решения неясны. В версии Василия Грозина уже можно искать по всему тексту стандартными средствами браузера, в том числе по всем указателям. Переход на страницу из указателя тоже может быть сделан через простую гиперссылку. Поисковики индексируют файлы книг, и через них так же возможен поиск. Все эти функции можно сделать лучше, но непонятно, как эти проблемы решает деление на страницы в «Марксизм.онлайн». Деление на страницы скорее усложняет поиск и чтение.

Опечатки и типографика

Несколько случайно выбранных страниц с опечатками.

Том 6, страница 4

  • «Марксизм.онлайн»
  • uaio.ru

В тексте брошюры ). лишний пробел перед скобкой, а вместо пробела должна стоять метка сноски.

«Марксизм.онлайн», том 6, страница 4.
«Марксизм.онлайн», том 6, страница 4.
uaio.ru, том 6, страница 4.
uaio.ru, том 6, страница 4.
Сканы, том 6, страница 4.
Сканы, том 6, страница 4.

Том 24, страница 27

  • «Марксизм.онлайн»
  • uaio.ru

Используется дефис вместо тире. Это совпадает во всех текстах на «Марксизм.онлайн» и на uaio.ru. В выражении в эпоху 1907- 1913 лишний пробел после дефиса, так же здесь должно быть тире вместо дефиса.

«Марксизм.онлайн», том 24, страница 27.
«Марксизм.онлайн», том 24, страница 27.
uaio.ru, том 24, страница 27.
uaio.ru, том 24, страница 27.
Сканы, том 24, страница 27.
Сканы, том 24, страница 27.

Внизу этой же страницы. Лишние пробелы после многоточия, лишний пробел перед восклицательным знаком, дефис вместо тире везде, нет выделения цитаты, выделенной в печатной версии.

«Марксизм.онлайн», том 24, страница 27.
«Марксизм.онлайн», том 24, страница 27.
uaio.ru, том 24, страница 27.
uaio.ru, том 24, страница 27.
Сканы, том 24, страница 27.
Сканы, том 24, страница 27.

Том 24, страница 15

  • «Марксизм.онлайн»
  • uaio.ru

Нет выделения одной из цитат, как в печатной версии, хотя на этой же странице первая цитата выделена правильно. Пропущено выделение курсивом. Неверное направление кавычки.

«Марксизм.онлайн», том 24, страница 15.
«Марксизм.онлайн», том 24, страница 15.
uaio.ru, том 24, страница 15.
uaio.ru, том 24, страница 15.
Сканы, том 24, страница 15.
Сканы, том 24, страница 15.

В целом про опечатки

В текстах — типичные нарушения типографики после OCR: дефис вместо тире, лишние пробелы, неверные символы. Отсутствуют выделения курсивом и выделения цитат, которые есть в печатной версии. Все найденные ошибки совпадают на «Марксизм.онлайн» и на uaio.ru — из этого можно предположить, что систематической вычитки текстов на «Марксизм.онлайн» не производится.

Форматирование

Способ разметки на uaio.ru совпадает с «Марксизм.онлайн», вероятно, исходный HTML был импортирован с небольшими корректировками: появились закрывающие теги, удалены якоря страниц.

Том 30, страница 225

  • «Марксизм.онлайн»
  • uaio.ru

Заголовок из uaio.ru:

<P><HR><A NAME=s225> </A><P ALIGN=CENTER>225
<H2 ALIGN=CENTER>ИНТЕРНАЦИОНАЛ МОЛОДЕЖИ</H2>
<P ALIGN=CENTER>(ЗАМЕТКА)

Заголовок из «Марксизм.онлайн»:

<p align='CENTER'>225 </p>
<h2 align='CENTER'>ИНТЕРНАЦИОНАЛ МОЛОДЕЖИ</h2> 
<p align='CENTER'>(ЗАМЕТКА) </p>

И в первой, и во второй версии в разметке отсутствует семантика. Номера страниц — это такой же заголовок, как и все остальные. Подзаголовок «ЗАМЕТКА» тоже никак не выделен.

В версии «Марксизм.онлайн» добавлена ошибка — лишние пробелы перед </p>.

Том 24, страница 22

  • «Марксизм.онлайн»
  • uaio.ru

Та же ситуация с отсутствием семантики в разметке подзаголовка.

Подзаголовок из uaio.ru:

<P ALIGN=CENTER>I

Подзаголовок из «Марксизм.онлайн»:

<p align='CENTER'>I </p>

Эта проблема отражается на оглавлении в «Марксизм.онлайн». В работе В. И. Ленина с этой страницы видно только подзаголовок III, так как он и в исходном тексте на uaio.ru оформлен семантически — как h3.

Том 3, страница 248

  • «Марксизм.онлайн»
  • uaio.ru

Таблица из uaio.ru:

<P>
<TABLE BORDER=1 CELLSPACING=0>
    <CAPTION>50 губерний Европейской России
        <A HREF="#p91"><SUP>91</SUP></A>
    </CAPTION>
    <TR>
        <TH ROWSPAN=3>Периоды
        <TH ROWSPAN=3>Население
            <BR>об. пола<BR>Миллионы
        <TH COLSPAN=4>Миллионы четвертей
        <TH COLSPAN=3>На одну душу населения приходится четвертей чистого сбора
    <TR>
        <TH>Посев
        <TH>Чист. сб.
        <TH>Посев
        <TH>Чист. сб.
        <TH ROWSPAN=2>Зернов. хлебов
        <TH ROWSPAN=2>Карто-<BR>феля
        <TH ROWSPAN=2>Всего хлеба
    <TR>
        <TH COLSPAN=2>Всех хлебов, т. е. зерновых хлебов плюс картофель
        <TH COLSPAN=2>Картофеля
    <TR ALIGN=CENTER>
        <TD ALIGN=LEFT>1864-1866
        <TD>61,4
        <TD>72,2
        <TD>152,8
        <TD>6,9
        <TD>17,0
        <TD>2,21
        <TD>0,27
        <TD>2,48
        ...
</TABLE>

Таблица из «Марксизм.онлайн»:

<table cellspacing='0' border='1' align='CENTER'>
  <caption><i>50 губерний Европейской России</i>
   <a href='/lenin-v-i/volume-3/656/#p91'><sup>91</sup></a>
</caption>
<tbody>
<tr>
<th rowspan='3'>Периоды</th>
<th rowspan='3'>Население<br>об. пола<br>Миллионы</th>
<th colspan='4'>Миллионы четвертей</th>
<th colspan='3'>На одну душу населения <br>приходится четвертей <br>чистого сбора</th>
</tr>
<tr>
<th>Посев</th>
<th>Чист. сб.</th>
<th>Посев</th>
<th>Чист. сб.</th>
<th rowspan='2'>Зернов. <br>хлебов</th>
<th rowspan='2'>Карто-<br>феля</th>
<th rowspan='2'>Всего <br>хлеба</th>
</tr>
<tr>
<th colspan='2'>Всех хлебов, <br>т. е. зерновых <br>хлебов плюс <br>картофель</th>
<th colspan='2'>Картофеля</th>
</tr>
<tr align='CENTER'>
<td align='LEFT'>1864-1866</td>
<td>61,4</td>
<td>72,2</td>
<td>152,8</td>
<td>6,9</td>
<td>17,0</td>
<td>2,21</td>
<td>0,27</td>
<td>2,48</td>
</tr>
...
</tbody>
</table>

Отличия минимальны, в основном касаются форматирования и переводов строк.

Таблицы — один из самых сложных элементов для форматирования и для отображения. Вот так эта таблица выглядит на сайтах:

«Марксизм.онлайн», том 3, страница 248.
«Марксизм.онлайн», том 3, страница 248.
uaio.ru, том 3, страница 248.
uaio.ru, том 3, страница 248.
Сканы, том 3, страница 248.
Сканы, том 3, страница 248.

Все варианты внешнего вида таблицы, включая тот, что в бумажной версии ПСС, — плохие. Разметка таблицы в виде HTML не удобна для редактирования и чтения без специальных инструментов, этот способ приходится применять от безысходности.

Внизу страницы сноски. Форматируются они одинаково и на uaio.ru, и на «Марксизм.онлайн». Здесь тоже видно отсутствие семантики — текст примечания это абзац в котором «маленький текст».

<hr width='15%' align='LEFT'>
<p align='JUSTIFY'><small>* Для периода 1883-1887 гг. взято население 1885-го года; прирост принят = 1,2%. Разница между данными губернаторских отчетов и данными д-та земледелия, как известно, незначительна. Цифры за 1905 г. вычислены переводом пудов на четверти.</small></p>

На этой же странице есть ссылка на примечание.

Ссылка на примечание из uaio.ru:

<A HREF="#p91"><SUP>91</SUP></A>

Ссылка на примечание из «Марксизм.онлайн»:

<a href='/lenin-v-i/volume-3/656/#p91'><sup>91</sup></a>

Том 3, страница 286

  • «Марксизм.онлайн»
  • uaio.ru

На этой странице ещё одна таблица. В этом случае печатный вариант хоть и с недостатками, но значительно лучше, чем оба оцифрованных. В этой таблице единственное встреченное исправление на «Марксизм.онлайн», по сравнению с uaio.ru, — это направление групповой скобки в таблице.

«Марксизм.онлайн», том 3, страница 248.
«Марксизм.онлайн», том 3, страница 248.
uaio.ru, том 3, страница 248.
uaio.ru, том 3, страница 248.
Сканы, том 3, страница 248.
Сканы, том 3, страница 248.

Другое

На сайте «Марксизм.онлайн» утеряны предисловия, которые присутствуют на uaio.ru. Также утеряны иллюстрации, которые идут после предисловия.

И на uaio.ru, и на «Марксизм.онлайн» в первом томе утеряно изображение В. И. Ленина, которое идёт сразу за титульным листом.

Бот для поиска

На главной странице библиотеки отображается ссылка на телеграм-бота

При его запуске он переводит на другого бота:

Этот бот просит подписаться на определенный канал, чтобы начать работать:

Пример новости из канала.
Пример новости из канала.

Функционал бота, связанный с «получением знаний по агитпропу»:

При использовании функции поиска бот выводит несколько цитат из собраний сочинений библиотеки и ссылку на страницу. Вероятно, используется или нечеткий поиск, или нейросети. Полезность поиска в реализованном виде вызывает сомнения.

Технологии

Сайт разработан на WordPress, написанном на PHP.

Для слежения за пользователями сайт библиотеки использует Яндекс.Метрику и Google Analytics.

Причём в Яндекс.Метрике включен webvisor:true, clickmap:true, и trackLinks:true. Эти инструменты используются для записи действий пользователя и принятия на основе этих записей маркетинговых решений.

О данном факте с радостью сообщают разработчики сайта в Телеграм-канале, прикладывая запросы пользователей и их месторасположение.

Данные посетителей сайта «Марксизм.онлайн». Отображается поисковый запрос по которому человек перешел на сайт, время посещения и город. Эти и другие данные хранятся на серверах компании «Яндекс».
Данные посетителей сайта «Марксизм.онлайн». Отображается поисковый запрос по которому человек перешел на сайт, время посещения и город. Эти и другие данные хранятся на серверах компании «Яндекс».

Рядом оповещение о новом канале в Дзене:

Трекеры, дзен и телеграм-бот выглядят скорее как глупость, чем злой умысел. Однако до того, как разработчики перейдут на более безопасные платформы и исключат трекеры с сайта, разумным людям следует воздержаться от посещения сайта и взаимодействия с авторами.

«Марксизм.онлайн» в целом

По сравнению с uaio.ru на «Марксизм.онлайн» не выявлено улучшений исходного текста. Деление на страницы скорее затрудняет чтение, чем облегчает. Кроме того, текст собраний сочинений не полный — нет введений и некоторых иллюстраций. Поиска принципиально лучше, чем через поисковые системы или средства браузера, на сайте нет. Оглавление тоже не даёт особенных преимуществ. Ситуация с информационной безопасностью уничтожает даже то, что могло бы быть потенциально полезным в части просмотра с мобильных устройств. В итоге получаем то, что работа одного человека на устаревших технологиях полезнее, чем новая версия, сделанная, предположительно, коллективно.

Отдельный момент: инструменты коллективной работы (если они есть) и результаты вычитки не обобществлены. Нет возможности скачать все тексты разом в удобном виде, чтобы сравнить их или использовать в других системах. Примечательно, что даже общегуманистические проекты вроде Викитеки и Проекта Гутенберг со скромными абстрактно-просветительскими целями в гораздо большей степени обобществляют свои результаты, чем это делают проекты «коммунистической» направленности.

Копии uaio.ru

Есть много сайтов, где дублируются файловые архивы или веб-версии. Существенной доработки текстов или внешнего вида не производится, только конвертация. Такие копии и архивы полезны тем, что не позволяют запретить или удалить все книги административным решением.

Один из примеров Библиотека коммунизма от Прорыва и Прорывиста. По сравнению с uaio.ru немного изменены стили CSS, изображения добавлены сразу в текст, а в uaio.ru местами были только ссылки. В первый том добавлено первое изображение после титульного листа.

В то же время, вероятно, из-за технических проблем появились небольшие дефекты. Например, лишний символ подчёркивания в номерах сносок и вынос таблиц отдельно от основного текста.

В библиотеке от «Прорыва» и «Прорывиста» используется аналитика «Яндекса», но в ограниченном объёме — без записи действий пользователя:

<noscript><div><img src="https://mc.yandex.ru/watch/None" style="position:absolute; left:-9999px;" alt="" /></div></noscript>

Однако даже такая минимальная интеграция потенциально позволяет передавать на серверы «Яндекса» IP-адрес пользователя и, вероятно, иную информацию. С другой стороны, в данном случае код выглядит незавершённым: вместо None должен быть указан идентификатор счётчика, и, возможно, именно поэтому трекер не работает.

В любом случае, на сайтах, стремящихся к освобождению труда, имеет смысл отказаться от счётчиков «Яндекса» и Google.

Возможные улучшения HTML-версий собрания сочинений

Указатели

В конце каждого тома собрания сочинений располагаются несколько указателей.

В Указателе имён есть номера страниц, на которых упоминается человек. Сейчас эти номера страниц никак не размечены на uaio.ru и на «Марксизм.онлайн». Эти номера страниц можно разметить ссылками, тогда на нужную страницу будет проще переходить. Также возможно свести Указатели имён со всех томов в единый указатель.

То же самое относится к Указателю литературных работ и источников. В биографических сведениях в конце книги тоже могут быть прямые ссылки на работы. Всё это действительно упростило бы работу с указателями.

Ссылки на таблицы

В третьем томе в тексте есть ссылки на таблицы следующего вида: [см. таблицу на стр. 80. Ред.].

Сперва кажется, что хорошим решением было бы обернуть этот текст в гиперссылку на нужную страницу. Однако, если посмотреть глубже, то источник добавления такой ссылки — это ограничения бумажной версии.

В оцифрованной версии логично не воспроизводить ограничения бумажной версии, а наоборот сделать то, что не получилось, но хотелось бы сделать верстальщикам бумажной версии — вставить нужную таблицу сразу за абзацем со ссылкой.

Поиск

Сейчас не хватает удобного интерфейса для поиска по всему собранию сочинений, а не только по одному тому. Также, кроме поиска по точному совпадению, полезен был бы поиск с учетом морфологии.

FB2-версия от «Литрес»

На разных сайтах можно скачать FB2-файлы собрания сочинений. Рассмотрим 4 источника: Флибуста, «Литрес», leninism.su и mrxsm.ru.

Для примера возьмем опечатки из 24 тома, указанные выше.

Файлы на Флибусте, leninism.su и mrxsm.ru совпадают.

В метаинформации файла автор документа следующий:

<document-info>
    <author>
        <first-name>Светлана</first-name>
        <last-name>Тимакова</last-name>
        <nickname>cveta</nickname>
    </author>
    <program-used>OOoFBTools-2.32 (ExportToFB21), FictionBook Editor Release 2.6.6</program-used>
    <date value="2016-04-14">14.04.2016</date>
    <src-url>http://www.litres.ru/pages/biblio_book/?art=17083647</src-url>
    <src-ocr>Текст предоставлен правообладателем</src-ocr>

Все найденные выше опечатки на страницах 15, 22 и 27 отсутствуют. Разметка цитат, курсива и заголовков сделана правильно. Можно предположить, что это отдельная оцифровка, которая проводилась компанией «Литрес», или исправление версии с сайта uaio.ru. Единственный обнаруженный недостаток — вместо тире везде используется символ короткого тире, но эту ошибку легко исправить массовой заменой.

На сайте «Литрес» файл 24 тома FB2 не скачивается, но при онлайн-просмотре опечаток так же нет. Похоже, что файл не скачивается из-за технической проблемы, а не преднамеренно. Том 1 на Флибусте и Литрес тоже совпадают. Описания файла такое же:

  <document-info>
    <author>
      <first-name>Светлана</first-name>
      <last-name>Тимакова</last-name>
      <nickname>cveta</nickname>
    </author>
    <program-used>OOoFBTools-2.32 (ExportToFB21), FictionBook Editor Release 2.6.6</program-used>
    <date value="2016-02-02">02.02.2016</date>
    <src-url>http://www.litres.ru/pages/biblio_book/?art=17083486</src-url>
    <src-ocr>Текст предоставлен правообладателем</src-ocr>
    <id>813ae309-c684-11e5-82bb-0cc47a5203ba</id>
    <version>1.01</version>

На основе этой информации можно предположить, что Светлана Тимакова, работая в «Литрес», вычитала как минимум часть собрания сочинений В. И. Ленина. Причём эта вычитка более качественная, чем на «Марксизм.онлайн» и uaio.ru. Однако сравнение качества вычитки проведено поверхностно, на основе нескольких случайных страниц, поэтому для практических задач, например, выбора версии, которую взять за основу для переводов, следует провести более детальное сравнение.

PDF-версии с сайта jvc-site.ru

Кроме HTML- и FB2-версий попадаются PDF-версии собрания сочинений, например, на сайте mlpb.ru.

Эти PDF красиво оформлены и являются изначально компьютерными PDF, а не сканами с OCR-слоем.

PDF 24 тома содержит отличающуюся комбинацию опечаток на странице 27: нет лишних пробелов, везде тире, в то же время по-разному оформлен пробел перед символом процента — в одном месте есть, а в другом нет.

Внизу страниц пробела перед восклицательным знаком уже нет, но лишний пробел после многоточия в начале цитаты — есть.

Эти признаки дают повод предположить, что это ещё одна независимая оцифровка собрания сочинений.

Метаинформация файла содержит следующие данные:

<rdf:Description rdf:about='uuid:4068cea4-4f82-4cf2-8ea1-05527bf92bcf'
    xmlns:pdf='http://ns.adobe.com/pdf/1.3/' pdf:Producer='Acrobat Distiller 6.0 (Windows)'>
    <pdf:Keywords>Предоставлено для читального зала WWW.JVC-SITE.RU без права тиражирования.</pdf:Keywords>
</rdf:Description>
<rdf:Description rdf:about='uuid:4068cea4-4f82-4cf2-8ea1-05527bf92bcf'
    xmlns:xap='http://ns.adobe.com/xap/1.0/' xap:CreatorTool='Acrobat PDFMaker 6.0 for Word' xap:ModifyDate='2008-08-04T17:51:00+04:00' xap:CreateDate='2008-08-04T16:41:44+04:00' xap:MetadataDate='2008-08-04T17:51:00+04:00'></rdf:Description>
<rdf:Description rdf:about='uuid:4068cea4-4f82-4cf2-8ea1-05527bf92bcf'
    xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/' xapMM:DocumentID='uuid:4031b5e3-fcb4-4c80-997f-d02cb55bf9d1'/>
<rdf:Description rdf:about='uuid:4068cea4-4f82-4cf2-8ea1-05527bf92bcf'
    xmlns:dc='http://purl.org/dc/elements/1.1/' dc:format='application/pdf'>
    <dc:title>
        <rdf:Alt>
            <rdf:li xml:lang='x-default'>В. И. Ленин. Полное собрание сочинений. Изд. 5</rdf:li>
        </rdf:Alt>
    </dc:title>
    <dc:creator>
        <rdf:Seq>
            <rdf:li>Правообладатель - JVC (WWW.JVC-SITE.RU)</rdf:li>
        </rdf:Seq>
    </dc:creator>
</rdf:Description>

Итого: файл создан в 2008 году для сайта WWW.JVC-SITE.RU. На этом домене находится старый онлайн-магазин книг «Библиотека электронных изданий „Уникум"»:

В одной из позиций собрание сочинений В. И. Ленина:

Скриншот с обложкой:

Внизу сайта пометка:

Вырученные средства предназначены для оказания помощи детским домам и приютам.

Сайт очень старый, сделан с помощью Word:

<meta http-equiv=Content-Type content="text/html; charset=windows-1251">
<meta name=ProgId content=Word.Document>
<meta name=Generator content="Microsoft Word 14">
<meta name=Originator content="Microsoft Word 14">
<link rel=File-List href="index.files/filelist.xml">
<link rel=Edit-Time-Data href="index.files/editdata.mso">
<title>WWW.JVC-SITE.RU : Библиотека электронных изданий «Уникум»</title>

Домен зарегистрирован в 2005 году:

domain:        JVC-SITE.RU
nserver:       ns1.rmt.ru.
nserver:       ns2.rmt.ru.
nserver:       ns.rmt.ru.
state:         REGISTERED, DELEGATED, VERIFIED
person:        Private Person
registrar:     RU-CENTER-RU
admin-contact: https://www.nic.ru/whois
created:       2005-04-24T20:00:00Z
paid-till:     2026-04-24T21:00:00Z
free-date:     2026-05-26
source:        TCI
Last updated on 2026-02-17T19:23:01Z

Судя по всему, оцифрованная версия на сайте jvc-site.ru независима от uaio.ruи сделана в 2008 году или раньше.

doc-версия с библиотеки «Нестор»

На сайте В. И. Ленин. Жизнь и деятельность располагается версия собрания сочинений в виде файлов в форме doc.

Метаинформация в файлах сходная, пример из файла первого тома:

└──╼ $exiftool bd01.doc 
ExifTool Version Number         : 12.57
File Name                       : bd01.doc
Directory                       : .
File Size                       : 4.4 MB
File Modification Date/Time     : 2006:08:06 10:28:06+06:00
File Access Date/Time           : 2026:02:18 15:22:52+05:00
File Inode Change Date/Time     : 2026:02:18 15:23:03+05:00
File Permissions                : -rw-r--r--
File Type                       : DOC
File Type Extension             : doc
MIME Type                       : application/msword
Identification                  : Word 8.0
Language Code                   : Russian
Doc Flags                       : Has picture, 1Table, ExtChar
System                          : Windows
Word 97                         : No
Title                           : 
Subject                         : 
Author                          : Вячеслав Сачков
Keywords                        : 
Comments                        : 
Template                        : Normal.dot
Last Modified By                : Вячеслав Сачков
Software                        : Microsoft Word 9.0
Create Date                     : 2006:08:05 23:41:00
Modify Date                     : 2006:08:06 05:28:00
Security                        : None
Code Page                       : Windows Cyrillic
Company                         : 
Char Count With Spaces          : 1271502
App Version                     : 9.6926
Scale Crop                      : No
Links Up To Date                : No
Shared Doc                      : No
Hyperlinks Changed              : No
Title Of Parts                  : 
Heading Pairs                   : Название, 1
Comp Obj User Type Len          : 24
Comp Obj User Type              : �������� Microsoft Word
Last Printed                    : 0000:00:00 00:00:00
Revision Number                 : 3
Total Edit Time                 : 2 minutes
Words                           : 181643
Characters                      : 1035366
Pages                           : 1
Paragraphs                      : 2070
Lines                           : 8628
Last Saved By                   : Вячеслав Сачков (G:\temp\bd01.doc)

Хранение этой информации — одна из причин, почему не стоит пользоваться Вордом.

Данные из файла приводят к Электронной библиотеке «NESTOR» (libelli.ru).

Главная страница libelli.ru
Главная страница libelli.ru

Собрание электронных текстов библиотеки-указателя "Nestor" (http://libelli.ru/) содержит 64161 позицию, 16690 имен авторов и названий сборников. Общий объем 8 (в разархивированном виде - 18) гб. Иначе говоря, моя библиотека является одной из крупнейших в рунете.

Кроме необычно большого размера она имеет еще ту особенность, что делается как хобби одним человеком, т. е. мной, в свободное от работы время. Поэтому у меня физически нет времени для того, чтобы обеспечить ее явными html-ссылками (я с благодарностью принял бы помощь людей, кто сделал бы эту работу), но, тем не менее, все тексты доступны и скачиваемы с сервера, только нетривиальным образом.

Составление, дизайн, частично OCR и вычитка Вячеслав Сачков, 14.09.2008.

Вот уже более 15-ти лет я делаю мой сайт в одиночку. (Источник).

В футере даты работы сайта обозначены как «2003-2020». У собрания сочинений В. И. Ленина есть отдельная страница. Ссылки на файлы сейчас не работают.

Набор опечаток на странице 27 тома 24 почти полностью совпадает с версией с jvc-site.ru за исключением лишнего пробела перед восклицательным знаком, который есть в версии библиотеки «Нестор».

PDF с jvc-site.ru, том 24, с. 27.
PDF с jvc-site.ru, том 24, с. 27.
doc с библиотеки Нестор, том 24, с. 27.
doc с библиотеки Нестор, том 24, с. 27.

Так как файл с jvc-site.ru редактировался в 2008 году, а файл из библиотеки «Нестор» в 2006, то можно предположить, что автор jvc-site.ru взял файл с библиотеки «Нестор», исправил какие-то опечатки и сделал PDF.

Косвенно это подтверждается использованием Acrobat PDFMaker 6.0 for Word. Ниже часть метаинформации PDF 24 тома с сайта jvc-site.ru:

XMP Toolkit                     : XMP toolkit 2.9.1-13, framework 1.6
About                           : uuid:4068cea4-4f82-4cf2-8ea1-05527bf92bcf
Producer                        : Acrobat Distiller 6.0 (Windows)
Creator Tool                    : Acrobat PDFMaker 6.0 for Word
Modify Date                     : 2008:08:04 17:51:00+04:00
Create Date                     : 2008:08:04 16:41:44+04:00
Metadata Date                   : 2008:08:04 17:51:00+04:00
Document ID                     : uuid:4031b5e3-fcb4-4c80-997f-d02cb55bf9d1
Format                          : application/pdf
Title                           : В. И. Ленин. Полное собрание сочинений. Изд. 5

Ещё одно косвенное подтверждение — в титульном листе первого тома в PDF с jvc-site.ru используется символ ~, что ближе к оригиналу.

doc с библиотеки Нестор, титульный лист первого тома.
doc с библиотеки Нестор, титульный лист первого тома.
PDF с jvc-site.ru, титульный лист первого тома.
PDF с jvc-site.ru, титульный лист первого тома.
Сканы, титульный лист первого тома..
Сканы, титульный лист первого тома..

На uaio.ru в этом месте дефис. Исходя из этого возникает вопрос: может быть, версия с библиотеки «Нестор» послужила источником для версии uaio.ru?

Сравнение доменов

domain:        LIBELLI.RU
nserver:       ns1.mchost.ru.
nserver:       ns2.mchost.ru.
nserver:       ns3.mchost.ru.
nserver:       ns4.mchost.ru.
state:         REGISTERED, DELEGATED, VERIFIED
person:        Private Person
registrar:     RU-CENTER-RU
admin-contact: https://www.nic.ru/whois
created:       2003-09-14T20:00:00Z
paid-till:     2026-09-14T21:00:00Z
free-date:     2026-10-16
source:        TCI
Last updated on 2026-02-18T11:23:01Z
domain:        UAIO.RU
nserver:       ns1.masterhost.ru.
nserver:       ns2.masterhost.ru.
nserver:       ns.masterhost.ru.
state:         REGISTERED, DELEGATED, UNVERIFIED
person:        Private Person
registrar:     RD-RU
admin-contact: https://cp.mastername.ru/domain_feedback/
created:       2009-09-17T20:00:00Z
paid-till:     2026-09-17T21:00:00Z
free-date:     2026-10-19
source:        TCI
Last updated on 2026-02-18T11:23:01Z

libelli.ru зарегистрирован в 2003 году, а uaio.ru в 2009. Кроме этого есть Объявление о создании универсального портала «Материалистическая диалектика», в котором указана дата 2000 г.

Мы убеждены, что обсуждение проблем развития нашего общества, основанное на принципах материализма и диалектической логики, позволит правильно оценить возникшие в стране и мире тенденции, сделать из них грамотные выводы для практики, четко определить цели и задачи и начать методически осуществлять их. Для этого мы создаем универсальный портал "Материалистическая диалектика", аккумулирующий и рассылающий, преимущественно в электронном виде, следующие материалы:

  1. собрания сочинений основоположников научного коммунизма;
  2. оригинальные работы других теоретиков марксистского направления;
  3. материалы дискуссий;
  4. современную малотиражную левую прессу.

Всех, кто интересуется теорией и особенно практическим применением методов диалектической логики, приглашаем к сотрудничеству.

12 октября 2000 г.

В. Сачков (nestor[собака]libelli.ru), В. Исайчиков (mihmarkinp[собака]mail.ru), И. Макаров (+), В. Страхов (vlast12[собака]mail.ru), С. Айзенберг (asenberg[собака]4ever.ru), С. Марков (sm_rpk[собака]mail.ru), А. Суворов (root[собака]suvorov.msk.ru), В.Ганжин (marks1917[собака]mail.ru), С.Новиков (nov959[собака]dol.ru).

Даты позволяют предположить, что для uaio.ru использовались файлы из библиотеки «Нестор» или же оцифровка на uaio.ru была независима, но сделана позже. Так как в версии библиотеки «Нестор» исправлено опечаток больше, то более вероятным кажется второй вариант — это два независимых проекта по вычитке.

На «Флибусте» кроме собрания сочинений в FB2 есть набор файлов в doc. Часть метаинформации из этих файлов:

Last Modified By                : Vitalii Usenko
Software                        : Microsoft Office Word
Create Date                     : 2010:07:19 18:34:00
Modify Date                     : 2010:08:01 10:15:00

Судя по этим данным и содержимому файлов — эти файлы более новая копия файлов Вячеслава Сачкова, сделанная в 2010 году Виталием Усенко.

Общее заключение

На основе поверхностного изучения файлов и сайтов с собраниями сочинений В. И. Ленина можно сделать следующие предположения:

  • Самая ранняя оцифровка сделана в библиотеке «Нестор» Вячеславом Сачковым, не позже 2006 года. Файлы распространялись в формате doc;
  • Из файлов библиотеки «Нестор» авторы сайта jvc-site.ru сделали PDF-версию собрания сочинений с исправлением некоторых опечаток. Эта работа была сделана не позже 2007 года;
  • Собрание сочинений на uaio.ru было сделано Василием Грозиным в период 2011—2017 гг. Возможно, за исходную использовалась версия из библиотеки «Нестор», но более вероятна независимая оцифровка со сканов;
  • Версия «Литрес» сделана около 2016 года Светланой Тимаковой, вероятно, во время работы в «Литрес». Какой исходник был взят, неизвестно;
  • От этих корневых версий идёт большое количество копий.

Наиболее вычитана версия «Литрес». Также она единственная с семантической разметкой, так как используется формат FB2. Точное качество вычитки нужно оценивать более детальной проверкой.

В версиях собрания сочинений, кроме «Литрес», при случайном просмотре нескольких страниц обнаруживается большое количество опечаток. Вычитка, конечно, проводилась, но, вероятно, не системная и без чётких правил, например, связанных с типографикой. Попадаются неверные символы, лишние пробелы, отсутствие выделений курсивом.

В итоге можно резюмировать: задача по оцифровке собрания сочинений В. И. Ленина остаётся актуальной. Текстологически выверенной версии в доступном для автоматической обработки и для переводов формате ещё нет. За основу можно взять один из существующих вариантов — уже проделана большая работа, и она будет полезна.

Если у вас есть более точная информация про упомянутые выше проекты по оцифровке или про другие и вы хотите ею поделиться, то свяжитесь, пожалуйста, через SimpleX Chat, Mastodon или почту.

Последнее изменение: 19.02.2026, 10:30