Текстология
Главная
Обновления в TG
Главная
Обновления в TG

Про ёфикацию текстов

18.09.2025

Во многих текстах вместо буквы ё используется е. Современные правила русского языка выделяют два варианта употребления буквы ё: последовательный и выборочный. Последовательное написание ё обязательно только в учебной и детской литературе. В остальных случаях допускается как последовательное, так и выборочное использование — только в тех словах, которые могут быть неправильно прочитаны или поняты.

Спор о необходимости обязательной ёфикации всех текстов длится уже давно, и у него есть как сторонники, так и противники. В контексте текстологии этот вопрос усложняется: речь идёт не о новых текстах, а о тех, что уже были написаны или опубликованы без ё. Даже расстановка ё по рекомендованным правилам может восприниматься как искажение оригинала.

Для автоматизации ёфикации существуют специальные программы — ёфикаторы. Например, можно использовать консольную утилиту eyo для Node.js; также доступна версия для встраивания в другие системы — eyo-kernel.

Алгоритм работы таких программ основан на словаре слов с буквой ё. Причем есть два варианта таких слов: когда в слове всегда используется ё и когда существует два различных слова, одно с ё, а другое с е. Словари таких слов [находятся eyo-kernel в файлах safe.txt и not_safe.txt.

Алгоритмы таких программ основаны на словарях слов с буквой ё. При этом различают два типа слов: те, где ё используется всегда, и те, где возможны две формы — с ё и с е, обозначающие разные слова. В проекте eyo-kernel такие списки [хранятся в файлах]https://github.com/e2yo/eyo-kernel/tree/master/dictionary) safe.txt и not_safe.txt.

Примеры слов из словаря safe.txt:

отклонён
отклонённ(ая|ого|ое|ой|ом|ому|ою|ую|ые|ый|ым|ыми|ых)
отключён
отключённ(ая|ого|ое|ой|ом|ому|ою|ую|ые|ый|ым|ыми|ых)
отклюёт
отклёван
отклёванн(ая|ого|ое|ой|ом|ому|ую|ые|ый|ым|ыми|ых)
...
отлётк(а|ам|ами|ах|е|и|ой|ою|у)
отлётн(ая|ого|ое|ой|ом|ому|ою|ую|ые|ый|ым|ыми|ых)
отлёток
отмалёвыв(ал|ала|али|ало|ать|ают|ая)
отмалёвыва(ем|ет|ете|ешь|ю)

Примеры слов в словаре not_safe.txt:

разарёнковск(ие|ий|им|ими|их|ого|ом|ому)
разарёновск(ие|ий|им|ими|их|ого|ом|ому)
развёрнут
разгромлён
разгромлённ(ая|ого|ое|ой|ом|ому|ою|ую|ые|ый|ым|ыми|ых)
разгружён
разгружённ(ая|ого|ое|ой|ом|ому|ою|ую|ые|ый|ым|ыми|ых)
раздвоён

Ёфикатор способен выполнять более сложные проверки, чем простое сопоставление со словарём. Например, он может отличить фразу мед. училище от он ел мёд по контексту.

Ёфикатор можно использовать для автоматической безопасной замены однозначных слов, а также для поиска слов, в которых возможны два варианта — с ё и с е. С другой стороны, замена слов, которые читаются однозначно, как раз и не является обязательной, так как не создаёт проблем при чтении.

Вопрос о массовой ёфикации остаётся открытым. В формате Comtext для таких случаев предусмотрено специальное поле textual-note, где можно зафиксировать особенности оцифровки отдельного текста, включая информацию о ёфикации.

Последниее изменение: 18.09.2025, 15:51