Совместное распознавание текста и оформления в исторических документах на русском языке
Аннотация:
Рассмотрена сквозная, свободная от сегментации архитектура Document Attention Network (DAN), на примере распознавания исторических документов на русском языке. Архитектура DAN способна распознать текст или макет документа любого размера и вывести распознанный текст, а также логические области макета оформления. Выполнено сравнение полученных результатов экспериментов с набором данных Digital Peter, по которому обучены модели распознавания рукописного текста, имеющие высокую точность распознавания на уровне строк. Набор данных состоит из документов рукописей Петра Великого. Эталонные данные для архитектуры DAN представлены в соответствии со сложной схемой формата XML, которая обеспечила точное определение макета оформления и текстовых областей. Получены следующие результаты распознавания текста на уровне страницы: 18,71 % для коэффициента ошибок символов (Character Error Rate, CER), 39,7 % — коэффициента ошибок в словах (Word Error Rate, WER), 14,11 % при упорядочении макета слов (Layout Ordering Error Rate, LOER) и 66,67 % для средней точности (mean Average Precision, mAP).
Ключевые слова:
Постоянный URL
Статьи в номере
- Анализ частотно-робастных многомерных динамических систем
- Фрактальные микро- и нанодендриты из серебра, меди и их соединений для фотокаталитического разложения воды
- Математическое моделирование трехслойного диэлектрика OTFT на основе пентаценового полупроводника для улучшения электрических характеристик
- Исследование гидратов диоксида углерода в тонких пленках методом FTIR-спектроскопии при температурах 11–180 К
- Метод повышения информационной ценности видеоданных на основе фильтрации кадров и оценки энтропии
- Метод выявления групп атакующих на основании анализа полезной нагрузки сетевого трафика по протоколу HTTP
- Детекция ключевых точек лица с помощью капсульных нейронных сетей
- Обзор национальных и международных стандартов для категорирования объектов критической информационной инфраструктуры
- Критерий безопасности сетевой инфраструктуры
- Новый способ сбора данных для обнаружения аномального поведения в среде Kubernetes и агент для сбора метрик с узлов
- Метод линейной аппроксимации временных параметров в эластичных системах
- Выделение ролей в сетях общественного транспорта с атрибутами узлов: исследование открытых данных Санкт-Петербурга
- Исследование тенденций взаимосвязи между профориентационными предпочтениями пользователей и их цифровыми следами в социальной сети
- Обнаружение слепоты при диабетической ретинопатии с использованием алгоритма связанных компонентов на основе байесовского варианта в Keras и TensorFlow
- Интеллектуальная поддержка клинических решений при небольших выборках числа пациентов
- Оценка готовности компьютерной системы к своевременному обслуживанию запросов при его совмещении с информационным восстановлением памяти после отказов
- Анализ устойчивости ортотропной цилиндрической оболочечной конструкции в программном комплексе ANSYS Mechanical APDL
- Обоснование выбора технологии мобильного широкополосного доступа для построения сетей радиосвязи железнодорожного транспорта
- Сравнительный анализ производительности DVR и DSTATCOM для распределенной генерации с алгоритмом гравитационного поиска
- Оценка моментов квантованной случайной величины
- Экспериментальный метод оценки динамической погрешности приборов и датчиков в условиях их эксплуатации
- Метод моделирования резервуаров сжиженного природного газа типа С на основе оптимизации объема для будущей эксплуатации в режиме частичного заполнения
- Оптические свойства нелинейных кристаллов семейства боратов и их применение в источниках интенсивноготерагерцового излучения
- Модель чувствительного элемента рефрактивного волоконно-оптического сенсора на основе MMF-SMF-MMF структуры с использованием поверхностного плазмонного резонанса