Теперь можно читать старый почерк с помощью платформы ИИ

Прочитано: 151 раз(а)


С помощью искусственного интеллекта компьютеры могут расшифровывать рукописные тексты и делать их доступными для всех. Платформа Transkribus, совместно разработанная в Университете Инсбрука, Австрия, делает эту технологию доступной для ученых и широкой общественности. Постоянно растущая группа людей использует Transkribus для изучения своей семейной истории. Недавно в Инсбруке собрались пользователи со всего мира.

Почерк так же индивидуален, как и люди. Тем не менее современные компьютеры способны автоматически распознавать почерк на самых разных языках. Программная платформа Transkribus, совместно разработанная Университетом Инсбрука, делает эту технологию доступной для научного сообщества , архивов и широкой общественности. Более 90 000 пользователей со всего мира уже используют платформу, чтобы сделать рукописные документы доступными для чтения и поиска. Постоянно растущая группа людей интересуется историей своей семьи и начинает искать своих предков в церковных записях, договорах или других исторических документах .

«Искать эти документы вручную может быть очень утомительной задачей. Наши технологии значительно облегчают изучение семейной истории», — говорит Гюнтер Мюльбергер из рабочей группы по оцифровке и цифровому архивированию Университета Инсбрука, Австрия, и председатель совета директоров. европейского кооператива READ-COOP.

Быстрый поиск в больших коллекциях

Архивы и библиотеки хранят исторические документы бесценной ценности. Эти документы занимают много места. Например, документы в австрийском государственном архиве занимают 350 км полки. Большинство этих документов доступны только в рукописном виде и больше не читаются многими пользователями, потому что они написаны шрифтом под названием Kurrent, старой формой немецкого почерка , основанной на скорописи позднего средневековья.

«Именно здесь на помощь приходит платформа Transkribus, которая автоматически распознает этот почерк и, таким образом, делает его понятным для всех», — объясняет Гюнтер Мюльбергер. Кроме того, документы также можно легко найти. Это значительно упрощает поиск с использованием исторических коллекций, поскольку можно одновременно искать в сотнях или тысячах документов фамилии или другие термины.

Чтение немецкого Kurrent, арабского и китайского языков

Транскрибус работает с нейронными сетями. Этот метод машинного обучения имеет большое преимущество, заключающееся в том, что вам больше не нужно вручную программировать распознавание для каждого типа письма. «Пользователи учат машину читать почерк», — говорит Гюнтер Мюльбергер. «И машина не устает, а это значит, что она может автоматически обрабатывать тысячи, сотни тысяч или миллионы страниц. Это то, что мы сделали, например, для Национального архива Финляндии, где хранится более 2 миллионов рукописных документов, до 19-го века теперь доступны для поиска всем».

Используемая технология полностью не зависит от языка и фактического сценария или типа письма. Transkribus распознает не только немецкий Kurrent или современный почерк, но и средневековые шрифты, а также еврейский, арабский или индийский почерк. «И прямо сейчас мы экспериментируем с древним китайским языком», — добавляет Мюльбергер.

Большая помощь исследователям

В науке, да и в гуманитарных, применение «Транскрибуса» многообразно. Например, филолог-классик из Инсбрука Уильям Бартон, получивший премию СТАРТ в размере 1,2 миллиона евро за свои исследования с помощью Transkribus, расшифровал считавшиеся утерянными дневниковые записи XIX века Карла Бенедикта Хазе, написанные рукописным древнегреческим языком. . Содержащаяся в нем ценная информация должна быть доступна для других областей исследований.

«Частные и секретные дневники ученого Карла Бенедикта Хазе содержат записи за девять лет. Объем текста огромен, около 2500 страниц», — поясняет Уильям Бартон из отдела неолатинских исследований. «Я научил машину моделировать почерк Хасе на основе 100 страниц. Теперь она способна читать все его дневники и надежно расшифровывать текст». Недавнее исследование, проведенное Эдинбургским университетом, показало, что с помощью Transkribus было выпущено более 400 научных публикаций.

Теперь можно читать старый почерк с помощью платформы ИИ



Новости партнеров