用户名/邮箱
登录密码
验证码
看不清?换一张
您好,欢迎访问! [ 登录 | 注册 ]
您的位置:首页 - 最新资讯
"Яндекс" научил свои нейросети расшифровывать архивы с дореволюционной орфографией
2023-01-29 00:00:00.0     НАУКА(科学)     原网页

       

       МОСКВА, 25 января. /ТАСС/. "Яндекс" обучил собственные нейросети расшифровывать архивные записи с дореволюционной орфографией, технология уже доступна в сервисе "Поиск по архивам". Об этом сообщает пресс-служба компании в среду.

       "Яндекс" научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией", - рассказали в пресс-службе.

       Как уточнили в компании, попробовать новую технологию в действии можно уже сейчас в сервисе "Поиск по архивам", где есть доступ к более чем 2,5 миллиона страниц исторических документов с текстовой расшифровкой. "Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и понимает особую структуру архивных документов", - добавили в "Яндексе".

       Как отметили в пресс-службе, специалисты компании обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII - XIX веков и десятков миллионов сгенерированных примеров. Сами материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания. "Поиск по архивам" повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье. Первым представленным в сервисе фондом стал Главархив Москвы, именно на его материалах разработчики обучали нейросеть. <...> Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться", - сообщили в "Яндексе".

       Документы, как рассказали в пресс-службе, можно найти по каталогу или через строку поиска, также есть фильтры по годам, архивам, фондам и описям. "Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями "Яндекса". Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии", - объяснили в компании.

       


标签:综合
关键词: пресс     сервисе     по архивам     Поиск по     службе     компании     архивные записи    
滚动新闻