29 апреля 2025 г. состоялось Открытое заседание научного семинара Лаборатории исследования и сохранения малых языков ИЯз РАН. С докладом на тему ?Из типологии в языковые модели - и обратно. Обзор современного состояния языковых моделей в применении к типологическим базам знаний? выступила Татьяна Олеговна Шаврина (к.ф.н., старший научный сотрудник Отдела прикладной лингвистики Института языкознания РАН).
Аннотация
В расширяющемся мире обработки естественного языка (NLP) большинство достижений непропорционально выделяет высокоресурсные языки, для которых доступны объемные корпусные данные. Однако тысячи языков по всему миру не покрыты цифровыми ресурсами и корпусами для разработки подобных систем. В докладе будут рассмотрены последние достижения и работы, устраняющие этот критический пробел за счет использования типологических баз. Мы исследуем, как описательные лингвистические грамматики могут быть использованы для улучшения NLP для малоресурсных языков - и как они могут быть полезны типологии.
На материале работы:
From MTEB to MTOB: Retrieval-Augmented Classification for Descriptive Grammars