用户名/邮箱
登录密码
验证码
看不清?换一张
您好,欢迎访问! [ 登录 | 注册 ]
您的位置:首页 - 最新资讯
Доклад Максима Меленченко и Марии Криволап на заседании иранистического семинара
2025-02-26 00:00:00.0     Новости и анонсы(新闻和公告)     原网页

       28 января в 18:00 в рамках иранистического семинара ИЯз РАН и НИУ ВШЭ состоится доклад Максима Меленченко и Марии Криволап ?Предсказание шугнанского рода с помощью методов машинного обучения?.

       Аннотация

       Доклад посвящён исследованию влияния различных факторов на приписывание рода (gender assignment) в шугнанском языке с помощью методов машинного обучения. Мы обучили несколько моделей предсказанию рода (женский/мужской) на датасете в 2390 существительных из шугнанско-русского словаря. В качестве ?предсказателей? для обучения использовались как семантические признаки (семантические классы и векторизованные русские словарные толкования), так и формальные (финали слов и последняя гласная основы). Результаты исследования показывают, что семантика играет главную роль в приписывании рода в шугнанском языке, так как выделенные нами семантические признаки правильно предсказывают род для ≈80% слов в нашей выборке. Формальные признаки менее значимы и правильно предсказывают род только для ≈70% существительных. Между этими типами признаков обнаруживается высокая корреляция (особенно для женского рода), поэтому их комбинация не приводит к значительному улучшению качества предсказаний.

       Подробная информация доступна на сайте pamiri.online.

       


标签:综合
关键词: методов машинного     правильно предсказывают     машинного обучения     предсказывают род     формальные     помощью методов     шугнанском языке     признаки    
滚动新闻
    相关新闻