Трясем деревья синтаксиса на улице Сезам: наборы данных для многоязычного исследования, организованные по типу текстового возмущения

В статье предлагается девять наборов данных для исследования, организованных по типу текстового возмущения для трех индоевропейских языков с различной степенью гибкости порядка слов: английского, шведского и русского. По итогам пробного анализа моделей M-BERT и M-BART авторы приходят к выводу, что синтаксическая чувствительность зависит от целей предварительной подготовки языка и модели.

Читать еще

Управление исследований и инноваций • Управление внутрибанковской безопасности
17 апреля 23
Создание инструмента второго мнения для классического полиграфа
Асонов Дмитрий Валерьевич, Крылов Максим Андреевич, Омелюсик Владимир Степанович, Рябикина Анастасия Евгеньевна, Литвинов Евгений Вячеславович, Митрофанов Максим Алексеевич, Михайлов Максим Алексеевич, Ефимов Альберт Рувимович
Управление исследований и инноваций
Управление исследований и инноваций
08 февраля 23
Наука в Сбере 2022

Мы используем cookies и аналогичные технологии для улучшения работы сайта и повышения удобства его использования.
Условия использования описаны в Уведомлении об обработке персональных данных сайтом и Политике в отношении Сookies и аналогичных технологий для сайта.