RuCoLA: Русский корпус лингвистической приемлемости

Корпус RuCoLA — это набор предложений на русском языке, которые размечены по бинарной шкале лингвистической приемлемости. RuCoLA включает в себя предложения, написанные экспертами в области лингвистики и сгенерированные языковыми моделями.

Ошибки, которые представлены в предложениях, покрывают широкий ряд языковых феноменов: от синтаксиса и семантики до галлюцинаций генеративных моделей. Корпус RuCoLA создан для улучшения методов обнаружения ошибок в естественном языке. Кроме того, мы организуем открытое соревнование, которое позволит следить за прогрессом в развитии этих методов.

Читать еще

Центр робототехники • Управление исследований и инноваций
Управление исследований и инноваций
30 августа 23
Science at Sber 2022
Управление исследований и инноваций • Управление внутрибанковской безопасности
17 апреля 23
Создание инструмента второго мнения для классического полиграфа
Асонов Дмитрий Валерьевич, Крылов Максим Андреевич, Омелюсик Владимир Степанович, Рябикина Анастасия Евгеньевна, Литвинов Евгений Вячеславович, Митрофанов Максим Алексеевич, Михайлов Максим Алексеевич, Ефимов Альберт Рувимович

Мы используем cookies и аналогичные технологии для улучшения работы сайта и повышения удобства его использования.
Условия использования описаны в Уведомлении об обработке персональных данных сайтом и Политике в отношении Сookies и аналогичных технологий для сайта.