Кросс-модальный контекстуализированный метод проекции скрытого состояния для расширения таксономических графов
Таксономия - это граф терминов, организованный иерархически с использованием отношений гипернимии ("X - это разновидность Y"). Мы предлагаем новую формулировку задачи без кандидатов для задачи обогащения таксономии. Чтобы решить эту задачу, мы используем лексические знания из предварительно обученных моделей, чтобы прогнозировать новые слова, отсутствующие в таксономическом ресурсе. Мы предлагаем метод, который сочетает в себе графические и текстовые контекстуализированные представления из сетей-трансформеров для прогнозирования новых записей в таксономии. Мы оценили метод, предложенный для этой задачи, по базовым показателям только для текста, основанным на представлении текста BERT и fastText. Результаты демонстрируют, что включение встройки графа полезно в задаче прогнозирования гипонимов с использованием контекстуализированных моделей. Мы надеемся, что новая сложная задача будет способствовать дальнейшим исследованиям в области методов автоматического построения текстовых графиков.