SketchBoost: быстрый градиентный бустинг для задач с многомерным выходом
В статье предлагаются новые методы ускорения процесса обучения градиентного бустинга на решающих деревьях (GBDT) в задачах с многомерным выходом. Идея заключается в приближенном вычислении функции скоринга лучшего сплита в деревьях решений. Ряд таких методов реализован в алгоритме SketchBoost, который интегрирован в библиотеку Py-Boost - легкую реализацию GBDT на Python для GPU. Эксперименты показывают, что SketchBoost ускоряет процесс обучения GBDT более чем в десятки раз при работе с сотнями выходов без потери качества.