Системы автоматической транскрипции русского текста: общая организаций и решенные и нерешенные проблемы
Решение задачи автоматического транскрибирования письменного текста востребовано в разных областях лингвистических технологий прежде всего (но не только) — при анализе и синтезе речи. Подобные системы должны быть многомодульными, причем входящие в них модули должны легко конфигурироваться. Необходим учет морфологических и синтаксических характеристик текста. Статья написана на основании опыта разработки системы автоматической транскрипции на правилах и описывает (анонимно) другие рассмотренные в процессе разработки коммерческие решения. В статье представлены стандартные задачи, решаемые при транскрибировании русского текста, предложена общая схема транскрипторов, обсуждается текущий уровень качества решения отдельных задач, изложены направления для доработки текущих решений.