IT-системы распознавания речи пока далеки от идеала

// // Интересное в сети //

Больше всего систем распознавания речи создано для английского языка. И дело не только в том, что этот международный язык является наиболее востребованным. Английский относительно прост для распознавания: существительные не имеют склонений, слова в предложении ставятся в строго определенном порядке.

 

Языки, кардинально отличающиеся по своей структуре от английского, чрезвычайно сложны для распознавания. К ним относится, в частности, русский. Его в первую очередь отличает высокая флективность (то есть одному слову может соответствовать большое количество грамматических форм, например: голос, голоса, голосу, голосом, о голосе, голосов, голосам, голосами, голосах) и относительно свободный порядок слов в предложении. Эти особенности не позволяют с большим успехом использовать разработанные для английского языка статистические модели.

При построении моделей языка необходимо учитывать особенности морфологии и синтаксиса русского языка. Кроме того, для последнего характерны особенности и на акустическом уровне. Среди наиболее значимых можно отметить относительно вялую (по сравнению с тем же английским) артикуляцию. Для того чтобы нивелировать воздействие этого эффекта на качество пофонемного распознавания русской речи, акустические модели должны обладать целым рядом специфических свойств, для выявления и формализации которых необходимо провести большое количество научных исследований.