При анализе аудиозаписей часто возникают сложности с определением, кто из участников диалога произносит ту или иную реплику. Это может негативно сказаться на результатах речевого анализа и эффективности работы виртуальных ассистентов.

Технология диаризации компании U-BSS помогает определить, кто и что говорит в конкретный момент диалога. Эта технология применяется для анализа монозаписей и записей с аудио-бейджей, улучшая качество распознавания записей с направленных стереомикрофонов за счет отделения аудиопотока от посторонних звуков.

Улучшения включают в себя добавление классификатора для определения речи клиента и оператора с использованием двух разных моделей — одна определяет реплики по биометрическим признакам голоса, а другая по характерной лексике. Также была внедрена технология верификации каналов для анализа только важных фрагментов диалога, что сокращает время обработки и анализа аудио и уменьшает нагрузку на IT-инфраструктуру.

Также улучшена работа технологии по исключению дублирования реплик, возникающего при записи с двух направленных микрофонов. За счет объединения двух звуковых дорожек в стереозапись удалось исключить дубли реплик в аудиофайле, что упрощает анализ диалога с помощью речевой аналитики.

«Находясь в авангарде развития речевых технологий, мы значительно усовершенствовали процесс диаризации и продолжаем вести работу в этом направлении. Диаризация улучшает качество транскрибации текстов и заметно повышает точность распознавания речи при использовании соответствующих систем, что делает такие технологии востребованными. Многие компании до сих пор записывают аудио в моно-формате. Благодаря технологии диаризации такие клиенты могут использовать речевую аналитику с такой же эффективностью, как и при наличии нового оборудования», — прокомментировал директор компании U-BSS Пулат Халиулин.

Телефон: (+998) 97−155−00−27.

Сайт: ubssys.uz
Telegram: t.me/ubssys

На правах рекламы.