ПРООН на базе Mozilla Common Voice запускает инициативу UzbekVoice.ai — открытую базу узбекской речи, используемую для машинного обучения. Об этом Spot сообщила пресс-служба ПРООН.
В сообщении отмечается нехватка голосовых данных на узбекском языке, которая мешает развитию локальных стартапов и инновационных проектов. Данная инициатива призвана решить эту проблему и сделать технологии распознавания голоса доступными для узбекистанского бизнеса.
Пользователи, говорящие по-узбекски, приглашаются к участию в UzbekVoice.ai — для этого нужно отправить свой голос в языковую базу. Она будет использоваться, чтобы научить алгоритмы ИИ понимать узбекскую речь и расширить его применение.
Участники могут как зачитывать предложения на узбекском языке, так и прослушивать их для оценки правильности перевода. Это поможет ИИ распознавать разные акценты языка.
Для участия в инициативе требуется:
- перейти на сайт Mozilla Common Voice (можно также зарегистрироваться, но это необязательно);
- нажать «O'qish» (Прочитать) или «Tinglash» (Прослушать)
- для выбравших «O'qish» — зачитывать представленные предложения на узбекском языке;
- для выбравших «Tinglash» — слушать предложения и проверять их правильность.
Пользовательские записи будут доступны публично, однако можно скрыть своё имя.
Наиболее активные слушатели и читатели UzbekVoice.ai получат ценные призы. Для трёх пользователей в каждой категории предусмотрены HDD, смарт-часы или внешняя батарея (powerbank). Награждение состоится 10 декабря.
Сбор данных осуществляется в рамках совместного с Мининфокомом проекта цифровой трансформации Узбекистана. Подробная информация доступна на сайте UzbekVoice.ai.
База голосовых данных будет публичной и каждый разработчик сможет использовать ее бесплатно, интегрировав голосового помощника на узбекском языке в свои проекты.
Ранее Spot сообщал, что в Узбекистане создадут особые условия для проектов в сфере ИИ.