“Alibaba” kompaniyasining Intellektual hisoblash instituti tadqiqotchilari EMO (Emote Portrait Alive) deb nomlangan sun’iy intellekt tizimini ishlab chiqdi. Bu haqda “3DNews” xabar berdi.

U odamning statik tasvirini jonlantirib, ularni real gapirish yoki kuylash imkonini beradi.

Tizim animatsiya yaratilgan audioning hissiy ohanglariga to‘liq mos keladigan real yuz ifodalari va bosh harakatlarini tasvirlaydi.


“An'anaviy usullar ko‘pincha odamning yuz ifodalarining to‘liq doirasini va individual yuz uslublarining o‘ziga xosligini qamrab ololmaydi. Ushbu muammolarni hal qilish uchun biz oraliq 3D modellar yoki yuz mos yozuvlar nuqtalariga bo‘lgan ehtiyojni chetlab o‘tib, to‘g‘ridan-to‘g‘ri audiodan videoga sintez yondashuvidan foydalanadigan yangi tizim “EMO"ni taklif qilamiz “, deb tushuntirdi ishlab chiqish guruhi rahbari Linrui Tyan.

“EMO” tizimi AI diffuziya modeliga asoslangan bo‘lib, u o‘zini haqiqiy tasvirlarni yaratishga qodirligini isbotlagan.

Tadqiqotchilar uni 250 soatdan ortiq gapiradigan videoyozuvlarni o‘z ichiga olgan ma’lumotlar to‘plamida o‘qitgan.

Oldingi usullardan farqli o‘laroq, uch o‘lchovli model yoki inson yuz ifodalarini taqlid qilish mexanizmlarini yaratishni, ovozni to‘g‘ridan-to‘g‘ri videoga aylantirishni o‘z ichiga oladi.

Bu tizimga tabiiy nutq bilan bog‘liq bo‘lgan eng kichik harakatlar va shaxsiy xususiyatlarni yetkazish imkonini beradi.


Avvalroq “Spot” “Apple” tasvirlarni tahrirlash uchun sun’iy intellekt modelini chiqargani haqida yozgandi.

Neyron tarmoq multimodal rejimda ishlaydi — u bir vaqtning o‘zida foydalanuvchining ingliz tilidagi matn so‘rovlarini tushunadi va tasvirlardagi obyektlarni taniydi.