Xitoyning “ByteDance kompaniyasi “OmniHuman-1” nomli yangi sun’iy intellekt tizimini taqdim etdi. Bu haqda “hi-tech-mail” nashri xabar berdi.

Bu neyron tarmoq oddiy fotosuratlarni odamlar harakat qiladigan, imo-ishora ko‘rsatadigan va hatto gapira oladigan haqiqiy videolarga aylantirish qobiliyatiga ega.

“OmniHuman-1” to‘liq bo‘yli videolarni yaratish imkoniyatiga ega bo‘lib, bu uni faqat yuz yoki tananing yuqori qismini jonlantira oladigan oldingi sun’iy intellekt modellaridan afzal qiladi.

Ta’kidlanishicha, yangi tizim mimika, imo-ishoralar va nutq bilan muvofiqlashtirilgan eng tabiiy harakatlarni yaratadi.

“So‘nggi yillarda insonning to‘liq animatsiyasi sezilarli darajada takomillashgan bo‘lsa-da, mavjud usullar hali ham ko‘lam va sifat jihatidan cheklangan. „OmniHuman-1“ esa bu cheklovlarni bartaraf etib, yanada universal yechimni taklif etmoqda,” deya ta’kidlashdi ishlab chiquvchilar.

Qayd etilishicha, “OmniHuman-1"ni o‘rgatish uchun turli vaziyatlarda odamlar tasvirlangan 18 700 soatdan ortiq videoma’lumotlardan foydalanilgan.

Neyrotarmoq matn, audio va tana harakatlarini tahlil qilishi natijasida yuqori aniqlikdagi videolarni yaratish imkoniyatiga ega bo‘ldi.

“Bizning asosiy g‘oyamiz shundan iboratki, matn, audio va tana holati kabi ko‘plab konditsiyalovchi signallarni qo‘shish ma’lumotlar yo‘qotilishini sezilarli darajada kamaytiradi va natija sifatini oshiradi,” deya izoh berdi tadqiqotchilar.

Sinov jarayonida “OmniHuman-1” bir nechta muhim sifat ko‘rsatkichlari bo‘yicha mavjud tizimlardan ustunligini namoyon etdi. U yuqori aniqlik va haqiqiylik bilan videolar yarata oladi.


Avvalroq “Spot” “Adobe” matn va tasvirlardan video yaratish uchun sun’iy intellekt modelini chiqargani haqida yozgandi.

Model 2D va 3D animatsiyalarni yaratishi, haqiqiy holatlarga taqlid qila olishi mumkin. Videoning maksimal uzunligi to‘rt soniyani tashkil qiladi.