Нов AI инструмент превръща снимките в реалистични видеа

22 Апр. 2024АЛЕКСАНДЪР АЛЕКСАНДРОВ

Microsoft

Технологичният гигант Microsoft представи нов AI инструмент, наречен VASA-1, който може да превърне статична снимка на човек в реалистично видео, в което той говори или пее. Този инструмент е способен да генерира различни изрази на лицето и движения на главата за съществуваща статична снимка, както и подходящи движения на устните, които да съответстват на реч или песен.

По-наблюдателните зрители веднага ще забележат, че тези видеа изглеждат малко роботизирани и несинхронизирани. Въпреки това от Microsoft са наясно, че технологията може да бъде използвана за създаване на deepfake видеа на реални хора. Ето защо създателите ѝ са решили да не пускат “онлайн демо, API, продукт или допълнителни детайли”, докато не са сигурни, че технологията им “ще бъде използвана отговорно и в съответствие с подходящите регулации”.

Въпреки потенциала за злоупотреби, VASA-1 има и множество полезни приложения. Технологията може да се използва за подобряване на достъпността за хората с комуникационни проблеми, като им предостави достъп до аватар, който може да комуникира за тях. Инструментът също би могъл да предостави компания и терапевтична подкрепа на нуждаещи се хора.

VASA-1 е обучен върху VoxCeleb2 Dataset, който съдържа “над 1 милион изречения за 6,112 известни личности”, извлечени от YouTube видеа. Това подчертава обширната база данни, използвана за обучение на инструмента, което му позволява да генерира реалистични движения и изрази на лицето.

Ако искате да подкрепите независимата и качествена журналистика в “Сега”,
можете да направите дарение през PayPal